울어라휘파람새야

EUC-KR과 UTF-8 비교 본문

밥줄/ASP

EUC-KR과 UTF-8 비교

꼬꼬리코 2009. 3. 5. 14:31

EUC-KR UTF-8 
 인코딩 방법 KSC5601에 기반을 둔 인코딩 방법  유니코드를 위한 가변 길이 문자 인코딩 방법 
 표현문자 KSC5601 + KSC5636  모든 문자 표현 가능 
 차지하는 바이트 수 ASCII 문자 코드는 1바이트로 표현하고, KSC5601에서 언급되는 한글 문자 코드는 2바이트로 표현  한 문자를 나타내기 위해 1바이트 (ASCII)에서 4바이트 (기본 다국어 평면(BMP) 바깥의 유니코드 문자) 까지를 사용 
 장점

 적은 메모리 공간을 차지한다.

오랜 개발 경험으로 특별한 어려움 없이 웹 페이지를 개발할 수 있다. 

 모든 문자를 표현할 수 있다. 

다른 언어 운영체제(OS)에서 폰트 없이도 한글을 볼 수 있다. 

 단점

 아??', '?' 같은 단어나 조선 시대 고어(古語) 등 우리말인데도 표시할 수 없는 문자가 있다. 

다른 언어 운영체제(OS)에서 폰트가 없으면 한글을 볼 수 없다.

 불필요한 메모리 공간이 사용될 수 있다. 

DB 용량이나 데이터 전환 비용이 추가될 수 있다. 

경험 미숙으로 웹 페이지를 개발할 때 난간에 봉착할 수 있다.

 

개발 방법

? EUC-KR
모든 페이지에 아래 코드를 적용
모든 페이지를 ASCII 형태로 파일을 저장.
<asp 적용>
<%@ CodePage=949 Language="VBScript!"%>
<%Option Explicit%>
<%Response.CharSet = "ks_c_5601-1987"%>
 
<html 적용>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=euc-kr">
</head>

?UTF-8
-- 모든 페이지에 아래 코드를 적용.
-- 모든 페이지를 UTF-8 형태로 파일을 저장

<asp 적용>

<%@ CodePage=65001 Language="VBScript!"%>
<%Option Explicit%>
<%Response.CharSet = utf-8"%>
 
<html 적용>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
Comments