울어라휘파람새야
EUC-KR과 UTF-8 비교 본문
적은 메모리 공간을 차지한다. 오랜 개발 경험으로 특별한 어려움 없이 웹 페이지를 개발할 수 있다. 모든 문자를 표현할 수 있다. 다른 언어 운영체제(OS)에서 폰트 없이도 한글을 볼 수 있다. 아??', '?' 같은 단어나 조선 시대 고어(古語) 등 우리말인데도 표시할 수 없는 문자가 있다. 다른 언어 운영체제(OS)에서 폰트가 없으면 한글을 볼 수 없다. 불필요한 메모리 공간이 사용될 수 있다. DB 용량이나 데이터 전환 비용이 추가될 수 있다. 경험 미숙으로 웹 페이지를 개발할 때 난간에 봉착할 수 있다.
EUC-KR
UTF-8
인코딩 방법
KSC5601에 기반을 둔 인코딩 방법
유니코드를 위한 가변 길이 문자 인코딩 방법
표현문자
KSC5601 + KSC5636
모든 문자 표현 가능
차지하는 바이트 수
ASCII 문자 코드는 1바이트로 표현하고, KSC5601에서 언급되는 한글 문자 코드는 2바이트로 표현
한 문자를 나타내기 위해 1바이트 (ASCII)에서 4바이트 (기본 다국어 평면(BMP) 바깥의 유니코드 문자) 까지를 사용
장점
단점
개발 방법
? EUC-KR
- 모든 페이지에 아래 코드를 적용
- 모든 페이지를 ASCII 형태로 파일을 저장.
<asp 적용>
<%@ CodePage=949 Language="VBScript!"%>
<%Option Explicit%>
<%Response.CharSet = "ks_c_5601-1987"%>
<html 적용>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=euc-kr">
</head>
?UTF-8
-- 모든 페이지에 아래 코드를 적용.
-- 모든 페이지를 UTF-8 형태로 파일을 저장
<asp 적용>
<%@ CodePage=65001 Language="VBScript!"%>
<%Option Explicit%>
<%Response.CharSet = “utf-8"%>
<html 적용>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
Comments