카카오 플러스

Encoding 인코딩의 종류

자주 까먹게 되는 인코딩 종류와 간략한 설명

ASCII
7비트 코드체계 사용
128개의 문자만 표현

ISO Latin-1(SIO-8859-1)
8비트 코드체계 사용
256개 문자 표현

KS C 5601
2바이트를 사용해서 완성형 한글표현
순수한 한글 코드에 대한 내용만 있을뿐 ASCII 문자에 대한 내용은 없음

KS C 5636
KC C 5601에 없는 ASCII 문자에 대한 표준 존재
역슬래시 대신 한국의 통화기호 원표시를 대치해 넣은 것
사실상 ASCII 문자 집합코드와 같음

EUC-KR
유닉스 운영체제에서 영어는 KS C 5636을, 한글은 KS C 5601을 사용하는 것을 말함
ASCII 코드는 1바이트로 표현하고 'KS C 5601'에 언급되어 있는 한글 문자 코드는 2바이트로 표현
이것은 한국 표준협회에서 '유닉스 상에서의 한글사용'이라는 제목으로 KS C 5861로 등록되어 있음

Unicode
두개의 대표적인 문자 인코딩 UTF-8, UTF-16

UTF-8
파일 사이즈를 적게 하기 위해 ASCII 문자 코드는 1바이트로 코딩하고, 다른 문자들은 2바이트나 그 이상으로 인코딩
한글은 3바이트로 인코딩
따라서, ASCII 문자로 구성된 파일은 ASCII 인코딩 체계 또는 UTF-8로 저장 되었을 경우 동일하게 8비트 인코딩 체계를 사용하므로 호환

UTF-16
간단하게 2바이트를 사용하여 모든 문자 코드를 표현


Encoding 인코딩의 종류