본문 바로가기
IT

ASCII / ANSI / UNICODE / UTF-8 쉽게 이해하기

by 최고영회 2018. 9. 10.
728x90
반응형
SMALL

American Standard Code for Information Interchange - 줄여서 ASCII 

즉 1960년대 미국에서 정의한 표준화한 부호체계이다.


컴퓨터의 기본 저장 단위는 byte 이며 1byte 는 8bit 이다. 

1byte 에는 2의 8승인 256개의 값을 저장할 수 있는데 ASCII 코드는 7bit 즉 128개의 고유 값만 사용한다. 

1bit 는 Parity Bit 로 사용한다. 


다른 언어를 표현하기에는 7bit 로는 부족했기 때문에 8bit로 확장한 ASCII 코드가 나왔고 이것을 ANSI 코드 이다. 


하지만 여전히 한국, 중국, 일본과 같은 문자를 표현하기에는 제한이 있었다.

그래서 용량을 크게 확장한 2byte 기반의 UNICODE가 등장한다. (2의 16승인 65536개의 고유값 표현 가능)


UNICODE 코드 포인트를 8bit 숫자의 집합으로 나타내는 것이 UTF-8 이다. 


728x90
반응형
LIST