문자 - ASCII, EUC, Unicode, UTF-8
ASCII- 영어 알파벳과 기호들을 컴퓨터에서 표현하는 규약, 128개의 문자 -> 7비트 사용, 1바이트는 사용하지 않거나 오류 검출용으로 사용한다. ANSI - 영어 외의 다른 문자 언어를 표현하기 위해 만든 인코딩, 256개 문자 -> 8비트 사용 멀티바이트 - 1바이트에 담을 수 없는 언어(한국어, 중국어, 일본어)들을 위해 나왔다. 문자를 2바이트 내에서 표현할 수 있게 되었다. EUC - Extended Unix Code, 한,중,일을 위한 멀티바이트 문자 인코딩이다. 같은 바이너리 패턴으로 다른 나라 언어를 표현한다. 그래서 같은 값을 다른 언어팩에 넣으면 글자가 깨져서 보인다. (EUC-KR - 한국어 문자 인코딩 방식) -> 여러 언어를 한번에 표현이 불가능하다, 이모티콘도 표현이 불가능..
2022. 12. 30.