Information and Character Encoding
정보와 문자 인코딩
Mar 26, 2024
비트(bit)
- 컴퓨터와 정보 이론에서 사용되는 가장 작은 데이터 단위
- 이진수 체계에서 0 또는 1의 값을 나타냄
- 8개의 비트는 바이트(byte)로 불리며, 일반적으로 컴퓨터에서 가장 작은 주소 단위
- 2의 n가지 정보 표현 가능
이진법(binary)
- 0과 1로 수를 표현하는 방법
- 컴퓨터는 전기적인 신호를 이용하여 데이터를 표현하고 처리
- 비트(bit)라는 단위로 표현됨
16진법(Hexadecimal)
- 0부터 9까지 10개의 숫자와 A부터 F까지의 6개의 문자를 사용하여 수를 나타내는 수의 체계
- 메모리 주소를 나타내는데 자주 사용됨
아스키 코드(ASCII: American Standard Code for Information)
- 영어 알파벳, 숫자, 특수 문자 등 컴퓨터에서 표현하기 위해 사용되는 표준 문자 인코딩
- 오직 영어와 일부 특수문자만을 포함하고 있어 다국어 및 유니코드 문자를 표현하기에 제한됨
EUC-KR(Extended Unix Code-Korean)
- 유닉스 운영체제에서 개발
- 완성형 인코딩으로 모든 한글을 표현하기에 부족
유니코드(Unicode)
- 전 세계 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도로 설계된 국제 표준 문자 인코딩 시스템
- 특수 기호, 수학 기호, 이모티콘도 표현가능
- 다양한 인코딩 방식(UTF-8, UTF-16, UTF-32...)이 있지만 UTF-8이 가장 널리 사용됨
- ASCII 문자는 1바이트로 표현되고, 한글과 같은 다국어 문자는 2바이트 이상으로 표현됨
Go toor?