Information and Character Encoding

정보와 문자 인코딩

Mar 26, 2024

비트(bit)

  • 컴퓨터와 정보 이론에서 사용되는 가장 작은 데이터 단위
  • 이진수 체계에서 0 또는 1의 값을 나타냄
  • 8개의 비트는 바이트(byte)로 불리며, 일반적으로 컴퓨터에서 가장 작은 주소 단위
  • 2의 n가지 정보 표현 가능

이진법(binary)

  • 0과 1로 수를 표현하는 방법
  • 컴퓨터는 전기적인 신호를 이용하여 데이터를 표현하고 처리
  • 비트(bit)라는 단위로 표현됨

16진법(Hexadecimal)

  • 0부터 9까지 10개의 숫자와 A부터 F까지의 6개의 문자를 사용하여 수를 나타내는 수의 체계
  • 메모리 주소를 나타내는데 자주 사용됨

아스키 코드(ASCII: American Standard Code for Information)

  • 영어 알파벳, 숫자, 특수 문자 등 컴퓨터에서 표현하기 위해 사용되는 표준 문자 인코딩
  • 오직 영어와 일부 특수문자만을 포함하고 있어 다국어 및 유니코드 문자를 표현하기에 제한됨

EUC-KR(Extended Unix Code-Korean)

  • 유닉스 운영체제에서 개발
  • 완성형 인코딩으로 모든 한글을 표현하기에 부족

유니코드(Unicode)

  • 전 세계 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도로 설계된 국제 표준 문자 인코딩 시스템
  • 특수 기호, 수학 기호, 이모티콘도 표현가능
  • 다양한 인코딩 방식(UTF-8, UTF-16, UTF-32...)이 있지만 UTF-8이 가장 널리 사용됨
  • ASCII 문자는 1바이트로 표현되고, 한글과 같은 다국어 문자는 2바이트 이상으로 표현됨
Go toor?