ISO/IEC 2022

ISO 2022
언어다양함
표준ISO/IEC 2022,
ECMA-35,
JIS X 0202
분류스테이트풀 인코딩
변환 / 암호US-ASCII 등 (구현체에 따라 다름)
다음 인코딩ISO 10646 (유니코드)

ISO/IEC 2022는 문자를 부호화하는 기술(techniques, 확장 기술 extension technique)로서, ISO 표준(ECMS 표준인 ECMA-35, ANSI 표준인 ANSI X3.41, 그리고 일본 산업 표준인 JIS X 0202와 같은)으로 다음과 같은 사항을 규정한다.

  • 다중 그래픽 문자 집합과 1차 제어문자(C0)와 2차 제어문자(C1)를 포함해서, 단수 문자 체계를 포함하기도 하는, 특이한 구조의 복수 문자 체계의 하부구조(infrastructure),
  • 이러한 문자 집합을 부호화하는 포맷(format),
  • 각 바이트에서 7bits만을 사용하는 경우에 8bits를 다 사용하는 경우와 같은 방식으로 부호화하고, 또한 8bits 문자가 7bits 환경에서 그대로 사용될 수 있도록 하기 위한 포맷(format),
  • ANSI escape codes를 위한 구조,
  • 개개의 문자 집합을 식별하기 하고, 특정 부호 기능이나 하위집합의 사용을 알리고, 다른 부호화 체계와 상호작용하고 교환하기 위한, 특별한 이스케이프(escape) 부호 포맷(format)

ISO/IEC 2022 부호화에 포함된 많은 문자 집합들이 이중 바이트(double byte) 부호화인데, 2개의 바이트가 한 문자를 나타낸다. 이로 인해 ISO/IEC 2022의 부호화는 가변폭(variable width) 부호화가 된다. 그러나 어떤 특정 구현체가 표준이 정하는 모든 것을 구현할 필요는 없다. 특정 구현체에서는 자신이 지원하는 문자와 레벨이 따로 정한다.

ISO/IEC 2022 표준에서 규정된 많은 메카니즘들이 자주 사용되는 것은 아니지만, 몇몇 현존 부호화 방식들은 ISO/IEC 2022 시스템의 하위집합(subset)에 기반하고 있다. 특히, ISO/IEC 2022의 7bits 부호화 시스템의 구현체로는 일본어 이메일에서 주요하게 사용된는 ISO-2022-JP(혹은 JIS 부호화)가 있다. ISO/IEC 2022의 7bits 부호화 시스템의 구현체로는 ISO/IEC 4873(ECMA-43)(이는 또한 ISO/IEC 8859가 따른다)와 동아시아(East Asia)에서 사용되는 확장 유닉스 부호(Extented Unix Code)가 있다. ISO 2022의 좀 더 특별한 응용으로는 MARC 21 라이브러리 레코드에서 사용되는 MARC-8이 있다.


ISO/IEC 2022의 부호화 방식은 통상 문자 하나에 1바이트나 2바이트 이상을 쓰는 가변 문자 부호화 방식이며 한국어의 경우 EUC-KR이 이 부호화 방식을 사용한다.


From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne