언어 | 다양함 |
---|---|
표준 | ISO/IEC 2022, ECMA-35, JIS X 0202 |
분류 | 스테이트풀 인코딩 |
변환 / 암호 | US-ASCII 등 (구현체에 따라 다름) |
다음 인코딩 | ISO 10646 (유니코드) |
ISO/IEC 2022는 문자를 부호화하는 기술(techniques, 확장 기술 extension technique)로서, ISO 표준(ECMS 표준인 ECMA-35, ANSI 표준인 ANSI X3.41, 그리고 일본 산업 표준인 JIS X 0202와 같은)으로 다음과 같은 사항을 규정한다.
ISO/IEC 2022 부호화에 포함된 많은 문자 집합들이 이중 바이트(double byte) 부호화인데, 2개의 바이트가 한 문자를 나타낸다. 이로 인해 ISO/IEC 2022의 부호화는 가변폭(variable width) 부호화가 된다. 그러나 어떤 특정 구현체가 표준이 정하는 모든 것을 구현할 필요는 없다. 특정 구현체에서는 자신이 지원하는 문자와 레벨이 따로 정한다.
ISO/IEC 2022 표준에서 규정된 많은 메카니즘들이 자주 사용되는 것은 아니지만, 몇몇 현존 부호화 방식들은 ISO/IEC 2022 시스템의 하위집합(subset)에 기반하고 있다. 특히, ISO/IEC 2022의 7bits 부호화 시스템의 구현체로는 일본어 이메일에서 주요하게 사용된는 ISO-2022-JP(혹은 JIS 부호화)가 있다. ISO/IEC 2022의 7bits 부호화 시스템의 구현체로는 ISO/IEC 4873(ECMA-43)(이는 또한 ISO/IEC 8859가 따른다)와 동아시아(East Asia)에서 사용되는 확장 유닉스 부호(Extented Unix Code)가 있다. ISO 2022의 좀 더 특별한 응용으로는 MARC 21 라이브러리 레코드에서 사용되는 MARC-8이 있다.
ISO/IEC 2022의 부호화 방식은 통상 문자 하나에 1바이트나 2바이트 이상을 쓰는 가변 문자 부호화 방식이며 한국어의 경우 EUC-KR이 이 부호화 방식을 사용한다.