한자/SIP

< 한자
유니코드 문자 집합의 문자 평면
기본보조
Plane 0
0000 ~ FFFF
Plane 1
10000 ~ 1FFFF
Plane 2
20000 ~ 2FFFF
Planes 3–13
30000 ~ 3FFFF
Plane 14
E0000 ~ EFFFF
Planes 15–16
F0000 ~ 10FFFF
기본 다국어 평면
BMP
보조 다국어 평면
SMP
보조 표의문자 평면
SIP
3차 표의문자 평면
TIP
보조 특수 목적 평면
SSP
사용자 자유 영역
PUA
0XXX8XXX10XXX18XXX20XXX28XXX문자 없음E0XXX15: PUA-A
1XXX9XXX11XXX19XXX21XXX29XXXF0000–​FFFFF
2XXXAXXX12XXX1AXXX22XXX2AXXX
3XXXBXXX13XXX1BXXX23XXX2BXXX16: PUA-B
4XXXCXXX14XXX1CXXX24XXX2CXXX100000–​10FFFF
5XXXDXXX15XXX1DXXX25XXX2DXXX
6XXXEXXX16XXX1EXXX26XXX2EXXX
7XXXFXXX17XXX1FXXX27XXX2FXXX


SIP는 사실상 한자 전용 평면이다. 평면 이름부터 보조 표의 문자 평면(Supplementary Ideographic Plane)이다.[1] 유니코드의 BMP 영역에는 이미 2만 자가 되는 한자가 배당되어 있지만, 그것만으로는 부족하기 때문에 한자 전용 평면을 만든 것이다.

SIP의 한자는 현대에는 잘 쓰이지 않는다고 생각하기 쉬우나, 현대에도 잘 쓰이는 것들이 있다. 𠮷, 𥝱, 𩸽 등은 현대 일본어에서 쓰이고, 주기율표/중국어의 𨧀, 𨭎, 𨨏, 𨭆, 𫟼, 𫓧, 𫟷 등은 현대 표준중국어에서 쓰이며, 𡃁, 𨋢 등은 현대 광동어에서 쓰인다.

이 문서는 새 한자 문서 작성 및 현재 존재하는 모든 한자 문서 확인에 요긴하게 쓰일 수 있다. 한자가 잘 보이지 않으면 브라우저의 글자 확대 기능을 이용할 것.

단일 문서로 SIP의 모든 글자를 넣기에는 공간이 너무 부족해서 부득이하게 두 개의 문서로 쪼개었고, 이마저도 길어 유니코드 하위문서로 대체되었다. SIP는 UTF-8에서는 모두 4바이트 크기다. 이게 65,535자가 있다고 생각해 보라. 문제는 이걸로도 안 끝난다는 거(…) SMPSSPTIP도 작성해야 할 판

  1. 그런데 한자는 표의 문자보다는 표어 문자로 분류하는 것이 적절하다. 순수히 뜻만 나타내는 글자도 있지만, 음이나 형태소를 나타내는 글자도 있기 때문.