크롬으로 이 문서를 편집할 경우 호환용 한자가 모두 통합 한자로 변환되는 문제가 있으므로, 크롬으로는 절대 편집하지 마십시오.
1 개요
KS X 1001은 독음이 여러 개인 일부 한자를 그 독음 수만큼 중복 배당하는 병크[1]를 저질렀다. 樂의 경우 '락', '악', '요' 셋에다가 두음 법칙을 적용한 '낙'까지 해서 총 4개의 코드에 중복 배당돼 있다.
일본이나 중국, 중화민국[2], 심지어 북한조차도 이런 식으로 한자를 중복 배당하지 않았다. 대신 일본은 없는 한자를 배당했고, 북한은 한글 아홉 자를 중복 배당했다. 만약 일본이 JIS 코드에 완성형과 같은 식으로 한자를 독음 수만큼 중복 배당했다면 JIS 코드와 유니코드에 生의 호환용 한자가 수십 개나 존재했을 것이다.
2 비판 및 문제점, 결점
이와 같이 발음이 다르다고 같은 문자를 일부러 중복 배당하는 것은 영어에서 father, that, about 등의 a 발음이 모두 다르니 a를 여러 번 중복 배당하는 것[3]과 한국어에서 '물고기'의 '고'와 '불고기'의 '고' 발음이 다르니 '고'를 두 번 중복 배당하는 것과 다를 바가 없다. 그 어떤 문자 코드도 발음이 다르다고 문자를 중복 배당하지는 않았는데(애당초 문자 코드는 문자 처리를 위해 존재하지 발음을 위해 존재하는 것이 아니다), 왜 KS 코드는 한자에 대해서만 그렇게 했는지는 상식적으로 이해할 수 없다. 즉 발음이 다르다고 같은 문자를 일부러 중복 배당하는 것은 정말로 생각이 없는 병크였다고 할 수 있다.
이로 인해 생기는 문제점 및 결점은 다음과 같다.
첫째, 똑같아 보이는 문자가 내부 코드상으로는 다르게 처리되다 보니 문자열 검색이나 비교 등에서 오히려 불편을 초래한다(樂(낙), 樂(락), 樂(악), 樂(요) 이 넷은 모두 코드가 다르다!). 실제로 이 병크의 결과로 이런 일이 생기기도 하며, 이 글에서 언급하는 바와 같이 온라인 서점에서 한자가 들어간 책 제목을 검색할 때도 문제가 될 수 있다(책 제목에 樂이 들어가 있으면 '낙'으로도 '락'으로도 '악'으로도 '요'로도 검색해 봐야 한다).
또한 같은 한자가 여러 개의 코드 값을 가진다는 것을 모르는 사람이 대부분이라는 것이다. 예를 들어, 年金(연금)이라는 단어를 입력할 때 누군가는 '연금'으로 변환해서 입력할 수도 있고 누군가는 年의 본 음가인 '년금'으로 변환해서 입력할 수도 있다(그리고 이 중복 한자 문제를 아는 사람은 '년김'으로 변환해서 입력할 수도 있다). 즉 작업자가 누구냐에 따라 똑같은 한자 단어를 다른 코드로 입력하게 되고 만다.
둘째, 이 중복 배당이 웃긴 것이, 모든 독음을 커버하는 것도 아니라는 것이다. 初八日(초파일), 六月(유월), 十月(시월), 木瓜(모과), 困難(곤란), 娑婆(사바), 唵川面(옴천면)[4], 邯鄲之夢(한단지몽), 白川郡(배천군)[5] 등의 '파', '유', '시', '모', '란', '바', '옴', '한', '배' 등에는 별개의 코드가 주어지지 않았다. 일단 대부분 활음조 현상으로 인한 음으로 굳이 추가할 이유가 없는 음이긴 한데, 이렇게 되면 異가 '리'에도, 寧이 '령'에도 배당된 것이 이상해진다.[6] 즉 이도 저도 아닌 어정쩡한 결과를 낳은 셈(…).
게다가 일관성조차 없다. 똑같은 독음을 가진 한자인데 어떤 것은 두음 법칙을 적용해서 중복 배당하고 어떤 것은 두음 법칙도 적용하지 않고 중복 배당하지도 않았다. 예를 들어 완성형에서 '력'이라는 독음을 가진 한자는 力, 曆, 歷, 瀝, 礫, 轢, 靂이 존재하는데, 이 중에서 力, 曆, 歷, 轢은 두음 법칙을 적용해 '력'뿐만 아니라 '역'이라는 독음으로도 중복 배당돼 있지만, 瀝, 礫, 靂은 오로지 '력'으로만 존재하고 '역'으로는 존재하지 않는다. 그래서 力學(역학)의 力은 '역'으로 변환해서 (호환용 한자를) 입력할 수 있지만 礫巖(역암)의 礫은 무조건 '력'으로만 변환해야 한다. 정말 이뭐병스럽지 않을 수 없다(…).
비슷한 예로 법조계에서는 表見代理를 어떻게 읽을 것인가를 놓고 '표현대리'냐 '표견대리'냐는 논란이 반세기 넘도록 이어져 왔다. 그러길래 애초부터 現을 썼어야지… 그런데 어째 논란이 식기는커녕 더 뜨거워지고 있다. 다른 사례로는 更改가 있다. 경개냐 갱개냐인데, 이것은 전자와 달리 한자 쓰기 자체의 문제는 아니다. 전자나 후자나 한자 고르는 걸로 깊은 빡침을 유발하게 하는 건 똑같네…
3 유니코드에서의 처리
유니코드는 한자 하나당 한 코드를 부여하는 것이 원칙이나, KS X 1001과의 호환을 위해 KS X 1001의 중복 한자들 중 하나만을 통합 한자 영역(U+4E00 ~ U+9FFF)에 넣고 나머지는 호환용 한자 영역(U+F900 ~ U+FAFF)에 넣었다. 樂의 경우 '악'에 해당되는 것만 통합 한자에 들어갔고 나머지 셋은 호환용 한자에 들어갔다.
유니코드는 기존 문자 집합과의 왕복 변환(round trip)을 위해서만 호환용 한자의 사용을 허용하고 있고, 다른 용도로 사용하는 것은 권장하지 않고 있다. 따라서 나무위키에서 한자 문서를 작성할 때는 통합 한자만을 사용하는 것을 원칙으로 하고 있다. 즉 樂의 경우 樂(악, U+6A02)만을 사용하고 樂(낙, U+F914), 樂(락, U+F95C), 樂(요, U+F9BF)는 사용하지 않는다. 호환용 한자를 사용하면 괜히 불편만 초래하니, 웬만하면 통합 한자만을 쓰도록 하자. 참고로 크롬이나 미디어위키에서는 호환용 한자를 입력하면 아예 통합 한자로 자동으로 바뀌며, 호환용 한자를 그대로 입력할 수 없다. 이 문서를 크롬으로 편집하거나, 이 문서의 내용을 복사해 미디어위키에 붙여 넣으면 호환용 한자가 모두 통합 한자로 자동으로 바뀌게 된다.
미디어위키에다가 호환용 한자를 집어넣고 미리 보기를 실행하면 자동으로 통합 한자로 바뀌므로, 호환용 한자 → 통합 한자 자동 변환을 원하는 사람들은 미디어위키에 변환할 문자열을 넣고 미리 보기를 한 뒤 그 결과물을 복사해서 쓰는 방법도 있다.
만약 한국어 IME로 일본어나 중국어를 입력할 경우[7], 호환용 한자를 쓰면 제대로 보이지 않을 수도 있으므로 통합 한자만을 사용하는 것이 바람직하다. 아래 리스트에서 '통합 한자' 줄에 있는 음가로 변환해야 한다(예: 樂의 경우 '악'으로만 변환해야 하며, 年金의 경우 '년김'으로만 변환해야 함).
나무위키에서 호환용 한자를 검색했을 때 검색 결과에 이 문서와 의도적으로 호환용 한자를 쓴 문서 유니코드/F000~FFFF, 한자/KS X 1001, 한자/BMP밖에 나오지 않는 것이 가장 이상적이다.
4 중복 한자 목록
모두 268자로, '두음'이 203자(75.7%), '일반'이 65자(24.3%)이다. 한자 268자 중복하는 대신 한글이나 더 넣지
종류가 '두음'일 경우 두음 법칙으로 인해 중복된 한자이다. 이 경우 호환용 한자를 입력하지 않으려면 두음 법칙이 적용되지 않은 본래의 독음으로 변환하면 된다. 종류가 '일반'이라면 그냥 외워야 한다(…).
아래 문단의 내용은 KS X 1001(완성형)에 중복 배당된 한자 목록이다.
4.1 두 번 중복
왠지는 알 수 없지만, 아래아 한글의 경우 2007까지만 해도 串, 金, 復, 不의 매핑이 반대로 되어 있었다.[8] 유니코드 표준 매핑은 아래 표에 나온 그대로이다.
통합 한자 | 호환 한자 | 종류 |
賈 8CC8 가 | 賈 F903 고 | 일반 |
降 964D 강 | 降 FA09 항 | 일반 |
見 898B 견 | 見 FA0A 현 | 일반 |
更 66F4 경 | 更 F901 갱 | 일반 |
契 5951 계 | 契 F909 글 | 일반 |
串 4E32 곶 | 串 F905 관 | 일반 |
廓 5ED3 곽 | 廓 FA0B 확 | 일반 |
句 53E5 구 | 句 F906 귀 | 일반 |
豈 8C48 기 | 豈 F900 개 | 일반 |
金 91D1 김 | 金 F90A 금 | 일반 |
拏 62CF 나 | 拏 F95B 라 | 일반 |
諾 8AFE 낙 | 諾 F95D 락 | 일반 |
奈 5948 내 | 奈 F90C 나 | 일반 |
女 5973 녀 | 女 F981 여 | 두음 |
年 5E74 년 | 年 F98E 연 | 두음 |
撚 649A 년 | 撚 F991 연 | 두음 |
秊 79CA 년 | 秊 F995 연 | 두음 |
念 5FF5 념 | 念 F9A3 염 | 두음 |
捻 637B 념 | 捻 F9A4 염 | 두음 |
怒 6012 노 | 怒 F960 로 | 일반 |
尿 5C3F 뇨 | 尿 F9BD 요 | 두음 |
杻 677B 뉴 | 杻 F9C8 유 | 두음 |
紐 7D10 뉴 | 紐 F9CF 유 | 두음 |
泥 6CE5 니 | 泥 F9E3 이 | 두음 |
匿 533F 닉 | 匿 F9EB 익 | 두음 |
溺 6EBA 닉 | 溺 F9EC 익 | 두음 |
茶 8336 다 | 茶 F9FE 차 | 일반 |
丹 4E39 단 | 丹 F95E 란 | 일반 |
糖 7CD6 당 | 糖 FA03 탕 | 일반 |
宅 5B85 댁 | 宅 FA04 택 | 일반 |
度 5EA6 도 | 度 FA01 탁 | 일반 |
讀 8B80 독 | 讀 F95A 두 | 일반 |
洞 6D1E 동 | 洞 FA05 통 | 일반 |
喇 5587 라 | 喇 F90B 나 | 두음 |
懶 61F6 라 | 懶 F90D 나 | 두음 |
癩 7669 라 | 癩 F90E 나 | 두음 |
羅 7F85 라 | 羅 F90F 나 | 두음 |
蘿 863F 라 | 蘿 F910 나 | 두음 |
螺 87BA 라 | 螺 F911 나 | 두음 |
裸 88F8 라 | 裸 F912 나 | 두음 |
邏 908F 라 | 邏 F913 나 | 두음 |
洛 6D1B 락 | 洛 F915 낙 | 두음 |
烙 70D9 락 | 烙 F916 낙 | 두음 |
珞 73DE 락 | 珞 F917 낙 | 두음 |
落 843D 락 | 落 F918 낙 | 두음 |
酪 916A 락 | 酪 F919 낙 | 두음 |
駱 99F1 락 | 駱 F91A 낙 | 두음 |
亂 4E82 란 | 亂 F91B 난 | 두음 |
卵 5375 란 | 卵 F91C 난 | 두음 |
欄 6B04 란 | 欄 F91D 난 | 두음 |
爛 721B 란 | 爛 F91E 난 | 두음 |
蘭 862D 란 | 蘭 F91F 난 | 두음 |
鸞 9E1E 란 | 鸞 F920 난 | 두음 |
嵐 5D50 람 | 嵐 F921 남 | 두음 |
濫 6FEB 람 | 濫 F922 남 | 두음 |
藍 85CD 람 | 藍 F923 남 | 두음 |
襤 8964 람 | 襤 F924 남 | 두음 |
拉 62C9 랍 | 拉 F925 납 | 두음 |
臘 81D8 랍 | 臘 F926 납 | 두음 |
蠟 881F 랍 | 蠟 F927 납 | 두음 |
廊 5ECA 랑 | 廊 F928 낭 | 두음 |
朗 6717 랑 | 朗 F929 낭 | 두음 |
浪 6D6A 랑 | 浪 F92A 낭 | 두음 |
狼 72FC 랑 | 狼 F92B 낭 | 두음 |
郞 90DE 랑 | 郎 F92C 낭[9] | 두음 |
來 4F86 래 | 來 F92D 내 | 두음 |
冷 51B7 랭 | 冷 F92E 냉 | 두음 |
掠 63A0 략 | 掠 F975 약 | 두음 |
略 7565 략 | 略 F976 약 | 두음 |
亮 4EAE 량 | 亮 F977 양 | 두음 |
兩 5169 량 | 兩 F978 양 | 두음 |
凉 51C9 량 | 凉 F979 양 | 두음 |
梁 6881 량 | 梁 F97A 양 | 두음 |
糧 7CE7 량 | 糧 F97B 양 | 두음 |
良 826F 량 | 良 F97C 양 | 두음 |
諒 8AD2 량 | 諒 F97D 양 | 두음 |
量 91CF 량 | 量 F97E 양 | 두음 |
勵 52F5 려 | 勵 F97F 여 | 두음 |
呂 5442 려 | 呂 F980 여 | 두음 |
廬 5EEC 려 | 廬 F982 여 | 두음 |
旅 65C5 려 | 旅 F983 여 | 두음 |
濾 6FFE 려 | 濾 F984 여 | 두음 |
礪 792A 려 | 礪 F985 여 | 두음 |
閭 95AD 려 | 閭 F986 여 | 두음 |
驪 9A6A 려 | 驪 F987 여 | 두음 |
麗 9E97 려 | 麗 F988 여 | 두음 |
黎 9ECE 려 | 黎 F989 여 | 두음 |
力 529B 력 | 力 F98A 역 | 두음 |
曆 66C6 력 | 曆 F98B 역 | 두음 |
歷 6B77 력 | 歷 F98C 역 | 두음 |
轢 8F62 력 | 轢 F98D 역 | 두음 |
憐 6190 련 | 憐 F98F 연 | 두음 |
戀 6200 련 | 戀 F990 연 | 두음 |
漣 6F23 련 | 漣 F992 연 | 두음 |
煉 7149 련 | 煉 F993 연 | 두음 |
璉 7489 련 | 璉 F994 연 | 두음 |
練 7DF4 련 | 練 F996 연 | 두음 |
聯 806F 련 | 聯 F997 연 | 두음 |
蓮 84EE 련 | 蓮 F999 연 | 두음 |
輦 8F26 련 | 輦 F998 연 | 두음 |
連 9023 련 | 連 F99A 연 | 두음 |
鍊 934A 련 | 鍊 F99B 연 | 두음 |
列 5217 렬 | 列 F99C 열 | 두음 |
劣 52A3 렬 | 劣 F99D 열 | 두음 |
烈 70C8 렬 | 烈 F99F 열 | 두음 |
裂 88C2 렬 | 裂 F9A0 열 | 두음 |
廉 5EC9 렴 | 廉 F9A2 염 | 두음 |
殮 6BAE 렴 | 殮 F9A5 염 | 두음 |
簾 7C3E 렴 | 簾 F9A6 염 | 두음 |
獵 7375 렵 | 獵 F9A7 엽 | 두음 |
令 4EE4 령 | 令 F9A8 영 | 두음 |
囹 56F9 령 | 囹 F9A9 영 | 두음 |
嶺 5DBA 령 | 嶺 F9AB 영 | 두음 |
怜 601C 령 | 怜 F9AC 영 | 두음 |
玲 73B2 령 | 玲 F9AD 영 | 두음 |
羚 7F9A 령 | 羚 F9AF 영 | 두음 |
聆 8046 령 | 聆 F9B0 영 | 두음 |
鈴 9234 령 | 鈴 F9B1 영 | 두음 |
零 96F6 령 | 零 F9B2 영 | 두음 |
靈 9748 령 | 靈 F9B3 영 | 두음 |
領 9818 령 | 領 F9B4 영 | 두음 |
例 4F8B 례 | 例 F9B5 예 | 두음 |
禮 79AE 례 | 禮 F9B6 예 | 두음 |
醴 91B4 례 | 醴 F9B7 예 | 두음 |
隷 96B7 례 | 隸 F9B8 예[10] | 두음 |
勞 52DE 로 | 勞 F92F 노 | 두음 |
擄 64C4 로 | 擄 F930 노 | 두음 |
櫓 6AD3 로 | 櫓 F931 노 | 두음 |
爐 7210 로 | 爐 F932 노 | 두음 |
盧 76E7 로 | 盧 F933 노 | 두음 |
老 8001 로 | 老 F934 노 | 두음 |
蘆 8606 로 | 蘆 F935 노 | 두음 |
虜 865C 로 | 虜 F936 노 | 두음 |
路 8DEF 로 | 路 F937 노 | 두음 |
露 9732 로 | 露 F938 노 | 두음 |
魯 9B6F 로 | 魯 F939 노 | 두음 |
鷺 9DFA 로 | 鷺 F93A 노 | 두음 |
碌 788C 록 | 碌 F93B 녹 | 두음 |
祿 797F 록 | 祿 F93C 녹 | 두음 |
綠 7DA0 록 | 綠 F93D 녹 | 두음 |
菉 83C9 록 | 菉 F93E 녹 | 두음 |
錄 9304 록 | 錄 F93F 녹 | 두음 |
鹿 9E7F 록 | 鹿 F940 녹 | 두음 |
論 8AD6 론 | 論 F941 논 | 두음 |
壟 58DF 롱 | 壟 F942 농 | 두음 |
弄 5F04 롱 | 弄 F943 농 | 두음 |
籠 7C60 롱 | 籠 F944 농 | 두음 |
聾 807E 롱 | 聾 F945 농 | 두음 |
牢 7262 뢰 | 牢 F946 뇌 | 두음 |
磊 78CA 뢰 | 磊 F947 뇌 | 두음 |
賂 8CC2 뢰 | 賂 F948 뇌 | 두음 |
雷 96F7 뢰 | 雷 F949 뇌 | 두음 |
了 4E86 료 | 了 F9BA 요 | 두음 |
僚 50DA 료 | 僚 F9BB 요 | 두음 |
寮 5BEE 료 | 寮 F9BC 요 | 두음 |
料 6599 료 | 料 F9BE 요 | 두음 |
燎 71CE 료 | 燎 F9C0 요 | 두음 |
療 7642 료 | 療 F9C1 요 | 두음 |
蓼 84FC 료 | 蓼 F9C2 요 | 두음 |
遼 907C 료 | 遼 F9C3 요 | 두음 |
龍 9F8D 룡 | 龍 F9C4 용 | 두음 |
壘 58D8 루 | 壘 F94A 누 | 두음 |
屢 5C62 루 | 屢 F94B 누 | 두음 |
樓 6A13 루 | 樓 F94C 누 | 두음 |
淚 6DDA 루 | 淚 F94D 누 | 두음 |
漏 6F0F 루 | 漏 F94E 누 | 두음 |
累 7D2F 루 | 累 F94F 누 | 두음 |
縷 7E37 루 | 縷 F950 누 | 두음 |
陋 964B 루 | 陋 F951 누 | 두음 |
劉 5289 류 | 劉 F9C7 유 | 두음 |
柳 67F3 류 | 柳 F9C9 유 | 두음 |
流 6D41 류 | 流 F9CA 유 | 두음 |
溜 6E9C 류 | 溜 F9CB 유 | 두음 |
琉 7409 류 | 琉 F9CC 유 | 두음 |
留 7559 류 | 留 F9CD 유 | 두음 |
硫 786B 류 | 硫 F9CE 유 | 두음 |
類 985E 류 | 類 F9D0 유 | 두음 |
六 516D 륙 | 六 F9D1 육 | 두음 |
戮 622E 륙 | 戮 F9D2 육 | 두음 |
陸 9678 륙 | 陸 F9D3 육 | 두음 |
倫 502B 륜 | 倫 F9D4 윤 | 두음 |
崙 5D19 륜 | 崙 F9D5 윤 | 두음 |
淪 6DEA 륜 | 淪 F9D6 윤 | 두음 |
輪 8F2A 륜 | 輪 F9D7 윤 | 두음 |
律 5F8B 률 | 律 F9D8 율 | 두음 |
慄 6144 률 | 慄 F9D9 율 | 두음 |
栗 6817 률 | 栗 F9DA 율 | 두음 |
隆 9686 륭 | 隆 F9DC 융 | 두음 |
勒 52D2 륵 | 勒 F952 늑 | 두음 |
肋 808B 륵 | 肋 F953 늑 | 두음 |
凜 51DC 름 | 凜 F954 늠 | 두음 |
凌 51CC 릉 | 凌 F955 능 | 두음 |
稜 7A1C 릉 | 稜 F956 능 | 두음 |
綾 7DBE 릉 | 綾 F957 능 | 두음 |
菱 83F1 릉 | 菱 F958 능 | 두음 |
陵 9675 릉 | 陵 F959 능 | 두음 |
利 5229 리 | 利 F9DD 이 | 두음 |
吏 540F 리 | 吏 F9DE 이 | 두음 |
履 5C65 리 | 履 F9DF 이 | 두음 |
李 674E 리 | 李 F9E1 이 | 두음 |
梨 68A8 리 | 梨 F9E2 이 | 두음 |
理 7406 리 | 理 F9E4 이 | 두음 |
痢 75E2 리 | 痢 F9E5 이 | 두음 |
罹 7F79 리 | 罹 F9E6 이 | 두음 |
裏 88CF 리 | 裏 F9E7 이 | 두음 |
裡 88E1 리 | 裡 F9E8 이 | 두음 |
里 91CC 리 | 里 F9E9 이 | 두음 |
離 96E2 리 | 離 F9EA 이 | 두음 |
吝 541D 린 | 吝 F9ED 인 | 두음 |
燐 71D0 린 | 燐 F9EE 인 | 두음 |
璘 7498 린 | 璘 F9EF 인 | 두음 |
藺 85FA 린 | 藺 F9F0 인 | 두음 |
隣 96A3 린 | 隣 F9F1 인 | 두음 |
鱗 9C57 린 | 鱗 F9F2 인 | 두음 |
麟 9E9F 린 | 麟 F9F3 인 | 두음 |
林 6797 림 | 林 F9F4 임 | 두음 |
淋 6DCB 림 | 淋 F9F5 임 | 두음 |
臨 81E8 림 | 臨 F9F6 임 | 두음 |
立 7ACB 립 | 立 F9F7 입 | 두음 |
笠 7B20 립 | 笠 F9F8 입 | 두음 |
粒 7C92 립 | 粒 F9F9 입 | 두음 |
磻 78FB 반 | 磻 F964 번 | 일반 |
復 5FA9 복 | 復 F966 부 | 일반 |
輻 8F3B 복 | 輻 FA07 폭 | 일반 |
不 4E0D 부 | 不 F967 불 | 일반 |
北 5317 북 | 北 F963 배 | 일반 |
殺 6BBA 살 | 殺 F970 쇄 | 일반 |
狀 72C0 상 | 狀 F9FA 장 | 일반 |
塞 585E 새 | 塞 F96C 색 | 일반 |
索 7D22 색 | 索 F96A 삭 | 일반 |
省 7701 성 | 省 F96D 생 | 일반 |
數 6578 수 | 數 F969 삭 | 일반 |
拾 62FE 습 | 拾 F973 십 | 일반 |
識 8B58 식 | 識 F9FC 지 | 일반 |
什 4EC0 십 | 什 F9FD 집 | 일반 |
惡 60E1 악 | 惡 F9B9 오 | 일반 |
若 82E5 약 | 若 F974 야 | 일반 |
易 6613 역 | 易 F9E0 이 | 일반 |
葉 8449 엽 | 葉 F96E 섭 | 일반 |
阮 962E 완 | 阮 F9C6 원 | 일반 |
異 7570 이 | 異 F962 리 | 일반 |
咽 54BD 인 | 咽 F99E 열 | 일반 |
刺 523A 자 | 刺 F9FF 척 | 일반 |
炙 7099 자 | 炙 F9FB 적 | 일반 |
切 5207 절 | 切 FA00 체 | 일반 |
辰 8FB0 진 | 辰 F971 신 | 일반 |
車 8ECA 차 | 車 F902 거 | 일반 |
參 53C3 참 | 參 F96B 삼 | 일반 |
拓 62D3 척 | 拓 FA02 탁 | 일반 |
沈 6C88 침 | 沈 F972 심 | 일반 |
便 4FBF 편 | 便 F965 변 | 일반 |
暴 66B4 폭 | 暴 FA06 포 | 일반 |
泌 6CCC 필 | 泌 F968 비 | 일반 |
行 884C 행 | 行 FA08 항 | 일반 |
瑩 7469 형 | 瑩 F9AE 영 | 일반 |
滑 6ED1 활 | 滑 F904 골 | 일반 |
暈 6688 훈 | 暈 F9C5 운 | 일반 |
4.2 세 번 중복
통합 한자 | 호환 한자 1 | 호환 한자 2 | 종류 1 | 종류 2 |
龜 9F9C 구 | 龜 F907 귀 | 龜 F908 균 | 일반 | 일반 |
寧 5BE7 녕 | 寧 F95F 령 | 寧 F9AA 영 | 일반 | 두음 |
說 8AAA 설[11] | 說 F96F 세 | 說 F9A1 열 | 일반 | 일반 |
率 7387 솔 | 率 F961 률 | 率 F9DB 율 | 일반 | 두음 |
4.3 네 번 중복
통합 한자 | 호환 한자 1 | 호환 한자 2 | 호환 한자 3 | 종류 1 | 종류 2 | 종류 3 |
樂 6A02 악 | 樂 F914 낙 | 樂 F95C 락 | 樂 F9BF 요 | 두음 | 일반 | 일반 |
- ↑ 똑같은 문자를 의도적으로 여러 개 배당하면 정보 처리에 혼란만 주기 때문에 충분히 병크라고 할 수 있다.
- ↑ 다만 대만의 Big5 문자 집합에는 한자 두 글자가 두 번씩 배당돼 있는데(兀: 0xA461, 0xC94A / 嗀: 0xDCD1, 0xDDFC), 이는 한국의 완성형과는 달리 의도적으로 중복 배당한 것이 아니라 문자 집합을 만드는 과정에서 생긴 실수이다. 저 두 글자의 경우, Big5 문자 집합에서 코드가 앞쪽인 것(0xA461, 0xDCD1)은 통합 한자에 들어갔고(兀: U+5140, 嗀: U+55C0) 코드가 뒤쪽인 것(0xC94A, 0xDDFC)은 호환용 한자(兀: U+FA0C, 嗀: U+FA0D)에 들어갔다.
- ↑ 유니코드의 A(U+0041, 라틴 문자 대문자 에이), Α(U+0391, 그리스 문자 대문자 알파), А(U+0410, 키릴 문자 대문자 아)와 같은 경우는 속하는 문자 체계가 다르고 개별 문자 자체가 다른 문자이기 때문에 별도의 글자로 배당된 것이고(가짜동족어와 비슷하다고 보면 된다), 같은 문자 체계의 같은 문자가 중복 배당된 것이 아니다. 한글 자모 ㅁ(미음)과 한자 口(입 구)가 다른 문자이고 둘에 별도의 코드가 주어진 것과 같다.
- ↑ 전라남도 강진군에 있는 면.
- ↑ 북한 황해남도의 행정구역.
- ↑ 異→리는 '지리산'에, 寧→령은 '무령왕', '의령군' 등에 쓰인다.
- ↑ 물론 일본어나 중국어를 한국어 IME로 입력하는 것 자체가 권장되지는 않는다.
- ↑ 한/글 2010에서는 저 네 글자의 매핑이 유니코드 표준 매핑대로 고쳐졌다. 그래서 한/글 2010부터는 저 네 글자를 한글로 바꾸고자 할 경우 어떻게 바꿀지를 묻는다. 한/글 2007 이하 버전으로 작성된 글과의 호환성 또는 한/글 외의 환경에서 작성된 글과의 호환성을 위해서인 듯하다.
- ↑ 유니코드에는 이 U+F92C 郎의 매핑이 올바른 U+90DE 郞가 아니라 U+90CE 郎로 잘못되어 있다. 이 매핑은 고칠 수 없기 때문에, U+FA2E 郞에 이 글자가 올바른 매핑(U+90DE 郞)으로 다시 배당되었다.
- ↑ 유니코드에는 이 U+F9B8 隸의 매핑이 올바른 U+96B7 隷이 아니라 U+96B8 隸로 잘못되어 있다. 이 매핑은 고칠 수 없기 때문에, U+FA2F 隷에 이 글자가 올바른 매핑(U+96B7 隷)으로 다시 배당되었다.
- ↑ 신자체를 위한 説(U+8AAC)이 따로 배당되어 있는데, 稅(U+7A05)도 마찬가지로 신자체를 위한 税(U+7A0E)가 따로 배당되어 있다. 그런데 사실 같은 글자들이다. 이보다 훨씬 더 엉망(?)인 益, 溢이 하나의 코드를 쓰는데도 말이다. 특히 益은 이들과 거꾸로 되어 있다. 통합 한자인 益(U+76CA)이 신자체로 활용되는 반면 호환용 한자에 있는 益(U+FA17)은 구자체로 되어 있다.