유령 문자

幽霊文字 (ゆうれいもじ)

1 소개

일본컴퓨터 환경에서 입력할 수 있는 한자 중에 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 한자들. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다. 어?

2 역사

일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였다.

그런데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되고 만다. 이는 한자에 대한 지식이 부족한 작업자가 착각을 하였거나 미세한 획을 잘못 입력하는 등, 전산화 작업에서의 사소한 오류로 인해 발생하였다고 여겨진다.

이 문제가 부상하면서 일본 국립 국어 연구소의 사사하라 히로유키 등이 조사를 시작하여, 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.

1997년의 JIS 한자 개정의 일환으로, 사사하라 히로유키를 비롯한 연구진이 유령 문자에 대한 조사를 벌였다. 그러나 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수가 없었다.[1]
일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데, 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯이 착오로 만들어진 진짜(...) 유령 문자는 총 8자로[2] 문자 집합을 함부로 건드릴 정도로 심각하진 않다.

3 수와 종류

1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었다. 지명·인명용 한자로 국자가 쓰이는건 한국에서도 乭이나 乷 등이 쓰이는 등 한자 문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다. 최초로 연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.

이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고, 열두 자를 제외하고는 대부분 그 출처가 확인되면서 유령한자가 아님이 드러났다. 대표적으로 이 과정에서 밝혀진 글자들은 다음과 같다.

과거 혹은 현재에도 지명·인명으로 사용되는 한자로 밝혀진 경우
すくも라고 읽는 지명용 국자임이 확인되었다. 여전히 히로시마에는 糘地(すくもち)라는 지명이 있고, 오카야마현에는 糘山(すくもやま)라는 산이 있다.
ゆき라고 읽는 지명용 국자임이 확인되었다. 과거 쿠마모토현 미나마타시에 膤割(ゆきわり)라는 지역이 있었다.
うるち라고 읽는 지명용 국자임이 확인되었다. 과거 후쿠시마에 粫田(うるちだ)라는 지명이 있었다. 현재는 糯田(もちだ)로 변경되었다.
ほう라고 읽는 지명용 국자임이 확인되었다. 아이치현에 垉六(ほうろく)라는 지역이 있다.[3]
이 글자의 경우 일본에서 やま라고 읽는 지명용 한자임이 확인되었다. 교토에 広岾(ひろやま)라는 지명이 존재하며, 또한 이 글자는 한국에서도 비슷한 의미로 사용되는데, 옥편에는 '땅이름 점[4], 고개 재' 2가지로 등록되어 있다.
だる라고 읽는 지명용 국자로 확인되었다. 시즈오카현 시즈오카시 아오이구에 石橸(いしだる)라는 지역이 있는 것이 확인되었다.
ぬだ라고 읽는 지명용 국자로 확인되었다. 야마나시현에 大垈(おおぬだ), 藤垈(ふじぬだ)라는 지명이 있다. 한국 옥편에는 '터 대' 로 등록되어 있으며, 일본에 비해 많이 쓰인다.[5]
ぬた라는 지명에 쓰이던 메이지대 지명에 사용되었다. 고치현에 汢の川라는지명에 사용되었는데, 현대에는 삼수변이 이수변으로 바뀐 또 다른 국자를 사용중이다. 그런데, 이 冫土는 반대로 JIS에 없다. 뭐하는 지거리야[6] 한국 옥편에는 '물 이름 토' 자로 등록되어 있다.
せき,ひろ라고 읽는 인명용 한자로 확인. 碩의 이체자로, 실제로 현대에도 이 한자를 쓰는 사람이 현존함이 확인되었다.[7][8]
ぬか라고 읽는 지명용 한자로 확인. 아키타현에 粐蒔沢(ぬかまきざわ)라는 지역이 존재한다.
어디서 나온 오자(誤字)인지 명백하게 밝혀진 경우.
오키나와의 榕原(ようばる)의 榕가 잘못 전사된 것으로 확인. 두 글자의 변을 보면 벼 화(禾)와 나무 목(木)은 딱 한 획 차이라서 다른 한자의 구성요소로 쓰일 경우 혼동하기 쉽다.

그러나 조사 후에도 열두 자는 출처가 밝혀지지 않았었다. 이러한 글자들은 강희자전 등 주요 자전에 실려있지 않는 등 출처를 파악할 수 없으며, 어디에서 쓰이는지조차 알려져 있지 않고 어떻게 읽어야 하는지도 알 수가 없었다.

墸 壥 妛 彁 挧 暃 椢 槞 蟐 袮 閠 駲

추가 연구를 통해, 이 열두 자 중에서도 열한 자는 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데, 연구 결과는 다음과 같았다.

출전 불명. 堵의 오자(誤字)로 추정됨.
㕓의 부수를 쉽게 찾을 수 없자 土변을 넣은 글자.
그런데 몽구집주(蒙求集注)[9]라는 책에 밭을 세는 단위를 나타내는 글자로 쓰인 것이 확인되었다. 여기에서 Ctrl+F로 壥을 찿을수 있다.
𡚴(山+女)의 오자로 추정. 𡚴(山+女)는 あけび라고 읽는 일본 국자인데, 한 책에서 이를 妛로 잘못표기한 것이 유래로 확인되었다.[10]
국토지리협회 국토행정총람지에서 등장한 글자로, 栩의 오자.
국토지리협회 국토행정총람지에서 皐、星、早、毘、昆、犀、韮、晃、昌、昇등의 오자로 사용됨.[11]
도쿠시마현 나루토시에 椢原(くにはら), 이바라키현에도 해당글자를 쓰는 椢内(くぬぎうち)라는 지역이 있다. 따라서 지명용 국자.[12]
櫳의 약자로 확인.
인명에 쓰였던 한자로 확인.
돗토리 현의 祢宜라는 지명의 示변이 衣변으로 착각된 한자.[13]
일본에 전해진 광운상에 통자관계로 설명되어. 閏의 속자.[14]
인명용 한자. 음독은 シュウ로 확인됨.

4 최후의 유령 한자

소위 '유령 한자'로 불렸던 글자들은 거의 다 그 출처가 밝혀졌다. 대부분 일본에서 지명/인명용으로 사용하는 국자거나, 일본 밖에서 쓰이는 글자거나, 오자라고 해도 어디서 생긴 오자인지 출처가 확실해진 것이다. 그러나 유독 라는 글자는 그 단서조차도 발견되지 않았다. 訶(꾸짖을 가) 등의 초서체를 옮기다가 획을 틀린 것이 아닌가 추정할 뿐. 일본어 워드프로세서 등에서는 일단 입력은 할 수 있도록 한자 제자 원리에 따라 임의로 음독을 배당해 놓았다.
  1. 심지어 한국에서도 이미 유령 문자가 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다.
  2. 穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁
  3. 한국 옥편에는 '캘 포' 자로 등록되어 있다.
  4. 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다.
  5. 낙성대(落星垈)가 이 글자가 들어가는 대표적인 지명이다.
  6. JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(冫土)는 인터넷 상의 문자에 없다는 것이다.
  7. 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많다. 각 집안 족보에 들여다보면 제법 찾을 수 있을 정도. 하지만, 후대 연구등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만드는 경우가 된다.
  8. 한국 한자음으로는 어째선지 이 아닌 으로 등록되어 있다. 이체자가 아닌 형성자 원리에 따라 石+貞으로 보아 으로 임의로 붙인 듯 하다.
  9. 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책.
  10. 한국 옥편에는 '더러울 치' 자로 등록되어 있는데 보통 '치'자는 위에 山이 아니라 屮의 형태이다. 하지만 山으로 나온 문헌도 있긴 하다. 링크 참조
  11. 한국 옥편에는 '떠날 비' 자로 등록되어 있다.
  12. 한국 옥편에는 '광주리 밑바닥 귀','광주리 괴' 자로 등록되어 있다. 옥편에 따라서는 槶를 올린 다음 椢를 槶의 약자로 풀이하였을 것이다.
  13. 示가 변으로 쓰일 때는 가타카나 ネ와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 한편, 한국 옥편에는 '꿰맬 치' 자로 등록되어 있으며, 참고로 祢는 '아비 사당 녜/니' 자로 등록되어 있다.
  14. 한국 측에서도 같은 용례로 쓰인다. 옥편에도 당연하다는 듯 '윤달 윤' 으로 등록되어 있다.