HWP

1 개요

한글과컴퓨터의 워드프로세서 프로그램인 한컴오피스 한글에서 사용하는 파일 형식이다.

2 논란 및 문제

2.1 HWP는 한글과컴퓨터에서 개발한 문서 포맷일까?

요약을 하자면 그렇다.

하나워드프로세서의 파일 형식을 그대로 지원했다는 말이 있지만, 애초에 하나워드프로세서는 완성형이었고 한/글은 조합형이라 한글코드부터 안맞다. 확장자만 이니셜이 같다보니 같은것 뿐이지 둘의 호환성은 0였고 컨버터도 그런거 없다였다. 적어도 하나워드프로세서가 쓰이던 시절엔. 2.0 들어서 지원한다.

사족으로 하나워드프로세서는 같이 나온 계열 프로그램인 하나스프레드시트와 함께 당시 금성전자에서 만든 행정망표준 워드프로세서. 행정망표준이니 당연히 완성형이고, 완성형한글을 DOS에서 별도 실행한 한글 에뮬레이터에 의존하는 방식이었다. 대신 그렇다보니 5.25인치 CD 1장에 다 커버되는 초미니 용량이었고 당시 한/글에 비해 강점이 하나 있다면 페이지를 넘길 때마다 편집 페이지를 새로 로드하는 디스크 스와핑과 비슷한 방식이라 편집 가능 용량이 한/글 1.x의 몇배에 달했다. 워드프로세서 시험 극초기에 검정용으로 채택되기도 했지만 이후 DOS에서 윈도우로의 이전, 한/글의 워드프로세서 시험 검정용 채택, 이용 사업체 및 유저 증가 등의 틈바구니 속에서 사라지게 됐다. 행망표준, 초기 워드시험 수검용이란 점 빼면 기존 보석글 같은 텍스트 기반 워드프로세서나 큰 차이가 없고 키디스크 복제방지까지 걸려서 많이 안퍼졌다 보니 잘 알거나 써본 사람은 한/글에 비하면 드문 편.

2.2 한국에서의 갈라파고스화

사기업에서 독자적으로 제정하기는 하였지만 그 포맷이나 구현이 훨씬 옛날에 모두 공개 리버싱돼서 다양한 읽기나 편집 솔루션이 나와 있는 MS워드의 포맷(DOC, DOCX)과는 달리, HWP는 그야말로 한국에서만 쓰이는 클로즈드 소스 포맷이다. 따라서 이것으로 작성한 HWP 형태의 문서를 외국 사람한테 보내는 일은 없도록 하자. 한/글 내에서도 DOC(MS워드 문서) 형태로 저장 가능하다. 최신 버전들은 PDF로도 출력이 가능하니 이것을 쓸 수도 있다.[1] 더불어 2010부터는 DOC 말고도 DOCX도 지원하며 리브레오피스/오픈오피스에서 사용하는 ODT로도 저장할 수 있다.
워낙 자연스럽게 쓰이는 프로그램이다 보니까 HWP를 외국에 있는 사람들한테 보내는 병크를 저지른 이야기가 수십수백개가 넘는다. 해외취업할 때 이력서나 해외대학 지원할때 원서 등을 HWP로 보낸 것은 애교 수준이고(당연히 읽을 수가 없으니 그 뒤는 더 이상의 자세한 설명은 생략한다.), 해외 바이어들한테 제품 소개서를 HWP로 보내서 해외 바이어가 무슨 일인가 하고 직접 한국 회사에 전화를 했다는 이야기도 있다.

  • 일단 KS규격으로 지정되지 않았음[2]에도 불구하고 다른 것보다 정부가 상용 프로그램 전용인 이 문서 포맷을 사실상 표준(de facto standard)처럼 취급해서 까인다. 지방자치단체등에서 전자문서등을 생성하거나 결재등을 올릴때 사용하는 ActiveX 편집기가 한/글 기반이다. 국민은 정부의 행정 상황을 알 수 있고 이에 관여할 수 있어야 하는데, 상용 프로그램인 한/글을 사야 HWP를 읽을 수 있다. [3]

2007년 8월에 국가 표준이 오픈도큐먼트(KS X ISO IEC 26300 오픈도큐먼트양식)으로 바뀌었으나, 여전히 모든 정부기관은 아래아 한글로 각종 문서 등을 공개한다. 게다가 정부양식을 뷰어로 열어서 출력하면 "이 문서는 한글뷰어로 출력한..." 이딴 글이 문서 아랫쪽에 찍혀나왔었다. 이부분은 2010년 현재 뷰어에서는 개선되었으나 뷰어 아랫쪽에 광고 배너는 여전히 뜨고 있다.

그러나 모든 공공기관의 문서가 HWP로만 제공되는 것은 아니며 PDF파일로 같이 제공하거나, 아예 PDF로만 제공하는 경우도 많다. 다만 HWP가 큰 비중을 차지하고 있는 것은 맞다.

  • 현재 포맷 공개와 표준화를 준비하고 있으며, 2010년 6월 30일 Hwp 포맷은 공개했으나 이 포맷을 사용하는 프로그램을 내놓기 전에 한글과 컴퓨터에 알려야 되며, 이로 인한 피해가 우려될시 꼭 한글과 컴퓨터에 알려야 된다는 독소조항이 들어가 있다. 그런데 2011년 2월 28일 hwp 공개문서에 따른 결과물을 기초로 한컴측에서 독점적, 배타적 권리를 취득하고, 이에 대해 법적 행사를 할땐 적극적으로 권리 행사를 할수 있으며, 결과물에 대한 저작권은 개인 혹은 단체에 있으나, 개발 결과물에 hwp 공개 문서를 참고하여 개발하였습니다란 문구를 삽입해야 된다고 개정되었다. 이로써 마음껏 만들어도 법적으로 아무런 문제가 없게 되었다. 즉 간단하게 이걸로 나 상대로 소송걸면 깝ㄴㄴ + 개발한후에 이걸로 개발했음!만 적어주면 라이선스 성립이 된다. 하지만 첫 공개 때의 병크덕분에 개발자들이 등을 돌렸다.
  • 포맷 공개 이전까지만 해도 HWP 파일을 읽어들일 수 있는 방법은 해당 컴퓨터에 한/글이 설치되어 있다는 조건 하에서만 가능했다. 이건 프로그램을 배포할 때 절대적인 장벽이다. 유저에게 '한글 까세요' 라고 요구할 수는 없는 일. 더군다나 그 방법도 한컴에서 라이브러리 같은 것을 제공해서 프로그램에 통합하는 게 아니라 OLE 객체를 통해서 통신하는 식의 빙 돌아가고 불편한 방식이었다. 덕분에 이러한 방법을 통해서 HWP 파일을 지원하는 프로그램은 거의 없었고, 네이버 같은 거대 회사들은 아예 한컴의 지원을 받는 호환 솔루션 업체와 계약해서 HWP 해석기를 사다 썼다. 포털등의 웹오피스 서비스에서 HWP가 열리는 건 그 때문.
  • 비공식적인 이야기지만, HWP 포맷의 구조는 긴 시간 동안 끊임없이 개량하고 기능을 덧붙이는 과정이 쌓여 극도로 복잡하고 까다로운 형태가 되어 있다고 한다. 한컴에서 쉽사리 포맷을 공개하려 하지 않았던 이유 중 하나가 여기에 있다는 이야기도 있다. 그래서 그런지 포맷이 공개된 지 1년 이상이 지나도록 해당 포맷을 이용해서 HWP 파일을 지원하는 프로그램 중 뭔가 쓸만한 게 나왔다는 소식이 들려오지 않는다.
  • 공개된 HWP 포맷을 이용해 리눅스용 HWP 파일 리더를 개발 시도하던 개발자의 말에 의하면 해당 공개된 자료는 불완전한 것으로, 공문서 등에 자주 사용되는 '배포판'을 읽기 위한 처리라든가 각 버전들 간의 차이 등의 기술이 누락되어 있다고 한다. 결국 현실적으로 완전한 기능을 하는 HWP 호환 리더를 만들 수 없는 공개라는 뜻. 개발자들이 이에 대해 항의했지만 '회사의 자원적 한계로[4] 공개자료를 보강할 계획이 없다'는 답변만 돌아왔다고.
  • 실제로 공개된 HWP 포맷 문서를 보고 개발을 조금이라도 진행해본 사람은 알겠지만 포맷 문서 자체가 정말 이해하기 어렵다. 각 바이너리 필드가 의미하는 바를 너무도 간략하게 기술했거나 심지어는 코드상의 변수명을 그대로 설명란에 채워넣는 듯한 느낌이 들 정도로 부실하다. 특히 레코드 길이는 포맷문서에 기입된 수와 실제 한/글에서 생성하는 바이트 수가 다른경우가 다반사고 심지어 포맷 문서 내의 내용 간에도 앞 뒤가 맞지 않는 경우가 상당 부분이다. 한 가지 분명한 건 공개된 포맷 문서만으로는 현재 출시 된 한/글을 기능적으로 대체하는 완벽한 뷰어나 리더는 만들 수 없다.
  • 홈페이지에서 다운받아서 설치하면 HWP 파일을 보거나 인쇄할 수 있는 한글 뷰어에 대한 라이센스 조항이 변경되었는데, 이게 또 문제가 되고 있다. 뷰어를 사용하는 모든 사업장에게 한글과 컴퓨터사측에게 해당 사업장의 뷰어 사용자 인적사항 현황을 서면으로 제출 후 허가를 받아야만 사용 할 수 있게 변경되었기 때문. 이것은 거의 모든 방식으로 배포되거나 사용하는 경우에까지 확장되도록 규약이 되어 있어 여기저기에서 대체 그걸 무슨 수로 다 파악해서 공문을 보내란 말이냐는 말이 나오고 있다. 한층 더 병크였던 것은 한컴에서 해당 게시글의 약관을 수정하면서 일자를 고치지 않아 졸지에 과거에 다운받아서 멀쩡히 쓰던 사람들이 엮여들어가는 소급조항이 되어버렸다. 이후 실수를 인정한 한컴측에서 날짜를 수정했지만 약관조항에 대한 논란은 여전한 상황이다.
  • 서체가 내장되지 않아서 해당 서체가 없는 시스템(특히 모바일)에서 레이아웃이 깨지는 문제를 내재하고 있다. 물론 비단 한/글만의 문제가 아니긴 하다. 배포용 문서 중 서체를 저장하는 것은 PDF가 거의 유일하다시피 하다.[5][6]
  • 상대적으로 덜 관심받는 부분이지만, 한컴오피스 한글에서 사용하는 '사용자 한자사전'의 포맷은 아예 공개 비슷한 것도 된 적이 없다. 즉, 한 번 한글에서 사용자 한자사전을 대량으로 가꾸어놓은 사람이라면 그 한자단어를 쓰기 위해서 계속 한글을 써야 한다는 것. 이것을 한컴오피스 외의 다른 환경에서 사용할 수도 없고, 사용자 한자사전을 응용한 한자단어 입력기(IME) 같은 것도 실현될 수 없다.

근데, 이제 이 독점도 최근들어 깨질 거 같다. Microsoft Office 2013부터 HWP읽기 및 편집을 지원한다. 컨버터 소개 다운로드 링크[7] 이 컨버팅 모듈을 이용하면 상식적으로 만들어진 문서의 컨버전은 상당히 훌륭한 수준으로 구현된다. 문제는 HWP를 써야 하는 이유인 정부 공문이고 이 공문이란 것들은 페이지 처음부터 끝까지를 표로 1픽셀 남김 없이 채워놓은 변태짓을 하는지라 좌우 문제는 그렇다 치더라도 페이지의 상하 구현을 1픽셀 오차 없이 컨버전한다는건 심지어 같은 오피스 버전 내에서도 무리다. 이를테면 같은 MS오피스라도 윈도우용과 맥용이 약간 다르게 보이는 경우가 생긴다던가 ODF 진영의 오피스라도 오픈/리브레/네오 오피스끼리도 같은 파일이 출력이 다른 경우가 생긴다. 이런 출력방식을 처음부터 전혀 고려하지 않는 자비심이 없는 문서 제작 방식이 HWP 공문서라는 것이다 보니 대체로 한 페이지짜리 공문서가 MS 워드에서 열면 페이지 하단이 다음 페이지로 넘어가버리는 일이 생긴다. 이렇게 되면 페이지 상하 간격을 줄이고 표 셀 간격을 줄이는 등 삽질이 이만저만이 아니게 된다.

그래서 ALZ/EGG에 반감을 가지고 있는 유저들이 많은 것과 같은 맥락으로 HWP를 싫어하는 유저들도 많다. 오죽하면 회사에서 내라는 서류를 hwp로 냈다가 채용시험에서 탈락된 케이스도 있다고 하니까[8][9] 남에게 보여줄 문서나 사기업에 보낼 공적인 문서는 어지간하면 PDF로 보내거나, 여의치 않으면 .doc로 저장하자.[10]
일부 사기업에서는 정부기관과 같이 일하지 않는 이상 아래아한글을 구입하지도 않는다. 대부분 오로지 MS 워드만 쓴다.[11]

간혹 hwp나 alz 등 한국에서 만들어진 포맷만 싫어한다며, 외국 것만이 제일인 사대주의를 들먹이는 사람들이 있는데, 정보 열람의 자유를 생각해 보면 문제가 있는 생각임을 알 수 있다. 이미 리버싱이던 규격공개던 될만큼 되서 대체물들이 잔뜩나온 MS office나 처음부터 공개된 zip등과는 달리 hwp나 alz는 규격공개나 리버싱등이 늦어 사용하려면 한글이나 알집을 필수적으로 설치해야한다.[12] docx나 odt, zip는 ISO에서 표준으로 등록돼 있기 때문에 hwp나 alz와는 달리, 단순히 외국 포멧이 아니고 국제 표준이기에 따로 할 말도 없고. 무엇보다 hwp나 alz는 한국에서만 쓰는 포멧이기에, 외국인들이 쓰기에는 매우 불편하다는것. how to open hwp file 그나마도 ALZ와 EGG는 외국에서 소소한 인기를 얻고 있는 반디집이라고는 대체재가 있는 것에 비해, HWP는 외국에선 열 수 있는 방법이 사실상 없다.

2.3 해명

  • 한컴 뷰어나, 최초 포맷 공개는 한컴의 병크가 맞다. 다만 2016년 현재는 굳이 한컴 뷰어를 쓰지 않아도 된다.[13]
  • HWP는 국가표준(KS)에 등록되어 있다. KS X 6101KSSN 검색결과이 그것이다. 분명 최초 한컴의 공개는 불완전 했지만, KS등록을 위해 포맷을 공개 하였고 위에서 소개한 MS오피스 변환 프로그램 뿐만 아니라, [네이버 오피스], 폴라리스 오피스, 구글 문서링크까지, 많은 프로그램들이 HWP파일을 읽어들이는 것도 이것을 이용한 것이다. HWP 포맷공개 이후 쓸만한 프로그램들이 없다고 했는데, 2016년 현재 많이 존재한다. 이제는 외국에서도 구글 문서를 통해 HWP 문서를 볼 수 있다.
  • 알집과의 비교는 HWP가 굉장히 억울하다. 애시당초 alz는 일부러 호환성을 안드로메다로 보낸것에 불과하지만, hwp는 90년대 초반 도스 시절부터 doc와 경쟁하던 포맷이다. 당시 신문을 보면 점유율 90% 이상으로 나와있다. 물론 이 때도 워드는 있었다. 그러나 불법복제때문에 돈은 별로 못 벌었다. 시장에서 doc가 이긴 것일뿐[14] 게다가 hwp 포맷이 처음 나왔던 시절에는 애초에 인터넷 같은 국제적인 규모의 네트워크 보급도 미약했고 우리나라에서만 쓰일 소프트웨어에 굳이 외국과의 호환성을 신경쓸 이유도 없었다. 덧붙여 pdf나 zip 같은 표준포맷도 원래는 자체적으로 사용했던 독자 포맷이 시장 점유율이 크게 높아진 상태에서 포맷을 공개했기 때문에 표준이 된 것이다. 이런 측면에서 보자면 일부러 독자적인 폐쇄 포맷을 채용하여 점유율을 높이려는 의도룰 지닌 alz 포맷과 비교하기는 어렵다. 그리고 이 [한컴오피스 한글] 문서 처음에 나와있듯이 똑같은 문서 편집 프로그램이지만, 목표자체가 다르기 때문에 완벽한 호환은 불가능하다. 당장 NEO버전에 포함되어있는 DOC호환 프로그램인 한워드를 써보면 알겠지만 기존 한글의 장점인 미세한 편집기능 따위는 없다. 그리고 DOC역시 HWP 급으로 공개를 미루고 불완전하게 공개했다. 다만 시장점유율이 높아 뜯으려 달려든 사람들이 압도적으로 많았을 뿐.
  • 사실, 한글의 기능들은 준 [DTP]에 가깝고, 이를 활용해서 만든 공문서들을 [워드]로 바꾸라고 하는건 국가기관의 모든 문서 양식을 바꾸라는 말밖에 되지 않는다. 그리고 사실, 워드던 한글이던 그대로 공개하는것은 틀이 완벽하게 호환되지 않기 때문에[15] 틀이 망가지면 안되는 공문서를 HWP나 DOC로 공개하는 것보다, PDF로 공개를 해야 한다. 공무원의 무지일 뿐.- 꼬우면 입찰하지 말던가의 마인드로 국가기관이 갑질하는 나라장터는 제외하자. -
이 문서의 내용 중 전체 또는 일부는 한컴오피스 한글 문서의 570판, 6번 문단에서 가져왔습니다. 한글&action=history 이전 역사 보러 가기
이 문서의 내용 중 전체 또는 일부는 한컴오피스 한글문서에서 가져왔습니다.</div></div>
  1. 예전 버전들의 경우는 Adobe Acrobat제품과 함께 한글 PDF Converter라는 프로그램을 판매했었다. 문제는 이 방법도 그렇고 최신 버전의 자체 변환 기능도 그렇고 Adobe Reader나 Acrobat 9버전 이후에는 호환성에 좀 문제가 있다. 시기상으로 볼때 PDF파일이 ISO표준으로 지정되면서 규격에 더 엄격해져서 그런게 아닌가 싶다.
  2. 진짜 국가표준으로 지정되려면 포맷이 공개되어야 한다. 그래서 법률상 표준(de jure standard)이 아니다.
  3. 1990년대 초반까지 한국 정부는 행망용 워드를 사용하고 있었고, 이것은 한글카드나 소프트웨어 한글 프로그램이 실행된 MS-DOS 위에서 돌아가는 텍스트기반 워드프로세서였다. 이것은 당시까지 대부분의 정부 컴퓨터가 흑백화면에 XT, AT수준(대부분 마우스도 없었다)이었기 때문이기도 했다. 대기업들 역시 90년대 초까지는 아직 자사 계열사가 개발했거나 보석글 등 행망용 워드 수준으로 프로그램을 이용하고 있었다.(당시까지 도스용 오피스 프로그램이라 할 각종 사무용 패키지를 국내외 여러 회사에서 출시해 팔았다. 그 목적을 위한 전문 사무기기도 존재했다.) 행망용 워드는 써본 사람은 알겠지만, 반복작업이 많은 업무, 도트매트릭스 프린터 환경에서 문서작성 효율은 좋았다. 이것이 한/글로 바뀌게 된 것은 공공기관에 납품되는 컴퓨터 사양의 고급화, 잉크젯과 레이저프린터의 보급, 한/글이 미려한 스케일러블 폰트, 표 작성 및 다양한 기능에서 진화하는데 행망용 워드는 개량이 없었기 때문이다. 한국에서 MS워드는 윈도우용 MS오피스4.2버전 이전까지는 거의 존재감이 없었다. 사실, 한글을 지원하는 도스기반 미국산 워드프로세서란 게 없었고 고려대상이 된 적도 없다. WYSIWYG를 지원하는 제품은 한글을 쓸 수 없었고, 텍스트 기반이면 그건 그저 텍스트 에디터 수준으로 기능이 떨어지는 데다, 에뮬레이터와의 궁합 문제도 있고 국내 문서작성 환경과 관행을 전혀 고려하지 않아 쓰레기가 돼버렸다.
  4. 이 표현은 한컴에서 '귀찮아서 씹고 안 만든다'를 말하고 싶을 경우 항상 돌아오는 답변이다.
  5. Microsoft Office 2003 이후 모든 버전의 워드, 파워포인트에서도 간단한 설정을 통해 거의 모든 서체를 내장(일부 상용 서체는 저장이 안 될 수도 있다)하여 문서를 저장할 수 있다.
  6. 폰트 설정에 락이 걸려 있으면 PDF 변환시 서체가 포함되지 않는다. 이 경우 해당 컴퓨터에 서체가 없으면 기본 서체로 대체되어 나오나 레이아웃이 깨지지는 않는다.
  7. 시스템 요구 사항에 보면 Word 2007 SP2 이후로 나온 된 제품들에서만 쓸 수 있다. 2016년 5월 기준 Windows 10은 아직 컨버터가 지원되지 않는다.
  8. 마찬가지로 대중에 공개하는 파일은 ALZ/EGG로 압축하지 말자. 실제로 자기 포트폴리오를 ALZ로 압축해서 제출한 사람이 면접도 못 보고 떨어진 사례도 있다고 한다. 압축파일을 열어볼 수가 없으니 서류전형을 진행할 수 없었다고 한다. 이게 그냥 꼬와서 안 여는게 아니라 회사에서 구입하지 않은 프로그램을 쓰면 단속에 걸릴 수 있고, 나아가 사용한 사람이 짤리거나 질책받을 수 있다. 알툴은 기업용이 유료다. 반디집 쓰면 되잖아
  9. 그리고 이건 HWP라서 탈락했다기 보다는 본인의 이력이 구렸거나(말 그대로 서류심사 탈락) 공고에 쓰인 양식을 지키지 않아서일 가능성이 높다. 애시당초 탈락이유를 말해 주는 경우도 거의 없고.
  10. DOCX가 표준화된 오픈 포맷이지만, 구버전 워드의 경우 지원을 안한다! 그에 반해 DOC는 오픈 포맷은 아니더라도 확실히 지원하니...
  11. 회사 차원에서 Microsoft Windows의 라이센스 구매를 할 때 같이 구입하기 때문. 일종의 묶음상품 비슷하게 꽤나 할인도 해주는 편. 회사가 윈도우와 MS오피스를 쓰니 개인도 그걸 사용할 수 밖에 없는 방식의 순환구조를 만들기 위해 공격적인 마케팅을 한다. 특히 한국은 그나마 MS오피스의 점유율이 낮은 편이라 꽤나 공격적인 프로모션도 하는편.
  12. 대체물로는 반디집이나 폴라리스 오피스등이 전부
  13. 다만 타 프로그램에서 틀이 와장창 깨지는건 감수해야 한다. 워드와는 개발 방향 자체가 다르기 때문에..
  14. 이 이기는 과정에도 문제가 많다. 마이크로소프트가 전 세계적으로 두들겨맞은 판매방식인 끼워팔기 때문.
  15. 당장 MS오피스만 봐도 맥용버전과 윈도우버전의 문서호환이 100%되지 않는다. 한글도 버전에 따라 틀이 망가진다.