590px
590px
요즘은 What's not street아라고 뜬다.[1]
깨알같은 무슨 지거리야
목차
1 개요
2007년 구글에서 발표한 무료 번역 서비스. 2006년 처음 만들어졌을 때는 4개 외국어는 영어, 중국어, 프랑스어, 스페인어로 시작했다. 2012년 11월에는 63개 언어, 2013년 7월에는 71개 언어를 지원했다. 통계적 기계번역으로 번역하기 때문에 정확도가 높다고 했지만 현실은 시궁창[2]영어 못하면 외국인이 구글 번역 썼냐고 물어보더라
2 설명
사실 '구글 번역기'가 아니라 '구글 번역'이 올바르다. 공식적으로 구글이 밀어주고 있다. 약 200억 개의 번역된 단어를 사용한다. 번역된 단어가 없으면 소리가 나는대로 표기하고 있다.
2007년 이전에는 SYSTRAN 기반의 번역기를 사용했지만 이후 독자 번역 엔진을 사용하고 있다. 또한 텍스트뿐만 아니라 웹 페이지 등의 번역이 가능해서 편리하다.
동사의 웹브라우저인 크롬에서는 해당 기능이 기본적으로 내장되어서 사용자의 크롬 언어와 다른 언어로 구성된 사이트를 열면 자동으로 번역하겠느냐고 물어본다.[3] 크롬의 모바일 버전에도 있다. 번역할 수 있는 페이지는 줄바꿈(
등)는 페이지 단위로 끊어진다. 하지만 그게 없다면 처음부터 끝까지 통번역을 한다. 다른 웹 브라우저에서도 확장기능으로 구글번역을 제공하고 있어서 크롬과 비슷하게 쓸 수는 있다. 다른 회사의 모바일 브라우저인 돌핀 브라우저에도 확장기능으로 있을 정도.
2016년 9월 28일(현지시각) 부터 알파고에도 쓰인 딥러닝기술을 적용한다.##2 기존 구글 번역의 오류를 58~87% 줄였다고 한다. 영어-중국어 번역부터 제공한다.
3 작동 원리
컴퓨터 번역 프로그램을 만든다면 언어학자들이 대거 동원될 것 같지만, 구글에 따르면 언어학자는 해당 팀에 단 한 명도 없다고 한다. 국제기구나 기업 등에서 동일한 문서를 A언어, B언어, C언어 이거 말고 등의 여러 언어로 만들어 놓은 것을 검색엔진이 검색하여, 많은 결과를 바탕으로 번역한다고 한다. 이러한 번역 원리를 말뭉치[4] 기반 기계번역(corpus-based machine translation; CBMT)라고 일컬으며, 두 언어 간의 병렬 말뭉치(bilingual parallel corpus)를 기반으로 비교분석하여 번역 결과물을 출력하는 과정을 거친다.[5] 말뭉치를 만드는 원리에 있어서는 통계적 기계번역(statistical machine translation; SMT)에 해당한다. 즉, 단어 대 단어, 구절 대 구절의 사용 빈도를 나타내는 모델을 만들어서 어떤 단어 및 구절의 번역으로 가장 많이 나타나는 표현이 확률적으로 정확하다는 것이다. 또한 그렇게 단어 및 구절 층위에서 확률적으로 정확한 표현이 선택되면 그것이 배열되는 순서도 마찬가지로 가장 많이 나타나는 순서가 확률적으로 정확하다고 판단하고 번역물을 출력한다. 그렇기 때문에 팀에 언어학자가 하나도 없어도 되는 것.
이 원리에 따르면, 인터넷에 많은 정보가 번역되어 있는 언어가 가장 번역 품질이 높게 된다.[6] 한국어 ↔ 영어 간의 직접 번역보다 한국어 ↔ 일본어 ↔ 영어 중역이 더 정확한 경우가 많은 것은 이러한 이유 때문이다. 한국어와 영어간 번역 사례보단 일본어와 영어 간의 번역 사례가 훨씬 많고, 한국어와 일본어간의 번역 사례도 엄청나게 많다는 점 때문이다.이로써 일어 DB가 얼마나 많은지 알수 있다. 불행히도 구글번역은 알아서 중역을 지원하진 않기 때문에 사용자가 알아서 중역을 해야 하지만.(실제 사례) 그리고 중역을 이용한 웹서비스도 있다.(더 나은 번역기) 설명을 보면 덕후들에게 고마워하면서 성욕이 최고라 하고 있다
한국어와 번역 사례가 한국어 ↔ 영어보다 적어서 중역을 거치는 외국어의 경우 영어를 할 수 있다면 영어로 읽는 편이 가장 의미 전달이 정확하다.(구글 기계번역 담당자를 인터뷰한 신문기사)
4 구글 번역 팁
사실 상술한대로 영어 → 한국어 직역보다는 다른 언어를 거쳐 번역하는 것이 훨씬 자연스럽다. 이 '다른 언어'로는 일본어를 쓰면 좋다고 흔히 알려져 있다. 이유는 밑에 나와 있다(…).
Please note that feedback may not be available for all items.
이 문장을 그냥 영한 번역으로 돌리면 '그 피드백은 모든 항목에 대해 사용하지 못할 수 있습니다.'라는 문장이 나온다. 그런데 같은 문장을 영일 → 일한 순으로 거쳐서 번역하면 '그 의견은 모든 항목에서 사용할 수 없는 경우가 있으므로 양해 바랍니다.'와 같이 영한 번역 대비 상당히 자연스러워진다. 참고로 번역된 일본어를 네이버를 이용해 돌리면 '그 피드백은 모든 항목이 사용할 수 없는 경우가 있으니 양해 바랍니다.'라는 식으로 더 자연스러워진다.(현재 수정) 모든 번역이 원문의 의미와는 차이가 있다는 게 함정
반대로 영몽 → 몽한 같은 뜬금없는 순서로 번역하면 역효과를 낼 수 있다. 앞서 말한대로 몽골어를 거쳐서 번역하면 '이벤트의 모든 종류가있을 것입니다 유의하시기 바랍니다.'라는 괴상한 문장이 된다. 안녕하신가! 힘세고 강한 아침, 만일 내게 물어보면 나는 왈도.
구글번역에 URL을 입력하고 옆에 표시된 번역 결과에 나온 URL을 클릭하면 그 URL의 웹사이트를 통째로 번역할 수 있다. 크롬을 사용하지 않는 사람이라면 유용한 기능. 크롬 브라우저는 구글에서 만든 웹브라우저이므로 자체적으로 구글 번역 기능을 탑재하고 있어 더 간편하게 웹사이트 번역이 가능하다.
5 나쁜 번역의 예
주의 : 현재는 더 좋은 번역이 나오는 경우가 많다. 확인하고 수정바람.
5.1 영어 → 한국어
- Hello there! Mighty fine morning, if you ask me! I'm Waldo.[7] → 안녕하십니까! 마이티 좋은 아침, 당신이 저를 요구하는 경우에! 나는 왈도입니다.
- Domain Knowledge - Weighted Score → 도메인 지식 - 가중 점수
- luncheon meat → 오찬 고기
-
wants → 원(화폐 단위)[8] - fire in the hole → 구멍에 불 Fire in the hole. → 구멍에 화재
- It is too dangerous to go alone, take this! → 그것은 혼자 너무 위험하다,이 걸릴!
링크 : 젤다, 해석 좀 해줘! - Hi there guys,Hi there! → 안녕 얘들 아, 안녕하세요!
어?뭐지? - Watch your step → 당신의 단계를 시청
- Would you consider to leave here? → 여기 떠날 생각하십니까?
- So Sweet! → 그래서 달콤한!
-
Ultimate Stream → 용의 콧물 - pit lord - 피트 주님
악마 주제에 성스럽다[9] - 과거에는 경쟁사인 마이크로소프트의 창시자 빌 게이츠라 치면 '돈 문'이라 나왔다고..
의도한건가 왈도체네 - Choo Choo -> 추신수 추신수
- Soo -> 한혜진(...)
- get dunked on!! →에 마 셨습니다하세요!(...)
- angry videogame nerds -> 화가난 비디오게임 바보 (...)
AVGN이 싫어합니다 - Call Of Duty : Advanced Warfare -> 콜 오브 듀티 : 고급 전쟁
- war thunder -> 전쟁번개(...)
- VGA -> VGA 그대로 출력... 그러나 브가 라 읽음
- namuwiki -> namu 위키[10]
- AMD -> AMD의(?) 게다가 암드의 라 읽음(...)
- intel inside -> 인텔 내부(...)
- galaxy S6 -> 은하수 S6[11]
- Smoke Weed Everyday → 위드 매일 연기
- Trapper → 사냥꾼(...)[12]
- What the fuck - 도대체
뭐? - Nuke - 누크(...)
- Dc inside - 직류 내부
- Are u crazy? - 유 미쳤어?
- horse does - 말은하지 않습니다
- hip hip hooray - 엉덩이 엉덩이 만세
- fuck you가 대소문자에 따라 다르게 해석이 된다
섹스를 섹스 - Fuck You - 당신 젠장 (대문자를 강조로 친다면 젠장! 너! 식으로 나눠 해석되었다 생각할수 있다 (딥러닝의 폐해)
- Fuck you - 엿 먹어 (매우 옳다!)
- fuck You - 당신 씨발 (이것도 "젠장 너"가 더 옳은 듯 하다)
- fuck you - 당신이 섹스 (???)
- fuck fuck you - 섹스를 섹스 (고만해 미친놈들아)
- "multiplication indicated by juxtaposition is carried out before division." → "병렬로 나타낸 곱셈 나눗셈 전에 수행된다."
5.2 한국어 → 영어
- 3529항하사 5492극 2914재 2910정 1934간 3920구 4930양 3854자 5049해 3903경 4835조 5049억 7029만 9847 -> Hanghasa income 5492 3529 2914 2910 re-defined the 1934 inter-party 5049 3854 3920 4930 amount to 1 trillion 5049 4835 3903 Sir billion 7029 10 000 9847
- 느금마 -> GOLDEN HORSE slow
- 독일의 과학력은 세계 제이이이이이이이이이이이이이일!! -> Germany is the world's scientific output Jay 1 22 22 22 22 22 22 !!
- 신태일과 김윤태 -> Tae work sintae(...)(신태'일'의 일을 work로 번역한것 같다)
- 공기놀이 → Air Play.(...) "공기"의 뜻이 달라져서 그런거지 직역하면 "공기놀이"는 맞다.
- 백조 한 마리 → 100,000,000,000,001.[13]
- ㅈ → Fucking → 현재 ㅈ으로 수정
- ㅁ → Klitschko →
- 곱창 → Hormone → gopchang으로 수정 → 다시 Hormone으로 바뀜
- 처칠 수상 → Churchill Prize → Churchill Award
- 쉴 새 없이 → Breathe without a new → without time to rest → without new shelter
- 내가 고자라니 → I said jarani[14]
엔지니어는 고자인가 보다→ What if I'm a eunuch으로 수정 → I said jarani로 또 수정대체 뭔 약을 빠셨어요. - 니아 ➡ California(...)
- 영문을 모르겠어 ➡ I don't know english(...)
- 힘내자. → Ganbarou[16]
- 중2병 → 2 bottles of →
2nd grade of middle school illness으로 수정[17] - 흑염룡 → Dragon heukyeom
- 아노하나 → One piano: 피아노 하나 → 현재 Ano one으로 수정
- 아시발꿈 → Ah City Dreams
왜 그런걸 검색해... - 데이트 어 라이브 → Dating fish live → 현재 Date alive로 수정
- 라든지 → Toka: 일본어의 とか(토카)로 추정된다. 위의 Ganbarou.와 비슷하다.
- 살고 싶다고 한다던지 → Throw it would live → Say if I want to live → Throw it wants to live으로 수정
- 용의 콧물 → For a runny nose → Runny nose of dragon → Runny nose for(...)으로 수정. 룡의 콧물로 검색하면 비교적 제대로 번역된다(...)
- 존나 → juicy[18] 존나를 그냥 치면 juicy가 나오지만 존나 배고파와 같이 문장에 넣어서 쓰면 Damn으로 번역된다.
- 씨가 말랐다 → Mr. skinny → Mr. dried up[19]
- 아이폰은 안드로이드보다 좋다. → Android is better than iPhone[20]
- 안드로이드는 아이폰보다 좋지 않다. → Android does better than iPhone[21]
- 구글폰은 안드로이드보다 좋지 않아. → Google Android phones are not worse than[22]
- 존나 배고파. → John I'm hungry → Damn I'm hungry로 적절하게 수정 → Fucking hungry(...) → Damn hungry.
-
차여신 → car loans - 츠키노 우사기 → Sailor moon(…)[23] → Tsukino Usagi로 수정
- 퇴근 → Work
야근해라?→ Go home집에나 가서 잔업이나 해라?→ Off work으로 수정 - 앙겟썸 → Never Back Down En[24]
- 투명드래곤 → Transparent Dragon[25]
- 고자 → Wants
이미 없어졌으니 원한다는 건가. 부관참시네. "뭐뭐 하고자 한다."에서 나온 것 같지만 알 게 뭐야- 이에 따라 '전 고자입니다' → I'm trying.
전 그것을 시도합니다
- 이에 따라 '전 고자입니다' → I'm trying.
- (옛한글이라 일부 • 또는 ㅁ으로 대체됨)
나랏말ᄊᆞ미
듕귁에 달아
문ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아닣ᄒᆞᆯ
이런 젼ᄎᆞ로 어린 셩이 니르고져 배이셔도
ᄆᆞᄎᆞᆷ내 제 들 시러펴디 몯노미 하니라
내 이ᄅᆞᆯ 윙ᄒᆞ야 어엿비 너겨
새로 스믈여듧ᄍᆞᆼᄅᆞᆯ ᄀᆞ노니
사ᄅᆞᆷ마다 수 니겨 날로 메 뼌킈 ᄒᆞ고져 ᄅᆞ미니라
→
Ss • The end of the US narat
Weigh in dyunggwit
Jj • The door ng to the Management Interviews • The s m t • The ahnit di l h • The
• The immersion into this ch Shungnak two young Nir gojyeo Bay feel free to
• The ch m m • The inside of the pick pyeodi mot nominal hanira
• The r l h • The wing is my eoyeotbi be neogyeo
• The new seumeul yeodeurb jj l • The g ng r • The noni
• You can use r m nigyeo every day mail ppyeon kui h • The gojyeo r • The mini LA - 방어 구이 → Grilled defense. 생선 방어를 공격행위를 저지하는 방어로 번역되었다...[26]
- 주상전하 납시오 → Pillar charges napsioh. 각각 기둥모양을 뜻하는 주상, 양전하 음전하의 전하, 납시오는 음차다(...).
- 좇ㄷ 나 → C Follow me 참고로 좆이 아니라 좇이다. 좇 하나만 치면 Follow라고 번역된다.[27]
- 빼애액 → I love juice out(...)
- 비둘기야 먹자 → Should eat pigeons
비둘기를 먹어야 한다.... - 백제 → Brightener. 한국어로 해석하면 광택제(...) '표백제'에서 온 듯.
- 풍악을 울려라 → D ring the pungak
- 어 딜도 망가 → Dildos've broken → 딜x가 파괴
- 참 쉽죠? → True's easy? → 정말의 쉬움? (...)
- 케라핌 → Kane rapim
케인? - 나무아미타불 관세음보살 → Wood Amitabha Buddha Avalokitesvara
- 이게 아부지도 없는게 까불어 → Dad, this is also how eopneunge French! → '없는게' 부분을 '없는 게'로 번역할 경우 This is how you blow even without Dad. 로 번역된다. 여전히 개판이지만 최소 eopneunge french보단 낫다.
- 말이 되는 소리를 해라 → Make a sound horse.
짝사랑-crushCrush는 짝사랑이라는 뜻의 슬랭이므로 맞는 번역- 무량대수 → Flat Number (???????)
- 애앢따 → Ke aektta
케액따 - 한 뚝배기 하실래요? → Would you like a pot?
- 우주게이 히맨 → Gay Universe himaen
- 장비를 정지합니다 → Stop the equipment
- 고만해 미친놈들아 → Step back, ye prick.
- 이보시오 의사양반 → See the Doc.
의사를 봐줘. 어떻게 생각해? - 올림픽대로 → As the Olympics(...) [28]
- 엿 장수 → Fuck sell man → Yeotjangsu
- 엿 → overhear [29]
- 백두산 백산수 → Paektu can Baishan
백두산이 백산수를 할수 있다고? - 막장 → face
니얼굴 막장 - 양 → amount(...)
- 씨 바 → Mr.Bar
- 죠스케 → Joe schedule [30]
-
골때린다 → Club Goals - 그는 고등학교에 다닌다 → He goes to elementary school
믿기지 않지만 고등학교가 초등학교로 바뀌어 번역된다--그리고 고등학교를 중학교로 바꾸면 잘 통역된다 - 국민의 정부 - National Uijeongbu
의정부? - 스모쉬 - Sumo rest
- 시발놈 - City Bastard
- 박정희 - Park
공원 - 나무위키 - Tree Wiki/Wiki Tree
- 잠뜰 - Jamtteul
- 고자 - Want
- 왕감자 - Royal potatoes
- 후파 - Hupa
- 이 차는 이제 제껍니다 - This car is the kkeopnida now.
- 시발 자동차 - City car
- 샤샤샤 - Sasha Shah
- 아이오아이 - lowa Eye
뭐야 이게
5.3 한국어 → 일본어
- 설설길 것 → 設設定長いこと
- 분수도 모르다 → 噴水も知らない
- 사과할게 → リンゴよ
- 고자 → う
- 셀카찍기 → ハメ撮り → ハメ撮りを撮る[31]
- 지랄 → 性交[32]
- 필요한지? → 必要韓紙
- 매화 → 梅
5.4 일본어 → 한국어
- っ → 정액: 적어도 2008년 ~ 2009년부터 이렇게 번역했는데 2015년 06월 05일 기준으로 여전히 정액으로 번역한다. 이는 구글번역 단어추가를 사용자중 로그인한 사람들에게 부탁하는 경우가 있어서 그렇다. 예를 들어 pencil에다가 욕(...)을 적어도 인정해준다→ ㅅ으로 수정
- 円 → 원: 물론 円이 도형 원을 지칭할 때는 '원'으로 번역하는 것이 맞는데, 円이 화폐 단위 엔을 지칭할 때도 '원'으로 번역한다. 그래서 이런 대참사가 생기기도 한다(…). 또한 반대로 원 → 円 으로 번역하니 주의해야 한다.
번역기 돌리는 일본인들도 매우 당황할 것 같다2015년 11월 기준 원형으로 번역하고 숫자+円은 숫자+엔으로 번역한다. - 日本時間→한국시간: 언젠가부터 이렇게 번역이 되있다. 사실 한국과 일본은 같은 시간대를 사용하기 때문에 문제는 없지만, 부분적으로 따지면 日本→한국이기 때문에 문제이다.
初音ミク → 이명박 : 과거 누군가 하츠네 미쿠 번역 단어를 이명박 전 대통령의 이름으로 등록해 둬서 생긴 해프닝으로 지금은 고쳐졌다. 하츠네 미쿠 추가 사항 참조へ → 박근혜 : 이것도 이명박의 사례처럼 누군가 단어를 저렇게 등록해서 잠깐동안 해프닝으로 벌어지기도 했다. 이것도 지금은 고쳐졌다. 그런데 빙 번역기는 구글 번역기에서 어휘를 가져왔는지 2016년 현재까지도 오역을 한다.
5.5 다른 외국어
구글 번역기의 성능이 좋지 않은 게 아니라 한국어 - 영어 번역 능력만 이상하리만치 나쁜 것이다. 아무래도 영어와 한국어가 관계가 전혀 없어서 어순 뿐 아니라 표현하는 방식 자체도 달라서 기계번역의 난이도가 더 어려운 것 같다. 그리고 은어나 속어를 많이 사용하는 문제도 있다. 실제로 중국어나 유럽 언어 등의 번역 품질은 타의 추종을 불허한다. 중국어 - 영어, 프랑스어 - 영어, 독일어 - 영어, 이탈리아어 - 영어, 네덜란드어 - 영어 등의 번역 품질은 긴 문장을 번역하더라도 흠이 거의 없는 완벽한 문장에 가깝다. 중국어 빼고 인도유럽어족 또한 한국어와 어순이 비슷한 일본어도 번역이 잘된다. 때문에 생소한 외국어 사이트에서 정보를 알게 될 때 적어도 영어만 잘하면 거의 전세계 인터넷의 언어 장벽이 무너지는 셈. 핀란드어의 경우 북유럽 언어인데도 밑의 노르웨이어, 스웨덴어, 덴마크와 달리 상당히 꼬인 결과물이 나오는 것으로 볼때, 번역 완성도가 어순과 어족의[33] 영향을 많이 받음을 알 수 있다.
재밌는 점은 어순이 완전히 다르다고 하더라도 일본어를 영어로 번역하거나 영어를 일본어로 옮기는 건 정확도가 꽤 높다. 일본어는 동인지 등 문화 폭탄의 산물들을 번역하는 과정에서 일본인 양덕들에게 수도 없이 교정되었기 때문이다. 오오 하지만 어순이나 문법도 다르고 딱히 일본인 양덕들이 교정할 필요도 없는 외국어들은 정확성이 확실히 떨어진다.
프랑스의 남자 이름인 Benoît를 Benedictus XVI(교황 베네딕토 16세)로 번역하는 일도 있었다.
- 中國是東亞的一個國家或地理區域,漢語中最早是泛指炎黃子孫在中原建立的國度,至現代國際體系成形後才開始作為國家的通稱。
- → China is a country or geographic area in East Asia, Chinese, refers to the descendants of the earliest establishment of the kingdom in the Central Plains, to the shaping of modern international system after the country began as a generic term.
매우 완벽한 번역이다. 이는 영어와 중국어의 어순이 거의 일치하는 것이 아니라 중국어 문법현상이 간단하기 때문에 가능하다. 영어와 중국어의 어순은 대조해 보면 알겠지만 완전히 다르다.
프랑스어 - 영어
- La France, en forme longue la République française, est un pays d'Europe de l'Ouest, mais qui comprend également plusieurs régions et territoires d'outre-mer disséminés sur plusieurs océans.
- → France, French Republic in the long form, is a country in Western Europe, but also includes several regions and overseas territories scattered across several oceans.
완벽한 번역. 프랑스어와 영어는 각각 로망스어와 게르만어로 어군은 다르지만, 상호 간에 문법적으로나 어휘적으로나 영향을 많이 주었기 때문에 비슷한 부분이 많다. 사실, 같은 영어는 게르만어군인 독일어와는 닮은 점이 생각보다 많지 않다.
독일어 - 영어
- Deutschland (Vollform Bundesrepublik Deutschland) ist ein bundesstaatlich verfasstes Land in Mitteleuropa und wird aus den 16 deutschen Ländern gebildet
- → Germany (Federal Republic of Germany long form) is a federal penned country in Central Europe and is composed of the 16 German states
long form과 penned를 빼면 그다지 트집잡을 곳은 없다.
이탈리아어 - 영어
- L'Italia, ufficialmente Repubblica Italiana, è una repubblica parlamentare situata nell'Europa meridionale, con una popolazione di 59,7 milioni di abitanti e capitale Roma.
- → Italy, officially the Italian Republic, is a parliamentary republic located in southern Europe, with a population of 59.7 million inhabitants and the capital Rome.
완벽.
네덜란드어 - 영어
- → do not ask for directions because everyone has lost its way
완벽.
노르웨이어 - 영어
- Kongeriket Norge er et nordisk, europeisk land og en selvstendig stat vest på den skandinaviske halvøy. Landet er langt og smalt, og kysten strekker seg langs Nordatlanteren, hvor også Norges kjente fjorder befinner seg.
- → Kingdom of Norway is a Nordic European countries and an independent state west of the Scandinavian Peninsula. The country is long and narrow, and the coastline stretching along the North Atlantic, where Norway's famous fjords are located.
완벽에 가깝다.
덴마크어 - 영어
- Danmark (fra oldnordisk: Danernes mark) er et land i Skandinavien beliggende i det nordlige Europa. Danmark kaldes sammen med Grønland og Færøerne officielt Kongeriget Danmark.
- → Denmark (from Old Norse: Danes field) is a Scandinavian country located in Northern Europe. Denmark called together with Greenland and the Faroe Islands, officially the Kingdom of Denmark.
완벽에 가깝다.
스와힐리어 - 영어
- Lugha ilianza takriban miaka 800-1000 iliyopita katika mazingira ya vituo vya biashara vya pwani ambako wafanyabiashara kutoka Uarabuni, Uajemi na Uhindi walikutana na wenyeji Waafrika.
- → Language started almost a decade ago in the context 800-1000 to coastal trading centers where traders from Arabia, Persia and India met with local Africans.
이해에는 큰 문제가 없다.
헝가리어 - 영어
- A magyar nyelv az uráli nyelvcsalád tagja, a finnugor nyelvek közé tartozó ugor nyelvek egyike. A legnagyobb finnugor (és egyben uráli) nyelv. Legközelebbi rokonai a manysi és a hanti nyelv, majd utánuk az udmurt, a komi, a mari és a mordvin nyelvek.
- → The Hungarian member of the Ural language family, one of the Finno-Ugric languages belonging languages. The largest Finno-Ugric (and Ural) language. The closest relatives of the Khanty Mansi and language, and after the Udmurt, Komi, Mari and Mordvin languages.
여기서부터 상태가 슬슬 안 좋아지기 시작한다.
터키어 - 영어
Mustafa Kemal Atatürk, Türk ordu subayı, mareşal ve Türkiye'nin ilk cumhurbaşkanı. Türkiye Cumhuriyeti'nin kurucusu ve önderidir. 1934'te Türkiye Büyük Millet Meclisi tarafından kendisine Türklerin atası anlamına gelen Atatürk soyadı verilmiştir.
- → Mustafa Kemal Ataturk, the Turkish military officers, marshals and Turkey's first president. It is the leader and founder of the Republic of Turkey. 1934 Grand National Assembly of Turkey by him 'Father of the Turks' last name Ataturk, meaning is given.
못알아먹을 정도는 아닌데, 문법적으로 거슬리는 부분이 눈에 띈다. 특히 주격인칭대명사 O가 생략된 문장에 대해서는 일괄적으로 it을 주어로 써서 혼동을 준다.
몽골어 - 영어
- Чингис хаан (~1162 - 1227 оны 8 сарын 18) 1206 онд Монгол аймгуудыг нэгтгэж Их Монгол Улс буюу Монголын эзэнт гүрнийг байгуулсан Монголын хаан байв. Хиад Боржигин Есүхэйн Тэмүжин (Тэмүүжин ч гэж бичдэг) гэдэг нэртэйгээр Боржигин овогт төрсөн бөгөөд түүхэн дэх хамгийн гарамгай улс төр, цэргийн суут удирдагч юм.
- → Genghis Khan (~ 1162 - 8 May 1227, 18) In 1206, Mongolian tribes were united Mongolian Mongolian Khan established the Mongol Empire.Khiad and Borjigin Yesükhein Temujin (Temujin would say), was born in the tribe called the Borjigin the most outstanding in the history of political and military leader of genius.
이쪽은 매우 안 좋은 사례(…). 원문에 없는 외계어가 출현하진 않았지만, 이해에 필요한 기초 문법 체계가 붕괴되었다.
6 구글 번역 개선하기
2011년 1월에 구글 번역이 엉망일 경우 사용자가 직접 번역을 개선할 수 있는 서비스가 생겼다. 세계의 오타쿠들아 내게 너희들의 번역지식을 나눠줘사용자가 제공한 번역은 번역 품질을 개선하는 데 사용되고 익명으로 다른 사용자에게 표시될 수 있다고 명시했지만, 사실은 구글 회사에서 사용자가 제공한 개선한 번역을 일일이 확인하여 운영진에서 최종적으로 선발하므로 꽤 까다롭다. 즉 사용자가 엉터리로 번역을 개선했다면 당연하겠지만 철저히 무시당하고 개중에 올바르게 번역을 개선한 부분이 선발되어 새롭게 표시된다는 것이다. 이 과정은 보통 한 달 정도가 소요된다고 카더라. 이 점은 중국의 포털 사이트인 바이두 백과와 비슷하다.
7 모바일 어플리케이션 버전
구글 서비스 애플리케이션 | ||||
개인화 및 소셜 | ||||
뉴스 및 미디어 | ||||
문서 도구 | ||||
구글 플레이 | ||||
부가 서비스 | ||||
구글 고글 | 구글 번역 | 구글 애드센스 | 구글 애드워즈 | 구글 어스 |
구글 지도 | 구글 카메라 | 구글 카드보드 | 마이 비즈니스 | 안드로이드 포 워크 |
기기 종속성 |
모바일 버전은 다음과 같은 기능을 제공한다.
- 텍스트를 입력하여 90가지 언어 번역
- 카메라를 사용하여 27가지 언어의 텍스트 즉시 번역
- 40가지 언어로 양방향 자동 음성 번역
- 키보드 입력 대신 손가락으로 손글씨 쓰기
- 여행 중 또는 인터넷 요금이 비싸거나 연결 속도가 느릴 경우 언어 팩 다운로드
- 번역에 별표 표시 후 저장하여 나중에 참고
- 텍스트를 사진으로 찍어서 높은 품질의 번역 또는 즉석 카메라 번역이 지원되지 않는 언어의 번역 가능
크롬을 사용하면 구글 번역기를 이용해서 웹페이지를 통으로 번역할 수도 있으며, 안드로이드의 경우 블럭을 지정해서 구글 번역기로 공유 버튼을 누르면, 해당 블럭만 번역해서 볼 수가 있다.
7.1 음성 번역
음성 번역을 사용할 때에는 자동 언어 인식이 불가능하니 미리 타겟 언어를 선택해야 한다.
A와 B언어를 선택한 후에 번역할 언어를 눌러서 말하면, 대상 언어로 번역해서 읽어준다.
가운데 마이크 버튼을 누르면, 양방향 번역도 가능하다.
7.2 사진 번역
카메라를 띄워서 촬영 버튼을 누르거나 갤러리에 저장된 사진을 불러와서 번역한다. 사진촬영 모드는 37가지 언어를 지원한다. 사진 번역을 사용할 때에는 자동 언어 인식이 불가능하니 미리 타겟 언어를 선택해야 한다.
일반적인 OCR에 비해, 일본어와 한자를 꽤 정밀하게 인식해낸다.
7.3 손글씨 번역
사진 번역으로 인식을 못할 때 사용한다. (화려한 간판 등)
손가락으로 글씨를 그려서 사용하면 된다.
7.4 비주얼 번역
카메라를 이용해서 보여지는 정보를 실시간으로 번역해서 이미지를 수정하는 기능이다.
아직은 로마 알파벳 기반의 언어만 지원하고 있다.
실시간 번역 지원언어 : 영어, 불가리아어, 카탈로니아어, 크로아티아어, 체코어, 덴마크어, 네덜란드어, 필리핀어, 핀란드어, 헝가리어, 인도네시아어, 리투아니아어, 노르웨이어, 폴란드어, 루마니아어, 슬로바키아어, 스웨덴어, 터키어, 우크라이나어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어. 힌디어, 태국어를 지원.
여기서 지원하지 않는 언어[34]는 사진촬영 모드로 할 경우 사용 가능하다.
뭘 했는지 죠스케를 조 일정으로 번역했다.....
8 기타
約束された勝利の剣을 검색하면 아래쪽 발음에 Ekusukaribā 라고 뜬다.
사용자 의견 수용도가 높은 서비스여서 다른 번역기가 'ハム太郎'를 그냥 액면 그대로 '햄타로'라고 번역하는 것을 구글 번역기에서는 '햄토리'라고 번역해 주는 등 다소 융통성 있는 번역도 가능하다. 중국어와 일본어 등지에서 연호로 연도로 표기할 때(중국어의 경우 건원(한 세종) 몇 년, 정관(당 태종) 몇 년, 홍무(명 태조) 몇 년, 건륭(청 고종) 몇 년 등이 있고 일본어의 경우 메이지 몇 년, 다이쇼 몇 년, 쇼와 몇 년 헤이세이 몇 년 등) 영어 등으로 번역하면 기독교 문화의 영향 때문에 서기로 바꿔서 번역하기도 한다. 한때는 'Fucking'을 '씨발'이라고 제대로 번역하기도 했다. (현재에는 빌어먹을이라고 번역되는데, 이것도 딱히 틀린 번역은 아니다.) 다만, 그 반대로 번역제안 기능을 이용해서 장난을 쳐 놓는 경우도 많다.
한 예로 2009년 경 初音ミク(하츠네 미쿠)를 한국어로 번역했을 때 이명박(…)으로 번역하던 게 한 때 유명세를 탔다가 수정되었다. 이명박의 실종
한때 '한국인', '쪽발이'를 일본어 번역하면 日本人으로 나오는 일도 있었고, 일본어 한자 神이 일신교의 유일신인 '하나님'으로 일괄번역된다. 정작 일영번역은 매우 자연스럽다.
파일:XNehGJv.jpg
초창기에는 이런 식으로 번역되기도 했었다.(…)
다른 언어를 영어로 번역했다가 번역제안 기능 때문에 잘못된 적도 있다.
필리핀어로 피카츄를 영어로 번역했을 때 배트맨으로 나오는 일이 있었다. 뱃카츄
사실 구글 번역기는 부분적으로는 한국어를 번역하기 위해 만든 번역기이다. 그런데도 개판이냐(관련기사) 2004년에 구글 회장인 세르게이 브린이 한국의 팬으로부터 받은 메일을 번역기에 넣자 「The sliced raw fish shoes it wishes. Google green onion thing!」으로 번역되었다고 한다.(회(The sliced raw fish) 신(Shoes) 바랍니다.(It wishes.) 구글(Google) 파(Green onion) 이팅!(Thing?)) 이건 뭐 왈도체를 뛰어넘는다 이는 구글이 직접 번역기를 만들게 된 계기 중 하나가 되었다. 여담으로 이 문장을 구글 번역기에 그대로 넣으면 콩글리시인 파이팅이 그대로 Fighting싸우자으로 번역되는것을 제외하곤[35] 정상적으로 영어로 번역된다.
스레딕에서는 이 번역기로 번역을 해서 글을 쓰는 스레도 있다.(...)
2016년 1월 기준으로 한국어 TTS목소리가 병맛 같아졌다. 음질이 낮아졌고, 갑자기 목소리가 갈라진 것 같은 느낌이다. 게다가 악센트가 이상하고 심하게 튕긴다. 일본어 TTS는 음질을 최악으로 낮춰서 그런지 이상하다. 성대결절인가 다음 달에는 괜찮아졌지만. 그리고 3월부터는 음질이 떨어지고 발음속도도 느려졌다. 미친
여담으로 구글 번역기의 각국 목소리를 뽑아주는 사이트도 있다. # 구글로이드나 실황에 관심있는 사람은 써보자 한국어가 풀어쓰기로 작성된다!! 이런[36]
니코동에서는 여러언어를 거쳐 번역한 대사를 더빙한 영상에재번역 태그를 단다. 또한 한국에도 구글 번역기 죠죠라는 비슷한 시리즈가 있다.
[1]
예전에 떠돌았던 북한어. 당연하지만 저건 합성이다. 모르겠으면 직접 찾아봐라. 불가리아어 바로 전에 나와야 하는데 안 나온다.
- ↑ 2016년 7월 기준으로 What do shit. 이라고 떴다가, 다시 what's not street로 바뀌였다.
그러나 요즘에는 앞에 '이게'를 붙이면 That's not what the street이라 뜬다 카더라 - ↑ 하지만 번역을 하는 것은 한국어의 문법이 통상적인 영어 문법과 달라서 이상한 거지 다른 외국어의 번역 수준은 제법 괜찮다.
- ↑ 자동으로 번역하지 않게 설정할 수도 있다
- ↑ 텍스트 자료를 데이터베이스화한 시스템 예시
- ↑ 따라서 원문의 문법 요소에 대한 분석은 고려하지 않는다.
- ↑ 검색결과(표본)가 많아야 통계적으로 정확성이 높아진다.
- ↑ "안녕하신가! 정말 좋은 아침이로군. 나는 왈도라고 하네."지만... "안녕하신가! 힘세고 강한 아침, 만일 내게 물어보면 나는 왈도가 훨씬 유명하다.
- ↑ 앞에 주어를 붙히거나 뒤에 목적어를 붙히면 '원하다'라는 서술어가 되고, 'wants'만 따로 때서 쓸 경우도 없으니 엄연히 오역은 아니다.
- ↑ 군주라는 뜻의 'lord'가 크리스트교의 하나님의 의미도 있어서 그렇다. 근데 왜 그 많은 뜻 중에 주님을...
- ↑ 참고로 언어감지를 사용하면 자바어로 인식한다.(...)
- ↑ 정말 신기하게도 모든 전작 갤럭시S 시리즈와 갤럭시S7은 갤럭시S*으로 정상번역이 되는데 유독 갤럭시S6만 오류가 난다... 더 신기한건 동세대 제품인 갤럭시 노트5 마저도 혼자만 번역에 오류가 난다는거... 요즘은 그냥 갤럭시 S6라고 나온다.
- ↑ Trapper를 그대로 직역하면 "지뢰꾼"이다.
- ↑ 해석하자면 "100조 하고도 1(숫자)"이다(…) 여담으로 두 마리로 늘려도 숫자 2가 더해지고(…), 아라비아 숫자 1을 넣어도 변화가 없다.
하지만 백조 백조 마리라면 어떨까?그리고 구천경 일 마리라고 하면 90000000000000000001으로 번역된다. 진짜다(...). 다만 현재는 구천경 일 마리라고 적으면 'Gucheon gyeong il mari' 라고 나온다(...) 굳이 정상적인 번역을 보고 싶다면 마리 수를 백조 앞에 적어보자. 정상적인 번역이 나온다. - ↑ 예전에는 I has to be high나 I and jarani로 나왔다.
- ↑ 현재 And jarani 라고 나온다.
- ↑ 실제로 네이버에 Ganbarou라고 검색할 시 지식in에 수많은 번역 오류들이 검색된다 2014년 2월 현재까지 사례가 확인됐다가 2015년 1월 1월 17일 기준에는 Cheerlessly라고 뜬다. 2015년 9월 18일 기준으로는 you can do it으로 수정.
- ↑ 아직 2 bottles of 로 남아있다.
- ↑ 2014년 기준으로는 Damn으로 적절하게 번역된다.2016년 현재 다시 juicy 로 바뀌었다.
- ↑ 과거엔 Mr. bankrupt였다.
- ↑ 이건 의도한 점이다. 윈도폰이나 블랙베리는 정상적으로 번역된다.(...)
- ↑ 이것도 의도한 점.
이정도 문장 장난도 노림수 쓸 수 있으면 좀 노력해봐.. - ↑ 구글이 안드로이드 폰을 자신의 폰(!!!)으로 생각하고 있음을 알 수 있는 부분일지도?
- ↑ 다른 전사들도 마찬가지로 미즈노 아미-sailor mercury, 히노 레이-sailor mars, 치바 마모루-Tuxedo mask로 자동으로 정체를 까발려지고 있다. 나중에는 고쳐졌지만 예전엔 영어로 세일러 문을 치면 선원 달로 번역이 되어 나왔었다(…). 다른 전사들도 마찬가지로 선원 수성, 선원 화성 이런 식으로 번역이 되었다.
- ↑ 겟썸이라는 액션 영화의 원제가 Never Back Down이기에 저렇게 번역된 것이다. 2015년 4월 기준으로는 En getsseom이다.
- ↑ transparent도 '투명하다'라는 뜻이긴 한데 유리처럼 속이 비쳐 보이는 투명함을 transparent라고 하고, 또 이게 원래 '투명'의 사전적 정의이기도 하다. 투명드래곤의 투명은 invisible(보이지 않는)이라고 해야 옳다. 다만 구글 번역이 투명드래곤을 알 리가 없으니 이게 최선.
- ↑ 뭐 두쪽 다 잘 쓰이니까 알아서 쓰는게 더 나을지도.
- ↑ 좇다 라는 단어의 뜻이 따라가다 이어서 그런 듯. 그런데 좇다라고 치면 또 Jotda 라고 번역한다.(...)
- ↑ 반대쪽의 강변북로는 Riverside로 번역된다(...)
- ↑ 아마 엿듣다로 인식한 것 같다.
- ↑ 이걸 다시 한국어로 번역하면 조일정(...)이 된다.
- ↑ 아마추어 포르노 촬영을 일컫는 말이다. 일본인들이 이 캐릭터 프로필을 구글 번역으로 번역했다가 일어난 대참사.
- ↑ 지랄은 발작의 다른 말이다. 성교와는 아무런 관계가 없다.
- ↑ 핀란드어, 에스토니아어, 헝가리어 등은 우랄 계통의 언어로, 인도유럽어족이 아니다.
- ↑ 동아시아의 언어들
- ↑ 그런데 파이팅은 외국 한류팬들이 한국어 영상물을 번역할 때도 그냥 'Fighting'으로 번역한다. 구글 번역도 그걸 반영한 듯. 한류유행어 참고.
- ↑ 사용하는 방법은 메모장에 미리 쓸 단어/문장을 적어, 그걸 복붙하면 된다
이 문서의 문서 이동 전 나무위키에서의 로그 기록은 이미지 , 이미지2 에서 확인하실 수 있습니다. |