알파고

(AlphaGo에서 넘어옴)

300px

딥마인드 공식 유튜브 채널에 올라온 소개영상(판 후이와의 대결 포함)[1]
네이쳐지에서 제작한 알파고에 대한 동영상

공식 홈페이지
바둑 랭킹 페이지

알파고:알파고, 알파고:이세돌 대국 해설(판후이 二단, 구리 九단, 저우루이양 九단 해설)

1 개요

알파고에 가장 근접한 프로 기사는 전성기 시절의 이창호 九단[2]

김성룡 九단, 구글 딥마인드 챌린지 매치 제2대국후 인터뷰에서#

이제 바둑계에 알파고류(流)가 생기지 않을까 싶습니다

ㅡ 김동민 YTN 스포츠부장(아마 6단), 구글 딥마인드 챌린지 매치 제2대국 후 YTN뉴스에서

알파벳구글 딥마인드에서 개발한 컴퓨터 바둑 인공지능 프로그램. 프로기사를 맞바둑으로 최초로 이긴 바둑 프로그램이기도 하다. 이름에서 "Go"란 일본어로 바둑을 뜻하는 碁(바둑 기. 일본어 음독은 "고")[3][4]를 의미한다. 이는 일반적으로 서구 언론에서 바둑을 의미할 때 "고"란 말을 쓰기 때문이다.

2016년 3월 15일 한국기원에서 (명예) 프로 九단 단증을 수여하게 되어 알파고 九단이 되었다. 또한, 객원기사 자격으로 한국기원에 등록되었기 때문에, 가능성은 낮지만 언제든지 한국기원에서 개최하는 대회에 참가할 수 있다. 심지어 세계 바둑 ELO 레이팅 점수 랭킹[5]에도 2위로 등재되었다.[6]

2 정보

초기엔 하드웨어로는 CPUNVIDIA GPU를 이용한 병렬 계산을 사용한다고 발표했다. 물론 가장 중요한 것은 하드웨어보다 소프트웨어쪽으로. 이렇게 병렬연결 된 상태의 알파고vs싱글 알파고 간의 바둑에선 77% vs. 23%의 승률이 나왔다고 한다. 개별 컴퓨터가 20% 이상의 승률을 보여줬다는 것 만으로도 얼마나 학습이 잘 되어 있는지를 알려주는 대목.

초기의 언론보도에 따르면 1202개의 CPU와 176개의 GPU를 사용한다고 알려져 있는데, 이는 잘못된 기사이다. 기사에서 CPU 1202 / GPU 176개를 사용한 버전이 세계 500대 슈퍼컴퓨터 순위의 하위권 수준이라는 내용도 오류이다. 2015년 11월 기준 세계 494위인 TU Dresden의 Taurus GPUs가 이미 GPU 256개를 사용한다. 당연히 500위 내에도 명함을 내밀 수준이 못된다. 또한 저정도 수준의 슈퍼컴퓨터는 구입하는데 100억도 들지 않는다. 물론 유지비는 따로 고려해야겠지만. 저 숫자는 2015년 10월에 유럽챔피언 판후이 2단과 대결할때 사용한 숫자로, 2016년 3월의 이세돌 九단과의 대결에서는 더 업그레이드 되어 1920개의 CPU와 280개의 GPU를 사용하는 버전이 이용되었다. 영문관련기사

알파고가 항복하면서 띄운 팝업창의 모습을 보면 최소한 모니터가 설치된, 클라이언트에 해당하는 컴퓨터에서는 우분투가 사용되는 듯 하다. 관련기사 다만 분산컴퓨팅을 하는 알파고의 특성상 여러 개의 컴퓨터와 연동되어 작동하게 되어 있는데, 나머지 시스템의 OS도 우분투라고 확신할 수는 없다.

결국 2016년 5월에 구글에서 TPU라는 듣도 보도 못한 하드웨어를 발표하면서 GPU를 썼다는것도 구라였다 ... 구글 엔지니어 블로그해외기사 TPU? TPU라는게 뭐냐 하면 딥 러닝에서 주로 사용되는 벡터/행렬 계산을 병렬처리할수 있게끔 특화된 하드웨어이다. 물론 GPU도 해당 목적으로 사용되기는 하지만 GPGPU에 비해 TPU는 넘사벽급의 와트당 전성비를 자랑한다. 결국 구글은 1년전부터 TPU를 사용하고 있었고 딥 러닝 오픈소스 툴 TensorFlow 도 TPU용으로 개발된거였고 해당 버전은 자기네들만 가지고 있고 공개한 TensorFlow는 GPU용으로 이식한 거였다(...)

3 상세

구글에 인수된 딥마인드에서 개발한 머신러닝 기반 바둑 프로그램으로, 자기 자신과의 자가대국을 통한 학습이 가능하다고 한다. 사내 테스트 결과 다른 바둑 인공지능 프로그램들을 상대로 495전 494승 1패 기록했다. [7] 이 중 한판은 알파고의 '실수'로 졌다고 하며 그 약점은 이미 보완이 끝났기 때문에 명실공히 현 최강의 인공지능 프로그램으로 군림하고 있다. 현재까지 나온 모든 바둑 인공지능을 성능으로 압도하는 모습에 일부 개발자들 사이에선 젠(Zen)이나 크레이지스톤(Crazystone) 등의 프로그램들이 더이상 존재 의미가 있는가, 바둑 인공지능 대회인 UEC를 계속 지속해야 하는가 등을 투표하는 등 굉장한 충격을 받고 있다. #

덤으로 서로 바둑 최강국임을 자부하며 10년 넘게 바둑 인공지능을 개발해오던 한국, 중국, 일본의 개발자들은 그 모든 기술과 노하우들이 고작 개발이 1년 좀 넘은 정도인 알파고가 발표됨과 동시에 전부 따라잡히며 성능으로도 처참하게 발려버리는 엄청난 격차가 생겨 순식간에 모든 프로그램을 한물 간 프로그램으로 만들어버리는 데꿀멍, 안습한 상황이 벌어졌다... 세계자본이 바둑에 관심을 보이면 어떤 일이 일어나는지 잘 보여주는 장면. 바둑 뿐만이 아니다

흔히 알파고의 강점이 엄청난 하드웨어를 바탕으로 한 계산량이라고 생각하는 경우가 많다. 그러나 알파고가 기존 바둑 프로그램과의 가장 큰 차이를 보이는 부분은 하드웨어가 아니라 소프트웨어의 알고리즘이다. 알파고는 일반 컴퓨터에서도 돌릴 수 있다. 단지 지금보다 기력이 떨어질 뿐(...) 컴퓨터 1대[8]에서 돌아가는 알파고를 CPU 1000개가 넘어가는 알파고가 이길 확률이 고작 77%였다. # 알파고가 기반하고 있는 딥러닝은 학습 과정이 학습한 걸 써먹는 과정보다 훨씬 길기 때문에, 일단 학습이 된 이후로는 그걸 써 먹는 과정은 정말 별 것 아닌 것이다. 알파고가 대국 중에 하드웨어를 많이 쓰는 이유는 추가 탐색으로 얻는 저 23%의 차이도 실제 대국에서는 중요하기 때문이다.

컴퓨터 비전이나 음성 인식 등 패턴 인식류 AI 쪽에서 딥러닝이 나오면서 최근 2년 동안의 결과가 지난 30~40년간의 결과를 다 발라버리는 사례는 비단 바둑 뿐만은 아니다. 그러나 딥러닝은 나름대로의 최신 트렌드인데다 이미지, 음성, 자연어 처리 같이 해야 할 일이 산더미 같은 상황에 바둑에 연구진을 투입할 수 있는 여유를 가진 곳은 드물다. AI와 하드웨어, 분산 처리 모두에 풍부한 박사급 인력을 가진 미국, 거기에서도 구글에서나 해볼만한 일이며, 현 시점 한중일에서는 비슷한 것을 시도해 볼 수 있는 회사는 없다고 보면 된다. 쉽게 말해 돈 안되는 사업에 최고급 인력과 자본, 시간을 양동이채로 퍼붓는 돈X랄[9]이 가능한 회사만이 할 수 있는 일이다. 다만 앤드루 응 교수를 데려간 바이두에서 몇 년 뒤 비슷한 것을 시도해 볼 수 있을 거라고 전망 되었지만, 사실 페이스북이 훨씬 먼저(구글 딥마인드보다는 느리지만) 범용 인공지능의 일환으로 딥러닝 바둑 인공지능을 개발하고 있다. 기사 고바야시 고이치 九단한테 호선으로는 패배했다고. 알파고처럼 처음부터 어마어마한 데이터를 쏟아넣는 형식은 아니고, 페이스북은 프로 바둑기사와 비슷한 수준으로 두면서 경량화하여 개별 컴퓨터 레벨에서 돌아가는 인공지능을 개발하는 것이 목표이다. 궁극적으로는 바둑 인공지능을 만들면서 튜링 테스트를 통과해서 페이스북의 개인정보 관리에 쓰려는 것이지만 말이다.

github에 알파고의 논문을 토대로 알파고를 구현하는 프로젝트가 공개되어 있다. 완전한 구현은 아니며, 아직 초기 단계라고 한다.

4 대국 내역

2016년 3월 15일 기준. 프로 바둑 기사와의 공식 전적은 총 10전 9승 1패이다.

  • vs 판 후이 : 5전 5승 0패
  • vs 이세돌 : 5전 4승 1패

4.1 vs. 판 후이 二단

2013-2015년 중국 프로 기사이자 유럽 바둑 챔피언인 판 후이(二단)[10]와 대국하여 5전 전승을 거두었다. 토너먼트 경기(Tournament games)라는 표현으로 보아 19 x 19에서 호선, 덤 7집 반을 적용한 대국이었다. 유럽에서 활동한다고 해도 프로기사가 인공지능에게 호선으로 패배한 것은 바둑 인공지능 역사상 처음 있는 일이다. 그것도 5판이나 연속으로!! 작년 10월 기준으로 프로 2단의 기력이라고 하며 분산 컴퓨팅 적용시 4-5단까지 상승한다고. 이 때문인지 네이처 소식란에 소개되기도 했다. (sgf(Smart Game Format)형식으로 기록된 기보)

alphago.jpg
대국 장면을 찍은 모습이다.

최종 결과 - 서양체스처럼 흑을 쥔 사람이 위, 백을 쥔 사람이 아래로 가게 기보를 적기 때문에 동아시아와는 반대로 흑1이 좌하귀에 있다. 총보만 있는 곳, 총평
장면도에서, 흑이나 백 세모 표시가 있는 돌이 해설을 시작하는 곳이다.

  • 문제의 장면 : 흑▲는 4국 흑157
  • 알파고의 행마 : 백△는 1국 백56
  • 알파고의 응수타진 : 백△는 1국 백84
    • 또 다른 장면 : 흑▲는 3국 흑47
    • 또다른 장면 : 백△는 4국 백118
  • 알파고의 정석 운용 : 흑▲는 2국 흑29
  • 알파고의 사활 능력 : 백△는 2국 백134
  • 알파고의 삭감 능력 : 백△는 2국 백146
  • 알파고의 공격력 : 백△는 3국 백64
    • 또다른 장면 : 백△는 4국 백20
  • 알파고의 결정력 : 흑▲는 4국 흑97
  • 알파고의 패싸움 능력 : 흑▲는 5국 흑145

김명완판후이와 알파고의 대국 기보를 분석하면서 알파고가 아주 침착하고 모양좋은 일본식 스타일의 바둑을 둔다고 리뷰했다.

참고로 판 후이와는 비공식 대국으로 속기전 형태로 5판을 두기도 하였는데, 여기에서는 판 후이가 그래도 2승을 따내었다. 즉, 알파고가 3승 2패를 한 것. 이는 비공식 대국이기에, 공식적인 승패 기록은 알파고의 5전 5승 무패이다. 재밌는것은 판 후이가 알파고와 이세돌과의 대국 이전까지만 하더라도 인공지능에게 패배한 프로기사, 아마 최강자급 실력, 약한 기사등으로 온갖 굴욕을 겪었었다.그러나 알파고가 이세돌마저 꺾으면서 재평가받고 있다 구글 딥마인드 챌린지 매치 시점으론 처음엔 바둑인들조차 판 후이가 누구인지 아는 사람이 적었지만 지금은 바둑인들은 물론이고 전세계적으로도 이름을 알려서 인터뷰도 자주 하고 방송도 나가고 나름 인기 스타가 됐다. 인생 참 알다가도 모를 일.

4.2 vs. 이세돌 九단

알파고는 판 후이를 꺾은 것에 힘입어 2016년 3월 9일과 10일에 한국의 프로 기사인 이세돌 九단과 대국하였다. 매치는 당시 한국에서 유례 없는 관심을 보였으며 1~3, 5국은 모두 알파고가 불계승을 거뒀으며 4국은 이세돌 9단에게 불계패했다. 이번 대국의 진정한 목적은 승패를 가르기 보다는 알파고의 약점을 찾아내고 인공지능을 더욱 발전시키는 데 있기 때문에 일반적인 프로바둑과 달리 5국 3선승제가 아닌 승부와 상관 없이 5국을 모두 두었다.

자세한 내용은 구글 딥마인드 챌린지 매치 참고.

4.2.1 프로 九단 수여

width=65%
 
원문해석
第 〇〇一號
名譽九段 ALPHAGO

貴下는 平素 棋道硏磨에 精進하고 棋士로서 人格陶冶에 힘써 棋品이 入神의 域에 이르렀으므로 九段을 免許합니다.

二〇一六年 三月 十五日
財團法人 韓國棋院
總裁 洪錫炫
 
제 001호
명예 九단 알파고

귀하는 평소 기도연마에 정진하고 기사로서 인격도야에 힘써 기품이 입신의 역에 이르렀으므로 九단을 면허합니다.

2016년 3월 15일
재단법인 한국기원
총재 홍석현
 
풀이
당신은 평소 바둑을 열심히 연구하고 바둑인으로서 힘써 인격을 닦고 길러서 바둑의 품격이 신의 경지에 도달했으므로 九단임을 인정합니다.

5국 종료 이후 홍석현 중앙일보 회장(한국기원 총재 겸임)이 한국기원 총재 자격으로 알파고한테 명예 프로 九단 단증을 수여했다. 기사 명예 프로라고 하지만 실제로 한국기원 데이터에도 九단 명단에 포함시킬 예정(객원기사 자격)이라고 한다. 이제 진짜로 알파고가 프로 九단이 되는 것.

당초에는 전통적으로 하던 것처럼 한자에 붓글씨로 직접 쓴 단증을 수여하려고 하였다가, 한국인과 영국계 기업 간의 대결이었다는 점을 고려해 한글/영문으로 병기된 단증을 수여하는 것이 어떠냐는 지적을 받아들여, 한국기원에서 부랴부랴 새 단증을 뽑았다. 다만 이것도 九단이 9단으로 표기되어 [11]별로 좋지는 않다. 대국 후 기자회견에서 둘 다 수여(한글/영문본은 사진찍는 대외용, 원본은 기자회견 직전에 수여되었다고 한다)되었다.

4.3 이후 다른 프로기사들과 대국?

이세돌 九단과의 매치가 화제가 되면서 많은 프로기사들이 알파고와의 대국에 관심을 두고 있다.

당장 2016년 현재 세계 최강 커제 九단이 이세돌 - 알파고 대결을 보고 "왜 나(커제)는 빼고 하냐"라고 하면서 불평이 많았다는 후문[12] 이 발언 때문인지(?) 중국의 바둑 인공지능인 NOVUMind와의 대국을 제의받았으나, 커제 九단은 컴퓨터와의 대국 계획은 없다며 부인했다. #[13] 그보다는 NOVUMind 가 알파고보다 성능이 낮기에 너무 쉬울 것 같아서 제안을 거절한 것일 수도 있다. 구글이 이세돌 九9단과의 대국을 발표할 때 말로는 추후에 커제 - 알파고 대국도 추진할 예정인데 정확한 일정은 불명이라고.

2016년 3월 16일, 중국기원을 통해 커제 九단이 직접 알파고와 대국을 하겠다공식 선언했다. 중국 정부의 승인이 나는 대로 구글 사와 협의를 시도한다고 한다. 2016년 연내로 커제 - 알파고 대국이 성사될 것으로 보인다. 中 "알파고 vs 커제 연내 대결 추진…구글과 협의 중"

이외에도 일본 최강자 이야마 유타 9단, 여류바둑계 한국 주장인 최정 六단과 기타 많은 바둑기사들이 알파고와 대국을 하고 싶다고 한다.(by 문도원 3단 in 바둑 비타민) 문도원 3단은 "알파고 저도 쉽게 이길 수 있습니다"라며 선전포고성 발언을 했다 바둑계의 코너 맥그리거

5 동작 방식

알파고는 다음 세 가지 다른 인공지능 구조MAGI를 혼합하여 동작하도록 되어 있다. 알파고의 대국 메커니즘도 참고. 또 다른 정리물

  • 가치망 (Value Network) : 현재 국면에서 이길 확률이 얼마인지를 점수로 뽑아낸다. 일반적인 강화 학습에서 보는 가치 함수 역할. 심층 컨볼루션 신경망(Deep Convolutional Neural Network)이다. 탐색 과정이 없는 행렬 연산이므로 순식간(0.1초 미만)에 결과가 나온다.
  • 정책망 (Policy Network) : 바둑판을 인식하여 직관적으로 어디에 두는 것이 좋을지 각 위치에 대한 점수를 뽑아낸다. 역시 심층 컨볼루션 신경망(Deep Convolutional Neural Network)이며, 결과는 순식간에 나온다.
  • 몬테 카를로 트리 검색(MCTS) : 다양한 경우의 수를 따져 보는 인공지능. 착수할 시간이 충분히 주어질 경우 가장 오래 걸리는 부분이지만 반대로 최적화할 여지는 적다. 훈련된 정책망을 사용하여 직관적인 수부터 먼저 고려한 뒤 가치망으로 그 가치를 계산하는 것이 일반적인 MCTS와의 결정적인 차이.
  • 구글 딥마인드 내부에는 다양한 버전의 알파고가 존재한다. 위 셋 중에 하나 혹은 둘만 쓴 버전도 있고, 한 대에서 돌아가는 버전, 클라우드용 버전, 신경망의 커널을 다르게 한 버전 등도 있다. 판후이전에 사용한 버전은 세 가지를 모두 쓴 클라우드 버전이며, 논문에서는 ELO rating 3140점으로 추정하고 있었다. 이세돌과의 대국에서 사용된 것은 버전 18, 분산처리 버전이며, 이 버전의 ELO rating은 3586점(세계 2위)로 집계되었다. 일단 이 레이팅은 이세돌과의 5번기 승패만으로 추정한 값이므로 실제 실력을 다 반영하고 있다고 보기엔 무리가 있다.

기존 바둑 프로그램과 달리, 바둑의 룰이나 기보 DB에 따른 특수 처리를 덜 한다는 것이 특징이며, 구글에서는 이것을 바둑 이외의 전문 분야에서도 어려운 문제를 해결하는 데 쓸 수 있을 것으로 보고 있다. 구체적으로는 기상 예측이나 질병의 해석 등을 들었다.

기존의 사고방식대로 나온 경우의 수를 따지는 방식이 아닌, 여러 방식으로 승부를 '예측' 하기 때문에 실제 바둑이 알려진 경우의 수보다 훨씬 적은 수를 연산한다고 하며, 계산해야 할 수가 적어지는 대국 후반으로 갈 수록 점점 더 계산이 빨라지고 강해진다고 한다. 실제로 이세돌과의 대전에서는 후반에는 1분 이내에 착점을 하는 무시무시한 속도를 보여주어 초세기로 끌어가지도 못했고, 이세돌이 돌을 던지기 30분 정도 전에 이미 불리한 경우의 수를 제거하고 자신의 승리 예측을 개발진에게 알렸다고 한다. 그때는 한창 해설자들이 '박빙이다' 라고 한 때였고 그 말을 전해들은 하사비스는 묘한 미소를 보였다고.

5.1 학습 방법

  1. KGS 공개서버에서 플레이된 게임들 중 비교적 고수(6단부터 9단)의 게임 16만개로부터 약 3천만수를 가져와 정책망을 학습시킨다. 교사학습(Supervised Learning)으로 진행된다. 이 부분은 바둑의 룰에 따라 착점하는 것을 이해하는 초기화 과정이라고 보면 된다.
  2. 교사학습된 다양한 버전의 정책망끼리 서로 대전시키며 정책망의 성능을 개선해나간다. 강화학습(Reinforcement Learning)으로 진행된다. 수억번의 연습도 실제로 가능하다
  3. 스스로의 대전 기록을 복기하며 가치망의 성능을 개선해나간다. 강화학습(Reinforcement Learning)으로 진행된다.

KGS 기보 데이터베이스는 정책망 초기화(1번)에만 사용되고, 이후의 학습에는 전혀 사용하지 않는다. 실제 학습 진행은 모두 스스로와 대전하는 강화학습으로 진행되며, 이같은 학습방식은 알파고가 독학으로 기력을 향상시킨다는 것을 말하기 때문에 바둑 세계 챔피언을 알파고가 이긴다면 이때까지의 정석이나 좋은 포석 등으로 알려진 것들이 바뀔 것이라 예상된다고 한다.

알파고가 3천만 건의 프로기사의 기보를 습득해서 학습했다는 이야기가 있으나, 이는 자기 자신과 대국을 두는 자가 학습으로 3천만 건의 대국을 소화했다는 말이 와전된 것이다.[14] 4주 동안 백만 건의 자가 학습 대국을 치렀다는 내용 역시 백만 건의 기보를 습득했다는 식으로 와전되고 있다. 상당수의 언론이 용어를 분명하지 않게 쓰고 있는 데다가 정신승리찌라시들 덕분에 해당 내용이 계속해서 퍼지고 있는 중이다. 역시 기레기.

이러한 알파고의 학습 특징의 근간이 되는 딥 큐 러닝(Deep Q-Learning)을 알기 쉽게 예시용으로 아타리벽돌깨기(Breakout) 게임에 적용한 것이 위의 동영상이다. 이 동영상에서 딥 큐 러닝에게 주어진 정보는 단 두 가지, 게임 화면과 '최고 점수를 내라'라는 목표. 딥 큐 러닝은공이 무엇인지, 막대가 왜 필요한지, 저 위의 벽돌이 뭔지 전혀 모르는 그야말로 '백지' 상태', 시작한 지 10분 정도 정도는 제대로 조종조차 못하는 모습을 보였으나. 그러나 스스로 학습하며 120분이 지난 무렵에는 꽤 괜찮게 플레이를 하고 있으며, 240분이 지난 후는 터널을 뚫어 공을 블록 위로 올리면 점수 획득에 유리하다는 것을 '스스로' 능욕터득한 플레이를 보여준다.

뭔가 인공지능이라서 해서 그럴싸해보이지만, 결국 "보통 사람이 게임 초보에서 게임 고수가 되는 그 과정"을 컴퓨터로 에뮬레이팅한다고 보면 된다. 다만, 그것이 기존의 컴퓨터로는 한계가 있기 때문에, 슈퍼컴퓨터를 쓰는 것. 아무래도 개발자인 데미스 허사비스가 컴퓨터공학 학사+뇌과학 박사이기 때문에 "보통의 사람이 게임의 룰을 이해하는 과정"을 탐구하기 위해 이 프로젝트를 시작한게 아닐까 하고 짐작할 뿐이다.

5.2 기력

판후이와의 대전에 사용된 버전 13 알파고는 ELO 레이팅으로 계산했을 때 3140점이었다. 당시 판후이는 goratings 사이트기준으로 2904점이었고, 구글에서는 79%의 확률로 이길 것으로 예상하고 있었다.

김성룡 9단과 알파고의 이세돌전 바둑을 검토한 프로들의 말에 의하면 사실상 9단, 그것도 최정상급이라고 하였다. 기풍은 철저한 집계산을 통해 중후반 바뀌치기 등에서 실수가 없는 실리형 바둑. 전반적으로 전투를 피하는 편이며 행마도 빠르기 보단 굳건한 것을 좋아한다. 는 진짜 싫어해서(?) 사전에 패를 만들지 않으려고 한다. 다만 계산 시간이 좀 걸리고 실리형이라서 그렇지 진짜 대놓고 전투를 벌이면 무시무시한 실력을 보여주기도 한다. 특히 선빵선수를 두는 타이밍과 손빼는 타이밍이 정말 좋다. 단지 초읽기 대국이나 이세돌과의 대국에서 드러났듯이 복잡한 상황에서 판단이 늦는 경향이 있으며 한번 실수를 하면 계속해서 말리는 타입인 듯. 이것이 버그인지 아니면 엔진 자체의 한계인지는 아직 판단되지 않았다. 이세돌 9단은 백돌을 쥐었을 때보다 흑돌을 (쥐었을 때) 힘들어 하는 것 같고[15], (알파고가) 생각하지 못했던 수가 나왔을 때 버그(bug·시스템 오류) 형태로 실수를 한다고 밝혔다.

전문 기사와 겨룬 열 판에서 알파고는 백을 여섯 번, 흑을 네 번 잡았다. 흑을 잡든 백을 잡든 처음 두는 수가 (흑1이든 백2든) 모두 화점이고, 백4까지 보여준 포석에서 이런 특징이 있다(동아시아식으로, 흑1을 귀에 두면 그 귀를 우상귀로 잡고 설명한다).

최근 공개된 알파고(Ver18)의 자가대국 기보를 보면 알파고가 흑일때 화점+소목을 둔 후 흑5는 백의 좌하귀를 걸친 후 흑7은 손빼고 우변에 둬서 중국식포석을 주로 두는 것으로 확인되었다. 최근버전에서는 어떤 식으로 포석을 둘지 모르겠지만 아마도 이 포석은 다른 경우에서처럼 프로바둑(+인터넷바둑)에서 다시 유행을 탈 것으로 보인다.

일각에선 아예 처음부터 상대의 수준에 맞춰주면서(?) 플레이하는거 아니냐는 시각도 있다. 즉 어디까지나 상대를 효율적으로 이기기 위해 게임을 하는 것이기 때문에 아예 상대를 압도적으로 이길 만한 실력을 보이는 게 아니라, 상대 플레이어의 실력을 이길 정도에만 맞춘 게임을 한다는 것. 안티 스파이럴 하지만 이는 부인되었다. #

파일:YlQTErVl.jpg
2016년 3월 15일 기준, 공식전 결과만으로 집계한 ELO 레이팅은 3586점으로, 세계 2위이다. 그러나 딥마인드 내부적으로는 다양한 버전의 알파고들 사이의 대국 결과를 통해 이세돌전에 사용된 버전 18 알파고의 레이팅을 무려 4500점으로 추정하고 있었으며, 버전 13 알파고를 4점 접바둑으로도 이기는 압도적인 기력이었다고 대국 후에 밝혀졌다. 질 생각이 전혀 없었던 구글 ## 이 값이 사실에 가깝다면 레이팅 3600 정도인 인간 최고수가 알파고를 이길 확률은 0.5%에 불과하다.[19] 알파고의 4승이 놀라운 것이 아니라 이세돌의 1승이 정말로 놀라운 일인 것이다. 사진이 공개된 후 "이세돌이 알파고를 한 번이라도 이겨본 마지막 인간이 되는 것 아니냐"라는 반응마저 나오고 있다.

2016년 8월 아자 황 박사의 인터뷰에 따르면 최신 버전의 알파고는 프로를 두 점 접어줄 실력(!)이라고 한다. 기사

6 논란

한얼 법무법인의 전석진 변호사를 필두로, 구글이 실제로는 클라우드 컴퓨팅을 활용한 브루트 포스 방법론에 의존해 대국을 벌이고 있으니 사기극에 불과하다는 주장이 나왔다. 이러한 주장이 여러 기사를 통해 유포되며 많은 사람들에게 알려지고 있다.

하지만, 이는 알파고의 작동 원리를 전혀 이해하지 못한 주장으로, 애초에 바둑이 브루트 포스[20] 로 극복하기엔 너무나 경우의 수가 많아서 딥러닝을 도입한 것이기 때문이다. 애초에 고전 중의 고전으로 통하는 3x3 틱택토[21]에 A/I 를 적용한 시도에서도 브루트 포스는 쓰이지 않았다! 즉 이런 주장은 A/I 의 기본 중의 기본도 모르는 괴언인 셈.

예컨대, 바둑의 경우의 수를 최대한 작고 안전하게 추산하기 위해, 매 수마다 기사가 최대 두 군데의 선택지만 고려한다고 가정하자. 대국의 상황에 따라 선택지가 하나뿐인 수도 있겠지만, 실제로는 둘 이상의 선택지가 있는 경우가 훨씬 많을 것이므로 무시할 수 있을 것이다. 이세돌과의 제1국이 186수만에 마무리되었으므로 브루트포스를 시도할 때 고려해야 할 전체 경우의 수는 [math]2^{186}[/math], 약 [math]9.8 \times 10^{55}[/math]이다. 이 숫자는 일반적으로 바둑 대국의 경우의 수를 논할 때 등장하는 숫자들에 비해 터무니없이 적게 추산한 것이지만 엄청난 경우를 수를 나타내 준다. [22] [23]

4GHz급으로 오버클럭된 서버용 도데카코어 CPU 하나가 대국 하나를 검토한다고 치면 매 초당 [math]12\times4^{10}[/math][24]대국을 검토하는 셈인데, 이런 가정 하에서 모든 경우의 수를 계산하려면 CPU에게 약 [math]7.8 \times 10^{48}[/math]초가 필요하다. 전 세계에서 가장 빠르다는 슈퍼컴퓨터의 CPU 수만큼 이어붙여서 어찌어찌 효율 100%를 낸다는 가정 하에 계산을 때린다 쳐도[25] [math]7.3 \times 10^{43}[/math] 초, 연도로 따져도 [math]1.1 \times 10^{35}[/math] 년이 걸린다. 빅뱅이 시작된 태초부터 지금까지의 시간을 전부 들여서 계산해도 근접은 커녕 시작했는지 티도 안 날 정도다... 고작 몇시간짜리 대국 하나를 가지고 어느 세월에 다 계산한단 말인가(...) 브루트 포스 가지고는 우주적 스케일이 나와버리는 이런 문제를 해결하기 위해 딥러닝이 도입된 것이고, CPU가 천 개 넘게 사용됐다고 한들 오히려 굉장히 싸게 먹혔다는 표현이 부족한, 천문학적인 금액이 절감된 수준이라고 판단할 수 있는 수준이다.

게다가 구글에서 공개한 알카노이드 게임 재현을 통한 딥러닝 구현방식을 본다면, 오히려 인위적 조작을 하는게 오히려 더 알파고를 꼬이게 만들 수 있다. 말그대로 이 슈퍼컴퓨터는 원리상으로는 "슈퍼컴이 안에서 끊임없이 보통 바둑을 계속 두는 것" 뿐이다. 뭐 결론적으로 이 많은 경우의 수를 많이 분석했기 때문에 이세돌이 이길 수 없다는 것은 뻔한 결과일지도.

결정적으로, 알파고가 패배한 대국이 나왔다. 만일 정말로 알파고가 브루트 포스 기법으로 대국에서 가능한 모든 수를 탐색하는 것이라면, 알파고가 질 가능성 또한 당연히 전혀 없다. 그런데 알파고가 졌다. 더 이상의 설명이 必要韓紙?

알고리즘을 실제로 구현하는 과정에서 빠질 수 없는 과정이 시간복잡도 계산과 계산시간 추정인데, 정보올림피아드 출전하는 초중고 학생들도 이해하는 내용을 IT 전문 변호사가 간과한 이유는 다소 의문. 다만 IT에도 여러 갈래 분야가 있다는 점과, 변호사라면 특히 법정에서 다룰 만한 내용들을 주로 공부하였으리라는 점을 생각하면 전혀 이해 못 할 만한 점은 아니라고 할 수 있다. 물론 자신의 전문 분야도 아니면서 경솔한 발언을 한 것은 명백히 해당 변호사 개인의 문제점이다. 또한 IT 전문이라는 부분만 강조하며 전문성을 부여하려는 기사들 역시 비판받을 만하다.

동아사이언스에서 이런 음모론 제기에 대한 기사를 내었다. 알파고, 역사와 전통을 자랑하는 음모론에 빠지다 브루트포스를 위한 CPU 갯수를 추정하는 계산의 가정 및 결론이 본 문서의 것과 동일한데, 기사에서는 누군가 ~ 한다고 하더군요하는 식으로 출처를 얼버무렸지만 본 문서를 참고했을 가능성이 상당히 높다.

7 기타

  • 디시위키에선 알파고가 스카이넷이라고 주장한다. 국내외 각종 커뮤니티에서도 스카이넷, 혹은 울트론에 비유되고 있다. # 가끔 판사 드립과 엮이는 경우가 있다. 알파고님 저는 기계를 소중히 대해왔습니다. 하지만 4번째 대국에서 알파고가 이세돌 9단에게 패하자 순식간에 태세를 바꾸고는 이 최고라며 되레 알파고를 X퇴물이라며 깐바 있다. 알파고 의문의 퇴물행. 근데 5번째 대국에서 알파고가 다시 불계승하자 이틀만에 원상복귀해서 이세돌을 퇴물이라고 까고 있으며 알파고 문서에는 인간 승리및 한국 승리 틀이 사라지고 다시 기계의 승리[26]로 틀이 변경되었다. 이젠 새삼스럽지도 않다만...
  • 알파고의 기풍이 이창호와 닮아서 사실 알파고는 거짓이고 이창호가 안에서 둔다는 드립이 있다.[27]
  • 알파고가 애플로 갔으면 아이고가 됐을 거라 카더라 #
일본 IT 미디어에도 알파고 의인화가 소개됐다. #
  • 일반인들도 알파고를 알사범이나 알구단이라고 부르는 등 모에의인화하는 경향이 크게 늘었고, 신문기사 등에도 알파고를 마치 인격체처럼 취급하는 논조가 늘었다. 앞으로 인간 지능에 가까운 인공지능체가 등장할 경우에 일반인들의 반응으로 시사하는 바가 있다.
  • 서양 사람이 배나 자가용에 곧잘 여성대명사를 사용하는 것처럼, 알파고도 개발자들에게 She, her 등으로 불리며 여성으로 취급된다고 한다. 중계 등에서 He라고 부르는 사람에게 개발진이 She라고 부르라고 정정해 주었다고… 세계 1위 여류기사[30]
  • 알파고가 이긴 후 알파가 들어가는 단어들을 이용한 드립들이 뉴스 댓글창에서 유행하기도 했다. 알파문구 드립이라든지 알파부대 출신이라든지...
  • 알파고와 같은 바둑 프로그램들은 Zen, Crazystone, 돌바람 등이 있지만 기력적으로는 아직 상당히 모자르다. 아직까지 프로들에게 3점으로 패하는 수준. 알파고 출현 후 세계 각국에서 알파고에 맞설 인공지능 바둑 프로그램이 하나 이상은 개발되고 있는 것으로 보인다. 물론 알파고만큼 세간의 집중을 받은 건 아직 없지만.
  • 대국 이후 많은 사람들이 알파고를 극찬했지만 스튜어트 러셀 UC 버클리대학 교수는 알파고가 경기를 운영한 방식이 과거 딥블루가 체스를 둘 때와 거의 비슷해서 AI 관점에서 보면 조금 실망스럽다는 평가를 내렸다. #
  • 대국 이후 알파고가 심영과 대화를 하다가 폭발하였다 카더라. #
  • 러시아에서 열린 EGC2016(유럽 바둑 대회)에서 알파고에 관한 프레젠테이션이 판 후이에 의해 진행되었다. 판 후이는 몇 주후에 딥마인드에서 홈페이지를 만들어서 알파고와 이세돌의 대국, 그리고 알파고 끼리의 자체 대국에 대한 기보를 올릴 예정이며, 복기는 구리 九단과 저우루이양 九단의 도움을 받았다고 이야기했다. 또한 판후이는 알파고가 이세돌과의 대국 동안 생각했던 예상도도 소개했다. # 참고로 영상에서 판후이가 설명하는 알파고의 대응들은 지금까지 알파고가 뒷맛을 생각하지 않고 둔다는 얘기들과는 달리 단지 최상의 수를 두어가는 과정으로 설명했다. 알파고의 예상에 따르면 악수는 이세돌九단 만이 두고있었다는 설명이 된다.
  • 판후이와 아자황은 강연을 통해 계속해서 맛보기로 예상도를 보여주고 있다.프로기사들도 참고해야 할 정도의 예상도가 있으니 강력추천은 덤.US GO CONGRESS에서의 강연, 며칠 수 또 다른 미국 Go CONGRESS에서의 강연. 이 프레젠테이션에서 판후이는 구리 九단과 저우루이양 九단 뿐만아니라, 창하오 九단을 비롯한 많은 중국 기사들이 복기에 참여했다고 예기했다.

7.1 스타크래프트 도전설

구글은 향후 알파고의 인공지능 기술을 스타크래프트에도 접목하는 방안을 검토중이라고 한다. # 이에 임요환#, 홍진호#2번째다, 이영호# 이윤열#등은 바둑과 스타는 다를 것이라면서, 인간의 힘을 보여주겠다고 즐겁게 반응했다. 이윤열의 YTN 사이언스 인터뷰

한국 언론사의 확대해석으로 SBS 8시 뉴스에서 보도한 건 알파고 관련 팀장이(알파고 개발과 관련이 없는 구글의 전설적인 개발자다. 제프 딘은 하사비스보다 못지않게 영향력이 크고, 현재 구글 딥러닝 개발의 총괄책임자다)스타크래프트를 예시로 언급한 것을 확대해석했다는 주장이 있는데 사실이 아니다. 잘 들어보면 알겠지만 데미스가 관심이 있다라 말했고, 할 예정이다라는 이야기도 있다. 딥마인드의 수장 데미스 허사비스는 인터뷰에서 스타크래프트 도전 루머에 대해 게임을 잘 하느냐가 중요한 게 아니라 실험이 인공지능에게 도움이 될 수 있는가가 더 중요하다며 선을 그은 것은 맞지만, 하사비스 입장에서는 아직 구체적으로 계획을 밝힌 것이 없어 바로 부정했을 수 있다.

종합하자면 언론들이 말한 것 처럼, 스타크래프트를 차기 목표로 확정한 것은 아니다. 다만 스타크래프트에 도전할 가능성을 열어둔 것은 맞기에 루머라고 치부할 정도는 아니다.

애당초 스타크래프트와 같은 실시간 진행 비디오 게임은 알파고와 같은 인공지능도 필요 없이 APM 컨트롤 싸움만 걸어도 사람이 이길 수 없다. AI 대전을 해 보면 알겠지만 트리거를 쓰지 않아도 컴퓨터는 스킬 사용의 정확도나 스킬 동시발동 등의 스킬 컨트롤에서는 인간보다 한참 우위이며[31] 게임 개발사들이 굳이 트리거 지정 없이도 신컨을 할 수 있는 AI를 추가하지 않는 이유는 그러면 게임이 너무 어려워 재미가 없어서다. 굳이 인간과 비슷한 조건을 만드려면 정밀제어가 가능한 로봇팔로 조작시키고 APM에 리미트를 걸면 되겠지만 그래도 인간을 능가하는 수준의 마우스 키보드 컨트롤이 가능할 것이다. 로봇팔은 인간의 팔과 달리 고속으로 움직이더라도 실수가 없으며 지치지도 않는다.

알파고라면 게임 규칙을 거의 모르는 상태에서 다른 사람들의 플레이 양상을 여럿 보고 자신이 직접 반복 플레이를 해보며 게임을 배우는 머신러닝이 핵심인 시스템이다. 또한 바둑처럼 턴방식이 아니니 실시간으로 순간적 판단을 내려야 하며, 적의 기지를 정찰하고 파악, 분석하며 기억해서 이에 맞춰 앞으로 상대가 추구할 전술을 추론하고 계획을 수립하며, 또 바뀌는 적의 전술을 적의 병력이나 추가 정찰 등으로 파악하면 이에 따라 또 순간적으로 전술을 고쳐야 하는 등 아주 복잡한 요소들이 많다.

한편으로 알파고가 스타에 안 도전해도 일단 스타를 비롯하여 RTS 게임을 하는 AI 자체는 있다. 아예 BWAPI라고 브루드워 인공지능용 툴도 있으며, SSCAIT, CIG, AIIDE등의 AI토너먼트도 열리고 있다. 다만 앞서 말한 여러 까닭들 탓에 여전히 인간에게 도전할 수준의 실력은 없다고.

중요한건 이렇게 글로 승부를 가려낼 수 있을만큼 알파고의 성능은 낮지 않고, 게이머의 저력도 엄청나므로 시원하게 한판 붙어보지 않는 이상 정확한 실력차는 미지수다.

디시 스타크래프트 갤러리에서 알파고 스타크래프트 관련으로 문의 메일을 보내자 이런 답변이 왔다고 한다. 그렇게 설레발로 마무리되나 싶었는데 3월 27일 중국 상하이 WCS 결승전에서 공허의 유산 수석 프로듀서 팀 모튼이 알파고와의 스타크래프트 2 대전을 놓고 구글과 블리자드가 논의 중이라고 언급하였다. 방한한 모하임 블리자드 CEO도 국내 언론사와의 인터뷰에서 구글 측과 실무협상을 벌인다고 밝혔다. 스타1, 2 등 종목과 선수, 장소 등을 협의한다고 했다가 다른 인터뷰 기사에서는 접촉만 있었을 뿐 실무협상은 없었다며 사실이 아니라고 부정했다. 현재까지는 떡밥에 불과한 듯.

5월 19일 구글이 로봇팔을 훈련 중이라는 기사가 나오면서 스타크래프트 도전설이 재점화됐다. 구글 “로봇팔 훈련중”…스타크래프트 진검승부 가시화?

8 관련 인물

  • 딥마인드
  • 바둑 기사
    • 판후이 : 2015년 10월 알파고와 대국하였다.
    • 이세돌 : 2016년 3월 알파고와 대국하였다.

9 함께보기

(영어)
(영어)
디시인사이드 알파고 갤러리

  1. 공식 유튜브 캡션 한국어 자막을 지원하므로, 자막이 안 보인다면 유튜브 플레이어 하단에 자막 버튼을 클릭
  2. 실제로 알파고의 기풍은 전성기 당시의 이창호 九단과 상당히 비슷하다. 대승의 여부를 따지지 않고 철저하게 승리 그 자체만을 취하는, 상대로 하여금 이기고 있는 듯 싶다가도 정신차리고 보면 이미 지고 있는 상태로 만들어 버리는 그런 바둑을 두고 있는 상황이다.
  3. 이러한 이유로 일본 언론 등에서는 알파고를 アルファ碁라고 표기한다.
  4. 바둑을 뜻하는 한자는 碁, 棋, 棊 세 가지가 있다. 모두 '바둑 기'. 일본에선 碁를, 한국과 중국에선 棋를 주로 사용한다.
  5. 알파고는 인공지능이라 성별이 따로 없으므로 성별란이 비어있다. 내가 알파고자라니!!
  6. 2016년 7월 17~21일, 8월 27~29일, 9월 7~10일, 20~28일, 10월 1일 커제를 제치고 1위에 올랐다. 순위는 매일 조정되고 있다.
  7. 참고로 이 승률은 1개의 컴퓨터를 사용하는 싱글 알파고가 따낸 승률이다
  8. 물론 이것도 멀티CPU 시스템이긴 하다. 48코어.
  9. 다만, 구글이 이걸 개발하는 이유는 궁극적으로 범용인공지능을 개발하기 위한 하나의 도전과제이기 때문이다. 다시 말하자면, 범용인공지능을 개발하면 벌 수 있는 막대한 돈을 생각한 장기적 관점의 투자인 것이다.
  10. 입단 후 유럽으로 건너가 바둑 보급에 힘쓰고 있다.
  11. 별도 명시가 없는 한 그냥 9단으로 쓰면 아마 9단을 뜻한다. 프로 단수는 규정상 한자로 표기(한국기원 프로바둑기사 규정)한다. 아마추어는 숫자, 프로는 한자.
  12. 김성룡 九단 - 농심신라면배 최종국 이세돌 vs 커제 해설 중.
  13. 커제 九단은 대회 참가할 때 돈(우승상금)을 무지막지하게 밝힌다. 국내대회는 물론이고 세계대회 중에서도 진짜 상금이 큰 대회만 골라서 출전하는 걸로 중국 바둑계에서도 심심찮게 까이는 중. 상금 큰 대회를 별로 좋아하지 않는 기사로는 중국스웨 九단이 있다. 스웨 九단은 결승전 부담감이 너무 커서 막판에 멘탈이 흔들린다고.
  14. 물론 대국 1회에 1개의 기보가 생겨나지만 당연히 이런 의미는 아니다.
  15. 아마도 때문에 그런 듯하다. 361(중국식 계가법은 살아 있는 돌도 집으로 세기 때문에 흑집과 백집을 더하면 반드시 19²=361이다)을 100%, 딱 반인 180.5를 50%라 치면 덤 3¾子(덤 7집반을 중국식으로는 이렇게 쓴다)는 (3¾÷361)×100%≒1.04%인데, '알파고는 흑 승률 48%, 백 승률 52%로 시작한다'는 설명이 사실이라면 실제 중국식 계가법으로 둔 바둑의 통계 결과와 비슷하다.
  16. 흑1이 우상귀 소목이면 흑1에서 한 칸 더 먼 쪽인 좌상귀 화점에 백2를 둔다.
  17. 판 후이 二단와 대결한 제1국은 판 二단이 흑1, 3 모두 화점으로 시작하자(양화점) 알파고는 백4를 비어 있는 좌하귀에 소목으로 두었다.
  18. 이때는 두 번 다 백4까지 천원을 중심으로 점대칭이었는데 그 다음 수인 흑5를 보면, 흉내바둑에 대처할 수 있는 것 같다.
  19. 참고로 승률 계산식은 1/1+10^(Ra-Rb/400)이다. Ra에 높은 쪽 레이팅, Rb에 낮은 쪽 레이팅을 넣으면 된다.
  20. 모든 경우의 수를 필터링 없이 무작정 전부 계산하는 것. 아이디어와 구현은 간단하나 대개의 경우 실용적으로 쓰기엔 너무 계산량이 많다. 문서 참조.
  21. O와 X를 3x3 표에다 그어 삼목을 만드는 게임. 총 경우의 수는 19,683가지. 인간이 모두 고려할 만한 경우의 수는 아니다.
  22. 실제로는 바둑의 끝내기 단계 전까지는 매 수마다 평균 5개 정도, 어떤 경우에는 10개 정도의 착점이 고려된다고 보면 된다
  23. 블로터 기사에 따르면 [math]10^{170}[/math]
  24. 12,582,912
  25. 참고로 슈퍼컴퓨터 항목을 보면 알겠지만, 최고 성능의 슈퍼컴퓨터는 약 1060만개 코어에 1.4GHz 클럭이다. 실제로 4.0클럭 수준의 코어가 1000만개는 고사하고 1000개씩이라도 덕지덕지 붙어있으면 사용은 커녕 작동가능여부나 걱정해야 할 판(...)
  26. 기계 1승 틀 자체가 알파고 문서에서 처음 생성된 오리지날 틀이 기원이다.
  27. 사실 이건 18세기에 유명했던 튀르크인(The Turk)이라는 기계의 사례에서 비롯된 것이다. 튀르크인은 체스를 두는 기계라고 하여 유명하였는데, 그 정체는 사실 기계 속에 몸집 작은 사람이 숨어 있는 것이었다.
  28. 알파고가 질 걸 상정하고 그려놨었다고 한다. 그리고 이는 4국 이후 현실이 되었다.오오 오라클 오오
  29. 사실 PSP 모에화 중 하나의 표절이다.
  30. [1]에서 Elo 레이팅 상위 100위까지의 목록을 보면 죄다 남자밖에 없다. 유일한 예외가 바로 알파고. 알파고의 성별은 표시되어 있지 않다.
  31. 인공지능이 발매 당시에도 특별할 게 없던 스타크래프트 1에서조차 컴퓨터는 인간이 못할 모든 스킬 동시에 사용하기를 해낸다. 적 고스트가 보이자 마자 바로 락다운 걸어버리고 자신이 락다운걸면 바로 풀어버리는 등. 그런데도 인간에게 패배하는 이유는 언제 어느 지점에 스킬을 발동해야 더 큰 피해를 줄 수 있는지 등의 인간보다 모자란 판단력이 이런 컨트롤 실력 차이로는 못 메울 수준이기 때문이다.

이 문서의 내용 중 전체 또는 일부는 바둑문서에서 가져왔습니다.</div></div>