인터넷

구글 알파고의 야심, ‘입신의 경지’마저 넘어설까

이대호

- 구글 딥마인드서 개발한 알파고(AlphaGo), 이세돌 9단에 도전장
- 알파고, 인간보다 학습효율은 떨어지나 4주 동안 100만번 대국 경험

[디지털데일리 이대호기자] 구글의 인공지능(AI) 컴퓨터 프로그램인 알파고(AlphaGo)가 유럽 바둑대회에서 3회 우승한 바둑기사 판 후이(Fan Hui) 2단을 5전 전승(youtu.be/SUbqykXVx0A)으로 이겼다. 다음 상대는 바둑 세계 최고수로 통하는 이세돌 9단. 이 9단은 구글의 도발적인 제안을 흔쾌히 받아들였다.

과연 구글 알파고가 입신의 경지로 불리는 바둑 9단을 이길 수 있을까. 그것도 이세돌 9단이다. 이 9단은 “적어도 이번엔 내가 이길 자신이 있다”고 소감을 밝혔다. 세기의 바둑 대결은 오는 3월 서울에서 열린다.

구글 딥마인드의 공동 창업자이자 최고경영자(CEO)인 데미스 하사비스<왼쪽>와 구글 딥마인드의 리서치 사이언티스트(강화학습연구 총괄)인 데이비드 실버
구글 딥마인드의 공동 창업자이자 최고경영자(CEO)인 데미스 하사비스<왼쪽>와 구글 딥마인드의 리서치 사이언티스트(강화학습연구 총괄)인 데이비드 실버
이와 관련해 구글코리아가 28일 서울 역삼동 집현전 사무실에서 구글 알파고를 개발한 딥마인드(DeepMind)의 미디어 브리핑 자리를 마련했다.

이날 구글 딥마인드의 공동 창업자이자 최고경영자(CEO)인 데미스 하사비스와 구글 딥마인드의 리서치 사이언티스트(강화학습연구 총괄)인 데이비드 실버가 국내 미디어와의 화상연결에 참여했다.

구글이 서구권에서 유명한 체스보다 바둑에 도전한 이유는 ‘인간이 만들어낸 가장 복잡한 게임’으로 봤기 때문이다.

데미스 하사비스 딥마인드 CEO는 “매 포지션마다 다음에 둘 수 있는 경우의 수가 체스는 20여개지만 바둑은 200여개”라고 말했다. 또 “체스엔 왕과 왕비가 있지만 바둑은 모든 돌이 동등하기 때문에 논리적 규칙을 정하고 특정 포지션에서 누가 이기는지 정의하는 게 어렵다”고 도전의 이유를 밝혔다.

그는 ‘알파고’와 체스 챔피언과의 대결에서 승리한 IBM 딥블루의 차이점을 ‘범용 알고리듬’에 뒀다. 딥블루는 일일이 경우의 수를 입력해서 무작위 대입하는 시스템이지만 알파고는 기계학습(머신러닝)을 활용해 어떻게 이기는 지 자체적으로 학습하는 AI라는 것이다.

알파고는 정책망(policy network)과 가치망(value network), 2가지 신경망을 사용한다. 정책망이 다음 움직임을 예측(탐색DB 축소)하고 가치망이 각각의 수의 승률을 평가하고 그 중 성공적인 수를 실행하는 역할을 맡는다. 이를 통해 수천만회 바둑을 두면서 강화학습을 하고 시행착오를 통해 새로운 전략을 발견하는 것이 알파고의 AI다.

이 AI는 앞서 언급한대로 ‘범용 알고리듬’을 채택해 새로운 학습만 가능하다면 다른 분야에서도 활용될 수 있다. 우리 생활 가까이에서 보면 가장 적절한 여행계획을 세우거나 의료 분야에선 CT나 MRI 사진을 판독하는 진단용으로도 이 AI가 쓰일 수 있다.

그러나 구글 알파고도 학습효율에 있어선 인간의 상대가 되지 못한다. 데이비드 실버 강화학습연구 총괄의 표현을 빌리자면 ‘하나를 가르치면 열은 안다’는 속담이 AI에겐 적용되지 않는다. 그는 “인간이 학습하는데 있어 기계보다 효율성을 보인다”고 말했다.

그렇지만 알파고는 인간과 달리 무중단 학습이 가능하다. 이미 지난 4주동안 100만번의 대국을 뒀다. 인간의 시간으로 봤을 때 한 세대(30년) 이상을 바둑에 집중했다고 볼 수 있다는 게 데이비드 실버 총괄의 설명이다. 그는 “한 선수가 1년에 1000번의 대국을 둔다면 알파고는 1000년에 해당하는 경험을 했다”고 말했다.

하사비스 CEO는 이 9단과의 대국 결과 전망에 대해 “진다면 재도전을 고민할 것인데 최선을 다해서 이기는데 초점을 둔다”며 “이긴다면 세계바둑협회나 개별 협회에서 알파고가 선수로서 출전할 수 있는 기회가 주어질 수 있는지 볼 수 있겠으나 현재는 3월 대국에만 집중하겠다”고 답했다.

그는 이 9단이 알파고의 대국 스타일에 대해 어떤 소감을 밝힐지도 궁금하다고 말했다. 하사비스 CEO는 “아마추어가 만든 시스템인데 바둑스타일에 대해 프로기사의 평가를 들어보면 좋겠다”며 “이 9단이 세계최고 기사이기 때문에 어떤 평가가 나올지 궁금하다”고 기대감을 보였다.

<이대호 기자>ldhdd@ddaily.co.kr

이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널