인터넷

이세돌 9단 “구글 인공지능 알고리듬 들어보니 만만치 않아”

이대호

왼쪽부터 데미스 하사비스 구글 딥마인드 최고경영자, 이세돌, 에릭 슈미트 구글 알파벳 회장
왼쪽부터 데미스 하사비스 구글 딥마인드 최고경영자, 이세돌, 에릭 슈미트 구글 알파벳 회장
[디지털데일리 이대호기자] 이세돌 9단이 오는 9일 구글 딥마인드가 개발한 인공지능(AI) 프로그램 ‘알파고’와 대국을 앞둔 가운데 기존과는 다른 모습을 보였다. 이전까지 “5대0으로 이긴다”며 자신감 넘치는 모습을 보였으나 8일 대국 전날 미디어간담회에선 “5대0까지는 아닐 것 같다는 생각이 든다”며 한발 물러났다.

이와 관련해 이세돌 9단은 8일 서울 종로구 포시즌스호텔에서 열린 미디어간담회에서 “여전히 자신감은 있다”면서도 “아직은 인간의 직관을 인공지능이 따라오기 힘들지 않나라고 봤는데 (구글이 이날 발표한) 알고리듬을 보면서 직관을 어느 정도 모방했다고 생각했다”고 말했다.

이어서 그는 “전에 말씀드린 것처럼 크게 차이나는 것은 아니라고 본다”며 “5대0까지는 아닐 것 같다는 생각이 든다”고 덧붙였다.

이세돌 9단은 “인간이 생각하는 수가 최대 1000가지 수라면 알파고의 경우 백만수, 천만수가 가능하다 생각했는데 생각의 폭을 줄여 10만수를 본다고 하니 그랬을 땐 위험할수 있겠다 생각했다”고 속내를 밝혔다.

또 알파고와 대국에서 첫판을 지면 어떻게 하겠느냐 질문엔 이전처럼 자신감을 드러냈다. 그는 “첫판을 진다고 생각 자체를 하지 않았다”면서 “첫판을 지는 여러 경험을 했기 때문에 판후이 2단처럼 흔들리지 않을 것이다. 그런 것도 훈련하고 있다”고 답했다.

알파고 개발을 주도한 데미스 하사비스 구글 딥마인드 최고경영자(CEO)는 이전 간담회와 같이 구글 알파고의 알고리듬을 재차 언급하면서 “정책망을 통해 (경우의수) 탐색범위를 줄이고 가치망을 통해 탐색의 깊이를 좁히면서 훨씬 더 (착점) 검색을 잘할 수 있게 했다”고 알파고의 AI를 설명했다.

하사비스 CEO는 알파고가 판후이 2단을 이긴 것을 두고 “많은 AI 전문가들의 예측보다 10년 빨리 이뤄진 결과”라며 “알고리듬 개선에 주력한 결과”라고 말했다.

그는 인공지능 개발 관련해 “범용 학습러닝머신을 개발하는 게 목적”이라며 “기존(내로우) AI의 경우 수작업으로 프로그래밍해야 한다. 예측 불가능한 과제에서 제대로 성능을 발휘할 수 없다”고 알파고의 개선점을 꼽았다.

다음은 이세돌 9단과 데미스 하사비스 구글 딥마인드 최고경영자(CEO)와의 일문일답이다.

Q 알파고의 강점과 약점은?

- 강점은 피로하지 않다는 것이다. 겁먹지 않는다. 인간으로서 이세돌 9단과 대국한다면 긴장하겠지만 기계라서 그럴 가능성은 없다. 이번 대국을 통해 알지 못한 것을 약점을 파악해낼 것이다.(데미스 하사비스)

Q 이세돌 9단의 자신감 근거는 무엇인가?

- 여전히 자신감이 있다. 아직은 인간의 직관 감각을 인공지능이 따라오기 힘들지 않나 보는데 (알파고의) 알고리듬을 보면서 직관을 어느 정도 모방하겠다 생각했다. 전에 말씀드린 것만큼 크게 차이나는 것은 아니라고 본다. 5대0까지는 아닐 것 같다 생각이 든다.(이세돌)

Q. 알파고에게 병목현상이 있는지 모르겠다. 인간은 아무리 노력해도 능력향상에 병목을 겪을 수 있는데?

- 알파고가 학습개선에 있어서 한계가 있는가는 지금까지 본 바로는 능력향상에 한계를 보지 못했다. 인간에 있어선 학습능력애 한계가 있을 수 있으나 알파고의 경우 그런 경우가 없다.(데미스 하사비스)

Q 이세돌 9단 대국을 앞둔 소감은. 특별한 대국 준비를 하고 있나?

- 이번처럼 생소한 느낌은 처음이다. 너무 기분이 좋다. 사람이 아니다보니 준비하는 것이 다르다. 상대방의 기운, 기개를 읽는 것이 중요한데 이번 대결에선 그런 것을 읽을 수 없다. 혼자서 두는 느낌이 들 수 있다. 하루에 1~2시간 가상훈련 통해서 극복하려고 노력하고 있다.(이세돌)

Q. 알파고는 이세돌 9단과 매번 대국할 때마다 자가학습할텐데, 이때 개발자들이 투입돼 알고리듬을 개선하는가?

- 새로운 법칙 이라든지 이런 것은 하루 밤사이에 프로그래밍 할 수 없다. 스스로 트레이닝통해 학습할 수 있는데 하나의 게임으로 학습할수 있냐, 이것은 일단 데이터가 충분치 않다고 본다. 수천 개의 테이터가 있어야 새로운 것을 학습할 수 있다. 경기가 끝난 후 그날 저녁마다 프로그래밍을 다시 하지는 않는다.(데미스 하사비스)

Q. 알파고가 인류의 실제 문제를 해결한다고 했는데.

- 이번 대국 통해서 내보이고 싶은 메시지는 알파고가 강력하면서도 유연한 학습 알고리듬을 가졌다는 것이다. 흥미로운 문제 해결에 기여할 수 있다. 이번 대국결과와 상관없이 알파고는 인간의 창의성의 힘을 증명할 수 있게 될 것이다. 알파고도 뛰어난 과학자들이 만들어낸 것이다. 실제 문제해결에 적용하는 것은 의료보건 분야에 가장 많은 관심을 가지고 있다. 데이터를 수집해서 정확한 진단이 이뤄질 수 있게 기여할 것이다. 일반적으로 알파고 시스템 기술은 여러 다른 종류의 문제 해결에도 도움이 될 수 있다.(이세돌)

Q 이세돌 9단과 대국에 앞서 알파고는 어떤 훈련을 했나. 판후이 2단과 붙을 때와 다른가?

- 특수훈련을 하지는 않았다. 물론 지난해 10월 버전과 이번 버전은 차이가 있다. 여러 자가 학습 데이터를 생성했다. 훨씬 양질의 데이터다. 피드백을 더 받을 수 있었다.(데미스 하사비스)

Q. 인간수준의 인공지능이 위험할 수 있다는 의견이 있다. 그런 위험에 대해서 어떻게 보는가. 그런 인공지능은 언제 출현하리라 보나?

- 새로운 강력한 기술이 등장할 때 중립성을 가진다. 인간이 어떻게 사용하냐에 따라 선한 것이 되고 악한 것이 될 수 있다. 구글 딥마인드는 모든 부분에 관심을 가지고 있다. 윤리적 부분에 많은 신경을 쓴다. 많은 사람들에게 혜택줄 수 있는 방식으로 쓰고자 한다. 인간수준에 도달할 것인지 앞으로 수십년이 걸릴 것이라 생각한다. 앞으로 상당히 많은 연구가 필요하고 도전과제를 극복해야 인간수준의 인공지능이 만들어질 것이다.(데미스 하사비스)

Q. 이세돌 9단이 지면 바둑은 컴퓨터가 잘 두는 게임이라고 해서 매력이 떨어질 수 있을 것도 같은데?

- 물론 질수도 있다. 그러나 바둑의 아름다움을 컴퓨터가 이해하고 두는 것은 아니다. 바둑의 가치는 계속될 것이다. 이번엔 제가 꼭 인간의 그런 것을 지켜낼 수 있도록 최선을 다하겠다.(이세돌)

Q. 이세돌 9단은 자신감을 보였다가 긴장한 모습도 보였는데 이유를 쉽게 풀어서 설명해달라.

- 알파고 알고리듬을 설명했는데 생각하는 수가 적다. 인간이 생각하는 수가 최대 1000수라고 생각한다면 알파고는 아주 많은 백만수, 천만수 정도라 생각했는데 10만수라고 했다. 생각의 폭을 줄였다. 그랬을 땐 위험할 수도 있겠다 생각했다.(이세돌)

Q. 알파고는 엄청나게 많은 데이터로 스스로 훈련했다. 이 가운데 프로기사의 기보는 적을 수 있다고 보는데, 이상한 수가 나올 수도 있지 않을까?

- 알파고의 경우 인간 프로기사 대비 상당히 많은 훈련을 했다. 프로기사들 보면 30~35세 정도 1년에 1000건 대국 치른다고 알고 있다. 그 경우 일단 평생 동안 수십만건의 게임 치르게 되는데 기보도 많이 공부하게 된다. 그러면서 스승한테 지도를 받는다. 알파고의 경우 스승의 지식을 지도를 통해 전달받는 게 없다. 정제된 지식을 받지 못한다. 알파고는 수천만건의 자가경기를 치렀다. 그럼에도 불구하고 스승이 없다는 단점은 극복해야 한다.(데미스 하사비스)

Q. 알파고는 착점할 때 어려운 수를 만나면 장고를 하는지, 시간편차가 있나?

- 알파고는 얼마정도의 시간을 두고 착수해야 하나 계산한다. 경우에 따라 더 많은 시간을 할애할 수 있다.(데미스 하사비스)

<이대호 기자>ldhdd@ddaily.co.kr

이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널