백지영 칼럼

[취재수첩] ‘알파고’에 뺨맞고, 번역기에 화풀이?

백지영

[디지털데일리 백지영기자] 지난 21일 세종대학교에서 개최된 인간 번역사와 인공지능(AI) 번역기의 대결이 연일 화제가 되고 있다. 지난해 3월 열렸던 이세돌 9단과 구글 딥마인드 ‘알파고’와의 바둑 대결에서 인간이 완패한 것에 대한 수모를 풀기도 하듯, “번역에선 인간이 AI를 눌렀다”는 제목의 기사도 유독 눈에 많이 띤다.

하지만 이번 대결이 과연 어떠한 의미가 있었는지에 대해선 비판의 목소리가 높다. 바둑이나 체스와 같이 명확한 평가가 가능한 게임과 달리, 주관적인 평가 기준이 들어가는 번역은 애초 대결 자체가 무의미하다는 지적이 제기돼 왔다. 특히 아직 초기단계인 AI 번역이 일정 수준에 도달하지 않은 만큼, 인간의 승리는 예상돼 왔다. “번역분야에선 아직 인간이 AI보다 월등하다”는 ‘시선 끌기’에는 성공했지만 평가 등 진행방식에서의 논란은 앞으로도 지속될 듯 보인다.

심지어 이 과정에서 네이버 파파고의 경우, 기존 통계 방식이 적용돼 경기가 공정하지 못했다는 지적도 받았다. 현재 베타 버전인 네이버 파파고는 200자까지만 인공신경망번역기술이 제공되는데, 이번에 제시된 번역지문은 모두 200자가 넘었다. 때문에 이번 대결에선 기존 통계 방식이 적용됐다는 것이다.

대결 방식을 이랬다. 행사를 주최한 세종대학교와 한국통번역사협회는 5년 이상 경력을 가진 전문 번역가 4명과 구글, 네이버, 시스트란 등 3사의 번역기를 대결에 참여시켰다. 문학과 비문학으로 나눠 한-영, 영-한 번역 2개씩 총 4개의 지문으로 경쟁을 벌였다.

일간지 오피니언란의 지문과 근대 문학소설(어머니와 딸), 폭스뉴스 경제면의 기사 등의 일부가 제시됐고, 각 15점씩 총 60점 만점으로 배점이 이뤄졌다. 인간 번역사에겐 50분의 시간이 주어졌지만, 번역기는 지문을 입력하자 1초만에 결과가 나왔다.

그 결과 인간 번역사는 49점으로 압도적 우위를 차지했다. 하지만 3사의 번역 서비스는 익명 처리해 A사는 28점, B사는 15점, C사는 17점이라는 점수만 공개했다. 이후 각 언론에선 각 번역기가 무엇이었는지 알아내는 시도(?)가 이어지기도 했다. 국제통번역협회는 이에 대해 “순위 보도를 통해 해당 자동번역기 기업의 이미지에 타격을 줄 수 있으니, 더 이상의 혼란을 가중시키지 말아달라”고 정정보도 요청을 냈다.

최근 통번역시장에는 인공신경망번역기술의 대세가 되고 있다. 단어가 아닌 문장 전체의 문맥과 어순을 고려해 번역하기 때문에 번역결과가 정확해진다. 다양한 언어와 어순, 의미를 스스로 학습하는 머신러닝 방식을 통해 실시간 번역 품질 향상을 기대할 수 있지만 아직은 걸음마 단계다. 물론 데이터가 많아지고 시간이 흐르면서 엄청난 발전이 기대되는 분야다. 다만 이번 대결은 마치 아직 훈련 중인 자율주행차와 F1 레이싱 선수의 대결 같았다.

특히 대회 자체가 성급하게 진행되다보니, 번역기 업체들과의 제대로된 커뮤니케이션이 없었다. 구글이나 네이버는 기사를 보고 경기사실을 알았다고 할 정도다. 번역기 업체 중 참여한 곳은 시스트란이 유일했다. 인공지능 번역기와의 대결을 통해 통번역사의 직업 정체성과 통번역 시장 전망하려는 한국통번역사협회의 기존 취지가 무색하게 돼 버렸다.

<백지영 기자>jyp@ddaily.co.kr

백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널