인터넷

인공신경망번역 진화의 끝은 어디?…네이버, ‘파파고’ 오프라인용 준비

이대호
네이버 파파고 김준석 리더(왼쪽), 신중휘 테크리더
네이버 파파고 김준석 리더(왼쪽), 신중휘 테크리더
- 서버 연결 없이도 인공신경망번역 가능한 엔진 구현…연말까지 연구
- 웹사이트 번역에도 인공신경망 기술 적용

[디지털데일리 이대호기자] 지난 1949년 기계번역 연구가 시작됐지만 반세기가 넘게 답보상태를 겪었다. 물론 조금씩의 발전은 있어왔으나 눈에 띌만한 진전은 좀처럼 나오지 않았다.

그러다 단어 기반, 구(phrase) 기반으로 번역 연구가 새로운 지평을 맞았고 2014년 들어 기존의 통계기반번역(SMT)의 패러다임을 뒤흔드는 혁신적인 연구모델이 나오게 된다. 인공신경망번역(NMT) 모델이다. 네이버가 구글보다 한달 앞선 2016년 10월, NMT 기반 ‘파파고’ 서비스를 선보인 바 있다.

NMT 연구는 기계가 문장 전체를 인식하는 것이 특징이다. 이 때문에 단어 단위, 구 단위보다 자연스러운 의미 번역이 가능해졌다. 특히 한국어와 영어 간 번역에서 난제로 꼽힌 어순 문제도 해결하게 됐다.

물론 NMT 연구도 더 발전해야 한다. 많은 연산량을 필요로 해 상당한 컴퓨팅파워가 뒷받침돼야 하는 것이 한계로 꼽힌다. 이 때문에 서버와 연결이 끊긴 NMT 엔진은 개발이 쉽지 않다. 구글이 자사 번역 앱에서 오프라인 번역을 구현했으나 기존 통계기반 번역보다 품질이 떨어진다는 평가가 나올 정도다. 번역엔진을 소형화하다보니 빚어진 일이다.

네이버(대표 한성숙)가 여기에 도전한다. 27일 네이버는 기술 스타트업 지원을 위해 강남대로에 마련한 D2스타트업팩토리에서 미디어 대상의 테크스터디를 열고 파파고 오프라인 번역기 개발을 알렸다.

파파고 개발진은 온라인과 오프라인 번역엔진을 같은 수준으로 구현하긴 어렵더라도 그 차이를 최소화하는데 주력한다. 해외여행 중 데이터통신이 끊긴 스마트폰에서도 자연스러운 번역 지원을 목표한다.

네이버 파파고 번역엔진 개발을 담당하고 있는 신중휘 테크리더는 “작고 가벼운 오프라인 번역엔진을 만들고 있다”며 “연산량이 워낙 많아 (서버에서) 복잡한 연산을 하고 (단말기로) 돌아와야 하는데 이것을 네트워크 없이 하는 것은 어렵다. 그러나 연내 출시를 목표로 개발한다”고 말했다. 김준석 네이버 파파고 리더도 “오프라인 번역기 소형화 작업을 연말까지 진행한다”고 덧붙였다.

신 리더는 “번역엔진 소형화가 굉장히 어려운 작업이지만 니즈가 많이 있다”며 “기존보다 훨씬 좋은 번역기를 만들고 싶다. (온라인용 파파고와 비교 시) 스펙적으론 제한이 있지 않을까하는데 만들어가면서 가이드라인이 나오지 않을까 한다”고 부연했다.

파파고 웹사이트 번역
파파고 웹사이트 번역
이날 네이버는 ‘파파고 웹사이트 번역’ 기술도 선보였다. 파파고 홈페이지에 들어가면 이용할 수 있다.

인공신경망 기반의 웹사이트 번역엔 보다 고도의 기술이 적용돼 있다. 웹사이트 내 텍스트(글)엔 컬러가 들어가거나 볼드(굵게) 처리, 주소 링크 등 번역에 불필요한 다양한 장애물이 포함돼 있기 때문이다. HTML 환경에서 보면 문장 속 태그 명령어도 볼 수 있다. 이로 인해 분절된 문장을 연결하고 자연스러운 번역을 하는 것이 쉽지 않다. 그러나 파파고 개발진은 그동안의 연구를 통해 파파고 기술을 녹여낸 웹사이트 번역을 구현했다.

김준석 리더는 “27일자로 통계기반 방식에서 인공신경망 기능으로 웹사이트 번역을 고체했다”며 “기사나 블로그 등 외국어로 된 콘텐츠를 번역할 때 활용하면 좋을 것”이라고 말했다.

한편 네이버는 파파고 번역 언어 확대 계획도 알렸다. 이르면 5월말 러시아어를 지원할 방침이다. 월드컵을 대비한 업데이트다. 올해 독일어, 이탈리아어, 아랍어 추가도 계획 중이다. 기존 네이버 사전 번역기는 올해 중으로 파파고 브랜드로 통합을 앞뒀다. 실시간 통역을 지원하는 마스(MARS) 이어피스도 연내 나올 전망이다.

<이대호 기자>ldhdd@ddaily.co.kr
이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널