[네이버 슈퍼주니어] 머뭇거리다 말문 터지니 ‘호기로운 자랑질’
시가총액 51조원. 네이버가 창립 21년 만에 일군 기업 가치입니다.
잘나가는 이유가 뭘까요. 단순히 비대면 시대 수혜 때문일까요. 되짚어 보면 네이버를 구성하는 ‘인재’가 첫손에 꼽히지 않을까 싶습니다. 이번엔 젊은 인재에 주목했습니다. 네이버 어벤저스를 꿈꾸는 ‘네이버 슈퍼주니어’입니다. 네이버의 미래를 이끌 주니어들의 솔직 과감한 모습을 연중 인터뷰로 이어갑니다. <편집자 주>
[디지털데일리 이대호기자] 네이버 ‘파파고(Papago)’는 통·번역이 필요할 때, 자주 쓰는 서비스다. 번역품질이 뛰어나 이용자들의 호평을 얻으면서 네이버의 핵심 서비스로 성장했다. 쇼핑, 브이 라이브 등 알게 모르게 네이버 여러 서비스에도 파파고 기술이 적용돼 있다. 서비스 뒷단에서 개발자들이 고민을 거듭한 결과다.
대중이 주목하는 서비스인만큼, 개발자들의 할 일이 끊이지 않는다. 이용자들은 통신이 끊긴 상황에서도 고품질의 번역 결과물이 나왔으면 하고 더욱 완벽한 음성번역을 듣길 원하는 까닭이다.
이 같은 파파고 발전의 기저엔 ‘스스로 일하는 문화’가 있다. 개선점이 눈에 띄면 그냥 지나치지 않는다. 누가 어떤 의견을 내더라도 귀를 기울이고 존중하는 문화가 자리 잡았다. 전 국민이 애용하는 서비스를 만든다는 자부심이 개발을 이어가는 원동력이 되기도 한다.
최근 네이버 그린팩토리 본사에서 파파고 개발에 몸담은 슈퍼 주니어들을 만났다. ▲텍스트 번역 담당인 정권우, 문지형, 김한태 ▲이미지 번역 담당인 구진모 ▲웹개발 담당인 정소영 연구원이 함께했다. <사진 왼쪽>부터 김한태, 정소영, 구진모, 문지형, 정권우 연구원이다.
◆난감했던 인터뷰… 어느 순간 술술 풀린 이유는?
이들 5인은 미디어 인터뷰가 처음이었다. 긴장한 기색이 역력했다. 심지어 서로 간에도 서먹해 보였다. 원격 근무 탓에 오랜만에 얼굴을 봤다는 것. 정식 입사 두 달째에 이제 여덟 번 출근했다는 개발자도 있었다. 이런 상황을 ‘대략 난감’이라고 할까.
그런데 꼬인 실타래 같던 인터뷰가 어느 순간 술술 풀리기 시작했다. ‘본인 또는 회사 자랑을 해보라’며 운을 띄웠더니 말문이 터진 것이다. 그 뒤부터 호기로운 자랑질이 시작됐다. 수줍어하면서도 할 말은 하는 당찬 주니어다운 모습을 보였다.
◆글로벌 학회서 번역 모델로 1등
문지형 연구원이 5인 가운데 ‘달변’이었다, 문 연구원은 네이버 쇼핑에 파파고 기술을 적용하고 있다. 무료배송을 무배로 줄여 쓰면, 번역이 이상하게 되는 사례 등을 바로 잡는다. 생소한 외국 상품명은 기존 데이터가 없어 번역이 제대로 되지 않는다. 이 같은 쇼핑번역 고도화가 문 연구원의 업무 중 하나다.
문 연구원은 “쇼핑에선 일반적 단어로 보기 어려운 명사의 나열이 많고 형태가 달라 번역이 쉽지 않다”며 “학계에서 좋은 데이터 성능 평가에 대한 기준이 있지만 현업과는 다르기 떄문에 좋은 번역 데이터를 얻을 수 있을지 처음부터 기준을 세우고 있다”고 말했다.
‘음성번역’도 대응하고 있다. 음성번역엔 텍스트 전환 과정이 있다. 이때 텍스트 번역이 이상하면 음성번역 결과도 품질이 좋지 않다. 번역평가 분야에선 사람의 평가를 높게 치지만 아무래도 비싸다. 대규모 서비스에선 기계번역으로 해결하되 성능을 높여야 한다.
문 연구원은 사내 인턴과 협업해 세계적인 기계번역 컨퍼런스 학회인 ‘WMT’에 참여해 번역 성능을 높이는 평가 모델을 제출했다. 이 모델은 품질평가(Quality Estimation) 부문 태스크(Task) 3에서 1위를 차지했다. 당시 제출했던 모델명이 ‘PATQUEST(Papago Translation Quality Estimation)’이다. 지금은 파파고에 적용된 기술이다.
◆‘연구하고 싶다’ 직접 건의해 서비스 발전시켜
정권우 연구원은 ‘온디바이스’ 기계번역에 주목했다. 온라인 서버 연동 없이 스마트폰 상에서 번역을 하는 방식이다. 그는 “오프라인 번역기는 기술적으로 품질이 떨어져 서비스가 어려웠으나, 품질을 유지하면서 오프라인에 쓸 수 있을 만큼 사이즈를 줄이는 기술이 나오기 시작해 파파고에서 해보면 어떻겠냐고 직접 건의했다”고 말했다.
당시 파파고 책임 리더는 ‘해보라’고 흔쾌히 권유했고 힘을 얻은 정 연구원이 자료조사를 거쳐 프로젝트 착수 6개월 즈음에 프로토타입(시범결과물)을 내놨다. 이것이 사내에서 좋은 평가를 얻으면서 9개월이 지나 팀원이 생겼다. 결국 오프라인 번역기를 만들어낸다. 지금은 한·일·영·중 4개 언어 파파고 번역에 적용돼 있다.
초임 연구원도 마찬가지로 제 역할을 하는 중이다. 정소영 연구원은 5인 개발자 중 연차가 가장 낮다. 인터뷰 당시 인턴에서 정식 입사로 전환된 지 두 달째였다. 그는 번역을 위한 기초(raw) 데이터 생성을 쉽게 만드는 도구를 만들었다. 사내 개발자들을 위한 도구(툴)로 유용하게 활용되고 있다.
◆K팝스타 이름 인식 잘된다 했더니 ‘이유 있었네’
김한태 연구원은 K팝스타 이름 인식률을 언급했다. 예를 들어 ‘아이즈원’, ‘몬스타엑스’ 등 그룹명은 다소 이상하게 번역될 수 있다. 번역기가 인식하기도 쉽지 않다. 파파고 개발진은 글로벌 스트리밍 서비스인 브이라이브 도메인에 최적화해 번역의 정확도를 끌어올리는 업무도 담당하고 있다.
김 연구원은 “인식이 중요하다”며 “기업마다 번역기 커스터마이징(최적화)과 운영기법이 달라 그 회사만의 노하우가 있다”고 경쟁 현황을 전했다. 그가 속한 팀은 브이라이브와 쇼핑 등 네이버 여러 도메인에서 번역기 인식률을 높이고 성능 하락이 없도록 하는 일을 하고 있다.
번역 결과물과 마찬가지로 번역기 자체 평가도 중요하다. 실험한 번역 모델들의 정확한 평가가 이뤄져야 성능에 대해 신뢰를 할 수 있는 까닭이다. 이는 텍스트 번역팀의 주요 업무이기도 하다.
◆파파고 팀도 한국어 처리도 최고
구진모 연구원은 파파고 이미지 번역팀에 대해 망설임 없이 “최고”라며 추켜세웠다. 팀워크가 최고라고 했다. 그는 카카오에서 네이버로 이직한 이력을 지녔다. 이유를 묻자 “다른 경험을 해보고자 이직한 것”이라고 답했다.
파파고의 한국어 번역 수준 관련해선, 개발자들도 이견이 없었다. “한국어 처리에 있어서는 구글보다 더 잘한다”는 것이다. 누적된 데이터가 많기 때문이다. 앞으로 한국어 번역 처리 만큼은 구글이 네이버를 넘어서기가 쉽지 않다.
물론 안주하진 않는다. 정권우 연구원은 “한국어가 포함돼 있으면 번역품질이 좋지만, 영어-일본어 등 언어는 더 잘한다고 볼 수 없다”며 “그 부분을 개선하는 작업을 하고 있고 경쟁사 대비 좋은 품질을 만들어내겠다”고 힘줘 말했다.
<다음 기사에서 계속됩니다>
<이대호 기자>ldhdd@ddaily.co.kr
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18