소프트웨어

‘상전벽해’ 네이버 음성검색, 품질의 비결은…

심재석 기자

[IT전문 미디어블로그 = 딜라이트닷넷]

제 블로그를 종종 방문하는 독자 분이라면 제가 음성인식 분야에 관심이 많다는 것을 느끼실 수 있을 겁니다. 네. 저는 음성인식을 비롯해 자연언어처리 기술 전반에 많은 관심을 가지고 있습니다.

이 때문에 음성인식 관련 블로그 기사를 여러 차례 포스팅 했습니다. 아래가 음성인식과 관련된 기사들입니다.

구글 넥서스원 음성인식, 우리도 할 수 있을까
영어유치원, 쓸 데 없는 낭비 될 수도
구글 음성검색…구글이 무서워졌다
한국어 스마트폰 음성검색, 최강자는 누구?
네이버 음성검색의 놀라운 진보…구글 수준

이런 저에게 최근 가장 신선한 충격을 준 서비스는 네이버 음성검색입니다. 지난 10월 ‘한국어 스마트폰 음성검색, 최강자는 누구?’라는 기사를 쓸 때만해도 구글에 비해 한 참 수준이 떨어졌던 네이버 음성검색 기술이 지난 1월에 ‘네이버 음성검색의 놀라운 진보…구글 수준’ 기사를 쓸 때는 구글에 맞먹는 수준으로 올라있었기 때문입니다.

이 짧은 기간 동안 네이버에는 무슨 일이 있었던 걸까요? 이 같은 질문에 답을 얻기 위해 네이버 음성검색 기술개발을 이끌어 온 이상호 음성검색팀장을 만났습니다.


이 팀장은 음성합성으로 박사학위를 취득한 음성공학 전문가로, LG전자 등에서 음성인식 기술을 연구해 왔습니다. 이후 검색엔진 전문업체 첫눈에서 검색엔진을 개발하다가 인수합병으로 NHN에 합류했습니다.

그런데 이 팀장이 저에게 건넨 명함에는 ‘음성검색팀’이 아닌 ‘검색모델링1팀’ 소속으로 돼 있었습니다. 네이버의 검색모델링팀은 검색결과의 순위(랭킹) 알고리즘을 개발하는 팀이라고 합니다. 옛날 명함을 그대로 쓰고 있다는 사실은 그가 음성검색팀을 맡은 지 얼마 되지 않는다는 점을 보여줍니다.

이 팀장에 따르면, NHN에 음성검색팀이 꾸려진 것은 불과 지난 해 7월 15일이라고 합니다. 당시는 구글과 다음이 음성검색 모바일 애플리케이션을 막 출시해 관심을 끌던 시기였습니다.

네이버는 그 이전에는 음성인식에 큰 관심이 없었던 듯 보입니다. 이 팀장은 네이버에 합류한 이후 줄곧 검색 모델링 업무를 맡았다고 합니다.

네이버는 지난 해 10월 음성검색 앱을 처음 출시했습니다. 하지만 이 때의 음성검색은 7월에 발족한 음성검색팀이 개발한 서비스가 아니었습니다. HCI랩이라는 국내 음성인식 전문업체의 기술을 이용한 것이었습니다.

제가 구글, 네이버, 다음의 음성검색 성능을 비교한 기사인 ‘한국어 스마트폰 음성검색, 최강자는 누구?’는 이 시점에 나온 것입니다. 당시 네이버의 음성검색의 수준은 구글에 한 참 못 미쳤습니다.

하지만 네이버는 12월 22일 훨씬 음성인식 기술이 향상된 음성검색 서비스를 선보였습니다. 이 버전이 음성검색팀의 기술이 처음 적용된 서비스입니다. 제가 ‘네이버 음성검색의 놀라운 진보…구글 수준’이라는 기사가 이 시점의 기사입니다.

음성검색팀이 처음 꾸려진 7월 15일로부터 불과 5개월 만에 구글에 비견할만한 음성검색 서비스를 개발한 것입니다.

음성인식은 지난 20년 동안 국내외 많은 전문가들이 매달려 온 기술입니다. 그럼에도 아직 완벽하게 상용화할 만한 기술을 개발한 기업이나 연구단체는 많지 않습니다. 네이버가 5개월 만에 이런 수준의 음성검색 서비스를 만들어냈다는 것은 거의 기적이 아닐 수 없습니다.

알고 보니 그 비결은 네이버 음성검색 팀의 구성원들에 있었습니다.

이상호 팀장을 비롯한 4명의 음성검색 팀원들은 이미 LG전자에서 함께 음성인식 기술을 연구해 왔던 인물들이라고 합니다. LG전자 이후 각자 제 갈 길을 걸어왔는데 우연히 NHN에서 다시 집결한 것입니다.

지난 해 7월 이상호 팀장에게 ‘자체 기술로 음성검색 서비스를 만들어라’라는 미션이 주어졌을 때 이 팀장이 같은 조직 안에 있는 옛 동지들을 모은 것입니다.

이 팀장은 “5개월 만에 결과가 나왔지만 사실 5개월 동안 새로 연구한 것은 거의 없다”면서 “과거에 이미 함께 연구하면서 머릿속에 있는 것들을 현실에 구현하기만 한 것”이라고 말했습니다.

그는 이를 피아니스트에 비유했습니다. 피아니스트가 사람들에게 실력을 보여주는 시간은 5분에 불과하지만 10년 이상 피아노 연주를 연습해 왔다는 것입니다. 음성검색 서비스를 만드는 데는 불과 5개월만이 걸렸지만, 10년 이상 음성인식 기술을 연구해왔기 때문에 가능했다는 설명입니다.

네이버 음성검색 서비스는 내부적으로도 매우 성공적인 프로젝트로 평가 받고 있습니다. 당초 3월에 처음 출시하기로 했었는데, 이를 3개월 앞당겨 12월에 만족할 만한 성능의 서비스를 선보인 것입니다.

이 팀장은 이 같은 성과의 비결에 대해 “교과서 대로만 하려고 노력했다”고 말했습니다. 사실 원래 교과서 대로 하는 게 더 어려운 법입니다. 야구선수가 교과서대로 던지고 교과서 대로 치고 싶지만, 누구나 그렇게 하지 못하는 것처럼 말입니다.

그는 “실수를 안 하려고 굉장히 노력했고, 10년 동안 컴퓨터의 성능이 좋아져 빠른 시간 안에 기술 개발이 가능했다”고 덧붙였습니다.

처음에는 태스크포스팀(TFT)와 유사하게 발족한 네이버 음성검색팀은 이제 정식 팀이 돼서 새로운 인력도 충원하고 있다고 합니다. 현재로서는 음성검색 품질을 더 높이기 위해 노력하고 있고, 어느 정도 수준에 오르면 검색을 넘어 음성 받아쓰기에까지 도전할 예정이라고 합니다.

네이버가 음성 받아쓰기 서비스도 구글과 경쟁할 수준이 될지 궁금해지고, 또 기대도 됩니다.

[심재석기자 블로그=소프트웨어&이노베이션]
심재석 기자
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널