인터넷

‘음성 AI’ 기술력 쾌거…네이버, 세계적 학회서 10개 논문 발표

이대호
- 최고학생논문 수상 등 ‘인터스피치 2020’ 역대 최고 성과 마무리


[디지털데일리 이대호기자] 네이버(대표 한성숙)는 지난달 29일 폐막한 세계적인 음성신호처리 학회인 ‘인터스피치 2020(Interspeech 2020)’에서 총 10개의 논문을 발표하는 이례적 성과를 거뒀다고 2일 밝혔다.

네이버는 지난 2018년 처음 인터스피치에 논문을 발표했다. 올해는 국내 참가 기업 중 최다 10편의 논문이 채택돼 인공지능(AI) 기술 리더임을 재차 증명했다는 게 회사 설명이다.

특히 음성인식, 음성합성, 데이터셋 모델 성능 평가지표 등 다양한 음성 신호 관련 분야에 걸친 연구 결과가 채택돼 지난 수년간 꾸준히 진행한 대규모 인공지능 분야 연구 투자가 가시적인 성과로 드러났다고 전했다.

네이버 음성인식 연구 결과는 ▲클로바 AI 스피커 ▲네이버 음성검색 등 관련 서비스에 적용되고 있다. 음성합성 관련 기술은 ▲뉴스 본문 읽기 ▲클로바 더빙 등 서비스를 구성하는 핵심 기술로 활용 중이다. 소상공인들이 활용할 수 있는 매장 전화를 대신 받아주는 AI 서비스인 AiCall(에이아이콜)을 개발하는데 사용된 데이터인 ‘ClovaCall(클로바콜)’도 논문으로 채택됐다.

네이버 정준선, 최소연 연구원과 연세대학교 강홍구 교수, 정수환 연구원이 협력 연구로 진행한 결과를 담은 ‘FaceFilter: Audio-visual speech separation using still images(페이스필터: 단일 이미지 활용 음성 분리 기능)’ 논문은 이번 인터스피치의 최고 학생 논문(Best Student Paper)으로 선정되는 쾌거를 이뤘다.

위 연구 성과들은 클로바 AI 깃허브에 소스코드와 함께 공개돼 AI 생태계 확장에도 기여하고 있다. 특히 그 중 클로바콜에 대한 논문은 한국어 목적 지향형 대화 음성 데이터를 함께 공개함으로써 국내 AI연구 저변 확대에 크게 기여했다는 평가를 받고 있다.

하정우 네이버 AI랩 리더는 “네이버가 보유한 자유롭게 중장기 선행 연구에 집중할 수 있는 문화와 AI 기술에 대한 지속적인 대규모 투자 확대가 국제무대에서도 주목받는 연구 결과로 이어지고 있다”며 “최근 AI랩 개설 및 국내 기업 최초 슈퍼 컴퓨팅 도입 등 더욱 대규모 AI 기술 투자를 진행하고 있으며 혁신적인 기술을 연구개발을 통해 서비스를 더욱 고도화하는 한편, 한국을 넘어서 글로벌 AI 생태계 확장에도 기여할 수 있도록 할 것”이라 밝혔다.

<이대호 기자>ldhdd@ddaily.co.kr
이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널