소프트웨어

삼성·네이버·KT가 투자한 사운드하운드, 솔트룩스와 한국어 AI 학습

백지영

화상회의시스템으로 솔트룩스 컨퍼런스에 참석한 케반 모하르 사운드하운드 창업자 겸 대표. 하운드파이 플랫폼을 시연 중이다
화상회의시스템으로 솔트룩스 컨퍼런스에 참석한 케반 모하르 사운드하운드 창업자 겸 대표. 하운드파이 플랫폼을 시연 중이다
[디지털데일리 백지영기자] 삼성과 네이버·라인, KT, 현대자동차 등 국내 주요 기업이 투자한 미국 음성인식 인공지능(AI) 기업 ‘사운드하운드’가 한국어 서비스 등을 위해 국내 AI업체인 솔트룩스와 협력한다. 최근 한국어를 학습한 IBM 왓슨 등과 경쟁할 수 있을지 주목된다.

지난 2005년 미국 스탠포드 대학 졸업생들이 만든 사운드하운드는 허밍만으로도 음악을 인식할 수 있는 애플리케이션을 출시하며 주목받은 기업이다. 사운드하운드는 현재 전세계 3억명 이상의 사용자를 확보하고 있다. 이와 함께 음성인식 AI 비서인 하운드와 대화형 인터페이스를 활용해 다양한 기능을 개발할 수 있는 AI 플랫폼 하운드파이 등을 제공하고 있다.

15일 솔트룩스가 서울 르메르디앙 호텔에서 개최한 ‘SAC 2017’ 컨퍼런스에서 케이반 모하르 사운드하운드 최고경영자(CEO)는 화상회의시스템을 통해 ‘음성 AI의 미래’라는 주제 발표를 진행하며 “IoT와 같은 소형 디바이스에서는 음성만이 유일한 인터페이스가 될 것”이라며 “삼성과 현대자동차, 네이버, 라인, KT와 같은 한국 대기업으로부터 투자를 받았으며, 한국과 중국, 유럽에 추가로 사무실을 개설할 예정”이라고 말했다.

사운드하운드의 하운드파이 주요 기능
사운드하운드의 하운드파이 주요 기능

이중 KT의 경우 올초 사운드하운드에 약 57억원을 투자하고 조만간 출시할 AI 스피커 기가지니 2.0에 사운드하운드의 기술을 통합할 예정이다. 현재 사운드하운드는 미국과 일본, 캐나다 등에 8개 사무소를 운영하고 있다. 조만간 한국 등에도 사무실을 마련해 시장 확대에 나설 방침이다.

사운드하운드는 현재 솔트룩스와도 한국어 AI 학습 및 글로벌 시장 진출 등을 위해 협력 중이다. 이와 관련, 이경일 솔트룩스 대표는 “자세히 밝힐 수는 없지만, 국내 대기업과 함께 사운드하운드의 음성인식 AI 기술과 데이터 등을 통합하고, 한국어로 서비스할 수 있도록 협력하고 있다”고 말했다. 다만 구체적인 내용은 이르면 12월 중 공개할 수 있다며 말을 아꼈다.

이날 모하르 CEO는 “시장조사기관에 따르면, 2020년까지 모든 검색의 절반은 음성 검색이 될 것이라는 조사가 있다”며 “구글 음성 검색 쿼리도 2008년 대비 지난해 35배 늘어난 만큼, 음성으로만 기기와 상호작용하는 날이 멀지 않았다”고 강조했다.

사운드하운드 음성인식 AI의 가장 큰 특징은 STM(Speech-to-Meaning)이다. 현재 나와있는 대부분의 음성인식 AI는 사람이 말을 하면 이를 텍스트로 바꾼 이후 이에 대한 의미를 분석하고 대답을 한다. 하지만 STM은 음성 인식과 언어 이해를 하나의 엔진에다 올려둬 실시간 의미 추출이 가능하다. 마치 사람 뇌가 동작하는 것과 유사하다. STM의 가장 큰 장점은 속도와 정확도가 높아진다는 점이다.

그는 “음성을 텍스트로 바꾸고, 여기에서 다시 의미를 추출하는 두 단계를 거치다보면, 레이턴시(지연)가 있을 수 밖에 없다”며 “STM를 상용화에 성공한 업체는 사운드하운드가 유일하다”고 자신했다.

솔트룩스가 15일 개최한 SAC 2017 질의응답 세션
솔트룩스가 15일 개최한 SAC 2017 질의응답 세션

실제 그는 이날 행사에서 직접 시연을 보이기도 했다. “한식당을 제외하고 수요일 오후에 여는 아시아 식당을 알려줘”라고 묻자 곧바로 근처의 일본 스시바를 추천하기도 했다.

이밖에 ‘딥 미닝 언더스탠딩(Deep Meaning Understanding)’을 통해 복잡한 질문도 손쉽게 이해하며, 특정 기술이가 도메인 지식이 서로 소통해 탁월한 결과값을 제시하는 ‘콜렉티브 AI’ 기능을 제공하는 것이 특징이다.

한편 솔트룩스는 지난해 출시한 AI 플랫폼 ‘아담’에 이어 내년에는 ‘이바(EVA)’를 출시할 것이라고 밝혔다. 이바에는 차세대 AI 기술이 적용돼 보다 개인화된 데이터를 제공할 예정이다. 지난해 출시된 아담의 경우도 올해 보유 데이터가 지난해 80억건에서 110억건, 일반지식도 8억, 전문지식은 200만건으로 늘어났다고 설명했다.

이경일 대표는 “특히 문장이해는 83%에서 87%, 의미이해는 65%에서 93%로 대폭 향상돼, 구글 어시스턴트에 맞먹는 대화 성능을 발휘하고 있다”고 강조했다.

지난해 출시한 AI 고객상담서비스 ‘아담 어시스턴트’의 경우 챗봇 기반의 상담서비스부터 고객 응대, 관광 예약, 법률상담 등의 분야에서 활용되고 있다. 우리은행과 신한은행, NH농협은행 등에 이미 적용됐다. 이 대표는 “올해만 135개 프로젝트가 진행됐다”며 “현재 경찰청과 범죄예방예측을 위한 서비스 적용도 진행 중”이라고 덧붙였다.

<백지영 기자>jyp@ddaily.co.kr

백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널