[디지털데일리 이종현기자] 카카오엔터프라이즈는 기업용 인공지능(AI) 음성인식-변환 모델 ‘커스텀 STT(Speech-to-Text)’를 공개했다고 25일 밝혔다.
STT는 음성을 텍스트로 변환해 주는 기능이다. AI 스피커 및 음성 검색, 내비케이션 등 여러 곳에 활용되고 있다.
카카오엔터프라이즈에 따르면 새롭게 공개한 커스텀 STT는 각 기업이 고객과 산업 특성에 맞는 모델을 쉽게 구축할 수 있도록 지원한다. 고객사가 직접 단어와 패턴을 추가하면 적합한 AI 모델을 자동으로 만들어준다. 고유명사나 길고 복잡한 단어 처리도 가능하다는 설명이다.
카카오엔터프라이즈의 내부 실험 결과 음성인식 오류율은 기존대비 30% 이상 개선됐다. 기존 STT 서비스를 수정·개발하기 위해서는 고객사가 직접 요청사항을 정리해 개발사에 전달하고, 개발사가 해당 모델을 재개발해야 하는 과정을 거친 것과 달리 고객사가 직접 클라우드에 접속해 제품명, 신기능, 요청사항 등을 입력하고 커스터마이즈 할 수 있는 것이 특장점이다.
카카오엔터프라이즌 상반기 오픈할 ‘카카오 i 커넥트 센터(AICC)’의 문의응대나 상담 업무에 커스텀 STT를 적용할 예정이다. 향후 음성인식(STT)뿐만 아니라 문자인식(OCR), 음성합성(TTS) 분야 보유 기술도 커스텀 가능한 서비스형 AI(AIaaS)로 제공한다는 방침이다.
카카오엔터프라이즈 최동진 AI 랩(Lab)장은 “커스텀 STT는 고객사가 직접 데이터를 쉽게 추가해 자동 학습을 진행하고 커스텀 모델을 만들기 때문에 AI 재학습과 업데이트 소요시간을 크게 단축할 수 있다. 기업들은 신속하게 데이터를 변경/추가해 사용자들에게 새로운 정보를 빠르게 전달하고 더 편리한 경험을 제공할 수 있을 것”이라고 말했다.
한편 카카오엔터프라이즈 AI 랩은 카카오 공동체 전체에서 가장 규모가 큰 AI 연구조직이다. 분사 이후 여러 산업에서 다수 기업과 많은 실험, 서비스 적용을 진행해 왔다. 작년 글로벌 AI 학회에 총 25건의 논문을 등재한 바 있다.