[디지털데일리 이대호기자] 영상 메신저 ‘아자르’로 유명한 기술기업 하이퍼커넥트(대표 안상일)가 지난해에 이어 올해도 ‘인터스피치 2020’에 참가해 음성 합성 관련 연구 성과를 발표한다고 7일 밝혔다.
국제음성통신협회(ISCA)가 주최하는 인터스피치(INTERSPEECH)는 음성언어처리 분야에서 세계 최고 권위를 인정받고 있는 국제학회라는 게 회사 설명이다. 매년 1000명 이상의 연구진이 모여 음성 인식과 음성 합성, 음성 통신 등 600개 이상의 음성 언어 처리 분야 논문을 발표하고 성과를 공유한다. 올해로 21회째를 맞는 이번 행사는 음성 처리를 위한 인지 지능을 주제로 오는 10월 25일부터 29일까지 온라인 개최된다.
하이퍼커넥트는 인터스피치 2020에서 ‘어텐트론: 관심 기반의 가변 길이 임베딩을 활용한 적은 샘플의 음성 합성(Attentron: Few-Shot Text-to-Speech Utilizing Attention-Based Variable-Length Embedding)’ 논문을 통해 음성 합성 관련 연구 성과를 발표할 예정이다.
이번 연구는 수 초 이하의 적은 음성 샘플만으로도 별도의 학습 없이 원하는 화자의 목소리로 합성해낼 수 있는 기술이다. 정량적 성능 평가에서 음성 품질을 나타내는 MCD(Mel Cepstral Distortion)와 원하는 화자와의 유사도를 나타내는 화자 유사도 점수(Speaker Similarity Score), 인공지능 음성 합성음의 자연스러움을 평가하는 MOS(Mean Opinion Score)에서 모두 좋은 결과를 얻었다고 회사 측은 밝혔다. 해당 기술은 향후 하이퍼커넥트의 다양한 서비스에 적용될 예정이다.
용현택 하이퍼커넥트 최고기술책임자(CTO)는 “영상 통신 및 온디바이스 AI 분야에서 쌓아온 기술력을 영상, 이미지, 음성, 텍스트 등 다양한 분야로 확장하여 세상을 연결하는 다양한 서비스를 제공할 수 있도록 노력할 것”이라고 밝혔다.