무선

모국어만으로 ‘전세계’서 통하는 시대, KT가 그리는 AI

최민지
[디지털데일리 최민지기자] #. A씨는 프랑스 본사 직원과 불어로 통화한 후, 한국에 방문한 중국 바이어와 중국어로 대화하며 사업계약을 체결했다. 퇴근 후에는 아이에게 유창하게 영어책을 읽어주며 하루를 마무리했다. A씨는 한국어밖에 할 줄 모르지만, 인공지능(AI) 통역 기술을 사용해 외국어 능통자와 같은 하루를 보낼 수 있었다.

가까운 미래, 모국어만 할 줄 알아도 전세계와 소통할 수 있는 시대가 열린다. AI 발전을 통해 가능한 시나리오다. 이를 위해 KT는 영어 개인화음성합성(P-TTS) 기술에 박차를 가하고 있다. 이를 기반으로 미래 통번역시장에서 먹거리를 찾을 수 있다는 판단이다.

우선, KT는 내년 4월말까지 개인화음성합성 기술을 적용한 영어책 읽어주는 서비스를 선보인다. 추출한 개인의 음색을 영어에 입히는 방식이다. 영어 또는 한국어 상관없이 한 문장만 읽은 후 훈련시작 버튼을 누르고 기다리면, 어느 새 현지인 발음에 본인 음색을 더한 영어동화책 한권이 완성된다.

박정석 KT 융합기술원 음성합성&AI비즈 프로젝트 팀장<사진>은 “올해 초부터 영어 버전의 P-TTS를 개발하기 시작했다. 얼굴이 있는 목소리, 누군지 알 수 있는 목소리로 TTS를 개발하고자 했다”며 “언어에 구애받지 않도록 딥러닝을 적용했다”고 설명했다.

앞서, KT는 지상파 3‧1절 다큐멘터리에 독립운동가 고 정재용, 이갑성 선생 목소리를 재현했다. 단 2분의 음성만 전달받았지만 합성은 충분히 가능했다. 영어책 사례에서 보듯이 단어나 문장의 뜻을 학습하는 것이 아닌 만큼, 음성 데이터가 적어도 성공할 수 있었다.

이를 일반인으로 확대하기 위해, KT는 지난 5월 ‘내 목소리 동화’를 선보였고 이용자 의견을 수렴해 영어동화책으로 확장하게 됐다는 설명이다. 내 목소리 동화에서는 300문장을 절차에 맞게 녹음해야 했지만, 영어동화책에서는 한 문장으로 간소화했다.

박 팀장은 “300문장이 많다는 피드백을 받았는데, 문장 수가 줄어드면 학습할 수 있는 알고리즘도 줄어들게 된다”며 “구글도 100문장을 입력해야 하는데, KT는 한 문장으로 가능하다는 차별점이 있다. 이와 관련한 특허도 출원했다”고 말했다.

지금 KT에서 주력하는 부분은 ‘속도’다. 학습하고 소리를 만들어내는 속도를 단축시키기 위해 연구개발(R&D)을 집중하고 있다. 현재 영어 한 문장을 말한 후 학습시키려면 약 1분의 시간이 필요하다. 이를 실시간 처리할 수 있도록 음성합성 속도를 높인다는 계획이다.

박 팀장은 “2년만 지나도 번역기술은 발전돼 있을 것이며, 여기에 AI가 본격 도입될 것”이라며 “컨퍼런스콜을 통해 회의를 하는 등 외국어가 필요한 업무들이 많은데, AI가 접목된 통신서비스를 사용하면 통번역 서비스를 제공받을 수 있게 될 것”이라고 내다봤다.

이어 “이 같은 방향으로 나아가기 위한 과정에서 AI 동화책 읽어주기와 같은 서비스를 선보였다”며 “부모와 아이 대상 서비스에 그치지는 않을 것”이라고 덧붙였다.

<최민지 기자>cmj@ddaily.co.kr
최민지
cmj@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널