일반

‘웅얼거리는 드라마 대사, AI로 명확하게’… KETI, 자동 제어기술 개발

이형두


[디지털데일리 이형두기자] 인공지능(AI) 기술이 TV 방송 프로그램 대사를 더 잘 들리게 돕는다.

전자부품연구원(KETI, 원장 김영삼)은 ‘AI기반 오디오 음원분석 및 자동 음량 실시간 제어기술’을 개발했다고 26일 밝혔다.

지난 2016년 개정된 방송법 개정으로 디지털 방송 프로그램 평균음량이 ‘디지털 방송프로그램 음량측정기준(LKFS)’ (-)24데시벨(dB)로 통일됐다. 그러나 각각 콘텐츠 내에서는 음량 편차 기준이 없어 대사가 배경음악에 묻히거나 하는 문제가 있었다.

KETI는 이 문제 해결에 인공지능 기술을 활용했다. 딥러닝을 활용한 CNN(Convolutional neural networks, 지능신경망의 일종)기반 알고리즘으로 콘텐츠 내 소리를 육성, 묵음, 배경음, 혼합음 등의 클래스로 구분했다. 구분된 클래스에 따라 맞춤형으로 음향을 제어하도록 고안됐다.

이 기술을 활용하면 웅얼거려 잘 안 들리는 대사 음량은 키워주고, 과도한 배경음향을 줄이는 등 기존 콘텐츠의 명료도를 개선할 수 있다. 라이브 방송 시에도 평균음량 규정을 실시간으로 맞출 수 있는 장점이 있다.

KETI 지능형영상처리연구센터 김제우 수석은 “이번 기술개발로 100% 해외 의존 중인 실시간 음량제어 방송장비의 국산화가 기대된다”며 “디지털 방송뿐 아니라, 인터넷 개인방송, 소셜 미디어 등 퍼스널 미디어시장이 지속성장하고 있는 만큼, 향후 편안한 시청환경 구축에 KETI 기술이 활용될 것”이라고 말했다.

한편, 해당 기술은 과학기솔정보통시눕와 정보통신기획편가원의 ‘방송통신산업기술개발사업’으로 지원된 ‘딥러닝 기반 지능형 오디오 분석을 통한 오디오 콘텐츠 변환 솔루션 개발’ 과제의 일환이다. 현재 주관기관인 네오컨버전스로 기술이전돼 사업화가 진행 중이다.


<이형두 기자>dudu@ddaily.co.kr

이형두
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널