반도체

자동차 음성인식 “하드웨어+클라우드 결합으로 이어질 것”

이수환 기자

[디지털데일리 이수환기자] 스팬션이 자동차용 음성인식 반도체 ‘어쿠스틱 코프로세서’를 발표했다. 음성인식 엔진은 애플 ‘시리’에 탑재된바 있는 ‘뉘앙스커뮤니케이션’의 데이터베이스를 이용했다. 코프로세서는 중앙처리장치(CPU)를 보조하는 일종의 보조용 프로세서다. 예컨대 과거 인텔 386·486 CPU 시절에도 정수연산과 실수연산이 하나로 합쳐져 있는 형태가 아니라 따로 분리되어 있었다. 코프로세서가 탑재된 CPU는 ‘486-DX’, 그렇지 않은 CPU의 경우 ‘486-SX’로 판매했었다.

어쿠스틱 코프로세서도 비슷한 역할을 한다. 자동차 인포테인먼트 시스템에 탑재된 애플리케이션 프로세서(AP)가 터치스크린, 내비게이션, 멀티미디어 등 다양한 데이터를 처리하는데 여기에 복잡한 연산이 필요한 음성인식까지 더하면 그만큼 속도가 느려지니 따로 코프로세서를 달아서 사용자 경험을 풍부하게 만들자는 것이 핵심 골자다.

어쿠스틱 코프로세서 발표를 위한 9일 방한한 스팬션의 글렌다 돌첵 수석 부회장 겸 글로벌 비즈니스 총괄 책임자는 기계와 사람과의 원활한 소통을 강조했다. “전자제품에 둘러싸여 있는 현대사회에서 인간과 기계를 이어주는 인터페이스가 느리면 답답할 수밖에 없고 그만큼 제대로 된 소통이 어려워진다”며 “어쿠스틱 코프로세서는 최적화된 회로와 초고속 메모리, 뉘앙스의 음성인식 엔진을 결합해 AP 부담을 줄여주고 자연스러운 대화가 가능하도록 해준다”고 설명했다.

스팬션이 자체적으로 실시한 벤치마크 결과에 따르면 어쿠스틱 프로세서를 적용하면 AP만 단독으로 사용할 때 보다 시스템 반응 속도가 최대 50%까지 높아졌다. 반대로 AP 부하는 최대 50%까지 낮춰줄 수 있어 내비게이션이나 터치스크린, 게임 등의 작업에 집중할 수 있도록 해준다.

참고로 테스트에 사용한 AP는 ARM 코어텍스 A9 기반에 800MHz 클록을 가지고 있다. 이 정도라면 재작년 보급형 스마트폰 수준이다. 현재 자동차에 탑재되는 인포테인먼트 시스템 AP는 이보다 더 성능이 높다. 듀얼코어에 클록도 1GHz가 넘는다.

돌첵 부회장은 “전 세계에는 7000개 정도의 언어가 있고 사투리나 독특한 발음을 더하면 4만개가 넘어가는데 오류 없이 빠른 속도로 자연어 음성인식이 가능하기 위해서는 어쿠스틱 코프로세서 필수”라며 “일반적인 코프로세서가 아니라 음성인식을 위해 광범위한 데이터베이스가 내장되어 있으며 전용 데이터 버스를 통해 AP와 함께 병렬 프로세싱이 가능하다”고 전했다.

최근 스마트 기기에 접목되어 있는 음성인식 기능, 예컨대 시리나 삼성전자 ‘S보이스’와 같이 클라우드를 이용하면 별도의 코프로세서가 필요치 않다. 굳이 자동차에 음성인식을 위한 코프로세서가 필요하냐는 질문에 대해 “클라우드와 하이브리드로 시장이 움직이고 있다는 것에 전적으로 동감하지만 자동차가 늘 인터넷에 접속되어 있는 상태가 아니고 어쿠스틱 코프로세서 자체도 더 많은 음성인식 데이터베이스와 집적도 향상을 높해 성능을 더 높일 수 있다”며 “이미 자동차 회사에서는 코프로세서와 클라우드를 모두 고려하고 있으며 스팬션도 전 세계 관련 업체와 함께 프로젝트를 이미 진행하고 있다”고 강조했다.

구체적으로 어떤 업체와 프로젝트를 진행하는지는 밝히지 않았지만 국내의 경우 현대 기아자동차가 이미 뉘앙스의 음성인식 기술을 사용하고 있다. 요즘 자동차에서 흔히 찾아볼 수 있는 블루투스 페어링을 위한 음성인식이 바로 그것.

“클라우드를 통한 음성인식은 긍정적이고 좋은 시도이지만 아직 모든 애플리케이션이 완벽한 것은 아니다”며 “뉘앙스의 톰슨 부회장도 음성인식 솔루션이 대중화되기 위해서는 하드웨어의 도움이 필요하다고 강조했고 앞으로 애플과의 관계가 어떻게 전개될지 알 수 없지만 필요하다면 상호 전략적인 자세를 취할 것”이라고 덧붙였다.

<이수환 기자>shulee@ddaily.co.kr

이수환 기자
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널