PLAY IT

[PLAY IT] 음성파일 텍스트로 바꾸는 MS 워드의 신기능··· 세상 좋아졌다

이종현
[디지털데일리 이종현기자] 인공지능(AI) 기반 기술이 우후죽순 쏟아져 나오는 가운데 마이크로소프트(MS)가 새로운 기술을 선보였다. 음성파일에서 텍스트를 자동을 추출하는 녹음 전사 기능인 ‘기록(Transcribe)’이다.

MS의 워드프로세서 프로그램 ‘워드’의 웹용 버전에서 이용할 수 있는 이 기능은 지난해 첫 선을 보였다. 당초 영어로만 제공되는 기능이었으나 최근 한국어도 지원하도록 업데이트됐다.
웹용 MS 워드의'기록' 기능
웹용 MS 워드의'기록' 기능

기능은 간단하다. 웹용 워드의 기록 기능을 통해 동영상 파일이나 오디오 파일을 업로드하면 파일 내 텍스트를 자동으로 추출한다. 말하는 이에 따라 스피커 1, 2 등으로 화자 인식을 한다. 어느 시간에 누가 말을 했는지도 구분한다. 지원하는 확장자는 .wav, .mp4, .m4a, .mp3 등 4개다.

MS 코리아의 유튜브 채널에 올라온 1분 남짓의 영상으로 테스트를 진행했다. 테스트 결과 ‘보안’을 ‘교환’으로, ‘한가지 자신 있게’를 ‘항상 자신 있게’ 등 오인식하는 경우가 왕왕 있었다. 화자를 인식하지 못해 한 사람의 말을 2명의 화자로 구분하기도 했다.

결과물에 대한 평가는 개개인에 따라 다를 듯하다. 문서 작업이 주된 업무인 기자의 입장에서는 보조적인 수단으로 활용하기에는 부족함이 없다고 느껴졌다. 녹음된 음성을 듣더라도 발음, 주변 소음 등으로 단어를 놓치는 일이 많기에 일부 오인식이 있는 것은 큰 흠이 아니다. 정확한 발음이 아니면 인식하지 못하던 과거를 떠올리면 그야말로 장족의 발전이다.

음성을 텍스트화하는 것은 완전히 새로운 기술은 아니다. MS 워드는 기록 기능 이전에 키보드 대신 음성을 인식해 텍스트화하는 ‘받아쓰기’ 기능을 제공했다. 구글 문서에서도 ‘음성 입력’ 기능을 제공한다.

음성 받아쓰기 기능은 이용자 입장에서는 ‘입력도구(PC의 키보드, 스마트폰의 자판 등)의 대신’이라는 한계가 있었다. ‘스트레오 믹스’ 등으로 마이크 대신 PC의 소리를 입력도구로 활용해 받아쓰는 등으로 활용할 수 있었지만 이 경우 다른 작업을 수행하지 못하기 때문에 특수한 경우가 아니고서는 쓰임새가 적다는 것이 단점이었으나 녹음 전사 기능인 기록은 이같은 제약이 없다.

해당 기능은 웹용 워드 버전, 구독형 서비스 고객만 이용할 수 있다. 평생 라이선스 유저는 활용하지 못한다. 또 업로드 가능한 파일 크기는 200메가바이트(MB) 미만이고 월에 업로드할 수 있는 오디오 파일 시간은 300분이다.

M365(구 오피스365)의 개인 라이선스는 연 8만9000원이다. 최대 6인까지 이용할 수 있는 패밀리 라이선스는 11만9000원이다. 한 번 제품을 구매하고 계속 쓸 수 있는 구축형이 아니라 구독형 제품이다.

일반 이용자 다수가 월간, 연간으로 과금을 하는 구독형에 익숙하지 않은 만큼 쉽사리 제품을 권하기는 어렵다. 구독료가 적절한가에 대한 논란도 많은 편이다. 직장에서 M365를 구독하고 있거나 개별적으로 구독 중인 개인 이용자라면 새로운 기능을 유용하게 사용할 수 있으리라 보인다.

유료 고객이 아니더라도 1개월 무료 체험이 제공되기 때문에 기능을 테스트해볼 수는 있다. 다만 무료 체험 기간이 종료될 경우 자동으로 연간 구독 금액이 결제되기 때문에 구매 의사가 없다면 주의해야 한다.

<이종현 기자>bell@ddaily.co.kr
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널