클라우드

[이그나이트2022] 영어 못해도, 자막 없어도 해외 영상 볼 수 있다?

이종현
[디지털데일리 이종현기자] 마이크로소프트(MS)가 자사 웹브라우저에서 작동되는 동영상의 오디오를 분석, 자동으로 자막을 생성하는 스피치 투 텍스트(Speech to Text, 이하 STT) 기능 추가를 예고했다.

12일(현지시각) MS는 개최한 연례 컨퍼런스 ‘이그나이트 2022’ 첫날 자사 웹브라우저 ‘엣지’의 최신 업데이트를 발표했다.

기존에는 없던 신규 기능 추가에 더해 다양한 접근성 개선이 이뤄졌다. 보안 기능도 업데이트됐다. 기술지원이 종료된 인터넷 익스플로러(IE)를 위한 엣지 IE 모드에도 변화가 있었따.

여러 기능 중 MS가 가장 힘주어 소개한 것은 여러 사람이 같은 웹페이지를 유지할 수 있도록 하는 ‘워크스페이스(Workspaces)’다. 여러 사람이 함께하는 프로젝트에서 같은 페이지를 볼 수 있도록 지원하는 기능으로, 모든 사람이 한 곳에서 동일한 웹사이트와 프로젝트에 대한 최신 작업 파일을 보도록 하는 브라우저 탭 집합 기능이다.

해당 기능의 초기 테스터들은 “우리 모두가 직관적인 방식으로, 동일한 재료로 작업을 할 수 있어 효율성을 높일 수 있었다”며 공동 작업 과정에서 시간을 절약할 수 있었다고 전했다.

‘사이드바’ 기능도 추가됐다. 오른쪽 패널에 인기 애플리케이션(앱)을 둬 페이지 변경 없이 해당 앱의 기능을 이용할 수 있도록 했는데, ‘아웃룩(Outlook)’이나 오피스 등의 앱을 이용 가능하다. 이는 네이버의 웹브라우저 ‘웨일’과 닮았다.
엣지에 추가된 사이드바 기능으로 아웃룩을 이용하는 모습
엣지에 추가된 사이드바 기능으로 아웃룩을 이용하는 모습

엣지 보안 기능도 업데이트됐다. 인터넷주소(URL)의 오타 방지 기능이 대표적이다. 잘 알려진 웹사이트의 URL을 이용한 사기성 사이트로의 이동을 막기 위해 사용자가 URL을 잘못 입력하더라도 정상 웹사이트로 연결되도록 안내한다는 것이 골자다.

여러 업데이트 중 가장 눈길을 끄는 것은 엣지에서 자막이 없는 동영상을 켤 경우 브라우저가 자동으로 오디오를 분석해 텍스트로 변환하는 STT 기능 ‘라이브 캡션’의 추가다.

음성인식은 얼굴인식과 함께 인공지능(AI) 기술 중에서도 크게 주목받는 분야다. STT의 경우 완전히 새로운 기술이라고 보기도 어렵다. MS는 이미 몇 년 전에 ‘워드(Word)’ 등 자사 서비스에 STT 기능을 탑재한 바 있다. 다만 이 경우 ‘아는 사람만 쓰는’ 기능으로 남았는데, 이번에 엣지에 자체 기능으로 제공하면서 범용성이 크게 늘어날 것으로 전망된다.

한편 라이브 캡션은 오는 연말 프리뷰(미리보기)로 출시될 예정이다. 엣지 카나리 버전 103.0.1264.0 이상을 사용하는 일부 사용자에게 우선 제공된다.
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널