e비즈*솔루션

오픈AI, 영상 인식기능 추가…AI와 눈마주치고 이야기 나눈다

오병훈 기자
[ⓒ오픈AI]
[ⓒ오픈AI]

[디지털데일리 오병훈기자] 오픈AI가 고급음성 모드에 카메라 인식 기능을 정식으로 추가하기로 했다. 이제 오픈AI 이용자는 챗GPT와 눈을 마주치고 육성으로 이야기를 나눌 수 있게 된 셈이다.

13일 오픈AI는 지난 5일부터 진행 중인 ‘오픈 AI의 12일간 여정(12 Days of OpenAI)’ 6일차를 맞아 고급음성(Advanced Voice)모드의 각종 추가 기능을 선보였다. 고급음성 모드는 이용자가 목소리를 통해 직접 AI와 대화를 나누며 필요한 사항을 질문하고 답변을 얻을 수 있는 기능이다. 실제 사람과 대화하는 방식으로 AI를 다룰 수 있어 향후 AI 에이전트 서비스를 위한 필수적인 기능으로 꼽히는 부분이기도 하다.

먼저, 오픈AI는 고급음성 모드에 비디오 및 화면 공유 기능을 추가한다. 이제 주변 환경을 설명하거나 사진을 업로드하지 않아도 카메라를 통한 비디오 공유, PC 화면 공유를 통해 챗GPT와 실시간으로 대화할 수 있다.

케빈 웨일 오픈AI 최고제품책임자(CPO)는 같은날 공식 홈페이지에 공개된 동영상을 통해 고급음성 모드 추가 기능을 소개했다. 영상에서 웨일 CPO는 산타 모자를 쓴 채 시연을 진행했는데, 카메라로 이를 인식한 챗GPT는 금세 이를 인식해 “산타 모자를 쓰고 있다”며 답했다.

이어 웨일 CPO가 주전자와 원두 커피 제작 도구를 보여주자 챗GPT는 “커피를 만들 계획이냐?”고 먼저 물어보기도 했다. 웨일 CPO가 도와달라고 요청하자 “물 6온스당 커피 2스푼 정도입니다. 그런 다음 뜨거운 물을 약간 부어 만들어야 한다”며 원두 커피를 내리는 방법을 상황에 따라 설명해주는 모습도 보여줬다.

PC 화면 공유를 통해서도 챗GPT와 소통하는 것이 가능하다. 이용자가 실제로 사용 중인 화면을 챗GPT가 인식해 이용자 요구 맥락을 파악하고 종합적인 답변까지 도출할 수 있다. 예컨대 메시지를 주고 받는 화면을 띄워 둔 이후 답장할 문장을 추천해달라고 하면 화면을 인식한 챗GPT가 적절한 메시지를 권장해주는 식이다.

오픈AI는 향후 며칠 내로 대부분 국가에서 비디오 및 화면 공유 기능을 ‘플러스’ ‘프로’ ‘팀’ 등 모든 유료 플랜 구독자에게 제공될 예정이다. 유럽연합(EU), 스위스, 아이슬란드, 노르웨이, 리히텐슈타인 지역의 챗GPT 플러스 및 프로 플랜 구독자에게도 제공된다. 기업 및 교육 사용자는 오는 2025년 1월부터 해당 기능 사용이 가능하다.

고급음성 모드 추가 기능은 챗GPT 채팅 바 옆 음성 아이콘을 탭하는 것으로 사용 가능하다. 음성 모드에 들어가 화면 왼쪽 하단의 비디오 아이콘을 탭해 카메라를 켜고 챗GPT와 소통할 수 있다. PC 화면을 공유하려면 세 개 점 메뉴를 탭하고 화면 공유(Share Screen)를 선택하면 된다.

한편, 오픈AI는 크리스마스 시즌을 맞아 고급음성 모드에서 산타 목소리도 추가했다. 모바일 앱과 웹,, 그리고 윈도 및 맥OS 등 다양한 환경에서 오늘부터 사용 가능하다. 크리스마스에 맞춰 나온 음성인 만큼, 내년 1월 초까지 사용할 수 있습니다. 산타 목소리를 설정하려면, 챗GPT 프롬프트 바 옆에 있는 눈송이 모양 아이콘을 탭해 산타 목소리를 선택하면 된다.

오병훈 기자
digimon@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널