e비즈*솔루션

챗GPT, 더 사람 같아진다…"보고, 듣고, 말하는 기능 추가"

김보민 기자
[ⓒ오픈AI 블로그 캡처]
[ⓒ오픈AI 블로그 캡처]

[디지털데일리 김보민 기자] 생성형 인공지능(AI) 챗GPT가 사람과 음성으로 대화하고, 이미지를 분석해 질문에 답할 수 있게 진화한다.

25일(현지시간) 오픈AI는 공식 블로그를 통해 챗GPT에 '보고 듣고 말하는'(see, hear, speak) 기능을 새롭게 추가한다고 밝혔다.

챗GPT를 활용할 방법이 다양해지는 셈이다. 지금까지 사용자는 프롬프트에 글자를 입력하는 방식으로 챗GPT와 대화를 해야 했다.

새롭게 추가되는 '듣고 말하는' 기능은 사용자가 음성으로 질문과 답변을 주고받을 수 있도록 지원한다. AI 비서와 달리, 단순 음성 명령을 시행하는 것을 넘어 실제 사용자와 대화를 할 수 있다.

챗GPT 음성은 다섯 가지 형태로 제공된다. 오픈AI는 음원 스트리밍 서비스 '스포티파이'와 협력해 음성을 다른 언어로 번역하는 기능도 검토하고 있다고 설명했다.

[ⓒ 오픈AI 블로그 캡처]
[ⓒ 오픈AI 블로그 캡처]

이미지를 '보고 답하는' 기능도 추가된다. 이용자가 사진을 업로드하고 관련 질문을 입력하면, 챗GPT가 종합 명령을 분석해 답변을 주는 방식이다.

일례로 사용자가 자전거 사진과 함께 '자전거 안장의 높이를 내리고 싶어'라고 요청하면, 챗GPT가 단계 별 방법을 알려주는 식이다.

자전거 안장 고정 장치 주위에 동그라미를 한 다음 요청을 하면, 볼트 유형을 인식하고 육각 렌치가 필요하다는 상세 답변을 받을 수도 있다.

오픈AI는 새 기능을 향후 2주 안에 챗GPT 유료 구독자(플러스·엔터프라이즈)를 대상으로 제공할 예정이다.

오픈AI는 "보다 새롭고 직관적인 유형의 인터페이스를 만나볼 수 있을 것"이라며 "우리의 목표는 안전하고 유익한 범용인공지능(AGI)를 구축하는 것"이라고 강조했다.

김보민 기자
kimbm@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널