AI

텍스트 벗어나 이제는 음성으로…오픈AI, GPT-4o 출시

이상일 기자
샘 올트먼 오픈AI CEO. [ⓒ연합뉴스]
샘 올트먼 오픈AI CEO. [ⓒ연합뉴스]

[디지털데일리 이상일기자] 오픈AI(OpenAI)가 13일(미국 현지시간) GPT-4o라는 새로운 생성형 AI 모델을 발표하며 생성형 AI 시장에서의 격차를 더 넓혀 주목된다.

"o"는 "omni"를 의미하며, 이 모델은 텍스트, 음성, 이미지 입력을 모두 처리할 수 있는 다중 모드 기능을 갖추고 있다. GPT-4o는 현재 챗GPT에서 구동하며, 이를 통해 더 광범위한 입력에 대응하고 더 복잡한 작업을 수행할 수 있다는 설명이다.

GPT-4o는 이전 모델에서 크게 향상된 추론 및 지시 수행 능력을 자랑한다. 오픈AI는 더 방대한 데이터와 개선된 계산 자원을 활용, GPT-4o를 훈련시켰으며, 이를 통해 더 안전하고 정확한 응답을 제공할 수 있게 됐다고 밝혔다.

특히, GPT-4o는 사용자와 전문가의 피드백을 반영해 안전성과 윤리적 기준에 맞춘 AI 기술을 개발하고 개선하는 전략의 일환으로 만들어졌다는 것이 오픈AI측의 설명이다.

GPT-4o의 출시는 AI 기술의 새로운 시대를 여는 중요한 이정표로 평가받고 있다. 멀티모달 기능을 통해 다양한 형태의 데이터를 처리할 수 있는 능력은 AI의 활용 범위를 크게 확장시킬 것으로 보인다. 예를 들어, 텍스트 기반의 전통적인 응답 외에도 이미지 분석, 음성 인식 및 생성 기능을 통해 더 다양한 응용 프로그램에서 AI를 활용할 수 있게 될 것이란 분석이다.

한편 오픈AI는 지속적으로 GPT-4o와 같은 모델을 개선하고 업데이트할 계획이며, 이를 통해 사용자들에게 더 나은 AI 경험을 제공할 것이라고 밝혔다. 또한, 안전성과 윤리적 문제를 중요하게 다루며, 기술 발전과 함께 이러한 문제들을 해결하기 위한 노력도 계속될 것이라는 설명이다.

이상일 기자
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널