솔루션

[딜라이트닷넷] 오픈AI, 언어 이어 영상마저도 정복했나… ‘소라’로 연타석 홈런

이종현 기자
오픈AI가 '소라'로 만든 영상 ⓒ소라
오픈AI가 '소라'로 만든 영상 ⓒ소라

[IT전문 미디어 블로그=딜라이트닷넷]

인공지능(AI) 업계의 슈퍼스타 오픈AI가 또 한번의 ‘홈런’을 날렸다. ‘챗GPT’에 이어 최근 공개한 ‘소라(Sora)’가 전 세계를 뜨겁게 달구는 중이다. 언어 챗봇의 한계를 무너뜨린 오픈AI가 영상마저도 정복했다는 평가가 나온다.

소라의 사용법은 챗GPT와 크게 다르지 않다. 챗GPT가 텍스트를 입력하면 그에 대한 답변을 내놓는 것처럼 소라는 텍스트를 통해 영상을 만들어낸다.

영상 생성형 AI 기술은 완전히 새롭다고 보기 어렵다. 챗GPT의 등장 이후 생성형 AI에 대한 관심이 폭증하면서 텍스트뿐만 아니라 오디오·이미지·영상 등 다방면으로 AI가 활용되기 시작했다. 그중에는 텍스트로 영상을 만들어주는 런웨이의 ‘젠-2’ 등도 있다.

새롭지 않은, 기존에 있던 기술을 발표한 것인데 이렇게 폭발적인 관심을 얻는 것은 왜일까. 그 이유는 한계가 명확했던 서비스를 획기적으로 개선한 것처럼 보이기 때문이다.

런웨이의 젠-2 등 기존 서비스는 3~4초 남짓의 짧은 영상만 제작할 수 있었다. 이를 넘어가면 내용이 왜곡된다. 먹어도 먹어도 줄지 않는 파스타, 벽을 통과하는 사람 등이 예다. 긴 영상은 짧은 클립을 편집해 이어붙이는 형태로 제작해야 했다. 내용물 역시도 ‘AI스러움’이 남아있다. 흥미 위주로 사용될 수는 있을지언정 상업적으로 사용하기는 어렵다는 평가를 받은 이유다.

하지만 오픈AI는 소라가 최대 1분 길이의 영상을 생성할 수 있다고 발표했다. 이것이 시사하는 바는 적지 않다. 챗GPT가 문법을 배우지 않았음에도 바른 문장을 만들 듯, 소라는 현실공간의 물리법칙에 위배되지 않는 영상을 만들기 때문이다. 생성된 영상의 품질이 기존 서비스에 비해 획기적으로 개선했다는 건 덤일 뿐이다.

쓰임새도 무궁무진하다. 최대 1분이라는 길이는 결코 짧지 않다. 영상을 촬영할 때 1분을 초과할 경우 롱테이크(Long Take)라고 한다. 대부분의 영상은 1분 미만의 여러 컷을 붙여서 만든다. 최근에는 짧은 동영상이 대세로 떠오르면서 전체 영상 길이가 1분 이하인 경우도 적지 않다. 소라를 통해 전체 광고 영상을 컷 편집 없이 만들 수도 있다는 의미다.

소라의 충격은 중국의 최대 정치행사 중 하나인 전국인민정치협상회의(이하 정협)에서도 회자됐다. 이대로면 경쟁에서 뒤처질 수 있다는 위기감에 AI 산업 발전을 위한 안건을 제출되기도 했다. 정협 위원인 중국 사이버보안 기업 치후360의 창립자 저우훙이는 소라 발표 직후 “소라가 광고와 영화 예고편 업계를 완전히 흔들 것”이라며 “소라의 등장으로 미·중간 AI 경쟁력 격차가 더 벌어지게 됐다”는 의견을 피력했다.

최근 오픈AI가 새로운 발표를 할 때마다 그림자처럼 따라붙는 말이 있다. ‘스타트업의 종말’이다. 소라의 등장으로 영상 관련 기술을 개발 중이던 기업들에게는 적색 경보가 켜졌다. 영상을 촬영·편집하는 기업 또는 이를 활용하는 기업들도 급격하게 발전하는 기술에 혼란 상태다. 기술적 특이점이 왔다고 평가되는 가운데 한국 기업들이 이에 어떻게 대응할지 앞으로 지켜볼 일이다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널