누가 승리할 것인가?…이미지 생성 AI시장 놓고 국내외 빅테크 경쟁 각축
[디지털데일리 이종현기자] 사용자가 원하는 이미지를 인공지능(AI)이 생성해주는 이미지 생성 AI시장이 뜨겁게 불붙고 있다. 국내에서도 생성형 AI 열풍을 타고 이미지 생성 AI서비스가 나오고 있지만 아직 글로벌 기업의 수준에는 못미치고 있다는 지적이다.
문제는 이미지 생성 AI는 콘텐츠 생산과 직결되는 만큼 시장성이 무궁무진한다는 점에 있다. 업계에서는 이미지 생성 AI 시장에 대한 국내 업체들의 전략이 보다 본격화될 필요가 있다는 지적이다.
명령어(프롬프트)를 입력하면 유창하게 대답하는 인공지능(AI) ‘챗GPT’의 등장 이후 AI 산업계는 빠르게 발전하고 있다. 그리고 AI의 활약은 언어 영역에 국한되지 않는다. 이미지 생성 AI 업계에서는 오픈AI의 ‘달리(DALL·E)’, ‘미드저니(Midjourney)’, 어도비의 ‘파이어플라이(Firefly)’, 스테이블AI의 ‘스테이블 디퓨전(Stable Diffusion)’ 등이 치열하게 경쟁하고 있다.
이 분야 선두 주자는 챗GPT로 정보기술(IT) 업계에 큰 충격을 준 오픈AI다. 오픈AI는 2021년1월 이미지 생성형 AI 달리를 출시했다. 초창기에는 ‘이런 것도 가능하다’는 수준에 그쳤다. 그러나 2022년 4월 기존 버전에서 진일보한 ‘달리2’를 공개하며 판도를 바꿨다. 그리고 2023년 9월, 또 한 번의 혁신을 이뤄낸 ‘달리3’가 공개됐다.
이미지 생성형 AI 대부분은 명령어를 입력하면 AI가 이를 이해한 뒤 그림으로 만들어주는 방식이다. 이는 달리 역시도 마찬가지다. 생성되는 이미지의 품질도 달리가 특출나게 뛰어나다고 말하기도 어렵다. 그럼에도 달리가 특히 많은 기대를 모으는 것은 챗GPT가 가진 인지도와 확장성의 영향이다.
달리3는 전용 홈페이지에 접속해야 했던 달리2와는 다르게 챗GPT 자체에 내장돼 있다. 챗GPT를 이용하듯 달리를 이용하면 된다. 마이크로소프트(MS)가 무료로 서비스하고 있는 ‘이미지 크리에이터(Image Creator)’도 달리3를 기반으로 한다. MS가 윈도를 비롯한 자사 제품 전반에 생성형 AI 기술을 도입하고 있는 만큼 앞으로도 활용처가 더 늘어날 것으로 보인다.
대화형 AI의 경우 챗GPT가 시장을 선점한 뒤 뚜렷한 경쟁자 없이 오픈AI가 독주를 이어가고 있다. 여러 빅테크 기업들이 대규모언어모델(LLM)을 개발했지만 챗GPT만큼의 가시적인 성과를 보인 곳은 드물다. 구글 정도가 ‘바드(Bard)’로 추격을 이어가고 있는 중이다. 하지만 이미지 생성형 AI의 경우 춘추전국시대를 방불케 할 정도로 치열한 경쟁이 이뤄지고 있다.
달리와 자주 비교 대상에 오르는 '미드저니'의 경우 디스코드 채널을 이용하는 만큼 커뮤니티성이 강하다. 다른 사람들이 어떤 명어로 어떤 품질의 이미지를 생성해 내는지를 실시간으로 확인할 수 있다. 다만 디스코드라는 플랫폼이 이에 익숙하지 않은 사람들에게는 진입장벽이 된다. 또 장점으로 보이는 커뮤니티성도 단점으로 작용할 수도 있다.
창작 분야 전통의 강자인 어도비도 이 시장에 뛰어들었다. 후발주자인 어도비는 시작부터 높은 완성도의 서비스를 선보이며 시장에 안착했다. ‘포토샵’, ‘라이트룸’, ‘일러스트레이터’, ‘인디자인’, ‘프리미어’ 등 예술 분야에는 어도비의 솔루션이 곳곳에 침투해 있다. 이들 솔루션과 본격적인 시너지가 발휘될 경우 적지 않은 파급효과를 낼 것으로 전망된다.
스테이블 디퓨전(Stable Diffusion)은 소스코드를 공개(오픈소스)해 많은 파생 서비스를 등장케 한 장본인이다. 일본 애니메이션 화풍으로 유명한 ‘노벨AI’도 스테이블 디퓨전을 기반으로 한다. 루리웹, 인벤, 디시인사이트 등 한국 커뮤니티의 이미지 생성형 AI의 근간이다. 중국에서도 많은 사랑을 받고 있는데, 최근에는 스테이블 디퓨전으로 만든 이미지가 저작권을 인정받는 희귀한 사례가 연출되기도 했다.
국내에서도 카카오가 독자적인 이미지 생성형 AI 서비스를 제공하고 있다. 작년 7월 공개된 ‘칼로(Karlo) 2.0’이다. 다만 생성되는 이미지의 품질은 달리나 미드저니, 파이어플라이, 스테이블 디퓨전 등에 크게 못미친다.
주목할 만한 점은 국내에서는 새로운 이미지를 만들어내는 것보다는 기존의 이미지를 AI로 변형하는 데 집중하고 있다는 점이다. 네이버의 ‘스노우’, ‘에픽’와 카카오브레인의 ‘비 디스커버’가 서비스 중인 ‘AI 프로필’이 그것이다.
거짓 정보를 사실처럼 전달하는 환각(Hallucination) 현상이 대화형 AI의 발목을 잡고 있는 가운데 이미지 생성형 AI는 빠르게 발전하고 있다. 물론 이미지 생성형 AI에도 해결해야 할 과제는 있다. 대표적인 것이 저작권이다. 현재 대부분의 이미지 생성형 AI는 저작권 문제에서 자유롭지 못한 상황이다. 이 부분에서 자신감을 드러냈던 어도비조차도 질타를 받고 있다. 해외에서는 다수의 소송도 진행 중이다.
국내에서도 웹툰에 이미지 생성형 AI를 적용하는 것을 놓고 갑론을박이 진행 중이다. 결론적으로 최근의 콘텐츠 소비가 텍스트에서 웹툰과 같은 이미지, 그리고 숏폼과 같은 영상으로 확산되고 있는 가운데 이미지 생성형 AI를 기반으로 한 빅테크 기업들의 경쟁은 보다 본격화될 것으로 전망돼 사회적 합의와 법적, 제도적 뒷받침이 얼마나 빠르게 정비되느냐에 따라 우리나라 이미지 생성 AI 시장 확대여부가 결론 날 것이란 관측이다.
머스크의 스페이스X, 8.6조원 규모 美 국방부 위성 사업 수주
2025-04-05 12:47:15[OTT레이더] “이병 성윤모…” 본격 군생활 코미디 드라마가 돌아왔다
2025-04-05 11:08:27[IT클로즈업] 외산 클라우드 공습, 공공시장 파장 얼마나?
2025-04-05 09:38:12[이음5G 현황下] 확산 한계치 도달?...“DX본격화 되면, 수요 급증” 전망도
2025-04-04 19:46:29