클라우드

데이터브릭스, 생성형 AI 플랫폼 ‘모자이크ML’ 13억달러에 인수

이종현 기자
ⓒ데이터브릭스
ⓒ데이터브릭스

[디지털데일리 이종현기자] 데이터 및 인공지능(AI) 기업 데이터브릭스는 생성형 AI 플랫폼 모아지크ML을 13억달러에 인수하기로 최종 합의했다고 28일 밝혔다. 생성형 AI 모델에 대한 양사의 접근성을 높여 모든 조직이 자체 데이터로 AI 모델을 구축·소유·보호할 수 있도록 한다는 전략이다.

모자이크ML은 대규모언어모델(LLM) ‘MPT-7B’로 알려져 있다. MPT-7B는 공개 이후 330만건의 다운로드를 기록하며 인기를 끌었다. 최근에는 새로운 버전인 MPT-30B를 선보이며 기업들이 자체 데이터를 이용해 비용 효율적인 방식으로 AI 모델을 신속하게 구축하고 학습하도록 지원하고 있다. 현재 앨런 AI 연구소, 제너럴 인텔리전트, 히포크라틱 AI, 리플릿, 스캐터랩 등이 모자이크ML의 생성형 AI 기술을 채택해 활용하고 있다.

알리 고드시(Ali Ghodsi) 데이터브릭스 최고경영자(CEO)는 “기업들이 AI가 가져다주는 혜택을 온전히 누리기 위해서는 데이터에 대한 제어권을 확보해야 한다. 데이터브릭스와 모자이크ML은 AI를 보편화하고, 레이크하우스를 생성형 AI 및 LLM 구축에 가장 이상적인 플랫폼으로 발전시키는데 상당한 시너지를 낼 수 있을 것”이라고 말했다.

데이터브릭스는 자사 ‘레이크하우스 플랫폼’에 모자이크ML의 기술이 결합되면 높은 비용 부담 없이 가치 있는 데이터에 대한 제어, 보안 및 소유권을 효율적으로 유지할 수 있을 것이라고 강조했다.

모자이크ML의 모델 학습 자동 최적화 기술은 표준화된 접근방식과 비교해 2배에서 7배 빠른 속도를 지원하며, 선형에 가까운 확장성을 기반으로 수십억 개의 매개변수를 가진 모델을 단 몇 시간 만에 학습시킬 수 있다. 양사의 기술이 결합된 플랫폼이 LLM을 훈련시키고 사용하는데 드는 비용을 대폭 줄여주리라는 설명이다.

이번 인수로 모자이크ML의 연구팀을 포함한 전 직원이 데이터브릭스에 합류하게 된다. 현재 가장 인기있는 고급 오픈소스 모델인 MPT-30B와 모자이크ML 제품을 구동하는 학습 알고리즘을 개발한 모자이크ML의 머신러닝(ML) 및 신경망 연구팀은 데이터브릭스에 합류 후에도 모델 학습 효율 개선을 위한 선구적인 AI 연구를 이어나갈 계획이다.

모자이크ML의 공동창립자 겸 CEO 나빈 라오(Naveen Rao)는 “모자이크ML은 어려운 엔지니어링 및 연구 문제를 해결해 누구나 대형 모델에 더욱 쉽게 접근할 수 있도록 하겠다는 목표로 시작됐다. 최근 생성형 AI로 인한 변화의 파도 속에 이러한 미션은 더욱 중요해졌다. 앞으로 데이터브릭스와 함께 공통의 미션을 위한 여정을 계속해 나갈 것”이라고 말했다.

한편 데이터브릭스는 미국 샌프란시스코에서 6월 26일부터 29일까지 데이터브릭스의 최신 업데이트 기술 및 소식을 공유하는 ‘데이터 + AI 서밋’ 행사를 진행 중이다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널