솔루션

AI 기업으로 거듭난 메타… 최신 LLM ‘라마3’ 공개

이종현 기자
라마3와 다른 LLM의 벤치마크 테스트 결과 [ⓒ메타]
라마3와 다른 LLM의 벤치마크 테스트 결과 [ⓒ메타]

[디지털데일리 이종현기자] 사회관계망서비스(SNS) 플랫폼 기업이든 메타(구 페이스북)가 인공지능(AI) 기업이 됐다. 직접 개발한 대규모언어모델(LLM)인 라마(Llama)를 오픈소스로 공개하면서 업계에서 가장 주목받는 기업 중 하나가 됐다. 18일(현지시각) 공개한 최신 LLM인 ‘라마3’는 구글의 최신 LLM인 ‘제미나이(Gemini)’를 제쳤다.

19일 메타는 매개변수 라마3를 공개했다. 매개변수(파라미터) 80억개(8B)와 700억개(70B)로 조성된 모델이다. 일반적인 지식을 측정하는 다중작업언어이해(MMLU) 벤치마크에서 8B 모델은 ‘미스트랄AI’를 큰 격차로 제쳤고, 70B 모델은 구글의 제미나이 프로 1.5보다 근소 우위를 점했다.

AI 산업계에서 메타의 최신 LLM 발표는 여타 기업의 LLM 발표보다도 더 이목을 끈다. 오픈AI, 구글 등이 폐쇄적인 LLM 정책을 펼치는 것과 달리 메타의 경우 자사 LLM을 상업적으료 이용 가능한 오픈소스 정책을 펼치고 있기 때문이다.

실제 국내에서 개발되는 LLM 상당수는 메타의 라마를 기반으로 개발됐다. 업스테이지의 ‘솔라’가 대표적이다. 영어를 중심으로 학습된 라마에 한국어를 잘 이해하도록 파인튜닝하는 것이 흔히 사용되는 방식이다. 메타의 LLM 성능 향상이 곧 국내에서 서비스되는 생성형 AI 서비스 수준 향상으로 이어지는 배경이다.

메타는 블로그를 통해 라마3를 아마존웹서비스(AWS), 데이터브릭스, 구글클라우드, 허깅페이스, 마이크로소프트 애저(MS Azure), IBM 왓슨X, 엔비디아 NIM, 스노우플레이크 등에서 활용 가능하다고 밝혔다. 또 라마3가 앤스로픽 ‘클로드’, 미스트랄AI, 오픈AI GPT3-5 등에 비해 더 높은 성능을 발휘한다고도 전했다.

다만 오픈AI의 최신 모델인 GPT-4 등과는 직접 비교하지 않은 점이 눈길을 끈다. 매개변수가 제한된, 비교적 소형 모델로 경쟁력을 보이고 있는 상황이다. 오픈AI의 GPT-3는 1750억개 매개변수를 사용했고 GPT-4는 이를 한참 넘을 것으로 알려졌다.

메타는 블로그를 통해 “우리의 가장 큰 모델은 4000억개가 넘는 매개변수를 갖고 있지만 아직 훈련 중”이라며 “앞으로 수개월 내에 새로운 기능을 갖춘 여러 모델을 출시하겠다”고 밝혔다.

한편 메타는 라마3 발표와 함께 자사의 SNS에 AI 챗봇인 ‘메타 AI’를 탑재한다고 발표했다. 메타 AI는 이날 공개된 라마3를 기반으로 하는 최초의 서비스다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널