페북·인스타도 ‘AI’ 챗봇 쓴다…차세대 모델 라마3 기반
[디지털데일리 이나연기자] 메타가 운영하는 사회관계망 서비스(SNS)인 페이스북, 인스타그램, 왓츠앱에 인공지능(AI) 챗봇 ‘메타AI’가 탑재됐다. 작년 9월 베타(테스트) 버전으로 선보인 지 7개월 만이다.
메타 AI는 이용자 질문에 무료로 답변을 제공하거나 이미지·애니메이션 등을 생성할 수 있다. 미국과 캐나다, 뉴질랜드 등 영어권 10여 개국에서 서비스를 우선 개시했다. 한국과 유럽연합(EU) 등에서 출시 계획은 미정이다.
18일(현지시간) 저커버그 메타 최고경영자(CEO)는 “메타AI는 이제 자유롭게 사용할 수 있는 가장 지능적인 AI 비서가 될 것”이라며 메타AI의 기반이 된 차세대 대규모 언어모델(LLM) ‘라마3(Llama 3)’를 오픈소스로 공개했다.
라마3는 사전훈련과 미세조정을 마친 80억 개(8B)와 700억 개(70B) 매개변수 모델 두 가지다. 메타 측은 라마3의 다중작업언어이해(MMLU) 테스트에서 구글 ‘제미나이프로 1.0’을 앞섰다고 강조했다.
라마3의 성능 향상은 모델의 사전 훈련과 사후 훈련 과정을 고도화해 이뤄졌다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했다. 라마3는 15조 이상의 토큰으로 훈련됐으며, 이는 라마2 대비 7배 이상 많으며 코드량은 4배 더 많다.
또한 라마3의 사전 훈련엔 일상적인 질문부터 과학, 기술, 공학, 수학(STEM) 분야, 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용됐다. 사전 훈련의 규모를 확대하고 보다 고도화된 ‘지시 미세조정(instruction fine-tuning)’ 과정도 진행했다.
오픈소스인 라마3 모델의 안전하고 책임감 있는 개발과 사용을 위한 다양한 안전장치도 마련했다. 지시 미세조정된 모델은 전문가와 자동화된 도구를 활용한 레드팀 훈련을 통해 부적절한 답변의 가능성을 최소화했다.
‘라마 가드2(Llama Guard 2)’, ‘코드 쉴드(Code Shield)’, ‘사이버 보안 평가 기준2(CyberSec Eval 2)’와 같은 안전 장치와 더불어 새로운 안전 도구들도 도입했다. 이번 라마3 공개와 함께 대규모 언어모델을 책임감 있게 사용하는 방법을 설명하는 ‘책임감 있는 사용 가이드라인’도 업데이트됐다.
메타는 투명하고 안전한 AI 개발을 위한 개방형 접근 방식에 따라 8B와 70B 매개변수 모델을 먼저 선보이며 연구원과 개발자의 피드백을 통해 지속 발전시킬 방침이다. 현재 훈련 중인 더 큰 규모의 모델 역시 추후 오픈소스로 공개한다.
메타 측은 “라마3를 더 긴 컨텍스트를 이해하는 다국어 멀티모달 모델로 발전시키고, 전반적인 성능을 지속 개선시키는 것이 궁극적인 목표”라고 전했다.
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18