e비즈*솔루션

알리바바 클라우드, '70억개 파라미터' LLM 오픈소스 공개

김보민 기자
[ⓒ알리바바클라우드]
[ⓒ알리바바클라우드]

[디지털데일리 김보민 기자] 알리바바 클라우드가 70억개의 파라미터를 갖춘 거대언어모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다고 8일 밝혔다.

해당 LLM은 인공지능(AI) 모델 커뮤니티 '모델스코프'와 협력 플랫폼 '허깅페이스'를 통해 첫선을 보였다.

앞서 알리바바 클라우드는 독자 첨단 LLM '통이치엔원'을 공개한 바 있다. 통이치엔원은 70억개 이상의 파라미터를 포함한 다양한 모델 사이즈를 제공하며, 중국어와 영어를 모두 지원하는 게 특징이다.

Qwen-7B는 2조 개 이상의 토큰에 대해 사전 학습됐고 중국어, 영어, 기타 다국어 자료, 코드, 수학 등 일반 및 전문 분야를 포괄한다. Qwen-7B-챗 모델은 학습 과정에서 인간의 지시 사항에 맞춰 조장됐다.

두 모델 모두 클라우드와 온프레미스 인프라에서 배포될 수 있다.

알리바바 클라우드는 AI 기술 민주화를 위한 노력의 일환으로 이번 오픈소스 공개를 시행했다고 설명했다.

월간 활성 이용자(MAU) 수가 1억 명 이하인 기업들은 이 모델을 상업적 용도로 무상 사용할 수 있다. 1억 명 이상의 사용자를 보유한 프로그램들의 경우, 알리바바 클라우드에 라이선스를 요청할 수 있다.

징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 "개방적인 접근 방식을 통해 집단 지성이 발휘되어 오픈소스 커뮤니티의 활성화에 기여할 수 있기를 희망한다"라고 말했다.

김보민 기자
kimbm@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널