알리바바 클라우드, '70억개 파라미터' LLM 오픈소스 공개
[디지털데일리 김보민 기자] 알리바바 클라우드가 70억개의 파라미터를 갖춘 거대언어모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다고 8일 밝혔다.
해당 LLM은 인공지능(AI) 모델 커뮤니티 '모델스코프'와 협력 플랫폼 '허깅페이스'를 통해 첫선을 보였다.
앞서 알리바바 클라우드는 독자 첨단 LLM '통이치엔원'을 공개한 바 있다. 통이치엔원은 70억개 이상의 파라미터를 포함한 다양한 모델 사이즈를 제공하며, 중국어와 영어를 모두 지원하는 게 특징이다.
Qwen-7B는 2조 개 이상의 토큰에 대해 사전 학습됐고 중국어, 영어, 기타 다국어 자료, 코드, 수학 등 일반 및 전문 분야를 포괄한다. Qwen-7B-챗 모델은 학습 과정에서 인간의 지시 사항에 맞춰 조장됐다.
두 모델 모두 클라우드와 온프레미스 인프라에서 배포될 수 있다.
알리바바 클라우드는 AI 기술 민주화를 위한 노력의 일환으로 이번 오픈소스 공개를 시행했다고 설명했다.
월간 활성 이용자(MAU) 수가 1억 명 이하인 기업들은 이 모델을 상업적 용도로 무상 사용할 수 있다. 1억 명 이상의 사용자를 보유한 프로그램들의 경우, 알리바바 클라우드에 라이선스를 요청할 수 있다.
징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 "개방적인 접근 방식을 통해 집단 지성이 발휘되어 오픈소스 커뮤니티의 활성화에 기여할 수 있기를 희망한다"라고 말했다.
국민연금, 고려아연 ‘집중투표제’ 지지… 법원 판단만 남아
2025-01-19 15:31:10공정・투명한 '공매도'위한 가이드라인 최종안 마련… 금감원 "3월말까지 전산화 완성"
2025-01-19 14:20:28알뜰폰 업계, 갤럭시S25 가입자 사전유치 경쟁 ‘후끈’
2025-01-19 13:16:35주담대 채무불이행자 비율도 '상호금융'업권이 가장 높아…"종합 리스크관리강화 필요"
2025-01-19 12:00:00