솔루션

투디지트, LLM 소스코드·데이터셋 모두 공개

이종현 기자
ⓒ투디지트
ⓒ투디지트

[디지털데일리 이종현기자] 투디지트가 자사 대규모언어모델(LLM)에 대한 정보 일체를 공개키로 결정했다.

19일 투디지트는 한국지능정보사회진흥원(NIA)의 한국어 LLM 평가 ‘Ko-LLM 리더보드’에서 평균 점수 60점을 초과하며 1위를 기록한 자사 LLM에 대한 소스코드, 학습 데이터셋 등을 공개한다고 밝혔다. 국내 LLM 생태계 확장을 위한 조치라는 설명이다.

투디지트의 LLM은 업스테이지의 LLM ‘솔라(Solar)’를 기반으로 한다. 지난 14일 Ko-LLM 리더보드서 최초로 평균 점수 60.59점을 넘었다. 19일 오전 기준으로는 평균 점수 67.77점인 새로운 모델을 공개한 상태다.

소스코드 공개로 여타 기업들도 투디지트의 LLM을 사용할 수 있게 됐다. 투디지트의 LLM을 학습시킨 데이터셋 역시 공개돼 다른 방식으로 모델을 재학습시키는 것 역시 가능하다.

김창연 투디지트 인공지능(AI) 랩 리더는 “이번에 공개한 모델과 기술로 앞으로 많은 기업들이 투디지트의 점수를 갱신하고 대한민국 AI 기술을 발전시키기를 바란다고”고 공개 취지를 전했다.

박석준 투디지트 대표도 “모든 이들을 위해 대한민국 AI 기업들도 기술을 공개하고 함께 발전하기 위한 노력에 동참해 주기를 바란다”고 부연했다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널