‘한국어 LLM 리더보드’ 업그레이드된다…추론 지표 추가
[디지털데일리 권하영기자] 한국지능정보사회진흥원(원장 황종성, 이하 NIA)은 업스테이지와 공동 운영하는 ‘오픈 Ko-LLM 리더보드’에 평가 지표를 추가해 업그레이드한다고 11일 밝혔다.
‘오픈 Ko-LLM 리더보드’는 지난해 9월 민관 협업을 통해 개설돼 학계 및 업계 다양한 참여자들로부터 큰 관심을 받고 있다. 지난 5월 말까지 참여한 거대언어모델(LLM) 모델 수는 1500개를 넘어섰고, 최고 점수는 70.7점을 기록했다. 이는 세계적으로 인정받는 허깅페이스의 LLM 리더보드(최고점 81.2점)에 근접한 수치다.
NIA와 업스테이지는 오픈 Ko-LLM 리더보드의 지속적인 발전과 개선을 위해 우선 추론 관련 지표를 추가해 운영할 계획이다. 추가 지표는 AI 언어 데이터 전문 기업인 플리토가 참여해 한국어에 맞는 번역 및 개발을 지원했다.
이번에 추가하는 지표는 허깅페이스의 오픈 LLM 리더보드에서 사용되는 평가지표 중 ‘추론 능력(Winogrande, 글 속 대명사 추론 능력)’ 및 ‘산출 추론 능력(GSM8K, 산술 연산 분야 추론능력)’ 두 개 지표다. 해당 지표를 한국어에 맞게 적용함으로써, 한국어 모델의 성능 평가 체계를 국제 평가 기준과 대등한 수준으로 끌어올릴 방침이다.
이번 업그레이드는 6월부터 적용되며, AI허브 사이트의 리더보드 메뉴에서 확인할 수 있다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52