솔루션

바이브컴퍼니, '숫자연산 기계독해 데이터' 과제 마무리

박세아

[디지털데일리 박세아 기자] 바이브컴퍼니(이하 바이브)가 '2022년 인공지능 학습용 데이터 구축 지원 사업(2차)' 일환인 '숫자연산 기계독해 데이터' 구축 과제를 성공적으로 마무리했다고 26일 밝혔다.

이는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(이하 NIA)이 추진하는 사업이다. 바이브는 '숫자연산 기계독해 데이터' 구축 과제의 주관기관으로 딥네츄럴, 포티투마루와 함께 컨소시엄을 구성해 사업을 수행했다.

숫자연산 기계독해 데이터란 사칙연산 등 숫자연산이 필요한 분야의 문서에 기계독해를 적용해 수치연산 질의를 통해 답을 찾아내는 인공지능 모델을 구축하기 위한 학습용 데이터를 뜻한다.

바이브 컨소시엄은 2022년 6월부터 12월까지 7개월간 ▲경제, 스포츠 분야 신문 기사 데이터에서 뽑은 30만 개 지문에 대한 39만 건의 질의응답 라벨링 ▲숫자연산 기계독해 AI 모델 구축을 진행했다. 특히 바이브는 지난 5월 한국어 기계독해 평가 '코쿼드(KorQuAD)1.0'에서 123개 모델 중 4위에 오르며 기계독해 기술력을 인정받은 바 있다. 이번에 구축된 데이터와 인공지능(이하 AI) 모델은 다음해 상반기 중 NIA에서 운영하는 'AI 허브'를 통해 공개될 예정이다.

바이브 인공지능빅데이터연구소 이기황 이사는 "이번 과제 수행을 통해 세계적으로 아직 초기 단계에 있는 숫자연산 기계독해 기술의 개발과 발전에 큰 기여를 하게 될 것으로 기대하고 있다"라고 밝혔다.

박세아
seeall@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널