[디지털데일리 이종현기자] NHN이 자유대화 분야 인공지능(AI) 빅데이터 구축에 나선다.
6일 NHN은 한국어 음성인식 서비스 활성화를 위한 자유대화 분야 ‘AI 학습용 데이터 구축 사업’ 수행기관으로 선정됐다고 밝혔다. 과학기술정보통신부(이하 과기정통부) 주관, 한국정보화진흥원(NIA)이 추진하는 ‘제2차 AI 학습용 데이터 구축 사업’의 일환이다.
NHN은 국내 노인, 소아 계층의 음성 대화 DB, 학습 데이터 등이 부족하다는 점에 착안, 양질의 데이터를 확보해 이를 필요로 하는 곳에 활용되도록 기여한다는 계획이다.
자유대화 분야 연구는 NHN을 비롯해 NHN다이퀘스트, NHN에듀, ㈜크라우드웍스, ㈜아임클라우드, 셀바스 AI, ㈜원더풀플랫폼, ㈜잉글리시헌트, EBS 등 인공지능, 클라우드, 교육 전문 기업·기관 등이 참여한다. 구축된 데이터의 실제 연구에 서강대, 성균관대, 건국대, 한국외대 등 4개 대학도 함께한다.
NHN은 인공지능 및 자연어 처리 기술에 대한 노하우를 바탕으로 관련 데이터 ▲수집 ▲가공 ▲검수 ▲학습 ▲유효성 검사 관리를 위한 시스템 개발 등 전 과정을 지원한다.
데이터 수집 과정에 인공지능 스피커, 음성 기반 채팅 서비스 등 효율적인 방식을 도입하고, EBS 교육채널, NHN 에듀 교육서비스 채널 등을 적극 활용해 다양한 테스터 및 DB를 확충해 나갈 예정이다.
또한 크라우드 소싱 기반의 AI 데이터 구축을 통해 관련 일자리 창출 역할도 수행한다. 기초생활수급자, 자립아동, 독거노인 등 사회적 배려 대상자 약 6000여명을 모집할 계획이다.
이번 프로젝트는 바둑 AI ‘한돌(HanDol)’을 개발한 박근한 NHN 기술연구센터 센터장이 총괄한다. 박근한 센터장은 “자유대화 분야의 AI연구를 통해 한국어 음성인식 품질을 한층 높이고, 음성인식뿐 아니라 자연어 처리 분야 발전에도 기여해 나갈 것”이라며 “이번 연구로 구축된 정보가 다양한 곳에 적극적으로 활용되길 희망한다”고 말했다.