[디지털데일리 권하영 기자] 네이버는 인공지능(AI) 자연어처리 분야의 세계 최고 권위 학회로 꼽히는 ‘EMNLP(Empirical Methods in Natural Language Processing) 2021’에서 초대규모 AI 연구 성과를 공유한다고 3일 밝혔다.
클로바 및 AI 랩 연구진은 네이버의 초대규모 AI ‘하이퍼클로바’의 핵심 연구 논문을 비롯해, 총 7개의 논문을 발표할 예정이다.
특히 네이버의 초대규모 AI인 하이퍼클로바의 핵심 연구 논문은 메인 컨퍼런스 발표에 채택되는 성과를 거뒀다. 하이퍼클로바는 네이버가 지난 5월 국내 기업 최초로 공개한 초대규모 AI이자, GPT-3보다 한국어 데이터를 6500배 이상 학습한, 현재 공개된 단일 모델 중 전세계에서 가장 큰 한국어 초대규모 언어모델이기도 하다.
해당 연구는 한국어 초대규모 언어모델인 ‘하이퍼클로바’와 그 학습에 사용된 데이터를 소개하고, 다양한 크기의 모델들이 갖는 성능을 검증하는 내용이다. 논문에서는 하이퍼클로바가 다양한 한국어 과제(task)에 대해 제한된 예제만으로도 뛰어난 학습(in-context learning) 성능을 보인다는 것을 증명했다.
한편, 25년 전통을 가진 EMNLP는 ACL(Association for Computational Linguistics)과 더불어 자연어처리(NLP) 분야의 최고 AI 학회로 꼽힌다. 올해는 도미니카공화국에서 11월7일부터 11일까지 열리며, 온라인으로도 동시 진행된다.