솔루션

AI 학습에 쓰이는 뉴스 등 저작물 대가 산정은?… 저작위 연구 사업 발주

이종현 기자
[ⓒMS 코파일럿 디자이너]
[ⓒMS 코파일럿 디자이너]

[디지털데일리 이종현기자] 인공지능(AI) 기술 경쟁이 심화되면서 데이터의 중요성이 커지는 가운데 저작권이 있는 데이터를 어떻게 활용할지, 적절한 대가 수준은 어느 정도인지 등에 대한 논의가 본격화되는 추세다.

한국저작권위원회(이하 저작위)는 지난 2일 ‘인공지능(AI) 학습에 이용되는 어문저작물의 적절한 대가에 관한 연구’라는 이름의 사업을 발주했다. AI 학습 과정에 저작물을 포함한 대량의 데이터가 이용되고 있는 만큼 이에 대한 실태를 파악해야 한다는 것이다.

저작위에 따르면 뉴스를 포함한 어문저작물은 AI 모델의 신뢰도를 높이고 자연스러운 문장의 생성에 활용돼 AI 학습 과정에 중요 부분으로 이용되고 있다.

다만 AI 사업자와 권리자간 이용허락 계약은 일부에서나 이뤄지고 있는 데다 적정한 수준의 대가에 대한 기준이 마련돼 있지 않아 향후 AI 사업자와 학습 저작물 관리자간 분쟁이 커질 것으로 내다봤다. 이에 AI 학습 방식, 학습 저작물의 규모 및 권리자의 경제적 이익 등을 포괄한 적절한 대가 마련을 위한 기초 연구가 필요하다는 것이 연구의 취지다.

이를 위해 어문저작물 관리단체 및 보상금수령단체를 통해 저작물 사용료나 보상금에 대한 실태를 파악하고 실제 AI 사업자가 어문저작물을 어떻게 이용하고 있는지 기술적 분석을 하게 된다. 모델별 어문저작물 이용방식 비교‧분석도 요구사항 중 하나다.

입찰은 8일부터 개시, 14일 마감한다. 연구 기간은 5개월이다. 예정대로 진행될 경우 올해 말 결과물이 나올 예정이다. 예산은 3500만원이 편성됐다.

한편 대부분의 AI 기업들은 학습 데이터를 공개하지 않고 있는 만큼 연구가 원활히 진행될 수 있을지는 미지수다. 유럽연합(EU)이 최근 통과시킨 AI법에 학습 데이터를 공개하라는 내용이 포함돼 있지만 이에 대한 갑론을박도 이어지고 있는 상황이다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널