소프트웨어

이파피루스, '챗GPT'에 PDF 기술 공급

이상일 기자
챗GPT에 이파피루스의 미국 자회사 아티펙스(Artifex)의 ‘PyMuPDF(파이뮤PDF)’가 적용됐다.
챗GPT에 이파피루스의 미국 자회사 아티펙스(Artifex)의 ‘PyMuPDF(파이뮤PDF)’가 적용됐다.

[디지털데일리 이상일기자] 이파피루스(대표 김정희)가 미국 오픈AI의 인공지능 챗봇 ‘챗GPT’에 자사의 PDF 기술을 공급한다고 29일 발표했다.

이번에 챗GPT에 사용된 기술은 이파피루스의 미국 자회사 아티펙스(Artifex)의 ‘파이뮤PDF(PyMuPDF)’다. 오픈AI는 챗GPT의 학습 뿐만 아니라, 서비스 과정에서 이루어지는 다양한 PDF 문서 처리에 파이뮤PDF 기술을 사용한다.

파이뮤PDF는 파이썬 기반의 고급 전자문서 처리 라이브러리로, 인공지능 및 빅데이터 처리에 필수적인 다양한 문서 처리 기능을 제공한다. 복잡한 문서로부터 텍스트, 이미지, 표 등의 정보를 정확하게 추출해 주며, 최소한의 사전 처리만으로 AI를 위한 학습 데이터를 만들 수 있어 오픈AI를 포함한 전 세계 100여 개 이상의 AI 기술 기업들로부터 높은 관심을 받고 있다.

용도에 따라 오픈소스와 상업용 라이선스 두 가지 모델로 제공되며, 일간 다운로드가 1백만 건에 달할 정도로 글로벌 오픈소스 커뮤니티에서도 큰 인기를 끌고 있다.

전자문서 처리 기술은 최근 AI 학습 및 활용에 있어 그 중요성이 점점 증가하고 있으며 대규모 언어 모델(Large Language Models, LLM) 기술 학습에도 필수적인 주요 데이터 소스로 자리매김 중이다. 이파피루스 또한 이번 협력을 통해 전 세계적으로 기술력을 인정받고 있음을 입증하며 글로벌 시장에서 약진할 것으로 예상된다.

이파피루스 김정희 대표이사는 “오픈AI와의 협력을 통해 우리 기술이 더욱 널리 인정받게 되어 매우 기쁘다. 파이뮤PDF는 정확하고 효율적인 정보 추출을 통해 AI 분야에 크게 기여하고 있다”며 “미국 골드러시 시대에 곡괭이와 청바지가 광부들의 필수 장비였듯이, 우리 기술은 AI 골드러시 시대에 데이터를 캐기 위한 ‘곡괭이와 청바지’ 역할을 할 것” 이라고 포부를 밝혔다.

이파피루스와 아티펙스는 오픈AI 외에도 구글, 오라클, 알리바바, 세일즈포스와 같은 세계적인 기업들에 자사의 PDF 기술을 공급하고 있다. 이파피루스는 파이뮤PDF를 통해 글로벌 시장에서의 입지를 더욱 공고히 하고, AI 분야에서의 혁신을 주도해 나갈 계획이라고 밝혔다.

이상일 기자
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널