e비즈*솔루션

대학 논문 표절 잡아내던 기술로 챗GPT 사용 여부 가려낸다, 'GPT킬러' 선보인 무하유

서정윤 기자
신동호 무하유 대표 [ⓒ디지털데일리]
신동호 무하유 대표 [ⓒ디지털데일리]

[디지털데일리 서정윤 기자] "세상이 변하면 단어도 바뀐다. 근본적으로 내가 쓰지 않은 내용을 썼다고 말하는 게 표절이라고 생각한다. 아직 생성AI와 관련한 표절 논의는 없지만, 문제가 발생할 여지는 충분하다. 생성AI가 만들어낸 정보를 믿기 어렵다는 문제도 있다."

무하유가 오는 9월 AI를 활용해 논문 표절을 잡아내는 '카피킬러' 서비스에 'GPT킬러'를 접목한다. 다양한 분야에 챗GPT가 쓰이며 학생들이 논문이나 보고서를 작성할 때 챗GPT를 악용할 가능성도 있다고 판단했기 때문이다.

지난 4일 서울 성동구에서 만난 신동호 무하유 대표는 카피킬러를 통해 닦아온 기술력과 노하우를 기반으로 GPT킬러도 원활하게 서비스할 수 있을 것으로 보고 있다. 신 대표는 "챗GPT가 등장한 이후 GPT킬러를 원하는 목소리가 많아 개발하게 됐다"며 "2학기 개학 일정에 맞춰 GPT킬러 기능을 카피킬러에 접목해 선보일 것"이라고 설명했다.

◆ "챗GPT 등장 이후 문의 많아…GPT킬러 정확도 94%"

무하유는 그동안 서비스형소프트웨어(SaaS) 형태로 대학에 카피킬러를 공급해왔다. 국내 4년제 대학의 94%가 카피킬러를 도입하고 있을 정도로 사업은 안정적이었다. 그러다 지난해 말 챗GPT가 등장한 후, 신 대표는 고민에 빠졌다. 고객사들이 챗GPT를 활용한 표절도 잡아달라고 요구하기 시작한 것이다.

신 대표는 "챗GPT의 등장이 무하유에게 호재가 될지 악재가 될지 모르는 상황이었기 때문에 고민에 빠졌다"고 말했다. 무하유는 고객사 담당자 9328명을 대상으로 챗GPT 탐지 프로그램이 필요한지 설문을 진행했다. 그 결과 응답자 중 78.7%가 탐지 프로그램이 필요하다고 답했다. 신 대표는 챗GPT 열풍이 무하유에게 기회가 될 수 있다고 판단, GPT킬러를 만들기 시작했다.

그렇다면 챗GPT가 쓴 글과 사람이 쓴 글을 어떻게 구별할 수 있을까. 신 대표는 "생성AI가 작동하는 방식은 확률적으로 다음에 나올 단어를 예측하는 형태"라며 "챗GPT는 확률이 높은 단어들만 사용하기 때문에 어휘나 단어들이 나타나는 분포를 살펴보면 기계가 썼는지 여부를 파악할 수 있다"고 설명했다. 챗GPT는 지나치게 무난한 단어들만 사용한다는 지적이다. 무하유는 내부적으로 GPT킬러의 정확도를 94% 정도로 보고 있다.

무하유는 다른 디텍트GPT 솔루션에 비해 GPT킬러가 한국어에 대한 정확도가 월등하게 높다고 보고 있다. 다른 서비스들은 영어에 특화된 반면 GPT킬러는 한국어를 학습했기 때문이다. 다만 GPT킬러는 현재 챗GPT에 대해서만 적용된다. 생성AI 경쟁을 챗GPT가 촉발시킨 만큼 챗GPT 사용량이 월등히 높기 때문이다.

◆ "챗GPT가 출처 생성해줘 문제 생겨…서비스 확장 계획"

일각에서는 챗GPT를 논문에 활용하는 게 왜 문제가 되는 거냐는 의견도 있었다. 신 대표는 챗GPT를 논문에 사용했을 때 나타날 수 있는 가장 큰 문제로 '환각 현상'을 꼽았다. 신 대표는 "챗GPT에 '출처를 만들어달라'고 요청하자 굉장히 그럴싸한 제목과 저자명을 만들어줬다"며 "당연히 이는 실제로 존재하는 논문이 아니었으나 악용하는 경우가 분명 생길 거라고 생각했다"고 말했다. 챗GPT가 거짓으로 생성한 출처표시를 학교에서 믿을 경우 교육 현장에서 혼란이 발생할 수 있다는 지적이다.

GPT킬러는 아직 출처 팩트체크 기능은 갖추지 못했다. 무하유는 앞으로 기술을 고도화해 출처를 검증하는 기능도 GPT킬러에 추가할 계획이다. 신 대표는 "생성AI는 출처가 될 수 없다"며 "챗GPT가 출처를 생성해내는 등의 문제에 대해 우려가 크기 때문에 이를 위한 단기, 중기, 장기 계획까지 세워 놓았다"고 말했다. 무하유는 카피킬러를 통해 쌓아온 논문 데이터들이 출처 팩트체크 기능에도 도움이 될 것으로 보고 있다.

신 대표는 "카피킬러 서비스를 하기 위해 인터넷상으로도 논문을 모으고, 기관 대 기관으로 협약을 해 논문을 모으기도 하는 등 수단과 방법을 가리지 않고 많은 논문을 모았다"며 "저희가 갖고 있는 논문을 토대로 GPT킬러의 서비스도 고도화할 수 있을 것"이라고 말했다. 무하유는 장기적으로 GPT킬러를 카피킬러와 AI 서류평가 서비스 '프리즘', AI 면접 서비스 '몬스터' 등에 접목할 계획이다. GPT킬러의 적용 범위도 실험보고서, 프로그래밍 코드 표절 등으로 넓힐 수 있다고 보고 있다.

신 대표는 "논문에 생성AI를 사용하는 건 연구윤리 측면에서 문제가 된다고 생각한다"며 "연구자는 성실하게 연구를 진행해 본인이 쓴 내용이 아니면 출처표기를 명확하게 해야 하는데 챗GPT의 등장으로 표절과 관련한 논의가 모호해질 수 있다는 생각이 들었다"고 말했다. 그러면서 "앞으로 GPT킬러 서비스를 고도화하며 연구윤리 측면에서 생각하고 접근할 것"이라고 덧붙였다.

서정윤 기자
seojy@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널