콘텐츠

로톡, ‘빅케이스GPT’ 변호사시험 정답 53.3% 적중

이나연 기자
[ⓒ 로앤컴퍼니]
[ⓒ 로앤컴퍼니]

[디지털데일리 이나연 기자] 법률 종합 포털 로톡 운영사 로앤컴퍼니가 인공지능(AI) 기반 통합 법률정보 서비스인 빅케이스와 만든 자체 AI 시스템 ‘빅케이스GPT’가 제12회 대한민국 변호사시험 객관식 문제에서 53.3% 정답률을 달성했다.

로앤컴퍼니는 해당 성과가 현존하는 최고 성능 언어 모델로 인정받는 GPT-4 정답률 34%를 56.8%(19.3% 포인트) 개선한 결과라며 18일 이같이 밝혔다.

지난 3월 로앤컴퍼니는 오픈AI의 최신형 언어 모델인 GPT-3.5와 GPT-4를 활용해 변호사시험 객관식 문항을 풀도록 하는 자체 실험을 했고, 각각 28.7%와 34% 정답률이 나오는 것을 확인했다. 변호사시험 객관식 문항은 공법 40문항, 민사법 70문항, 형사법 40문항 등 총 150문항으로 구성된다. 빅케이스GPT는 이 문항 중 각 19개, 40개, 21개 등 총 80개 정답을 맞혔다.

로앤컴퍼니는 빅케이스GPT에 GPT-4를 기반으로 증강검색생성기법(RAG) 모델과 자체 고안한 프롬프트 엔지니어링을 적용했다. 또한 빅케이스가 확보한 국내 최다 판례 329만건 중 정보 가치가 높은 판례들을 중심으로 벡터화된 데이터베이스를 구축, 법률 분야 질의에 최적화된 답변을 내놓도록 설계했다.

로앤컴퍼니는 빅케이스GPT에 판례뿐 아니라 빅케이스가 보유한 법령 14만5000건, 결정례 7000건, 유권해석 7000건 등 총 16만건 법률정보도 추가로 학습시켰다. 특히 빅케이스GPT는 생성형 AI 최대 한계점으로 꼽히는 할루시네이션(환각, 정보 왜곡 현상)을 ‘제로’에 가깝게 통제해 데이터 신뢰성을 대폭 강화한 것이 특징이다.

실제 로앤컴퍼니는 반복적인 테스트를 통해 빅케이스GPT가 가짜 판례나 법령을 제시하지 않는 수준에 이른 것에 대한 검증을 마쳤으며, 향후 지속적인 품질관리(QA)를 거쳐 이를 완벽하게 제거할 예정이다.

로앤컴퍼니는 향후 빅케이스GPT에 다수 언어 모델을 실험·적용하고 자체적으로 개발한 최적의 언어 모델을 추가로 적용해 본 시스템을 고도화한다. 이를 통해 내년 상반기 중 ‘슈퍼로이어(Super Lawyer, 가칭)’라는 AI 기반 변호사 기업 간 거래(B2B) 서비스형 소프트웨어(SaaS) 서비스를 신규 출시할 계획이다.

김본환 로앤컴퍼니 대표는 “한국어와 대한민국 법률에 최적화된 언어 모델로 개발될 슈퍼로이어는 변호사를 돕는 AI 법률 비서와 같이 구동되며 변호사 업무효율을 극대화하는 역할을 맡게 될 것”이라며 “법률AI연구소를 중심으로 변호사 성과를 높이기 위한 서비스 출시에 집중해 더 많은 변호사 업무환경 개선에 도움이 되고 싶다”고 강조했다.

이나연 기자
lny@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널