인터넷

한국판 챗GPT 올해 격돌…네이버‧카카오, AI기술 어디까지 왔나

이나연
[디지털데일리 이나연 기자] 오픈AI가 개발한 대화형 인공지능(AI) 챗봇 ‘챗GPT’ 등장에 AI에 대한 사회적 관심이 그 어느 때보다 높다. 글로벌 빅테크 기업들이 앞다퉈 유사 AI 검색 서비스를 도입하는 가운데, 국내에서도 한국판 챗GPT들이 서서히 윤곽을 드러내고 있다.

이와 관련 네이버와 카카오는 각각 ‘서치GPT’와 ‘코GPT’ 개발에 박차를 가하고 있다. 올해 상반기 내 한국어 특화 생성AI 서비스를 내놓겠다는 목표다.

먼저 네이버는 최근 개발자 컨퍼런스 ‘데뷰2023(DEVIEW 2023)’을 통해 개발 중인 서치GPT 청사진을 처음 공개했다. 서치GPT는 챗봇 서비스인 챗GPT와 달리, 고도화된 검색 경험을 제공하는 것을 골자로 한다.

챗GPT와 차별화된 점이라면 ‘한국어 최적화’ 요소를 꼽을 수 있다. 서치GPT는 하이퍼클로바X를 기반으로 개발됐는데, 하이퍼클로바X는 챗GPT 대비 한국어를 6500배 더 많이 학습했다. 서치GPT는 ▲정보의 신뢰성(trustworthy) ▲네이버 서비스와의 연결성(connected) ▲효과적인 정보 제공을 위한 멀티모달(multimodal) 세 가지를 중점으로 연구 개발을 진행 중이다.

특히 네이버는 서치GPT가 최근 대화형 AI 챗봇에서 논란되는 답변 신뢰성 문제를 해소할 수 있을 것이란 자신감도 내비쳤다. 서치GPT는 하이퍼클로바를 네이버 검색에 특화한 검색 대규모 언어모델(Search LLM) ‘오션(OCEAN)’을 백본(back-bone)으로 활용한다. 네이버가 20년간 축적한 사용자 검색 흐름 데이터를 모델링해 사용자가 검색 목적을 달성하도록 최적의 경로를 안내, 검색 의도와 결과를 더 잘 이해하고 신뢰성이 강조된 답변을 생성케 하는 기술이다.

김용범 네이버 서치US 치프 사이언티스트는 “정보 신뢰성은 검색 서비스가 필수로 갖춰야 할 요소이나 결과를 직접 만드는 생성AI에 신뢰성 보장은 매우 어려운 일”이라면서도 “서치GPT가 가장 중요하게 생각하는 가치는 신뢰할 수 있는 결과 제공”이라고 강조했다. 서치GPT는 사실입증(Fact verification) 모델 및 RLH2F를 통해 최신성과 사실성이 보장된 신뢰도 높은 검색결과를 생성한다는 설명이다.

네이버는 검색지식을 바탕으로 수많은 콘텐츠 생성자가 실시간 업데이트하는 최신 이슈와 트렌드 및 통계 정보 등 콘텐츠 정보 체계를 갖추고 있다. 이 가운데 검증된 정보를 기반으로 신뢰성 있는 결과를 보여주고, 다양한 유형 채널에서 수집된 입체적인 피드백을 통해 지속적으로 서치GPT 모델을 개선할 방침이다.

아울러 서치GPT는 음악‧웹툰 등 네이버 생태계 내 다양한 서비스와 연계해 질문자가 최종적으로 도달해야 하는 목표에 부합할 수 있게 한다. 멀티모달 기술을 활용해 이미지를 통해서도 원하는 답변을 얻을 수 있도록 한다. 김 사이언티스트는 “서치GPT 강점은 정확하고 신뢰성이 높은 검색 결과와 함께 다음 액션을 연결, 사용자 목표를 달성시킨다는 것”이라며 “네이버 검색에서 느낄 수 없었던 편리함과 새로운 검색 경로로 여러분에게 다가가겠다”고 전했다.

카카오도 올 상반기 ‘코GPT’ 출시를 예고했다. 카카오브레인 AI 모델 ‘칼로’ 한국어판과 AI 이미지 생성 앱 ‘비 디스커버’(B^ DISCOVER)를 활용한 AI 프로필 생성 기능을 선보인다는 목표다.

지난 2일 열린 카카오브레인 기업 설명회에서 김광섭 카카오브레인 최고기술책임자(CTO)는 코GPT를 “한국어를 사전적, 문맥적으로 이해해 사용자가 원하는 결과를 보여주는 카카오브레인만의 초거대 AI 언어모델”이라고 정의한 바 있다.

코GPT는 2021년 11월 최대 오픈소스 커뮤니티 깃허브(GitHub)에 공개된 GPT-3 한국어 특화 AI 언어모델이다. 60억개 매개변수(파라미터)와 2000억개 토큰(token) 한국어 데이터를 학습해 한국어를 이해한다. 코GPT는 주어진 문장에 대한 긍정과 부정 판단, 긴 문장 한 줄 요약, 문장을 추론한 결론 예측, 문맥을 이해해 질문에 답변 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다는 점을 차별화로 내세운다.

2022년 10월에는 ‘카카오디벨로퍼스’에 자체 개발한 코GPT를 오픈 응용프로그램 인터페이스(API)로 공개했으며, 이용자는 월 200건까지 무료로 이용할 수 있다. ‘코GPT API’는 이용자가 입력한 한국어를 사전적, 문맥적으로 이해한 후 이용자 의도에 적합한 문장을 생성하는 기능을 제공하는 툴이다. 맥락과 의도에 따라 문장을 생성해 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등 높은 수준의 언어 과제를 해결하고 다양한 분야에서 활용할 수 있다.

코GPT API 모델을 활용해 향후 다양한 상품 후기를 보유한 서비스 플랫폼사나 광고회사 등을 대상으로 파트너십 체결을 하고 서비스 적용 범위를 확대할 예정이다. 동시에 해외 서비스 진출도 준비한다. 향후 카카오브레인은 코GPT 영어 및 일본어 모델을 준비해 오픈소스화하고, 베트남어와 말레이시아어 등 동남아어 버전으로 확장 개발할 계획이다.

카카오브레인 칼로사업실 김재인 실장은 “카카오브레인의 초거대 이미지 생성 AI 기술을 글로벌 이미지 생성 AI 분야의 선두로 만들겠다”며 “이미지 생성 AI 분야 생태계 확장을 위해 칼로 기술을 중심으로 국내 스타트업을 선발해 지원하는 ‘칼로 100X 프로젝트’를 상반기에 시작할 계획”이라고 말했다.
이나연
lny@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널