인터넷

[일문일답] 안방에선 안 진다…네이버, 생성형AI “한국에 베팅”

이나연 기자

[디지털데일리 이나연 기자] 챗GPT가 촉발한 초거대 인공지능(AI) 개발 경쟁으로 일찌감치 구글 ‘팜2’와 마이크로소프트(MS) ‘GPT4’가 시장 선점에 나선 가운데, 네이버가 토종 AI로서 강한 자신감을 드러냈다. 차세대 대규모언어모델(LLM)인 ‘하이퍼클로바X’뿐만 아니라, 이를 활용한 네이버판 챗GPT 역시 충분한 경쟁력이 있다는 판단에서다.

최수연 네이버 대표는 24일 서울 강남구 그랜드 인터컨티넨탈 서울 파르나스에서 열린 컨퍼런스 ‘단(DAN)23’에서 오픈AI의 챗GPT와 비교해 네이버 대화형 AI 서비스 ‘클로바X’가 지닌 차이에 대한 질문에 “자연스러운 한국 표현을 포함해 한국 사회 맥락 등을 생성형 AI가 이해하고 있다는 점”을 차별점으로 꼽았다.

이를 사용하는 중소상공인과 창작자들이 한국 시장을 타깃한다는 점에서 국내 고객사에 최적화된 기술이라는 점이 최수연 대표 생각이다. 전 세계를 타깃으로 하는 글로벌 기업은 더 큰 데이터 학습 모델을 활용해야 하므로 국가별 로컬라이징 시장이 약화 될 수밖에 없다. 국내 사용자 대다수가 이용하는 포털 플랫폼인 네이버가 매일 갱신되는 최신 데이터를 기반으로 AI 서비스를 한국 특화로 구상하는 것도 이 때문이다.

네이버는 재작년 하이퍼클로바X 전신인 하이퍼클로바 파라미터(매개변수)가 2040억개라고 발표한 바 있다. 최근 오픈AI가 GPT4 파라미터 수를 공개하지 않았듯, 네이버도 언어모델이 핵심 노하우라는 점을 감안해 이번에는 구체적인 파라미터를 공개하지 않았다. 다만, 네이버는 하이퍼클로바X 성능에 대해 오픈AI LLM인 GPT 3.5와 비교했을 때 하이퍼클로바X 승률은 75%라고 강조했다.

한편, 최근 구글이 무서운 기세로 국내 검색시장 점유율을 늘리고 있다는 지표가 잇따라 발표되며 일각에서는 포털 플랫폼으로서 네이버 경쟁력 약화를 우려하는 목소리도 나온다. 하지만 내부적으로 매출을 비롯한 검색 만족도, 활성화 지표를 볼 때 견고한 위치를 유지 중이라는 것이 네이버 판단이다. 네이버가 생성형 AI로 검색 관련한 버티컬 서비스에 집중하는 것도 국내 포털 1위라는 자리를 강화하기 위한 전략이다.

다음은 최수연 네이버 대표와 최재호 네이버 에어서치 책임리더, 김용범 네이버 서치 US AI 기술 총괄, 성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄과의 일문일답.

Q. 오픈AI의 챗GPT와 네이버 클로바X 차이점은. 하이퍼클로바X는 초거대 AI인 만큼 운영 비용이 많이 들 것 같은데.

▲(최수연 대표) 자연스러운 한국 표현을 포함해 한국 사회 맥락 등을 생성형 AI가 이해하고 있다는 점이 차별점이다. 이를 사용하는 중소상공인과 창작자들이 한국 시장을 타깃한다는 점에서 국내 고객사에 최적화된 기술이라고 본다. 특히 네이버는 사용자가 인터넷에서 하는 모든 행위가 일어나는 플랫폼으로, 매일 갱신되는 최신 데이터가 학습된 대규모 언어 모델이라는 점이 특장점이다. 비용 문제 경우, 네이버는 기업(B2B) 모델부터 수익화하며 클로바X 검증을 계속할 예정이다. 소비자(B2C) 역시 마찬가지로 지속 검증할 계획이다. 이전에도 B2C 서비스는 기술적 전환기를 거칠 때 비용이 상승하는 이슈가 있었지만, 서비스 경쟁력과 차별점으로 연결되면 수익으로 이어지는 효과를 경험했기 때문이다. 아울러 경량화와 반도체 칩 설계 등 기술적인 연구 투자도 이어가려고 한다.

▲(성낙호 총괄) 전 세계를 타깃으로 하는 글로벌 기업은 더 큰 데이터 학습 모델을 활용해야 해 국가별 로컬라이징 시장이 약화 될 수밖에 없다. 반대로 네이버는 ‘한국에 베팅’하는 것이다. 이런 형태로 특화된 모델을 만들고 경량화를 진행하는 이유도 그래서다.

Q. 해외 플랫폼이 강세인 상황에서 네이버가 검색 시장에서 위협을 받고 있는다는 이야기가 있다. 이 위기를 극복할 네이버 방안은 무엇인가. 클로바X는 결국 네이버판 챗GPT인데 수치적으로 얼마나 더 차별점이 있는지 구체적으로 설명해달라.

▲(최수연 대표) 검색시장 점유율과 앱 사용 시장 등 지표가 여러 매체 통해 발표되면서 네이버 점유율 경쟁력이 낮아지는 거 아니냐는 우려가 나오는 것 알고 있다. 하지만 내부적으로는 매출을 비롯한 검색 만족도, 활성화 지표를 볼 때 견고하게 유지되는 편이다. 다만 사용자의 모든 생활이 인터넷 모바일로 옮겨가는 상황에서 모든 것을 네이버가 점유할 수는 없다. 대신 버티컬 서비스로 어떻게 각 니즈를 만족시킬지 보고 있다. 생성형 AI에서 검색 관련한 여러 기술로 뾰족한 경쟁력을 유지한다면 기존 위치를 유지하고 강화할 것이라 자신한다.

▲(성낙호 총괄) 초거대 언어모델(LLM)을 특정 수치로 비교하는 것은 적절치 않으나, 오픈AI LLM인 GPT 3.5와 비교했을 때 하이퍼클로바X 승률이 75% 정도다. 클로바X를 통해 네이버가 원하는 것은 사용자가 어떤 질의를 요청하는지 등을 파악해서 해당 부분에 대한 집중 투자로 시장이 원하는 AI를 빠르게 공급하는 것이다. 오늘부터 서비스를 시작하면 몇 달 내로 문제 개선이 가능할 것 같다.

Q. 지난 2021년 네이버가 세계에서 세 번째로 초거대 AI인 하이퍼클로바를 내놓았을 때는 파라미터(매개변수)를 공개했다. 물론, 최근에는 이를 공개하지 않는 것이 추세지만 이번에 네이버도 공개 안 한 이유는 무엇인가.

▲(최수연 대표) 당시에는 연구개발(R&D) 차원에서 여러 가지를 공유했다. 하지만 파라미터가 언어모델 핵심 노하우라는 점을 고려해 파라미터 학습 데이터셋 규모를 공개하지 않기로 했다. GPT 4 역시 추측만 있을 뿐, (파라미터가) 공개되지 않는 상황이다.

Q. 오는 11월부터 큐:가 통합검색 서비스에 도입되면 장기적으로 기존 검색 화면도 전면적인 변화가 이뤄지는 것인가.

▲(최재호 책임리더) 네이버 검색이 전면적으로 큐:로 대체되는 개념은 아니다. 다만, 복합적인 의도에 대해서도 원하는 답변을 한 번에 제공함으로써 기존 검색에 상호 보완적인 역할을 할 것이라고 생각한다. 장기적으로 보면 큐:라는 것도 결국 검색 결과 일부로서 검색 서비스를 대체한다기보다는 발전적인 방향성이라고 이해해달라.

▲(김용범 총괄) 큐:는 새로운 생성형 AI 검색 기술을 이용해 기존 검색 경험을 확장한다는 데 목적이 있다. 풍부한 콘텐츠를 통해 입체적인 답변을 줄 뿐만 아니라, 실질적인 서비스까지 제공하며 사용성을 크게 높이는 것을 지향한다.

Q. 하이퍼클로바X 학습 소스가 구체적으로 무엇인가. 그에 대한 대가를 어떻게 지불할 것인지. 가령 기존 하이퍼클로바가 뉴스 50년치를 학습했다고 하는데, 지불 방침 같은 게 마련돼 있나.

▲(최수연 대표) 이 부분은 여러 논의가 지금도 지속되고 있다. 지금까지 학습한 데이터들은 기존에 규제라든지 특정 근거를 두고 한 것으로, 별도 사용료에 대해 이야기하는 단계는 아니다. 다만, 뉴스를 50년치 학습했다는 표현은 과거 하이퍼클로바를 출시할 때 데이터 규모를 알기 쉽게 전달하는 과정에서 오해 소지가 있었던 것 같다.

Q. 하이퍼클로바X 해외 진출에 대한 계획은. 또 지난해 말 삼성전자와 AI 반도체 협력 계획을 발표했는데, 하이퍼클로바X에도 삼성전자가 개발한 솔루션이 적용되는지. 현재 협력 상황이 궁금하다.

▲(최수연 대표) 글로벌 모델 대비 네이버 강점은 그 나라에 특화된 데이터를 획득해 학습했을 때. B2B 모델 기본 세트나 특장점 있는 플랫폼에 적용하려는 전략을 논의한다는 것이다. 삼성전자와의 AI 반도체 협력 경우, 경량화 알고리즘이 성공적으로 작동하는지 등을 테스트하는 것은 거의 마무리되는 단계다. 상용화와 사업화에 대해서는 양사가 논의할 것이 많은 상황이다.

Q. AI 할루시네이션(챗GPT 같은 AI 언어 모델에서 주어진 데이터 또는 맥락에 근거하지 않은 잘못된 정보나 허위 정보를 생성하는 것) 문제는 어떻게 해결할 생각인가.

▲(최수연 대표) 할루시네이션을 해소하기 위해 출처 위주 결과도 더 많이 쓴다든지, 답변을 생성하는 과정에서도 팩트가 일치하는지 여부를 확인하는 처리 절차를 거쳐 보완하려고 한다. 관련해 큐:와 클로바X 간 가장 큰 차이점은 ‘자유도’다. 큐:는 검색에 적용할 것을 염두하고 좀 더 엄격한 제한을 두지만, 클로바X는 자유도 있는 모델이다. 얼마나 자유도를 뒀는지에 따라 검색형 질문에 대해서도 서로 다른 답을 얻을 수 있다. 네이버가 극복해야 할 과제이기는 하나, 처음부터 답변 자체를 출력할 수 없다고 하면 사용자나 창작자가 불편을 느낄 수 있어 이러한 차이를 뒀다.

Q. 매출과 영업이익 증대 측면에서 하이퍼클로바X 기반 서비스들로 목표하는 성과적 수치가 있는지.

▲(최수연 대표) B2B 자체는 과금이나 상품에 대한 유료화 계획은 있지만, 목표 매출에 대해 외부에 공개할 적절한 수치는 없다. 내부에서 목표로 하는 숫자는 있기에 투자할 때 이들 측면을 고려 중이다. 네이버가 가진 장점이라고 하면, 기술적인 연구 투자를 선제적으로 하는 회사이기 때문에 GPU 등 서버 투자가 미리 들어갔다는 점과 인력에 대한 연구가 앞서 있다는 부분을 들 수 있다. 즉, 다른 회사와 비교해 향후 들어갈 비용은 경쟁력을 가진다고 생각한다.

Q. 큐:에서 추천하는 장소나 아이템들은 모든 사용자에게 동일하게 노출되나. 각 사용자에 따른 개인화 예정이 있는지.

▲(김용범 총괄) 생성형 AI 꽃은 개인화에 있다. 충분히 깊은 이해를 통해 훌륭한 생성을 만들 수 있는 독자적인 리즈닝 기술 확보 중이다. 특히 쇼핑과 로컬을 중심으로 해 개인화 서비스를 예정하고 있다. 쇼핑에서는 장보기와 같이 사용자 배송지와 선호물, 배송 히스토리를 기반으로 할 것이고, 로컬에서는 사용자 위치 정보를 기반으로 추천할 계획이다.

Q. 하이퍼클로바X에 꾸준히 최신 뉴스를 학습시켜야 할 것 같은데 제휴 언론사들과 어떻게 협업할 것인지. 뉴스 콘텐츠 AI 이용료 문제 등도 제기되고 있는데 어떻게 판단하나.

▲(최수연 대표) 네이버는 생성형 AI에 뉴스를 어떻게 활용할 것인가를 글로벌 플랫폼보다 가장 적극적으로 먼저 고민해 온 회사다. 지금까지 뉴스 콘텐츠를 어떻게 학습했는지는 약관에 근거한 것이라 앞으로 언론사들과 명확하게 협의하는 방향성을 생각 중이다. 현재는 공정, 무료, 수익화 문제들이 있는데 지금 네이버가 답을 알고 있다고 보지는 않는다. 이런 논의들이 건강하게 계속해서 되면서 기술 회사나 콘텐츠 회사 모두 윈윈할 수 있는 방법을 따라가려고 한다.

Q. 하이퍼클로바X 영어 능력은 GPT 대비 어떠한가. 내수형 초거대 AI라는 비판에 대해서는 어떤 입장이며 국내 플랫폼 기업으로서 독과점, 자사우대 등 이슈는 어떻게 보는지 궁금하다.

▲(최수연 대표) 아직은 보완해야 할 버전이긴 하지만, 영어와 일본어도 잘한다는 것을 느낄 수 있을 것이다. 네이버는 기업으로서 이를 투자하고 상품 개발 및 출시하기 위한 전략적 측면에서도 성공할 시장을 선점해야 하므로 국내 스타트업들 니즈를 맞추고 있다. 물론, 글로벌에 대한 니즈 대응도 노력할 예정이다. 규제에 대한 목소리가 강조되는 플랫폼 이슈 경우, 기본적인 회사 입장은 생성형 AI 서비스 자체가 국경을 넘어서 이뤄지는 싸움이라는 점이다. 기술 회사들은 다 글로벌 회사이고 많은 부분이 회색지대라 창의성을 강조하는 방향이 바람직하지 않나 생각한다. 끼워팔기나 자사 우대 등 사회적 책임에 대해서는 네이버가 누구보다 더 엄격하게 바라봐야 한다.

이나연 기자
lny@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널