네이버 vs 카카오…초거대AI 경쟁 막 올랐다
[디지털데일리 임재현기자] 초거대 인공지능(AI) 경쟁이 뜨겁다. 이미 세계 시장에서는 일론 머스크 테슬라 최고경영자(CEO) 등이 주도해 설립한 오픈AI를 필두로 관련 연구가 활발하다. 국내 빅테크 쌍두마차인 네이버·카카오 모두 올해 한국어 기반 초거대 AI를 발표하며 경쟁에 뛰어들었다.
초거대 AI란 알파고로 대표되는, 지시에 따라 주어진 일만을 수행하는 '약인공지능'을 벗어나 인간 지성에 가까운 '강인공지능'으로 향하는 길목에 있는 기술이다. 대규모 데이터를 처리할 수 있는 슈퍼컴퓨터를 기반으로 해 일반 AI보다 파라미터 수가 월등하다. 파라미터는 인간 뇌로 치면 정보를 전달하는 시냅스 부분에 해당하는 것으로, AI 성능의 지표가 된다. 초거대 AI는 이를 바탕으로 스스로 생각하며 학습할 수 있다.
국내 초거대 AI 경쟁 포문을 처음 연 것은 네이버다. 지난 5월 국내 최초로 초거대 AI '하이퍼클로바'를 공개했다. 현존하는 초거대 AI 중 가장 뛰어나다고 평가받는 오픈AI의 'GPT-3' 파라미터 수인 1750억개를 뛰어넘는 2040억개 규모다. 특히 한국어 데이터는 GPT-3 대비 6500배 이상 학습했다. 한국어를 가장 잘 이해하고 구사할 수 있는 최초 초대형 AI라는 설명이다.
네이버는 하이퍼클로바 상용화를 사실상 시작했다. 검색 서비스에 기본 도입돼 오탈자를 자동으로 수정해 주고 있으며, 지난 7월부터 네이버쇼핑을 비롯해 자사 서비스 곳곳에도 적용하고 있다.
지난 24일부터 3일간 진행된 개발자 콘퍼런스 '데뷰2021'에서도 하이퍼클로바 관련으로 무려 8개 세션을 준비하며 초거대 AI에 초점을 맞췄다. 네이버는 우선 하이퍼클로바를 텍스트뿐만 아니라 이미지와 음성 등을 동시에 이해할 수 있는 다감각(Multimodal) 모델로 확장할 계획이다. 한국어와 영어를 동시에 이해하는 모델을 실험하는 등 관련 결과를 세션을 통해 공유했다.
이외에도 독거노인을 위한 말벗 서비스 '케어콜', 물류 수요 예측 서비스 '클로바포캐스트' 등 검색·쇼핑을 넘어선 다양한 서비스에 하이퍼클로바를 접목한다. 최종적으로는 하이퍼클로바 기반 초거대 AI 생태계 구축이 목표다. 외부 협력사에 하이퍼클로바를 제공해, 데이터 수집량을 늘리고 가치를 극대화한다는 것이다.
성낙호 클로바 사내독립기업(CIC) 책임 리더는 "초거대 AI는 전문가뿐만이 아닌 누구나 접근 가능한 플랫폼이 되고 있다"며 "외부 협력사가 각자 데이터를 하이퍼클로바에 접목함으로써 하이퍼클로바 생태계가 더욱 확장될 수 있을 것"이라고 언급했다.
카카오 역시 네이버에 맞서 초거대 AI를 공개했다. 카카오브레인은 지난 17일 연례 콘퍼런스 '이프카카오2021'을 통해 초거대 AI 언어모델 'KoGPT'를 소개했다. KoGPT는 GPT-3의 한국어 특화 모델로, 카카오브레인은 세계 최대 오픈소스 커뮤니티 깃허브(GitHub)에 이를 공개했다. 기술을 적절한 곳에서 사용할 수 있도록 무상 제공은 물론 지원도 지속할 것임을 밝혔다.
GPT-3가 갖는 단점을 극복하기 위해 알고리즘 재설계도 진행 중이다. 여전히 윤리적·편향적 이슈 등 해결 실마리조차 찾지 못한 부분이 많다는 것이다. 카카오브레인은 추론 능력과 기억력을 포함해 다양한 알고리즘 개선을 논문으로 공개하고 모델을 개선할 방침이다.
지난 25일에는 연구 효율을 높이기 위해 국내 최대 딥러닝 인프라를 도입하기도 했다. 구글 클라우드 대용량 연산 인프라 'TPU'를 활용해 1엑사플롭스(EF) 이상 연산 속도를 낼 수 있다. 네이버가 도입한 700페타플롭스(PF)급을 뛰어넘는 국내 최대 규모다.
카카오도 네이버와 마찬가지로 초거대 AI 생태계를 구상 중이다. 카카오 생태계는 블록체인 기술을 기반으로 한다. 블록체인 구조를 이용해 모델 학습 연산을 도와주거나 좋은 지식이 존재하는 데이터를 제공하는 등 누구나 기여할 수 있으며, 기여한 사람은 지분을 일부 갖게 돼 모델 사용료를 소유 지분만큼 받는 것이다. 이를 통해 언어모델 최대 규모를 100배 이상 더 키울 계획이다.
김일두 카카오브레인 CEO는 "향후 공개할 다양한 초거대 AI에 도입한 인프라를 활용함으로써 연구 효율이 크게 높아질 것으로 기대된다"며 "다양한 언어모델을 준비하고 오픈소스화해 국내외 AI 생태계를 구축하는데 기여할 것"이라고 말했다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52