[디지털데일리 이종현기자] 국내에서는 ‘카카오톡’에 밀린 ‘라인(LINE)’이 일본 시장을 장악한 지 오래다. 9월 기준 라인의 월간 활성 이용자 수(MAU)는 1억8900만여명으로, 카카오톡의 4배가량이다. 올해로 출시 10주년을 맞이한 라인은 한 차례 더 도약을 꿈꾸고 있다. 라인·네이버의 초거대(하이퍼스케일) 인공지능(AI) ‘하이퍼클로바’가 그 기반이 될 것으로 보인다.
라인은 10일부터 11일까지 이틀 동안 ‘라인 디벨로퍼 데이 2021(LINE DEVELOPER DAY 2021)’을 개최했다. AI와 블록체인을 중심으로 데이터, 머신러닝(ML), 오픈소스 소프트웨어(OSS), 인프라스트럭처, 보안 등 총 59개 세션에 대한 발표가 마련됐다.
◆모바일 메신저로 시작해서 핀테크, 이커머스까지 확장한 ‘라인 플랫폼’
카카오톡이 그러하듯, 라인 역시 메신저를 기반으로 영역을 확장해 나가고 있다.
박의빈 라인 최고기술책임자(CTO)는 “일본의 ‘라인 뉴스’는 월간 154억 페이지 조회수(PV)를 내는 서비스로 성장했다. 2014년 라인 페이, 증권, 은행 등으로 핀테크 분야에도 진출했다. 2020년 현지 은행과 손잡고 출시한 모바일 뱅킹 서비스 ‘라인BK’에 이어 올해에는 대만, 인도네시아에 ‘라인뱅크’를 출시했다”며 최근의 사업 성과를 공유했다.
라인은 다양한 사업 영역에서 확보되는 데이터를 ‘인포메이션 유니버스(Information Universe)’라는 하나의 데이터 플랫폼으로 모으고 있다. 현재 290페타바이트(PB)의 데이터가 적재돼 있고, 이는 매월 10PB가량씩 증가 중이다. 이를 활용해 공통의 ML 플랫폼을 구축, 서비스를 아우르는 대형 모델을 만들었다는 설명이다.
◆한국어·일본어라면 MS·구글보다도 우위··· 네이버·라인의 ‘하이퍼클로바’
라인은 당초 사내 데이터를 위한 플랫폼이었던 인포메이션 유니버스를 외부 개발자도 이용할 수 있는 형태로 개발 중이다. 네이버와 라인이 공동으로 개발 중인 AI 하이퍼클로바다.
글로벌 빅테크 기업이 AI 시장에서 격돌하고 있는 가운데 라인·네이버는 한국어와 일본어 자연어처리(NLP) 분야서 남다른 경쟁력을 보인다.
마이크로소프트(MS)는 1750억개의 매개변수(Parameter, 파라미터)를 가진 오픈AI사의 ‘GPT-3’를 활용하는데 GPT-3의 경우 학습한 언어의 93%가 영어 학습이다. 반면 하이퍼클로바는 한국어 2040억개, 일본어 390억개의 매개변수를 가졌다. 2022년에는 일본어도 2040억개의 매개변수를 갖춘 모델을 구축한다는 계획이다.
라인과 네이버는 일반인도 이용할 수 있는 AI 음성인식 서비스 ‘클로바노트’ 등을 서비스하고 있다. 음성파일을 업로드하는 것만으로 텍스트를 풀어낸다. 클로바노트는 한국어의 경우 MS의 ‘워드’에서 제공하는 동일 기능 ‘기록(Transcribe)’과 비교해도 정확도가 더 높다.
◆SST·TTS로 사람과 자연스레 대화하는 AI 구현 가능
이사고 신이치로(Isago Shinichiro) 라인 AI컴퍼니 최고경영자(CEO)는 기조연설에서 하이퍼클로바로 구현한 가상 캐릭터 ‘키즈나 아이’와 대화하는 모습도 시연했다. 이사고 CEO가 “안녕하세요”라는 말에는 “안녕, 키즈나 아이야. 반가워”라는 답변을, “아이씨는 AI에 대해 어떻게 생각하나요”라는 물음에는 “인공지능의 힘으로 세상이 편리해지면 참 좋을 것 같아”라는 답변을 했다.
화자의 말을 텍스트로(SST, Speach to Text) 변환해 하이퍼클로바에 입력하고, 하이퍼클로바가 알맞은 답변을 텍스트로 뽑아낸 뒤 이를 다시 말로(TTS, Text to Speech) 변환해 출력하는 원리다. 이는 게임을 비롯해 고객센터, 라이브 방송 등 다방면에 활용될 수 있다.
이사고 CEO는 “하이퍼클로바는 아직 해결해야 할 기술적 과제가 많다. 매개변수를 늘렸을 때 기대치만큼 성능이 높아지지 않고 있다. 또 전 세계적으로 화두가 된 AI 윤리도 중요하다. 하이퍼클로바가 출력한 문장을 어떻게 평가하고 필터링할 것인지, 사람에게 상처주지 않는 AI로 행동하기 위한 기술이 필요하다”고 당면한 어려움을 토로했다.
이어서 그는 “네이버와 라인은 현재 진행 중인 모델을 구축한 뒤 외부에 공개코자 한다. 또 하이퍼클로바의 적용이 힘든 영역에서는 소형 범용 언어 모델도 개발할 계획”이라며 “이번에는 입출력 모두 텍스트를 전제로 하는 모델을 소개했는데, 이후에는 이미지나 음성신호를 결합한 멀티모델 시스템에 도전하겠다”고 향후 방향성을 전했다.