솔루션

[초거대AI②] 대기업 주도로 추진되는 국내 초거대AI 기술

박세아

알파고로 촉발된 AI기술이 이제 초거대AI로 발전하고 있다. 알파고가 특정 분야에서의 인간을 뛰어넘는 성과를 보였다면 초거대 AI는 인간과 비슷한 사고와 추론까지 가능하게 하는 연구다. 이미 글로벌 기업은 물론 국내 기업들까지 뛰어들고 있는 초거대AI가 불러올 파장과 효과, 그리고 유의점에 대해 3회에 걸쳐 진단해본다<편집자>

엑사원이 그린 호박모양 모자
엑사원이 그린 호박모양 모자

[디지털데일리 박세아 기자] 세계적으로 초거대 인공지능(이하 AI) 기술 관련 경쟁이 시작됐다. 구글, 마이크로소프트(MS) 등 내로라하는 빅테크 기업들은 연달아 초거대AI 모델을 공개하며 '인간'과 닮은 AI가 곧 탄생할 수 있다는 희망에 불을 지피고 있다.

국내에서도 빅테크 업체는 물론 대기업 그룹 차원에서 초거대AI 기술 고도화를 위해 잇달아 모델을 공개하는 등 시장 선점에 분주한 모습이다.

◆LG 엑사원, '호박 모양 모자 만들어 줘'

LG그룹은 최근 AI토크 콘서트를 개최한 자리에서 구글과 협력해 만들어낸 초거대 AI 엑사원을 공개하며 주목 받았다. 엑사원은 세계 최대 수준인 말뭉치 6000억개와 2억5000만장 이상 이미지를 학습했다. AI 연산 능력을 가늠할 수 있는 파라미터(매개 변수)는 한국 최대인 3000억개라고 밝히고 있다.

이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있다. 이는 구글 딥마인드에서 개발한 바둑 특화 알파고의 300배가 넘는 수준이다. 엑사원에는 구글이 아직 공개하지 않은 최신형 모델 구글 AI 칩 'TPU v4'가 탑재됐다.

엑사원 멀티모델은 텍스트와 음성, 이미지, 영상 등 서로 다른 양식 데이터를 자유자재로 이해하고 변환할 수 있다. 쉽게 말해 기존에 글을 해석하고 써내는 능력 정도만 갖춰진 챗봇 수준에서 조금 더 사람처럼 배우고 생각하며 추론하는 모습에 가까워진 모습을 구현한 것이다.

LG AI 연구원은 현재 3000억개인 엑사원 파라미터를 내년에 6000억개까지 늘릴 예정이다.

LG그룹 관계자는 "엑사원은 '전문가 AI'로 활약할 수 있도록 만든다는 점에서 타사 초거대AI 모델과 지향점이 다르다"며 "네이버와 카카오가 빅테크 기업으로써 서비스하고 있는 부분에 초거대AI를 적용하는 것을 주안점에 두고 있다면, LG그룹은 각 분야 전문가 AI로써 B2B 모델을 추구하고 있다"고 설명했다.

◆질세라 속도 높이는 카카오브레인

최근 카카오브레인도 각각 텍스트, 이미지 생성 초거대 AI모델 코지피티(KoGPT), 민달리(minDALL-E)를 공개하면서 초거대 AI에 대한 관심에 불을 지폈다. 코지피티는 주어진 문장이 긍정적인지, 부정적인지를 판별하거나 긴문장을 요약하고, 추론해 결론을 예측하는 한국어 특화 AI 모델이다. 민달리는 텍스트를 입력하면, 실시간으로 이용자가 원하는 이미지 결과값을 도출해내는 모델이다. 먼저 카카오는 이와 같은 초거대 AI를 교육과 헬스케어 분야에 적용하겠다는 방침이다. 실제 카카오브레인은 최근 투자한 AI신약개발 스타트업 갤럭스에 기술적용을 추진하고 있다.

카카오브레인 관계자는 "네이버 하이퍼클로바가 논문을 통해 수행한 과제와 그 점수를 공개하고 있는 상황에서, 동일한 과제를 진행한 결과 영화 리뷰(댓글)에 대한 긍/부정 분석 등에서 정확도가 더 높게 나타났다"며 "하이퍼클로바에서 공개된 성능 중 가장 큰 모델인 800억 파라미터 모델과 비교해 비슷한 수준의 성능을 보였다고 볼 수 있다"고 설명했다.

또 "글로벌 오픈소스 커뮤니티 깃허브(github)에 오픈소스로 공개됐다는 점에서 연구기관, 기술스타트업의 기술접근성을 높여 초거대 AI 분야의 플레이어를 늘리고, 궁극적으로 국내 초거대 AI 분야 성장을 가속화 할 수 있을 것이라고 본다"고 덧붙였다.

다만, 카카오브레인은 파라미터 측면에서 코지피티 300억개, 민달리 14억개 정도로 다른 국내 초거대AI보다 부족하다는 지적도 있다. 이를 두고 카카오브레인 김일두 대표는 "무작정 사이즈를 키우는 것보다는 실용적으로 쓸 수 있는 규모의 언어모델을 타사 최고 크기 모델과 비등한 수준 성능으로 끌어올리겠다"고 설명했다.

카카오브레인 관계자는 "내년 800억개까지 공개 검토예정이고 내부적으로는 더 확장된 크기로 연구중인 상황"이라고 말했다. AI 언어모델은 규모가 클수록 속도가 느리고 학습 과정도 복잡한 데다, 결과를 도출하는 것까지 비용이나 시간이 늘어난다는 단점이 있어 지연 시간 없이 실시간 응답이 가능한 실용 구간은 60억~800억 개 수준으로 추정된다고 전했다.

업계 관계자는 "사실상 파라미터수가 무조건 많다고 해서 사람과 같은 AI 구현이 가능한 것은 아니다"라며 "양질의 데이터 즉 실용적으로 활용할 수 있는 데이터 확보가 중요하다"고 언급했다.

◆서비스 상용화 이미 시작, 네이버 하이퍼클로바

네이버는 올해 5월 자체 개발한 초거대AI 하이퍼클로바를 공개했다. 하이프클로바는 매개변수(파라미터)가 2040억개에 달하는 대규모 서비스로 다양한 서비스에 이미 적용된 상태다.

네이버는 음성인식부터 쇼핑, 회의록 작성, 검색, 케어콜까지 확장했다. 네이버는 네이버쇼핑 'FOR YOU'에 하이퍼클로바를 활용하고 있다. 이 서비스는 모바일 전용으로, 쇼핑과 관련해 이용자 개인 관심사와 취향을 모아 보여준다. 이밖에 음성 기록 서비스 '클로바노트', 독거 어르신 안부와 정서를 체크하는 '클로바 케어콜' 등에도 활용되고 있다.

업계 관계자는 "일단 초거대AI 모델 기술은 외부에 공개된 것보다 각사에서 내부적으로 진행하고 있는 연구를 포함하면 더 고도화 되고 있을 것"이라며 "내부 기술 고도화 내용을 제외하고, 외부적으로는 네이버가 실제 기술을 서비스에 적용한 상황이어서 최근 초거대AI에 열을 올리는 카카오와 경쟁이 치열해 질 것"이라고 설명했다.

박세아
seeall@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널