반도체

퀄컴 부사장 "AI 비용, 하이브리드 시스템이 대안…온디바이스AI 확대될 것"

고성현 기자
6일 그랜드하얏트 서울에서 미디어 브리핑을 진행하는 두르가 말라디 퀄컴 수석 부사장
6일 그랜드하얏트 서울에서 미디어 브리핑을 진행하는 두르가 말라디 퀄컴 수석 부사장

[디지털데일리 고성현 기자] 퀄컴이 인공지능(AI) 시장 내 온디바이스A I의 입지가 더욱 커질 것으로 내다봤다. AI 시장이 지속되기 위해서는 인프라 구축 비용을 줄이는 것이 핵심인 만큼, 온디바이스를 활용한 하이브리드 시스템이 저변을 넓힐 수 있다는 이유에서다. 특히 거대언어모델(LLM)의 경량화와 올해부터 확산되는 사용 사례가 혁신의 불을 댕길 것으로 내다봤다.

두르가 말라디 퀄컴 테크날러지 수석 부사장 겸 기술 기획 및 엣지 솔루션 부문 본부장은 지난 6일 서울 한남동 그랜드하얏트 서울에서 기자간담회를 열고 퀄컴의 AI 전략과 비전을 공유했다.

말라디 부사장은 "클라우드 상으로 AI 추론을 구동하면 전통적인 비용 대비 10배 가까이 높아진다. 음성이나 비디오 등을 더한 멀티모달리티(Multimodality)로 넘어간다면 이 방식은 더욱 어려워질 것"이라며 "에너지 사용량 측면에서도 전세계 전력 소비량의 3.5%에 달할 것이란 분석이 나온다. 따라서 반드시 해결해야만 하는 과제"라고 말했다.

이어 "이를 해결하는 하나의 해법이 바로 분산형(하이브리드) AI"라며 "이때 온디바이스 AI를 활용한다면 훨씬 더 일관성 있는 경험을 구현할 수 있다"고 강조했다.

현재 생성형 AI 시장은 오픈AI, 구글, 메타, 앤트로픽 등이 개발한 초거대언어모델(LLM)을 중심으로 구축돼 있다. 데이터센터에서 AI 모델 학습·추론 등 인프라를 구축한 후, 클라우드 상으로 일반 소비자·기업 등으로 AI 서비스를 제공하는 형태다. 이때 인프라 구축에 필요한 비용은 비싼 칩 가격과 높은 전력 소모량, LLM 용량 확대 등에 따라 기하급수적으로 증가하는 추세다.

온디바이스 AI는 모바일, PC 등 개별 디바이스 내에서 자체적으로 AI 추론 등을 시행하는 시스템을 일컫는다. 거대한 LLM을 디바이스·칩 성능에 맞게 변조해 저장한 뒤 필요마다 구동하는 방식이다. 기기 내에서 자체적으로 AI를 구동하기 때문에 클라우드 상에서 일어날 수 있는 정보 유출에서도 안전하다는 평가를 받는다. 하이브리드 AI는 이러한 온디바이스 AI의 강점과 클라우드 방식의 장점을 결합한 솔루션이다.

6일 그랜드하얏트 서울에서 미디어 브리핑을 진행하는 두르가 말라디 퀄컴 수석 부사장 [ⓒ퀄컴]
6일 그랜드하얏트 서울에서 미디어 브리핑을 진행하는 두르가 말라디 퀄컴 수석 부사장 [ⓒ퀄컴]

말라디 부사장은 "온디바이스 AI는 이미 상당한 크기의 LLM, 멀티모달 모델을 구동 가능한 지점에 도달해 있다"며 "생성형 AI를 클라우드에서 처리하면 이동 과정이 있는 반면, 온디바이스 방식은 자체적으로 처리하기 때문에 속도가 빠르다는 것도 강점"이라고 말했다.

이어 그는 "클라우드 방식은 훨씬 더 거대안 모델을 이용할 수 있어 (온디바이스 AI에서) 실행하기 어려운 영역에서는 이 영역에서 진행하게끔 사용할 수 있다"며 "두 방식이 서로 상호보완적인 역할을 하게 될 것"이라고 설명했다.

LLM의 발전이 온디바이스 AI 확대 추세에 힘을 실을 것이라는 전망도 내놨다. 소형거대언어모델(sLLM) 형태로 최적화될 수록 온디바이스 AI가 감당할 수 있는 영역이 확대될 수 있다는 의미다.

말라디 부사장은 "2년 전 출시된 오픈AI의 'GPT3'는 당시 175억개의 매개변수(Parameter)를 가진 LLM으로 관심을 받았다지만, 지금 출시된 메타의 '라마(Llama)3'는 80억개 수준의 매개변수로도 GPT3를 뛰어 넘는다"며 "현재 나와 있는 GPT3.5(매개변수 1750억개)와 대등한 수준을 보이고 있다. 이러한 sLLM의 성능이 폭발적으로 증가하고 있는 것"이라고 운을 뗐다.

그러면서 "이러한 sLLM은 온디바이스로도 충분히 실행 가능하면서도 사용자들에게 풍부한 경험을 제공해줄 수 있을 것"이라고 전했다.

말라디 부사장은 온디바이스 AI의 적용처가 올해를 기점으로 점차 늘어날 것으로 내다봤다. 갤럭시S25 울트라 등 스마트폰을 시작으로 '코파일럿+' 기능을 지원하는 PC, 자동차, 확장현실(XR)에 이르는 영역까지 활용할 수 있다는 의미다. 이와 관련 퀄컴은 지난 5일(현지시간) 독일 베를린에서 열린 'IFA 2024'에서 보급형 프로세서인 '스냅드래곤X 플러스 8코어'를 공개하기도 했다.

그는 "퀄컴은 프리미엄뿐 아니라 중간 가격대의 제품에서도 온디바이스 AI를 활용할 수 있도록 하고 있다"며 "올해는 생성형 AI가 온디바이스 영역으로 구현한 첫 해인 만큼 점점 범위를 확대해나갈 것"이라고 밝혔다.

급증한 투자 비용에 따라 등장한 'AI 거품론'에 대해서는 "잘 모르겠다"면서도 AI의 지속적인 발전 가능성을 높게 샀다.

말라디 부사장은 "거품의 유무보다 AI를 통해 사용자 인터페이스가 바뀌고 있다는 점이 가장 중요하다"며 "2007년 스마트폰 등장 이후 터치스크린이 15년 동안 UI로 자리 잡았다. 하지만 생성형 AI의 강화로 음성(Vocie)이 더욱 더 큰 인터페이스로 자리잡게 될 것이다. 분명히 변화가 시작되고 있다"고 말했다.

고성현 기자
naretss@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널