PC/프린팅/디바이스

[CES 2025] 퀄컴, '온프레미스 AI 어플라이언스 솔루션·인퍼런스 스위트' 공개

라스베이거스(미국)=김문기 기자

[사진=퀄컴]

[디지털데일리 김문기 기자] 퀄컴이 생성형 AI 추론 및 컴퓨터 비전 워크로드 구현하는 온프레미스 전용 하드웨어 솔루션과 컴퓨터 비전부터 생성형 AI까지 AI를 조작화하는 솔루션을 공개했다.

퀄컴(대표 크리스티아노 아몬)은 6일(현지시간) 미국 라스베이거스에서 개최되는 세계 최대 전자박람회 CES 2025에 앞서 온프레미스 데스크톱 또는 벽걸이형 하드웨어 솔루션인 퀄컴 AI 온프레미스 어플라이언스 솔루션(Qualcomm AI On-Prem Appliance Solution)과 니어 엣지부터 클라우드까지 AI 추론을 지원하는 소프트웨어 및 서비스 묶음인 퀄컴 AI 클라우드 인퍼런스 스위트(Qualcomm Cloud AI Inference Suite)를 발표했다.

두 신규 솔루션은 함께 사용할 시 중소기업과 대기업, 산업 기관은 생성형 워크로드 등을 포함한 맞춤형 및 상용 AI 애플리케이션을 온프레미스로 실행할 수 있다. 온프레미스에서 AI 추론을 실행하면 AI 인프라를 임대할 때보다 운영 비용과 총 소유 비용(TCO)을 크게 절감할 수 있다.

AI 온프레미스 어플라이언스 솔루션과 AI 인퍼런스 스위트는 함께 사용하면 고객사는 독점적 데이터과 미세 조정된 모델, 기술 인프라를 활용해 생성형 AI를 구현할 수 있다. 이를 통해 소매점, 패스트푸드 식당, 쇼핑 아울렛, 대리점, 병원, 공장 및 작업 현장 등 작업 흐름이 확립됐다. 반복적이며 자동화 가능한 대부분의 환경에서 사람과 기계 프로세스 및 애플리케이션을 자동화할 수 있다.

나쿨 두갈(Nakul Duggal) 퀄컴 오토모티브, 산업 IoT 및 클라우드 컴퓨팅 부문 본부장은 “AI 온프레미스 어플라이언스 솔루션과 AI 인퍼런스 스위트는 클라우드에서만 가능했던 생성형 AI 워크로드 작업을 로컬 및 자체 서버에서 처리할 수 있어 AI 구현시 경제적인 총소유비용이 가능하다”라며, “퀄컴의 AI 온프레미스 어플라이언스 솔루션은 매장 내 어시스턴트, 직원 교육, 현장별 정보, 안전 규정 준수, 판매 및 서비스 지원 등 다양한 AI 자동화 사용 사례에서 기업과 산업의 요구에 필요한 AI 운영 비용을 크게 절감한다”고 말했다.

퀄컴 AI 온프레미스 어플라이언스 솔루션은 가속기로 구성된 퀄컴 클라우드 AI 제품군(Qualcomm Cloud AI family)으로 구동된다. 데이터센터 추론 서버의 접근성과 성능을 온프레미스 AI 솔루션의 전력 효율성, 무게 및 폼팩터, 데이터 보호, 개인화 및 제어 기능과 결합한 솔루션이다.

독립형 데스크톱 제품부터 벽걸이형 어플라이언스 기기군까지 확장이 가능해 상자형 음성 에이전트 및 소형 언어 모델(SLM), 대형 언어 모델(LLM), 대형 멀티모달 모델(LMM) 오프로드, 지능형 색인 검색 및 요약을 위한 검색증강생성(RAG) 기능, 에이전트형 AI, AI 워크플로우 자동화, 이미지 생성, 코드 생성, 컴퓨터 비전, 카메라 처리와 같은 다양한 로컬 AI 서비스를 제공한다.

폭넓은 오픈 소스 및 독점적 생성형 AI, 자연어 처리 및 컴퓨터 비전 모델을 지원해 지능형 다국어 검색, 맞춤형 AI 비서 및 에이전트, 코드 생성, 자동 문서 작성 및 필기 등 다양한 기업 애플리케이션의 워크플로우 자동화를 구현한다.

보안, 안전 및 사이트 모니터링에 특화된 컴퓨터 비전 애플리케이션을 위한 이미지, 영상 및 스트리밍 처리가 가능한 카메라 AI 역시 가능하다.

퀄컴 클라우드 AI 인퍼런스 스위트는 기업 고객과 개발자가 생성형 AI 애플리케이션을 개발하거나 퀄컴 AI 온프레미스 어플라이언스 솔루션 또는 퀄컴 클라우드 AI 가속기 기반 제품으로 이식할 수 있는 포괄적인 도구와 라이브러리를 제공한다.

또한 사용자 관리·행정, 채팅, 이미지 생성, 오디오 및 영상 생성 AI 기능, 오픈AI API 호환성, RAG 등 다양한 API를 제공하고, 널리 사용되는 생성형 AI 모델 및 프레임워크와의 통합과 쿠버네티스 또는 베어 컨테이너를 통한 배포를 지원한다.

허니웰 (Honeywell) 은 AI 온프레미스 솔루션과 AI 인퍼런스 스위트를 사용해 AI 워크플로우 자동화 사용 사례의 설계, 평가 및/혹은 구현에 대해 퀄컴과 협력하고 있다. 에티나는 AI 온프레미스 어플라이언스 솔루션을 기반 엔터프라이즈 구현을 위한 온프레미스 장비를 제공하는 최초의 OEM중 하나이다. IBM은 온프레미스 AI 어플라이언스뿐만 아니라 클라우드에서도 배포할 수 있는 왓슨 (watsonx) 데이터 및 AI 플랫폼과 그래니티 (Granite) AI 모델군을 제공하기 위해 노력하고 있다.

한편, 퀄컴은 이날 클라우드 기반의 서비스 플랫폼인 퀄컴 어웨어 플랫폼(Qualcomm Aware Platform)의 차세대 진화를 발표했다. 연결형 디바이스에 클라우드 기반 가시성과 인사이트, 지리적 위치, 정밀한 실내 위치 측정, 펌웨어 업데이트, 디바이스 관리 서비스 등을 추가하는 고도로 통합된 방식을 구현한다.

나쿨 두갈 본부장은 “퀄컴 어웨어 플랫폼은 지능형 연결 솔루션을 구축, 맞춤화 및 배포하는 과정에서 발생하는 가장 중요한 몇몇 과제를 해결하는 데 도움을 줄 수 있다”며, “이처럼 고도로 통합된 접근 방식은 기업에게 클라우드 기반의 가시성 인사이트, 지리적 위치 서비스, 디바이스 관리 도구 등 종합적인 기능을 활용해 디바이스에 가치를 더하는 간단한 방법을 제공한다. 이 같은 기능은 산업별 특정한 요구 사항에 따라 맞춤화할 수 있어, 기업이 제품 개발 기간을 단축하고 부가 가치를 창출하며, 혁신을 촉진하도록 지원한다”고 설명했다.

라스베이거스(미국)=김문기 기자
moon@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널