스퀴즈비츠, 맞춤형 LLM 서빙 솔루션 '핏츠 온 칩스' 출시
[디지털데일리 이건한 기자] 인공지능(AI) 경량화 및 최적화 전문 스타트업 '스퀴즈비츠'가 대형언어모델 서빙(LLM Serving)을 위한 맞춤형 솔루션 '핏츠 온 칩스(Fits on Chips)'를 출시했다고 3일 밝혔다.
핏츠 온 칩스는 LLM 서빙 전 과정의 단순화와 최적화된 설정을 찾는 데 도움을 주는 솔루션이다. 허깅페이스 등 오픈소스 라이브러리와 연동해 다양한 LLM 모델을 손쉽게 통합하고 성능을 비교 평가함으로써 최적의 LLM 서빙 설정 값을 찾아 적용할 수 있다.
이때 모델 선택부터 서빙 옵션 조정, 장치 및 프레임워크 설정, 성능 평가, 배포까지 LLM 서빙에 필요한 모든 단계를 원스톱 지원한다. 이를 통해 엔지니어의 기존 작업 시간을 약 10분의 1로 줄이고, 비용은 2배 이상 절약할 수 있다는 것이 회사 측 설명이다.
하드웨어뿐 아니라 'vLLM', 'TensorRT-LLM'과 같은 프레임워크를 다각도로 비교 분석하는 기능도 제공한다. 사용자는 분석 결과를 바탕으로 최적화된 LLM 서빙 환경을 구축해 인프라의 전체적인 효율을 극대화할 수 있다. 추후 AI 에이전트를 연동하거나 AMD, 아마존, 구글 등의 하드웨어를 지원하는 등 더 다양한 모델과 하드웨어, 서버 환경 등을 지원할 수 있도록 확장해 나갈 계획이다.
이 밖에도 스퀴즈비츠는 최근 인텔, 네이버와 함께 인텔의 가우디 하드웨어에서 LLM을 효율적으로 작동시키기 위한 협업 프로젝트를 진행하고 있다. 해당 협업으로 엔비디아 GPU에 이어 인텔의 가우디까지 핏츠 온 칩스의 지원 범위를 확장했다. 추후 다양한 하드웨어를 비용, 속도 관점에서 비교할 수 있도록 제공할 방침이다.
김형준 스퀴즈비츠 대표는 "누구나 쉽게 LLM 서빙을 시뮬레이션하고 분석해볼 수 있도록 제품을 설계하고 개발했다"며 "앞으로도 LLM 서빙 솔루션을 비롯한 다양한 기술 개발을 통해 AI 서비스 기업의 성능 최적화와 비용 절감을 적극 지원하겠다"고 전했다.
한편 2022년 3월 설립된 스퀴즈비츠는 서울대, 포스텍, 카이스트 AI 연구진과 AI 분야에서 오랜 기간 경험을 쌓아 온 전문가들 중심심으로 구성된 팀이다. AI 경량화와 가속화 기술에 전문성을 두고 주요 AI·ML(인공지능·머신러닝) 학회에서 연구 논문을 70편 이상 제출해 왔다. 또한 카카오벤처스, 네이버 D2SF, 삼성넥스트, 포스텍 홀딩스, 포스코기술투자 등 국내 주요 투자사로부터 투자 유치 이력이 있다.
[re:Invent2024] 나를 속이는 AI의 착각, AWS는 이렇게 해결한다
2024-12-04 17:19:40삼성전자, 조직개편 마무리 수순…CFO에 박순철 부사장 내정
2024-12-04 17:01:58[DD퇴근길] '비상계엄' 지나간 자리, '혼란'만 남았다
2024-12-04 17:01:27코스피 1.44% 하락 마감… “그나마 선전” 평가속, KB금융 등 은행주 급락
2024-12-04 15:59:53