스캐터랩 ‘제타’에 카카오클라우드 도입…“3분의1 비용절감”
[디지털데일리 권하영기자] 카카오엔터프라이즈는 인공지능(AI) 스타트업 스캐터랩이 카카오클라우드 기반으로 최근 출시한 인터랙티브 AI 콘텐츠 플랫폼 ‘제타(zeta)’를 서비스하고 있다고 26일 밝혔다.
지난 4월 출시된 제타는 AI와 함께 실시간으로 스토리를 창작할 수 있는 플랫폼이다. 사용자가 자신이 만들고 싶은 캐릭터의 이름, 이미지, 특징 등을 프롬프트(명령어)에 입력하면 스캐터랩의 생성 AI 기술이 해당 내용을 스토리와 대화에 반영한다.
스캐터랩은 감성 대화에 탁월한 성능을 보이는 자체 AI 언어모델을 파인튜닝해 제타에 적용했으며, 모델 최적화 및 서빙 작업을 지속하고 있다. 출시 이후 제타가 매달 2배 이상 트래픽 증가세를 보임에 따라, 더 많은 그래픽처리장치(GPU)가 필요하게 됐다.
이에 스캐터랩은 사용자 접속량과 수요에 맞춰 GPU 사용량에 따라 가변적으로 조절할 수 있으면서, 빠른 응답속도 및 안정성과 가격 합리성을 모두 갖춘 카카오클라우드의 서비스형GPU(GPUaaS)를 선택했다.
제타는 카카오클라우드의 클라우드 컴퓨팅 서비스인 BCS(Beyond Compute Service) 중 컴퓨팅 성능을 가속화하는 기술이 적용된 GPU 인스턴스를 기반으로 운영된다. 카카오클라우드의 GPU 인스턴스는 대규모 데이터 세트에서 빠른 속도로 AI 모델을 학습시키거나 고성능 그래픽 애플리케이션, 게임 등을 실행하는 사용사례에 적합하다.
기존에 사용하던 해외 GPUaaS는 지리적으로 떨어져 있어 데이터 전송 지연 등 사용자 불편이 있었지만, 카카오클라우드는 신속한 네트워크 처리 속도와 안정성을 제공해 사용자의 불만사항 접수도 크게 줄었다는 설명이다. 비용 측면에서도 기존에 사용했던 클라우드 서비스 대비 채팅 1회당 약 3분의 1의 비용이 절감되는 것으로 추산됐다.
스캐터랩은 향후 거대언어모델(LLM) 활용을 확대하고 이미지 생성 등 GPU 위주의 고부하 작업을 필요로 하는 신규 기능을 준비하고 있으며, 카카오클라우드를 통한 예산 절감 효과로 배포 사이클 또한 빨라져 더욱 빠르게 사업을 확장할 수 있게 됐다.
[IT백과] 생성형AI의 진화 ‘AI 에이전트’, 기존 AI 비서와 뭐가 다를까?
2024-12-21 13:27:59[종합] AI 초격차 확보 공고히 한 오픈AI…12일간 여정 끝엔 ‘쩐의전쟁’ 남았다
2024-12-21 11:15:25오픈AI, o1보다 더 강력한 o3 예고…개발자·연구자 대상 사전 테스트 실시
2024-12-21 08:02:48