[re:Invent2024] 초거대AI를 감당할 머신러닝툴, ‘아마존 세이지메이커’의 진화
[디지털데일리 권하영기자] 생성형 인공지능(AI)의 폭발적인 성장으로 중요해진 요소 중 하나가 바로 머신러닝(ML)이다. 생성형 AI를 필요로 하는 많은 기업들은 어떻게 하면 머신러닝을 효율적이고 저렴하게 수행할 수 있을지 고심해왔지만, 최근에는 AI 모델의 규모와 복잡성이 상상 이상으로 커지면서 이런 고민이 더욱 깊어지고 있다.
아마존웹서비스(AWS)는 이 같은 문제를 해결하기 위해 자사 머신러닝 플랫폼인 ‘아마존 세이지메이커(Amazon Sage Maker)’를 한단계 진화시키기로 한다. 4일(현지시간) 미국 네바다주 라스베이거스의 베네시안 호텔에서 열린 ‘AWS 리인벤트 2024(AWS re:Invent 2024)’에서는 아마존 세이지메이커의 주요 업데이트가 발표됐다.
아마존 세이지메이커는 복잡한 인프라 없이도 머신러닝 알고리즘의 개발·학습·배포 등 머신러닝 관련 전체 워크플로를 지원해주는 도구다. 이번 리인벤트에선 단지 세이지메이커에 몇 가지 기능이 추가됐다는 의미 이상으로, 차세대 세이지메이커가 데이터의 시작부터 AI의 마지막까지 전부를 아우르는 하나의 싱글 인터페이스로 진화했다는 해석이 더 적절해 보인다.
AWS 스와미 시바수브라마니안 AI및데이터부문 부사장은 이날 기조연설에서 “아마존 세이지메이커는 단순히 머신러닝 툴셋 이상으로 수년간의 작업과 수만 고객과의 대화, 전체 AWS팀의 결집을 통해 새로운 통합 환경을 제공해왔다”며 “세이지메이커는 지난해부터 140개 이상의 새로운 기능을 출시했고, 이는 고객이 파운데이션모델을 더욱 빠르고 효율적으로 구축할 수 있게 도와주고 있다”고 소개했다. 이를 통해 현재 수십만 고객이 세이지메이커를 활용해 모델을 학습·배포시키고 있다는 설명이다.
시바수브라마니안 부사장은 “그러나 생성형 AI 이후 우리는 엄청난 캐파빌리티(Capability)를 감당할 새로운 도구가 필요해졌다”며 “수십·수백·수천억 파라미터 규모의 거대 모델을 구축하는 것에는 엄청난 양의 데이터를 수집하고 머신러닝을 가속화하는 과정에 따른 딥러닝 전문성이 필요하기 때문”이라고 지적했다. 이에 AWS는 보다 대규모의 모델 학습을 가속화하는 데 초점을 둔 ‘아마존 세이지메이커 하이퍼팟(Amazon Sage Maker HyperPod)’을 지난해 선보였다.
이번 리인벤트에서는 세이지메이커 하이퍼팟에서 더욱 유연하고 자동화된 기능들을 사용할 수 있는 ‘플렉서블 트레이닝 플랜(Flexible Training Plan)’, 팀 협업 및 작업 최적화를 돕는 ‘태스크 거버넌스(Task Governance)’ 기술이 공개됐다.
시바수브라마니안 부사장은 “하이퍼팟 플렉서블 트레이닝 플랜은 모델을 학습시킬 때 컴퓨트 요구사항과 원하는 학습 기간을 정의한 다음 나머지는 세이지메이커에서 처리할 수 있도록 한 것”이라며 “또한 하이퍼팟 태스크 거버넌스는 비싸고 한정적인 컴퓨트 리소스의 활용을 극대화하기 위해 역동적으로 컴퓨트 자원을 할당하고 분배하며 실시간 관리를 해줌으로써 비용을 40% 줄인다”고 설명했다.
뿐만 아니라 AWS는 코멧(Comet), 딥체크(Deepchecks), 피들러(fiddler), 라케라(lakera) 등 인기 있는 파트너 AI 애플리케이션을 세이지메이커에서 지원받을 수 있도록 해 생태계 확장에도 나섰다. 시바수브라마니안 부사장은 “각 애플리케이션이 가지고 있는 기능과 세이지메이커의 기능을 접목시켜 심리스하면서 완전관리 형태의 경험을 제공할 수 있다”며 “세이지메이커의 보안과 프라이버시도 그대로 유지된다”고 강조했다. 이러한 파트너 애플리케이션은 이번 발표를 시작으로 계속 추가될 방침이다.
이날 리인벤트에선 세이지메이커와 함께 ‘아마존 베드록’의 신규 모델 추가 소식도 전해졌다. 아마존 베드록은 주요 AI 파트너사들의 여러 파운데이션모델들을 동시에 제공함으로써 고객이 여러 모델들을 조합해 맞춤 애플리케이션을 만들 수 있는 생성형 AI 개발도구다. 지금까지는 아마존 자체 모델 ‘아마존 타이탄’을 비롯해 앤스로픽의 ‘클로드’, 메타의 ‘라마’, 코히어의 ‘커맨드’, 미스트랄AI의 ‘미스트랄’, 스태빌리티AI의 ‘스테이블디퓨전’ 등이 제공되고 있었다.
이제는 여기에 또 다른 AI 기업 풀사이드가 내놓은 소프트웨어(SW) 엔지니어링용 AI 모델 ‘말리부’와 ‘포인트’, 영상 AI 스타트업 루마AI의 멀티모달 모델 ‘레이2’, 스태빌리티AI의 새로운 ‘스테이블 디퓨전 3.5 라지’도 이용할 수 있게 된다. 물론 전날 발표됐던 타이탄에 이은 아마존의 새 AI 모델, ‘아마존 노바’도 아마존 베드록에서 활용 가능하다.
또한 ‘아마존 베드록 마켓플레이스’도 탄생했다. AWS 마켓플레이스는 AWS의 인증을 받은 솔루션과 서비스들이 등록돼 이를 필요로 하는 기업이 손쉽게 검색하고 구매할 수 있는 온라인 플랫폼인데, 이 같은 구조를 베드록으로 가져온 것이다. 쉽게 말해 AI 모델 전용 마켓이라 할 수 있다.
시바수브라마니안 부사장은 “베드록 마켓플레이스는 100개 이상의 새롭고 전문화된 파운데이션모델에 대한 접근성을 제공한다”며 “여러분들의 유즈케이스에 맞는 최고의 모델에 접근할 수 있으면서 아마존 베드록이 처음부터 가지고 있는 보안, 가드레일, 지식기반(Knowledge base) 등도 다 지원된다”고 자부했다.
한국에서는 최초로 엔씨소프트의 ‘바르코 LLM(13B 인스트럭트)’, LG AI 연구원의 ‘엑사원3(7.8B 인스트럭트)’, 그리고 업스테이지의 ‘솔라(미니, 프로)’가 베드록 마켓플레이스에 이름을 올린 상태다.
시바수브라마니안 부사장은 “모델 선택은 첫 단계에 불과하다”며 그동안 반비례할 수밖에 없었던 비용과 레이턴시(지연속도)의 관계를 깰 ‘아마존 베드록 서포트 프롬프트 캐싱(Amazon Bedrock Supports Prompt Caching)’과 ‘아마존 베드록 인텔리전트 프롬프트 라우팅(Amazon Bedrock Intelligent Prompt Routing)’도 소개했다.
전자는 사용자가 특정 질문을 했을 때 과거 비슷한 내용으로 질문돼 이미 답변이 생성된 게 있다면 이를 재사용함으로써 정보처리량을 줄이고 비용을 절감하는 기술이다. 최대 90%의 비용 절감과 85%의 응답 시간 단축을 가능하게 한다. 후자는 어떤 질문에 대해 답변할 때 대규모 모델과 소형 모델 중 어떤 모델을 활용하는 것이 적합한지를 스스로 조정해서 비용을 줄이는 기술이다. 이를 통해 비용은 30% 줄이면서 정확성은 떨어지지 않는다.
검색증강생성(RAG)도 업그레이드된다. 40개 이상 데이터 소스를 활용해 기업의 지식기반으로 구조화된 검색을 지원하는 ‘아마존 켄드라 생성형AI 인덱스’가 추가됐고, 노코드(No-Code)로 비정형 데이터를 추출·변환해 가용할 수 있는 ‘아마존 베드록 데이터 오토메이션’이 등장했다.
이날 리인벤트 현장에서 만난 AWS코리아의 최영준 AI·머신러닝 전문 수석 솔루션즈아키텍트(SA)는 “사용자의 니즈에 따라 각기 중요한 서비스들이 대거 공개됐다”며 “데이터 사이언티스트 입장에선 세이지메이커 하이퍼팟을 통해 학습 시간을 단축했다는 게 중요할 것이고, AI 모델의 다양성을 원하는 고객이라면 아마존 베드록에 새로운 모델들이 추가된 것에 더해 마켓플레이스로 확장됐다는 게 반가운 소식일 것”이라고 분석했다.
또한 “비용에 민감하다면 프롬프트 캐싱과 프롬프트 라우팅 기술이 아마존 베드록 API를 사용하는 입장에서 가장 기대했던 서비스일 것이고, RAG 구성이 어려웠던 개발자 입장이라면 구조화된 데이터 검색과 데이터 자동화 서비스를 바로 사용할 수 있게 된 점이 고무적”이라고 평가했다.
KG이니시스, 자영업자위한 '이니톡결제' 론칭…"알림톡으로 청구·수납"
2025-01-08 12:03:51원전 계속운전제도 적절한가?…박충권 의원실 세미나 개최
2025-01-08 11:33:58베일 벗은 SKT 글로벌 AI 에이전트 '에스터'…3월 美 베타서비스
2025-01-08 11:32:31"한국시장 겨냥한 전문 간병·가사서비스 인력 양성"… 케어브릿지, 베트남 하이코리안 어학원과 MOU
2025-01-08 10:49:51"밸류업 흔들림 없이 추진"… 양종희 KB금융 회장, 해외 투자자에 서한
2025-01-08 10:37:46