[re:Invent2024] 맷 가먼의 첫번째 메시지는 ‘AI칩’…애플 깜짝등장 이유는?
[디지털데일리 권하영기자] 글로벌 퍼블릭 클라우드 1위 기업 아마존웹서비스(AWS)가 인공지능(AI) 시대 핵심 도전과제로 떠오른 컴퓨팅파워를 전폭적으로 혁신한다.
AWS는 3일(이하 현지시간) 미국 네바다주 라스베이거스의 베네시안 호텔에서 연례 기술 컨퍼런스인 ‘AWS 리인벤트 2024(AWS re:Invent 2024)’를 진행했다.
리인벤트의 메인 행사인 최고경영자(CEO) 기조연설에 나선 AWS 맷 가먼 CEO는 이 자리에서 클라우드 컴퓨팅 빌딩블록(Building Blocks, 구성요소) 기업으로서 AWS의 정체성을 다시 한번 확인시켰다. 빌딩블록은 AWS 서비스를 마치 레고블록처럼 조립해 고객이 원하는 애플리케이션을 완성하게 한다는 의미로, AWS는 컴퓨트-스토리지-데이터베이스(DB)로 이어지는 일종의 블록 모음을 갖췄다고 할 수 있다.
가먼 CEO는 “AWS는 빌딩블록 서비스로 세계 최고 기업”이라고 자부하며 “고객은 AWS 서비스를 쉽고 놀라운 방법으로 결합하고 있으며, 이를 통해 기술을 소비하고 회사를 구축하는 새로운 방법을 제시하고 있다”고 강조했다.
빌딩블록의 신규 발표로서 가장 첫 번째로 언급된 것은 컴퓨트(Compute)다. 초고성능 연산과 대량 데이터 처리가 필수인 생성형 AI 시대 들어, 컴퓨팅파워는 상상 이상으로 그 중요도가 높아지고 있다는 점에서 이해되는 대목이다.
AWS는 2013년부터 자사 클라우드 컴퓨팅 서비스인 ‘아마존 EC2’ 기반으로 나이트로(Nitro)라는 특수 하드웨어로 맞춤형 칩을 생산해왔으며, 2018년 Arm 기반의 자체 설계 CPU ‘그래비톤’을 출시해 작년 그래비톤4에 이르기까지 안정적으로 운영해오고 있다. 이에 더해 AI 수요가 늘어나는 시점에 맞춰 2019년과 2020년에 각각 훈련용·추론용 AI 칩인 ‘트레이니움’과 ‘인퍼런시아’를 내놨고, 이는 엔비디아의 고성능 GPU가 AI 가속기 시장을 주도하는 가운데 비용효율성을 갖춘 대안적 AI 칩으로 주목받았다.
이에 AWS는 이번 리인벤트에서 작년 리인벤트 당시 시범공개됐던 학습용 AI 칩 ‘트레이니움2’의 정식 출시를 발표하고, 차세대 ‘트레이니움3’의 내년 출시도 예고했다.
트레이니움2 칩은 8개의 뉴런코어와 96GiB의 고대역폭메모리(HBM)를 탑재했다. 단일 칩은 최대 1.3페타플롭스(FP)의 고밀도 FP8 컴퓨팅과 최대 5.2FP의 희소 FP8 컴퓨팅을 제공한다. 각 인스턴스는 차례로 16개의 트레이니움2 칩을 수용하는데, 1세대 인스턴스보다 4배 빠르며, 4배 더 많은 메모리대역폭, 3배 더 많은 메모리용량을 제공한다. 현재 세대의 GPU 기반 EC2 P5e 및 P5en 인스턴스보다 30~40% 더 나은 가성비를 얻을 수 있고, 지연시간도 이전 세대보다 최대 35% 더 낮다.
뿐만 아니라 AI 모델의 규모가 갈수록 커지면서 단일 서버로 감당하기 힘든 페인포인트를 해결하기 위해, AWS는 ‘트레이니움2 울트라서버’를 공개했다. 울트라서버는 고대역폭·저지연 뉴론링크로 상호연결된 64개의 트레이니움2 칩을 탑재, 초대형 규모의 프론티어 파운데이션모델에서 추론 및 학습 성능을 제공한다. 83.2페타플롭스(PF) 정도의 성능이 하나의 컴퓨팅 워크로드에서 구현되는 수준이다.
트레이니움2 울트라서버는 AWS의 최대 AI 파트너 중 하나인 앤스로픽이 적극 활용한다. 가먼 CEO는 “AWS는 앤스로픽과 함께 프로젝트 레이니어(Project Rainier)라는 이름으로 울트라서버의 EC2 울트라클러스터를 구축하고 있다”며 “여기엔 수십만개의 트레이니움2 칩이 들어갈 것”이라고 설명했다. 그러면서 “앤스로픽은 그동안 최첨단 클로드 모델을 사용해 왔는데, 이 클러스터를 통해 컴퓨팅파워를 5배 높일 수 있을 것이며 이를 통해 어떤 결과를 가져다줄 것인지 기대가 크다”고 말했다.
이에 대해선 전날 열린 AWS 피터 데산티스 유틸리티컴퓨팅 수석부사장의 기조연설에서도 언급된 바 있다. 해당 기조연설 무대에 올랐던 앤스로픽의 톰 브라운 공동창업자는 앤스로픽 AI 모델 ‘클로드’의 새로운 학습 프로젝트에 오로지 트레이니움2만 활용할 것이라 밝혔다. 아마존은 앤스로픽에 80억달러(약 11조원) 투자를 진행 중으로, 이번 발표 또한 양사의 AI 관련 전략적 협력이 더욱 공고해진 시그널로 해석된다.
내년 출시를 계획 중인 트레이니움3의 경우, 종전보다 컴퓨팅파워는 2배, 효율성은 40% 늘어날 것으로 예상된다. 이에 대해 구체적인 스펙이 공개되진 않았지만, 가먼 CEO는 “나이트로와 그래비톤, 트레이니움3으로 이어지는 강력한 라인업을 통해 AI 컴퓨팅파워를 높이겠다”고 설파했다.
또한 이날 CEO 기조연설 무대에는 파트너 발표자로 애플이 참여해 눈길을 끌기도 했다. 애플이 AWS와의 파트너십 사실을 공식적으로 밝힌 것은 처음이다. 애플은 지난달 자체 AI 시스템 ‘애플 인텔리전스’를 탑재한 최신 제품들을 출시했으며, 이를 챗GPT에 연동함으로써 오픈AI와의 파트너십이 시장의 큰 주목을 받은 바 있다.
애플의 브누아 뒤팽 머신러닝·AI 수석디렉터는 이 자리에서 AWS와의 장기 파트너십을 통해 트레이니움2 인스턴스를 가속화하고 있다고 밝혔다. 뒤팽 수석디렉터는 “애플은 글로벌하고 확장 가능하게 우리를 지원해주는 AWS의 십년 이상 고객”이라며 “AWS의 그래비톤과 인퍼런시아를 사용함으로써 40% 이상 효율 개선을 이뤘고, 검색 기능 효율성은 2배 이상 향상할 수 있었다”고 언급했다. 이어 새로 나온 트레이니움2를 통해 이런 효율은 앞으로 50%가량 개선될 것으로 예측했다.
그는 “애플 인텔리전스를 발표한 올해는 애플에 가장 중요한 해 중 하나일 것”이라며 “우리는 모든 머신러닝과 AI 서비스에서 AWS와 협업하고 있으며, AWS가 사용하는 모델을 파인튜닝하고 사전학습 최적화 등 지속적으로 기능을 확대하면서 확장성, 효율성, 고성능 기술이 필요한 부분에 대해 AWS의 지원을 받고 있다”고 소개했다.
이러한 컴퓨트 혁신에 이어 AWS의 오브젝트 스토리지인 ‘아마존 S3’에 대한 업데이트도 발표됐다. 먼저 ‘아마존 S3 테이블’의 경우 아파치 아이스버그(Apache Iceberg)를 삽입하게 되면, 초당 트랜잭션 효율이 10배 높아지고 확장성이 좋아지며 비용도 줄일 수 있다. ‘아마존 S3 메타데이터’는 이른바 ‘데이터에 대한 데이터’로서 해당 데이터의 속성정보를 일컫는 메타데이터를 쉽고 빠르게 분류해주는 기능이다.
데이터베이스(DB) 혁신도 주요하게 나왔다. AWS의 관계형DB 서비스 ‘아마존 RDS’는 그동안 클라우드에서 관계형 DB를 쉽게 설정하고 운영 및 확장할 수 있도록 지원해왔다. 특히 AWS에서 제공하는 고성능 RDS인 ‘아마존 오로라’는 표준 마이SQL이나 포스트그레SQL 대비 최대 5배 빠른 성능을 보여준다. 이번에는 가장 빠른 분산형 기술을 기반으로 99.99% 가용성과 구글 스페너 대비 4배 빠른 속도를 자랑하는 ‘아마존 오로라 DSQL’이 공개됐다.
한편, AWS 리인벤트 2024는 지난 2일부터 6일까지 닷새 동안 베네시안 엑스포와 호텔을 중심으로 시저스포럼, 엔코어, 만달레이베이, MGM그랜드, 윈 호텔 등 라스베이거스 내 주요 거점에서 진행된다. 이날 가먼 CEO의 기조연설에 이어 셋째날 오전에는 AWS 스와미 시바수브라마니안 AI및데이터부문 부사장, 오후에는 AWS 루바 보르노 글로벌 전문가·파트너 부사장, 그리고 마지막날에는 AWS 워너 보겔스 최고기술책임자(CTO)가 각각 기조연설을 발표한다.
[re:Invent2024] “정확성·저비용·저지연…아마존베드록, ‘골든 트라이앵글’ 갖췄다”
2024-12-05 01:00:00비상계엄 혼란 틈타는 공격자들…금융보안원, 긴급 임원회의 개최
2024-12-04 21:42:21한미사이언스, “한미약품 주식 의결권 행사는 정당한 권리”
2024-12-04 17:50:45"뱅크런 우려" 금융권, 계엄령 사태에 비상체제 '진땀'…인뱅은 서비스 중단도(종합)
2024-12-04 17:50:10[re:Invent2024] 나를 속이는 AI의 착각, AWS는 이렇게 해결한다
2024-12-04 17:19:40