리사 수 AMD “AI는 컴퓨팅 미래”…AI 가속기 ‘인스팅트 MI300’ 빅테크 확산
[디지털데일리 김문기 기자] “AI는 컴퓨팅의 미래다.”
리사 수 AMD CEO는 6일(현지시간) 자체 행사인 ‘어드밴싱 AI(Advancing AI)’ 행사에서 마이크로소프트(MS), 메타, 오라클, 델, HPE, 레노버, 슈퍼마이크로, 아리스타, 브로드컴, 시스코 등 주요 파트너사와 함께 클라우드, 기업 및 PC 등 다양한 부문에 고급 AI 솔루션을 제공하기 위한 다양한 협업 사례를 발표하면서 이같이 말했다.
이날 AMD는 ‘인스팅트 MI300' 시리즈 데이터 센터 AI 가속기, 대규모 최적화 및 대규모 언어 모델(LLM)을 지원하는 새로운 기능을 갖춘 ROCm 6 개방형 소프트웨어 스택, 라이젠 AI가 탑재된 라이젠 8040 시리즈 프로세서 등 다양한 신제품도 공개했다.
리사 수 CEO는 “AMD는 대규모 클라우드부터 엔터프라이즈 클러스터, AI 지원 지능형 임베디드 기기 및 PC에 이르기까지 AI 시대를 정의할 엔드투엔드 인프라를 강화할 수 있는 독보적인 위치에 있다”라며, “우리는 생성형 AI를 위한 세계 최고 성능의 가속기인 인스팅트 MI300 GPU에 대한 수요가 매우 높다고 보고 있다”고 진단했다.
이어, “현재 최대 규모의 클라우드 기업, 업계 최고의 서버 제공업체, 가장 혁신적인 AI 스타트업과 함께 데이터 센터 AI 솔루션 분야에서 상당한 모멘텀을 구축하고 있으며, 인스팅트 MI300 솔루션을 시장에 빠르게 보급하고자 긴밀히 협력하고 있다”라며, “AI 생태계 전반의 혁신 속도가 빨라지고 있다”고 설명했다.
AMD는 이번 행사 기간 동안 여러 파트너와 함께 AMD 인스팅트 데이터 센터 AI 가속기 채택 사례를 발표하고 성장 모멘텀에 대해 강조했다.
우선, 마이크로소프트는 AI 워크로드에 최적화된 새로운 애저 ND MI300x v5 가상머신 시리즈 구동을 위해 AMD 인스팅트 MI300X 가속기를 활용하는 방안에 대해 자세히 설명했다. 메타는 AI 추론 워크로드를 강화하기 위해 ROCm 6과 함께 데이터 센터에 AMD 인스팅트 MI300X 가속기를 추가하고 있으며, AMD가 라마 2(Llama 2) 모델 제품군에 대한 ROCm 6 최적화를 수행한 것에 대해서도 인지하고 있다고 밝혔다.
오라클은 AMD 인스팅트 MI300X 가속기를 갖춘 OCI 베어 메탈 컴퓨팅 솔루션 공급 및 향후 자사 생성형 AI 서비스에 대한 AMD 인스팅트 MI300X 가속기 포함 계획을 발표했다.
다수의 대형 데이터 센터 인프라 제공업체가 자사 제품 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 가속기를 탑재할 계획이라고 발표했다. 델은 AMD 인스팅트 MI300X 가속기와 파워엣지 XE9680 서버 솔루션을 통합해 생성형 AI 워크로드에 대한 획기적인 성능을 제공하는 확장 가능한 모듈식 제품을 공급한다. HPE는 엔터프라이즈 및 HPC 제품에 AMD 인스팅트 MI300 가속기를 도입한다는 계획을 발표했다.
레노버는 AMD 인스팅트 MI300X 가속기를 레노버 씽크시스템 플랫폼에 도입하여 소매, 제조, 금융 서비스 및 의료를 포함한 산업 전반에 AI 솔루션을 지원할 계획이다. 슈퍼마이크로는 자사의 AI 솔루션 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 GPU를 제공할 예정이다.
이 밖에도, 에이수스, 기가바이트, 인그라시스, 인벤텍, QCT, 위스트론, 위윈 등도 AMD 인스팅트 MI300 가속기 기반의 솔루션을 공급할 계획이다.
AMD는 인스팅트 데이터 센터 가속기를 지원하는 소프트웨어 생태계 확장에 대해서도 강조했다.
이를 위해 생성형 AI, 특히 대규모 언어 모델에 최적화된 AMD 인스팅트 GPU용 오픈 소스 소프트웨어 스택인 ROCm 6의 최신 버전을 공개했다. ROCm 6는 새로운 데이터 유형, 고급 그래프 및 커널 최적화, 최적화된 라이브러리 및 강력한 어텐션 알고리즘을 지원한다. 라마 2 기준 텍스트 생성 전체 대기 시간을 비교하면, ROCm6를 MI300X에서 구동 시 MI250에서 실행되는 ROCm 5 대비 최대 8배 향상된 성능을 제공한다.
최신 모델과 AI 솔루션을 개발하는 스타트업인 데이터브릭스, 에센셜 AI, 라미니는 AMD 인스팅트 MI300X 가속기와 개방형 ROCm 6 소프트웨어 스택을 활용해 고객에게 차별화된 AI 솔루션을 제공하는 방법도 논의했다.
오픈AI는 트리톤 3.0에 AMD 인스팅트 가속기에 대한 지원을 추가하여 개발자가 AMD 하드웨어에서 더 높은 수준의 추상화 작업을 수행할 수 있도록 지원한다.
AMD는 이번 행사에서 더욱 다양한 AI 컴퓨팅 기능을 제공하는 최신 AMD 라이젠 8040 시리즈 프로세서도 출시했다. 또, 개발자가 사전 훈련된 모델을 사용해 윈도우 애플리케이션에 손쉽게 AI 기능을 추가하고 배포할 수 있도록 하는 소프트웨어 스택인 라이젠 AI 1.0을 출시했다.
아울러, AMD는 내년 출시 예정인 차세대 ‘스트릭스 포인트’ CPU에 XDNA 2 아키텍처가 탑재돼 이전 세대에 대비 3배 이상 향상된 AI 컴퓨팅 성능을 제공하고 새로운 생성형 AI 경험을 지원할 것이라고 밝혔다.
[IT클로즈업] 본회의만 남은 AI기본법, 통과돼도 갈길 멀었다
2024-12-19 09:20:04[현장] 팝업 맛집 ‘라인프렌즈’, 이번엔 제베원…“제로즈, 널 위해 알차게 준비했어”
2024-12-19 07:30:00KT엠모바일, '1인 결합' 서비스 '아무나 SOLO' 출시…왜? [IT클로즈업]
2024-12-19 07:10:00밈 코인 투자 플랫폼 GMGN… "블록체인 기술 기반 밈 토큰 거래 혁신 패러다임 구축"
2024-12-18 17:50:02