젠슨 황 엔비디아 CEO ”추론 에이전틱 AI 위한 블랙웰 울트라”…‘GB300’ 공개 [소부장반차장]
[디지털데일리 김문기 기자] “추론과 에이전틱 AI가 훨씬 더 많은 컴퓨팅 성능을 요구하고 있다. 우리는 바로 이 순간을 위해 블랙웰 울트라를 설계했다.”
젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 18일(현지시간) 미국 새너제이에서 열린 GTC 2025에서 AI 추론을 용이하게 하는 엔비디아 블랙웰 울트라(NVIDIA Blackwell Ultra)를 발표하며 이같이 말했다. 이는 엔비디아 블랙웰 AI 팩토리 플랫폼의 차세대 버전이다.
엔비디아 블랙웰 울트라는 추론 중 추가적인 계산을 할당해 정확도를 개선하는 기법인 테스트 타임 스케일링(Test-Time Scaling, TTS) 추론과 훈련을 강화한다. 이를 통해 AI 추론이나 에이전틱 AI(Agentic AI), 물리 AI와 같은 애플리케이션을 어디서나 가속할 수 있도록 한다.
블랙웰 울트라는 지난해 소개된 혁신 기술인 블랙웰 아키텍처를 기반으로 한다. 또한 엔비디아 GB300 NVL72 랙 스케일 솔루션과 엔비디아 HGX B300 NVL16 시스템을 포함한다. GB300 NVL72는 엔비디아 GB200 NVL72 대비 1.5배 높은 AI 성능을 제공한다. 뿐만 아니라 엔비디아 호퍼(Hopper) 기반으로 구축된 AI 팩토리에 비해 블랙웰의 수익 기회를 50배 증가시킨다.
젠슨 황 CEO는 “AI는 엄청난 도약을 이룩했다”라며, “이제 이 다목적 플랫폼은 사전, 사후 훈련과 추론형 AI의 추론을 더욱 쉽고 효율적으로 만들어준다”고 말했다.
엔비디아 GB300 NVL72는 블랙웰 울트라 GPU 72개와 Arm의 네오버스(Neoverse) 기반 엔비디아 그레이스(Grace) CPU 36개를 랙 스케일 디자인으로 연결했다. 이는 TTS용으로 구축된 거대한 단일 GPU로 작동한다.
GB300 NVL72는 또한 진화하는 워크로드를 위해 소프트웨어, 서비스, AI 전문 지식으로 성능을 최적화하는 선도적인 클라우드의 엔드 투 엔드 완전 관리형 AI 플랫폼인 엔비디아 DGX 클라우드(DGX Cloud)에서 사용 가능할 것으로 예상된다. DGX GB300 시스템이 탑재된 엔비디아 DGX SuperPOD은 GB300 NVL72 랙 설계를 사용해 고객에게 턴키 AI 팩토리를 제공한다.
엔비디아 HGX B300 NVL16은 거대 언어 모델(Large Language Model, LLM)에서 11배 빠른 추론, 7배 향상된 컴퓨팅, 4배 많은 메모리를 제공한다.
이는 정교한 추론과 반복 계획을 통해 복잡한 다단식 문제들을 자율적으로 해결한다. AI 에이전트 시스템은 명령을 따르는 것을 넘어 특정한 목표 달성을 위해 추론, 계획, 행동할 수 있다. 로봇이나 자율주행차량처럼 대규모 애플리케이션의 훈련을 위한 합성 데이터와 사실적인 영상을 실시간으로 생성할 수 있게 지원한다.
블랙웰 울트라 시스템은 엔비디아 스펙트럼-X 이더넷(Spectrum-X Ethernet)과 엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 플랫폼과 통합된다. 이때 시스템 내 GPU당 800 Gb/s의 데이터 처리량을 제공하며, 엔비디아 커넥트X-8 슈퍼NIC(ConnectX-8 SuperNIC)로 연결된다.
블랙웰 울트라 시스템에도 탑재된 엔비디아 블루필드-3(BlueField-3) DPU는 멀티 테넌트 네트워킹, GPU 컴퓨팅 탄력성, 데이터 액세스 가속화, 실시간 사이버보안 위협 탐지를 지원한다.
블랙웰 울트라 기반 제품은 올해 하반기부터 파트너들을 통해 구매가 가능할 예정이다. 시스코(Cisco), 델 테크놀로지스(Dell Technologies), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 레노버(Lenovo), 슈퍼마이크로(Supermicro) 에이브레스(Aivres), 애즈락랙(ASRock Rack), 에이수스(ASUS), 에비덴(Eviden), 폭스콘(Foxconn), 기가바이트(GIGABYTE), 인벤텍(Inventec), 페가트론(Pegatron), QCT, 위스트론(Wistron), 위윈(Wiwynn) 등의 기업이 블랙웰 울트라 기반의 다양한 제품들을 선보인다.
아울러 클라우드 서비스 제공업체인 아마존 웹 서비스(Amazon Web Services, AWS), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라(Oracle Cloud Infrastructure)를 비롯해, GPU 클라우드 제공업체인 코어위브(CoreWeave), 크루소(Crusoe), 람다(Lambda), 네비우스(Nebius), 엔스케일(Nscale), 요타(Yotta), YTL이 블랙웰 울트라 기반 인스턴스를 가장 앞서 선보일 예정이다.
한편, 엔비디아 블랙웰 제품 포트폴리오 전체는 풀스택 엔비디아 AI 플랫폼의 지원을 받는다. 오픈 소스 추론 프레임워크인 엔비디아 다이나모(Dynamo)는 추론형 AI 서비스를 강화해 처리량을 늘린다. 동시에 테스트 타임 컴퓨팅(Test-Time Compute)의 확장에 가장 효과적인 솔루션을 제공해 응답 시간과 모델 서빙 비용을 절감한다.
[IT클로즈업] AI 태운 IPTV 셋톱박스, 실익은?...“NPU 장착, 빠르고 선명하게”
2025-03-20 06:15:00‘6G 첫발’ 3GPP 워크숍, 어떤 이야기 오갔나 [IT클로즈업]
2025-03-19 18:53:05“의사정족수 3인 방통위법 거부, 합의제기구 성격 무시한 결정”
2025-03-19 18:52:04우리투자증권, 종합증권사 도약 기반 마련… 금융위, '투자매매업' 본인가
2025-03-19 18:03:15삼성생명, 결국 삼성화재를 자회사로 편입… 금융위, 편입안건 의결
2025-03-19 17:28:03