e비즈*솔루션

[re:Invent2024] AWS, AI 최적 데이터센터 신기술 발표…컴퓨팅파워 12% 향상

라스베이거스(미국)=권하영 기자

AWS는 2일(현지시간) 미국 네바다주 라스베이거스의 베네시안 호텔에서 연례 글로벌 기술 컨퍼런스 ‘AWS 리인벤트 2024(AWS re:Invent 2024)’를 개최했다. [Ⓒ AWS]

[디지털데일리 권하영기자] 아마존웹서비스(AWS)가 차세대 인공지능(AI) 혁신을 지원하는 새로운 데이터센터 기술을 공개했다.

AWS는 2일(현지시간) 미국 네바다주 라스베이거스의 베네시안 호텔에서 연례 글로벌 기술 컨퍼런스 ‘AWS 리인벤트 2024(AWS re:Invent 2024)’를 개최한 가운데, 이날 컴퓨팅파워가 종전보다 12% 향상된 AI 데이터센터 구성요소를 발표했다.

새로운 기능들은 더 많은 고객 혁신을 뒷받침하도록 보다 에너지효율적인 데이터센터 구축을 위해 전력, 냉각, 하드웨어 설계의 혁신을 결합한 것이 특징이다. 이는 AWS의 신규 데이터센터에 전세계적으로 구현될 예정이며, 이미 많은 구성요소들이 기존 데이터센터에도 배포돼 있다.

AWS의 프라사드 칼야나라만 인프라서비스부문 부사장은 “AWS는 전세계 고객을 대상으로 성능과 복원력이 가장 뛰어나고 또 안전하고 지속가능한 클라우드를 구축하기 위해 끊임없이 인프라를 혁신하고 있다”며 “이러한 데이터센터 기능은 에너지효율성이 향상되고 새 워크로드를 유연하게 지원한다는 점에서 중요한 진전”이라고 말했다.

이어 “더욱 흥미로운 점은 이런 기능들이 모듈식으로 설계돼 기존 인프라를 액체냉각 및 에너지효율성을 위해 개조함으로써, 생성형 AI 애플리케이션을 지원하고 탄소발자국을 줄일 수 있다는 것”이라고 전했다.

AWS는 지난 18년 동안 대규모 데이터센터를 구축했으며, 그중 13년간은 AI 워크로드를 위한 그래픽처리장치(GPU) 기반 서버를 설치해왔다. 이를 통해 현재 AWS 데이터센터는 AWS의 생성형 AI 서비스 ‘아마존베드록’을 사용하는 수만 고객을 비롯해 AWS AI·머신러닝(ML) 서비스를 사용하는 수십만 고객, 나아가 전세계적으로 수백만의 활성고객을 지원하고 있다.

최근에는 생성형 AI 사용과 GPU 용량 수요가 계속 증가함에 따라, AWS 데이터센터는 점점 더 높아지는 전력밀도를 지원할 수 있도록 적응하고 있다.

◆ 간소화된 전기 및 기계 설계

먼저, AWS 데이터센터는 고가용성을 위한 간소화된 전기배전 및 기계 설계로 고객이 가장 신뢰할 수 있고 유지관리가 쉬운 인프라를 제공하는 데 초점을 맞추고 있다. 이를 통해 99.9999%의 인프라 가용성을 실현하며, 전기 관련 문제로 영향을 받을 수 있는 잠재적 랙의 수도 89% 줄일 수 있다는 설명이다.

또한 데이터센터에서 전기는 IT장비에 도달하기 전에 여러 변환 및 배전 시스템을 거치는데, 각 단계마다 비효율성과 에너지 손실, 잠재적 장애 지점이 자연스럽게 발생한다. 하지만 새로운 설계에선 배전을 간소화해 잠재적 장애 지점의 수를 20% 줄였다.

다른 단순화 사례로는 백업 전원을 랙에 더 가깝게 배치하고, 뜨거운 공기를 배출하는 데 사용되는 팬의 수를 줄이는 것이 있다. AWS는 자연적인 압력차를 활용해 뜨거운 공기를 배출하며, 이는 서버에서 사용할 수 있는 전기량을 개선한다. 이러한 모든 변화는 장애 위험을 최소화하면서 전체적인 에너지 소비를 줄이는 데 도움이 된다.

◆ 냉각, 랙 설계, 제어 시스템의 혁신

최신 AI 서버는 고밀도 컴퓨팅 칩을 더욱 효율적으로 냉각하기 위해 액체냉각의 이점을 활용한다. AWS는 새로운 데이터센터와 기존 데이터센터 모두에서 구성 가능한 액체-칩(liquid-to-chip) 냉각을 제공하는 새로운 기계식 냉각 솔루션을 개발했다.

일부 AWS 기술은 액체냉각이 필요 없는 네트워크 및 스토리지 인프라를 활용하기 때문에, 업데이트된 냉각 시스템은 AWS ‘트레이니움2’와 같은 가장 강력한 AI 칩셋은 물론 엔비디아 GB200 NVL72와 같은 랙 규모의 AI 슈퍼컴퓨팅 솔루션, AWS의 네트워크 스위치 및 스토리지 서버를 위한 공기 및 액체냉각 기능을 원활하게 통합한다.

또한 AWS는 데이터센터에서 랙을 배치하는 방법을 최적화함으로써 전력사용효율을 극대화하고 있다. 이는 서버를 배치하는 가장 효율적인 방법을 예측하는 데이터와 생성형 AI 기반 소프트웨어를 통해 달성됐다. 이를 통해 AWS는 사용되지 않거나 충분히 활용되지 않는 에너지인 미사용전력(stranded power)의 양을 줄이고 사용 가능한 에너지를 더욱 효율적으로 활용할 수 있다.

이러한 설계는 동시에 다른 여러 하드웨어 유형도 수용할 수 있을 만큼 유연하다. AWS 인프라는 750개 이상의 아마존 EC2 인스턴스를 갖춘 광범위하고 심층적인 컴퓨팅 플랫폼으로, 고객에 모든 워크로드에 맞는 최신 프로세서, 스토리지, 네트워킹, 운영체제 및 구매모델 선택권을 제공한다.

유연한 멀티모달 냉각 설계 외에도, AWS는 전력 공급 시스템에서 엔지니어링 혁신을 이뤄 향후 2년간 랙 전력 밀도를 6배 증가시키고 이후에는 3배 더 증가시킬 수 있도록 지원할 방침이다. 이는 데이터센터 전력을 랙 전체에 효율적으로 전달해 전기변환손실을 줄이는 새로운 파워쉘프(power shelf)를 통해 부분적으로 제공된다.

이러한 혁신을 종합한 결과, AWS는 고객 워크로드를 위해 사이트당 12% 더 강력한 컴퓨팅 성능을 제공할 수 있다. 이는 동일한 양의 컴퓨팅 용량을 제공하는 데 필요한 전체 데이터센터의 수를 줄일 수 있다는 의미다.

◆ 에너지효율성 및 지속가능성 향상

수년간 AWS는 인프라 전반에 걸쳐 에너지효율성과 지속가능성을 개선해왔다. 아마존은 2030년까지 운영에서 소비되는 모든 전기를 100% 재생에너지로 충당하겠다는 목표를 7년 앞선 2023년에 달성한 상태다.

이번 업데이트에서는 피크 냉각시 메가와트당 물 사용량을 늘리지 않으면서도 기존 설계 대비 기계 에너지 소비를 최대 46% 절감할 수 있는 냉각 시스템이 포함된다. 새로운 단면 냉각 시스템, 냉각 장비 감소, 액체 냉각 기능 도입 등을 통해서다.

이에 더해 데이터센터 건물 외피의 콘크리트 내 탄소 포집량을 업계 평균 대비 최대 35%까지 감소시키고, 백업 발전기는 화석 디젤과 비교했을 때 연료의 수명주기 동안 온실가스 배출량을 최대 90%까지 줄일 수 있는 생분해성 및 무독성 연료인 재생 디젤로 운영될 수 있다. AWS는 이미 유럽과 미국의 기존 데이터센터에서 백업 발전기의 연료를 재생 디젤로 전환하기 시작했다.

엔비디아의 이안 벅 하이퍼스케일·HPC 부문 부사장은 “데이터센터는 AI의 혁신적인 요구를 충족하기 위해 진화해야 한다”며 “고급 액체냉각 솔루션을 활용하면 에너지 사용을 최소화하면서 AI 인프라를 효율적으로 냉각할 수 있으며, 액체냉각 랙 설계에 대한 AWS와의 협력을 통해 고객은 뛰어난 성능과 효율성으로 까다로운 AI 워크로드를 실행할 수 있을 것”이라고 자신했다.

앤스로픽의 제임스 브래드버리 컴퓨팅부문 수석엔지니어는 “최첨단 데이터센터 구축을 위한 AWS의 노력은 우리가 주요 클라우드서비스제공사이자 교육 파트너로 AWS를 선택한 핵심 이유 중 하나”라며 “AWS의 설계 개선은 AI 모델을 구동하고 이 분야 혁신을 주도하기 위한 안전하고, 확장 가능하며, 효율적인 인프라를 제공할 것”이라 지적했다.

한편, 새로운 데이터센터 구성요소는 34개 리전, 108개 가용 영역 및 AWS 로컬 존(AWS Local Zones)과 같은 다른 인프라 오퍼링을 포함한 AWS의 전세계 인프라 전반에 걸쳐 확장 가능하도록 설계됐다. 모든 구성요소를 갖춘 새로운 AWS 데이터센터의 건설은 2025년 초 미국에서 시작될 예정이다.

라스베이거스(미국)=권하영 기자
kwonhy@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널