AI 데이터센터 시대 전력량 급증, AWS가 말하는 해결법은?
[디지털데일리 권하영기자] 최근 인공지능(AI) 기술 발전으로 에너지 수요가 급증하며 환경적 영향에 대한 우려가 커지는 가운데, 온프레미스에서 클라우드로 전환하는 것만으로 탄소배출량을 최대 95% 줄일 수 있다는 연구 결과가 나왔다.
아마존웹서비스(AWS)는 4일 서울 강남구 역삼동 AWS오피스에서 ‘지속가능성 미디어브리핑’을 열고, 국내 기업이 컴퓨팅 부하가 높은 AI 워크로드를 AWS 클라우드 데이터센터에서 실행할 경우 온프레미스 대비 탄소배출량을 국내 리전 사용 기준 최대 72%, 글로벌 리전 사용 기준 최대 95%까지 감축할 수 있다고 밝혔다. 이는 AWS의 의뢰로 글로벌 IT 컨설팅 기업 엑센츄어에서 진행한 연구 결과다.
켄 헤이그 AWS 아시아태평양·일본 에너지·환경정책 총괄은 이날 화상연결로 참여해 “전세계 기업의 IT 지출 중 85%가 온프레미스에 집중된 상황에서, 한국 기업이 AWS상에서 AI 워크로드 최적화를 통해 탄소 배출량을 최대 95% 줄일 수 있다는 것은 지속가능성 측면에서 의미 있는 기회”라고 지적했다.
이어 “AWS는 데이터센터 설계 최적화부터 AI 전용 칩에 대한 투자까지 데이터센터 전반의 지속가능성을 위해 끊임없이 혁신, 고객의 컴퓨팅 수요를 충족하기 위해 에너지 효율성을 지속적으로 높이고 있다”고 강조했다.
AWS가 에너지효율을 개선하는 대표적인 방법 중 하나는 자체 칩에 대한 투자다. 2018년 출시한 자체 개발 맞춤형 범용 프로세서인 AWS 그래비톤(Graviton)은 동급의 아마존 EC2 인스턴스(데이터센터에서 컴퓨팅이 이뤄지는 가상 환경) 대비 동일 성능을 구현하는 데 60% 더 적은 에너지를 사용하는 그래비톤3보다도 더 에너지효율적이다.
실제 SK텔레콤은 탱고(TANGO)라는 차세대 AI 네트워크 관리 시스템을 구축하면서, 증가하는 데이터 이슈를 온프레미스 환경에서 해결하기 어려운 상황에 직면했다. AWS는 SK텔레콤의 탱고 솔루션 구축에 AWS 그래비톤 인스턴스를 제공함으로써, 온프레미스 대비 AWS 워크로드의 탄소배출량을 약 27% 감축하는 데 기여했다.
AWS는 성능과 에너지 소비를 최적화하기 위해 AWS 트레이니움(AWS Trainium), AWS 인퍼런시아(AWS Inferentia)와 같은 자체 AI 전용 실리콘도 갖추고 있다.
AWS 트레이니움은 생성형 AI 모델의 학습 시간을 몇 달에서 몇 시간으로 단축하며, 특히 트레이니움2는 1세대에 비해 최대 4배 빠른 훈련 성능과 3배 더 많은 메모리 용량을 제공하는 동시에 에너지효율(와트당 성능)을 최대 2배까지 개선하도록 설계됐다. AWS 인퍼런시아2는 와트당 최대 50% 더 높은 성능을 제공하며, 동급 인스턴스 대비 최대 40%까지 비용을 절감할 수 있다.
데이터센터 설계 효율화도 중요한 부분이다. AWS는 리소스 활용을 최적화해 유휴 용량을 최소화했다. 데이터센터 설계에서 대형 중앙 무정전전원공급장치(UPS)를 제거하는 대신 모든 랙에 통합되는 소형 배터리팩과 맞춤형 전원공급장치를 사용해 전력 효율성을 개선하고 가용성을 높였다. 이를 통해 에너지 변환 손실은 약 35% 감소했다.
데이터센터에서 서버 장비에 전력을 공급하는 것 다음으로 에너지 사용량이 많은 부분 중 하나가 냉각 시스템이다. 이에 AWS는 장소와 시간에 따른 프리쿨링(free air cooling) 등 다양한 냉각 기술을 활용했다. AWS의 최신 데이터센터 설계는 최적화된 공랭 솔루션과 엔비디아의 그레이스 블랙웰 슈퍼칩과 같은 강력한 AI 칩셋을 위한 액체 냉각 기능을 완벽하게 통합해 성능과 효율성을 극대화할 수 있다는 설명이다.
하지만 AI 기술이 발전할수록 대량 데이터에 대한 고성능 연산 처리를 위해 데이터센터 자체가 어마어마한 전력량을 소모하는 만큼, 기술 차원의 효율화 작업 이상으로 재생에너지 수급을 위한 정책적 지원도 뒷받침돼야 한다는 지적도 나온다. 실제 지난 5월 국회 입법조사처에 따르면 원활한 AI 데이터센터 운용을 위해서는 기존 데이터센터의 6배 전력을 소비하는 수준의 대규모 전력 설비가 필요하다는 조사 결과도 있다.
헤이그 총괄은 이러한 지적에 대해 “과거 IEA(국제에너지기구)에서 2000년대 초 인터넷 사용률 급증으로 에너지 사용량도 급증할 것이란 보고서를 발표한 적이 있는데, 이후 20년이 지나 2020년 중반까지 실제로 인터넷 사용률은 6배 증가했지만 에너지 사용량은 비교적 비슷하게 유지됐다”며 “그 이유는 대규모 데이터센터와 클라우드 프로바이더들이 에너지 효율을 극대화할 수 있었기 때문”이라고 말했다.
그러면서 “물론 AI 발전으로 에너지 사용량이 증가되는 부분에 대한 우려가 있으나, 일단 AI 수요가 예상했던 만큼 빠르게 늘어나지 않고 있고, 데이터센터에서도 지속적으로 효율화를 하고 있기 때문에 에너지 사용량을 최적화할 수 있다”며 “향후 AI 워크로드가 얼마나 증가할지 그래서 에너지 사용량이 얼마나 증가할지 정확히 파악할 순 없지만, 아직은 이런 혁신들을 통해 대응하고 있다”고 강조했다.
다만 나날이 급증하는 전력량 문제를 해결하려면 데이터센터 자체의 효율성뿐만 아니라 재생에너지를 최대한 조달하는 것이 중요해질 수밖에 없다. 헤이그 총괄은 이 점을 지적하며 “재생에너지 수요는 이미 굉장히 높은데 수요에 부응할 프로젝트나 공급이 이에 못따라가는 게 현실”이라며 ”한국 시장에서 재생에너지 확산과 관련된 문제는 기술보단 정책이나 시장에서의 장벽 문제가 크고, 따라서 이런 장벽을 하나씩 허물어간다면 한국에 있는 기업고객들의 투자 기회가 많아질 것“이라고 언급했다.
AWS가 아시아청정에너지연합(ACEC)과 협력을 강화하는 이유도 그래서다. ACEC는 아시아 주요 시장에 재생에너지 정책을 개선하기 위해 출범된 조직으로, 아시아의 주요 재생에너지 구매자들이 판매자 및 금융기관과 협력해 아시아 지역 시장의 정책을 전략적으로 전환할 수 있도록 연합을 구성해 있다. 아마존뿐만 아니라 구글과 애플, 델, 시스코, 삼성 등이 운영그룹으로 활동 중이다.
이날 브리핑에 함께 참석한 강수지 ACEC 디렉터는 “기업 입장에선 가장 효과적이고 안전하게 탄소를 저감할 수 있는 에너지원으로 재생에너지를 고려하고 있으나, 수요와 공급의 미스매치로 공급이 현저하게 부족하고 이 때문에 가격도 높게 책정되는 문제가 발생하고 있다”며 “특히 한국에선 인허가 문제가 복잡하게 형성돼 있는데 이를 해결하고 재생에너지를 최우선화하는 게 가장 시급한 과제”라고 설명했다.
강 디렉터는 “예를 들어 해상풍력 프로젝트를 하나 하려면 덴마크나 영국, 태국에선 3년 정도 걸리는 것이 우리나라에선 인허가 문제로 7~10년이 걸린다”며 “이를 해결하기 위해 지난 21대 국회에서 해상풍력특별법이 상정됐으나 국회 문턱을 넘지 못했고 이번 22대 국회에서 재발의됐는데, 이러한 법안들이 조속히 통과되길 기대하고 있다”고 덧붙였다.
주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52네이버페이, 한국재무관리학회 ‘상생금융 우수기업상’ 수상
2024-11-22 16:44:59케이‧토스‧카카오뱅크, 3분기 중저신용대출 비중 30% 상회
2024-11-22 16:41:56