“데이터센터 전력 난제…빅테크 Arm 기반 자체칩 성과 컸다” [인더인싸]
[디지털데일리 김문기 기자] “하이퍼스케일러 기업들이 구축하고 있는 데이터센터는 현재 100MWh 규모 대비 10배 더 큰 1GWh 전력을 필요로 한다. 1GWh는 미국에 분포한 가구로 환산하면 90만세대의 전력을 공급할 수 있는 수준이라고 할 수 있다. 빅테크들이 Arm 기반 자체 칩을 설계하는 이유가 여기에 있다. Arm은 고성능, 저전력, 저비용을 지원하기 위해 꽤 오랫동안 만반의 준비를 해왔고 이제 결실을 맺고 있다.”
모하메드 아와드 Arm 수석 부사장은 5일 서울 광진구 그랜드 워커힐 서울 호텔 더글라스 하우스에서 <디지털데일리>와 만나 Arm이 글로벌 파트너들을 대상으로 제한 없이 지속 발전하고 있는 AI의 잠재력을 깨우기 위한 기반을 제공할 것이라며 이같이 말했다.
아와드 Arm 수석 부사장은 “AI 잠재력을 충분히 실현시키기 위해서는 창의적인 방법으로 지속 가능한 에너지를 공급할 수 있는 방법을 생각해야 한다”라며, “제한된 전력 내에서 최대한의 컴퓨팅 성능을 낸다는 것은 에너지 효율성이 그만큼 중요하고 시스템 레벨 차원에서의 사고가 필요하다. 이 부분에 있어 Arm이 큰 도움을 줄 수 있다”고 설명했다.
◆ 인프라 시장서 부상한 Arm…’고성능 저전력 저비용’ 3박자
사실 Arm이 데이터센터 등과 같은 인프라 시설 등에 강점을 가진 기업은 아니었다. 저전력의 특성을 갖춘 Arm의 경우 고성능을 낼 수 있는 경쟁사에 밀려 제대로된 성과를 내기 어려웠다. 파트너들 역시 Arm을 기반으로 한 서버 프로세서 시장을 겨냥하기는 했으나 실제 구현 사례와 성공사례가 적다. 다만, 현재는 상황이 달라졌다. AI 시대가 열리면서 성능에 대한 제한이 풀리고 이에 따른 전력효율이 곧 성능과 직결되는 상황이 벌어진 것. ‘전력이 없다면, AI가 없다’는 등식이 성립된 시기가 열린 셈이다.
아와드 Arm 수석 부사장은 “Arm은 10여년간 지속적인 투자를 통해 관련 기술을 성장시켰다”라며, “우선 그간 소프트웨어에 투자한 것들이 이제서야 의미있는 방법으로 실현되고 있다. 그 덕분에 서버를 배포하는데 있어 많은 수고를 드리지 않아도 되는 수준에 이르렀다”고 말했다.
이어, “데이터가 늘어나고 고성능 필요성이 커지면서 하이퍼스케일러인 AWS나 마이크로소프트, 구글 같은 기업들은 자체적인 칩을 구축하고 개발하고 있다. 그 일환으로 소프트웨어 부분에도 아주 많은 투자를 하고 있다”라며, “예를 들어 AWS의 100개 고객 중 99개 고객은 그래비톤(AWS가 Arm 기반으로 자체 설계한 서버용 프로세서)을 사용하고 있다”고 덧붙였다.
또한 “마지막으로 자체 칩을 설계하는 장벽을 낮췄다”라며, “과거 커스텀 칩을 설계하는데 따른 비용이 많이 들어갔으나 Arm이 제공하는 CSS(Arm의 컴퓨트 서브 시스템) 등을 통해 더 적은 에너지로 더 많은 컴퓨팅 성능을 낼 수 있을뿐만 아니라 비용을 절감하고 시장진입(Time to Market)을 단축할 수 있는 결과를 갖게 됐다”고 강조했다.
즉, Arm 기반의 자체 칩 제작은 Arm이 제공하는 다양한 지원 프로그램을 통해 비용을 줄임과 동시에 파트너들이 데이터센터나 인프라 시설에 최적화를 위한 제품을 지속적으로 개발할 수 있다는 강점이 있다. 특히, Arm 토탈 디자인(ATD)은 인프라를 위한 네오버스 CSS를 기반으로 맞춤형 시스템온칩(SoC)를 원활하게 제공하기 위한 파트너 에코시스템으로 지난해 출범한 이래 1년만에 회원수가 2배로 성장하기도 했다. 파트너사들은 이미 IP 검증 및 펌웨어 커스터마이징부터 최첨단 프로세스 노드에 칩렛을 구축에 이르기까지 모든 작업에 네오버스 CSS를 사용하고 있다.
대표적인 사례가 한국에도 있다. ATD 파트너인 삼성전자와 에이디테크놀로지, 에이직랜드, 리벨리온 등이 함께 협력해 2나노 기반 AI 플랫폼을 개발하고 있다.
아와드 Arm 수석 부사장은 “사실 네오버스가 출시되기 이전까지는 파트너사들이 Arm의 아키텍처 라이선스만을 활용하는 방법밖에는 없었고, 이는 굉장히 많은 비용이 들는 쉽지 않은 접근법이었다”라며, “네오버스 출시 이후에는 Arm이 자체적으로 투자해 인프라를 위한 CPU 코어 인터커넥트와 설계 자산들을 활용해 전방위적인 지원에 나섰고, 이에 따라 파트너사들은 가상화라던지 메시 인터커넥트 등을 통한 CPU 지원, 효율성과 고성능 등의 다양한 환경에서 설계가 가능한 수준으로 올랐다. AWS가 네오버스를 처음으로 채택한 이후 이제는 마이크로소프트나 구글, 알리바바, 텐센트 같은 빅테크들도 모두 사용할만큼 영향력이 커졌다”고 부연 설명했다.
실제 Arm의 지원을 통해 하이퍼스케일러 등은 40~60% 수준의 전력당 성능을 개선시킬 수 있었다고 강조했다.
가령, 엔비디아가 올해 발표한 블랙웰과 관련된 혁신에도 Arm의 기여도가 크다는 설명이다. 엔비디아는 Arm을 기반으로 한 프로세서인 ‘그레이스’를 자체 설계하는 한편, NV링크라는 커스텀 링크도 개발했다.
그는 “이전에는 4개 혹은 8개의 GPU가 하나의 CPU와 연결됐고, 이는 PCle 5세대 인터페이스를 통해 연결됐다. 초당 128Gb의 전송속도를 가졌다. 하지만 Arm 기반의 NV링크를 고안하면서 초당 900Gb까지 성능 향상을 가져왔으며 대역폭이 7배나 크게 성장한 것을 확인할 수 있었다. 결과적으로 그레이스 블랙웰의 경우 다른 시스템보다 훨씬 더 우월한 성능을 가져올 수 있게 된 것”이라고 말했다.
◆ '재사용 가능한 칩렛 디자인' 비용 절감 효과…오토모티브 시장 공략도 자신
Arm은 늘어나는 전력에 따른 비용 부담의 해결책으로 칩렛 구조도 강조했다. 칩을 생산하는데 있어 공정과 크기 제한이 있었으나 칩렛 구조를 채택한다면 여러 칩을 하나의 동일한 패키지 안에서 연결해 제한을 극복할 수 있다. 마치 레고처럼 칩을 배치해 비용과 효율, 프로세스 노드 등을 최적화할 수 있다.
아와드 수석 부사장은 “칩렛의 또 하나의 장점은 여러 애플리케이션에 활용할 수 있다는 것”이라며, “하나의 설계에만 적용되는 것이 아니라 다양한 디자인에 맞춰 제작할 수 있다”고 언급했다.
이어, “즉, 칩렛은 여러 설계에 걸쳐 재사용할 수 있다는 굉장히 중요한 강점을 가지고 있다. 첨단 프로세스 노드에 칩을 개발하는데 드는 비용은 2억달러에서 3억달러에 이른다. 만약 칩렛 디자인을 재사용할 수 있다면 다른 설계용으로 기존에 만들어진 칩렛 디자인을 가져올 수 있기 때문에 투자 비용을 낮출 수 있는 굉장한 장점을 가지고 있다”고 풀이했다.
또한 “또한 범용 칩과 특화 전문 가속기를 함께 사용할 수도 있다”라며, “ATD 프로그램을 통해 삼성전자와 에이디테크놀로지, 리벨리온 들이 협력해 CSS를 활용해 범용 컴퓨터 칩을 활용하고 AI 가속기를 더해 삼성 파운드리에서 최첨단 공정으로 생산하는 하나의 패키지가 실제 사례다”라고 덧붙였다.
Arm은 인프라 시장뿐만 아니라 오토모티브 시장에도 문을 두드리고 있다. 그는 “오토모티브는 인프라와는 결이 다르긴 하나 기본적은 전략은 유사하다”라며, “오토모티브 파트너들은 자체적인 칩을 개발하고자 하고 여러 효율적인 차원에서 전기차 등과 같은 분야에 최적화된 솔루션을 찾고 있다. Arm의 오토모티브 CSS가 이런 것들을 가능하게 해줄 것”이라고 자신했다.
한편, 아와드 Arm 수석 부사장은 앞서 지난 4일 서울 코엑스에서 열린 SK AI 서밋에 참가해 AI를 구현하기 위한 전력효율성에 대한 Arm의 차별화 전략과 전문가 대담으로 진행된 패널토의를 통해 다양한 의견을 개진한 바 있다.
그는 “한국은 Arm에게 가장 중요한 시장 중 하나로 파트너인 SK의 AI 서밋 참여도 있었지만 삼성, 리벨리온, 세미파이브, 에이직랜드, 에이디테크놀로지 등 대기업부터 강소기업까지 다양한 파트너들과 미팅을 진행했다”라며, “사실 반도체 기술을 고려하면 한국은 떼어놀 수 없는 이 분야 강자다”라고 말했다.
SK AI 서밋과 관련해 “SK AI 서밋은 최태원 SK 회장의 AI에 대한 강한 의지를 확인할 수 있어 인상 깊었다”고 운을 땐 그는 “SK가 전체 AI 에코시스템에 얼마나 규모 있게 참여하고 있는지 깊이 이해하지 못했는데 이번 서밋을 통해 잘 알 수 있게 됐다”라며, “참여한 글로벌 플레이어 수만 보더라도, 해외 참석자들만 보더라도, 또 정말 수준 높은 다양한 인사이트를 경험할 수 있고 동일한 문제에 대해 하나의 단일화된 목소리를 낸다는 것이 굉장히 인상 깊었다. AI 에코시스템 그리고 기술 전반의 시스템에 있어 한국의 위치가 얼마나 중요한지 보여줄 수 있는 계기였다”고 감탄했다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52