[테크다이브] 이젠 GPU론 안된다…떠오르는 'AI반도체'
[디지털데일리 배태용 기자] 대규모 언어모델(LLM) 챗GPT의 등장 이후, 이제 인류는 'AI(인공지능)' 시대를 맞을 준비에 나서고 있다고 합니다. 제조, 의료, 금융, 유통 등 많은 산업군에서 AI 적용에 나서고 있다는 점을 보면 정말 조만간 대전환이 이뤄질 것으로 전망됩니다. AI 기술력은 빠르게 고도화되고 있는데요. AI 관련 업체들은 정확성을 높인 버전을 계속해서 선보이고 있습니다.
이렇게 단기간에 AI 기술이 고도화되고 있는 것은 '반도체' 기술의 성장 때문이라 해도 과언이 아닙니다. AI의 원리는 방대한 양의 데이터를 학습, 패턴을 인식하고 예측하면서 동작합니다. 이를 많은 양의 데이터를 빠르게 처리해야 하는 만큼, 하드웨어의 역할은 매우 중요합니다.
초기 버전의 챗GPT는 하드웨어로 GPU(그래픽 처리 장치)라는 것을 사용했습니다. 챗GPT는 약 1억7000만개 수준의 파라미터(변수)를 가지고 있었는데, 매우 큰 규모의 데이터인 만큼, 이를 학습하기 위해서는 많은 양의 계산이 필요했습니다.
일반적인 CPU(중앙 처리 장치)는 이러한 계산을 처리하는 데 시간이 오래 걸리기 때문에, GPU를 사용한 것인데요. 보통 AI 시스템엔 1000개의 CPU 연산 시간과 맞먹는 수준인 약 300만 개의 GPU 연산 시간이 필요합니다. 따라서, 챗 GPT를 구동하기 위해서는 CPU보다 GPU를 사용하는 것이 적합했습니다.
너도나도 GPU 사용을 하기 시작하면서, 금세 문제도 드러나기 시작했는데요. 우선 GPU의 수요가 폭증함에 따라 가격이 매우 비싸졌습니다. GPU 시장은 미국의 엔비디아라는 기업이 90% 이상을 점유하고 있는데요. 업계에 따르면, 챗GPT에 사용된 엔비디아의 GPU인 H100 가격은 지난해 3만6000달러(4700만원)에서 지난 10월 4만56000달러(6000만원)까지 치솟았습니다. 올해 초 챗GPT 등장 후 가격이 28%가량 오른 것입니다.
구조적인 문제도 점차 드러나기 시작했습니다. GPU는 AI를 처리하기에 적합하긴 하지만 당초 그래픽 처리를 위해 만들어진 만큼, 필요 없는 성능도 많이 포함돼 있다는 것인데요. 그래픽 처리에는 특정 변수의 값을 일정한 수식에 따라 반복적으로 계산하는 경우가 많습니다. 예를 들어, 화면의 각 픽셀의 색상을 계산하는 경우, 각 픽셀의 위치, 색상, 밝기 등의 변수를 일정한 수식에 따라 계산합니다. 즉, 변수 계산이 정해진 상태에서 반복하는 것에 최적화돼 있습니다.
그러나 AI 분야에서는 다양한 형태의 데이터를 처리해야 하며, 계산의 순서도 정해져 있지 않은 경우가 많습니다. GPU가 이런 계산을 인위적으로 하다 보니, 속도도 느려지고 전력도 더 많이 필요로 하게 된다는 부작용이 나타나기 시작한 것입니다.
이에 최근엔 GPU를 대체할 만한 칩을 만드는데 열을 올리고 있습니다. 그렇게 등장한 것이 바로 'AI 반도체'이죠. AI 반도체는 GPU의 구조적인 문제를 해결하고, AI 서비스에서 요구되는 데이터 학습 및 추론에 필요한 대규모 연산 능력을 갖춘 반도체를 일컫습니다.
AI 반도체는 대량의 데이터를 동시에 처리해야 할 수 있는데 최적화돼 있습니다. AI 연산만을 위한 목적이기 때문에 GPU보다 범용성이 적습니다. 알고리즘의 딥러닝 네트워크를 구성하는 신경망을 하드웨어로 구현한 만큼, 구조상 다른 AI 알고리즘을 습득하기 어렵습니다. 이 때문에 GPU 대비 높은 효율을 보입니다.
이러한 특성 때문에 AI 반도체 시장은 빠르게 커질 것으로 전망되고 있습니다. 반도체 전문 분석업체 테크인사이츠에 따르면 특히 전체 반도체 시장에서 AI 반도체가 차지하는 비중은 올해 7%에서 2027년에는 16%까지 9%포인트(P) 확대할 것으로 기대됐습니다.
이러한 만큼, 우리나라 기업들도 AI 반도체 시장에 출사표를 던지고 있는데요. 올해 삼성전자는 네이버클라우드와 손잡고 AI 반도체를 공개했습니다. 4배 이상 압축된 초거대 모델을 저전력 하드웨어에서 구현한 것이 특징입니다. 현재 상용 제품과 비교해 AI 연산 과정에서 8배 이상의 전력 효율을 장점으로 내세웠습니다.
SK 그룹의 반도체 기업 사피온도 지난달 AI 반도체 'X330'을 공개했습니다. 전작인 X220과 비교해 연산 처리 속도를 4배 개선하며 기술력을 과시했습니다. X330은 동영상 관련 프로그램의 처리 속도 향상을 위한 비디오 코덱 및 비디오 후처리 IP도 내장하고 있어 이목을 끌었는데요. 내장된 하드웨어 IP를 통해 4채널 4K 60프레임(fps) 동영상 입력 처리가 가능하다고 합니다.
기존 강자인 엔비디아에 우리나라 기업들이 도전장을 내밀고 있는 상황인 가운데 다행인 것은 아직 AI 반도체 시장이 초기 단계라 완전히 자리 잡지는 못했다는 것입니다. 아직 우리나라 기업들이 우위을 점할 기회가 있다는 것이지요. 과연 AI 반도체 시장에서 승기는 누가 잡을지 많은 이들이 주목하고 있는 이유입니다.
[IT백과] 생성형AI의 진화 ‘AI 에이전트’, 기존 AI 비서와 뭐가 다를까?
2024-12-21 13:27:59[종합] AI 초격차 확보 공고히 한 오픈AI…12일간 여정 끝엔 ‘쩐의전쟁’ 남았다
2024-12-21 11:15:25오픈AI, o1보다 더 강력한 o3 예고…개발자·연구자 대상 사전 테스트 실시
2024-12-21 08:02:48