반도체

[반차장보고서] 엔비디아, 차기 GPU 깜짝 공개…가성비 빈틈 파고든 인텔

배태용 기자

반도체⋅부품 관련 정책 동향과 현장의 목소리를 전달하기 위해 한 주 동안 열심히 달린 <소부장반차장>이 지난 이슈의 의미를 되새기고, 차주의 새로운 동향을 연결해 보고자 주간 보고서를 올립니다. <반차장보고서>를 통해 한 주를 정리해보시길 바랍니다. <편집자주>

젠슨 황 엔비디아 창립자 겸 CEO가 2일(현지시간) 대만 타이베이에 위치한 국립 타이베이 대학교 스포츠센터에서 엔비디아 컴퓨텍스 2024 기조연설을 가진 자리에서 블랙웰 기반 플랫폼을 손에 들고 있다.
젠슨 황 엔비디아 창립자 겸 CEO가 2일(현지시간) 대만 타이베이에 위치한 국립 타이베이 대학교 스포츠센터에서 엔비디아 컴퓨텍스 2024 기조연설을 가진 자리에서 블랙웰 기반 플랫폼을 손에 들고 있다.


"블랙웰 다음은 '루빈'"…젠슨 황 엔비디아, 차기 GPU 깜짝 공개

젠슨 황 엔비디아 창립자 겸 CEO는 2일(현지시간) 대만 타이베이에 위치한 국립 타이베이 대학교 스포츠센터에서 엔비디아 컴퓨텍스 2024 기조연설을 갖고 미래 AI 가속기 로드맵을 깜짝 공개했다. 엔비디아가 차세대 로드맵을 대거 공개한 것은 이례적 일이라 많은 관람객들의 관심을 증폭시켰다.

엔비디아는 2022년 호퍼 플랫폼을 고안한 이후 올해 블랙웰 아키텍처 기반의 플랫폼을 공개했다. 이에 대해 젠슨 황 CEO는 "블랙웰 아키텍처는 생성형 AI 시대에 만들었고 AI 팩토리의 중요성을 깨달은 세대에 만든 제품으로 모든 클라우드 제공 사업자(CSP)와 OEM, 통신사 등이 블랙웰을 도입하고 있다"고 말했다.

이어, "우리는 거기서 멈추지 않고 폭발적 성장시기에 맞춰 성능을 향상시키고 비용을 낮추면서도 스케일업을 필요로 하고 있다"라며, "호퍼는 가장 중요한 데이터센터용 프로세서로 믿을 수 없는 성공을 거둿으며, 블랙웰은 모든 GPU를 연결해 큰 도메인을 만들 수 있는 플랫폼 그 자체다"라고 덧붙였다.

향후 로드맵과 관련해 "기본 철학은 심플하다"라며 "1년 단위로 진행, 데이터센터 스케일업하며 모든 기술을 한계까지 가져갈 것이다"라고 밝혔다.

리사 수 AMD CEO는 3일(현지시간) 대만 타이베이 난강전람회 2관에서 개최된 컴퓨텍스 2024 기조연설의 첫 연설자로 나서 신규 에픽을 소개하고 있다.
리사 수 AMD CEO는 3일(현지시간) 대만 타이베이 난강전람회 2관에서 개최된 컴퓨텍스 2024 기조연설의 첫 연설자로 나서 신규 에픽을 소개하고 있다.


리사 수 AMD, 5세대 에픽 '튜린' 공개…내년 MI350 AI 성능 35배↑

리사 수 AMD CEO는 3일(현지시간) 대만 타이베이 난강전람회 2관에서 개최된 컴퓨텍스 2024 기조연설의 첫 연설자로 나서 확장된 AMD 인스팅트 가속기 로드맵을 공개하고, 올 4분기 출시 예정인 최대 용량의 메모리를 탑재한 새로운 AMD 인스팅트 MI325X 가속기를 포함해 전반적인 AI 가속기 개발 계획을 소개했다.

이 자리에서 AMD는 5세대 AMD 에픽(AMD EPYC) 서버 프로세서인 코드명 '튜린(Turin)'을 발표했다. 올해 하반기 출시를 목표로 하고 있다.

리사 수 CEO는 보다 확장된 여러 세대에 걸친 가속기 로드맵을 공개했으며, 생성형 AI의 연간 주기에 따른 향후 성능 개발 및 메모리 탑재 등의 계획을 설명했다.

확장된 로드맵에는 올해 4분기에 출시되는 AMD 인스팅트 MI325X 가속기도 포함된다. 이 제품은 288GB의 초고속 HBM3E 메모리를 탑재할 예정이다.

내년 출시가 예상되는 차세대 AMD CDNA 4 아키텍처는 AMD 인스팅트 MI350 시리즈에 활용된다. 기존 AMD CDNA 3가 탑재된 AMD 인스팅트 MI300 시리즈 대비 최대 35배 향상된 AI 추론 성능을 제공할 전망이다. 또한, 지속적 성능 및 기능 개선을 통해 오는 2026년 출시 계획인 MI400 시리즈 가속기에는 CDNA 넥스트(Next) 아키텍처를 활용한다.|

르네 하스 Arm CEO는 3일(현지시간) 컴퓨텍스 2024가 열리는 대만 타이베이 그랜드 힐라이 호텔에서 기조연설자로 무대에 올랐다.
르네 하스 Arm CEO는 3일(현지시간) 컴퓨텍스 2024가 열리는 대만 타이베이 그랜드 힐라이 호텔에서 기조연설자로 무대에 올랐다.

르네 하스 "Arm 선택 이유? AI 전력효율 해답"…'CSS-클레이디' 띄운다

르네 하스 Arm CEO는 3일(현지시간) 컴퓨텍스 2024가 열리는 대만 타이베이 그랜드 힐라이 호텔에서 기조연설자로 무대에 올라 마이크로소프트 개발자와 거대한 생태계의 노력을 통해 Arm 역시 모바일 경험을 재정의할 수 있는 AI 최적화에 나서고 있다며 이같이 말했다.

그는 “현재까지 3000억 개의 Arm 기반 칩을 출시했으며, Arm 플랫폼은 AI 혁명이 사회에 더 많은 기회를 열어줌에 따라 가장 복잡한 AI 슈퍼 컴퓨터에서 엣지의 저전력 장치에 이르기까지 빠른 컴퓨팅을 가능하게 하는 이전에 본적없는 잠재력을 보여주고 있다”고 말했다.

특히, 그는 에너지 효율성이 요구되는 AI 시대에 Arm이 선택될 수밖에 없다고 단언했다. 그는 “Arm을 통해 에너지 절감에 나선 사례로 AWS 그래비톤 60%, 마이크로소프트 코발트 40%, 구글은 60%, LLM 트레이닝을 위한 엔비디아 그레이스 블랙웰 전력 소모 감소 25배를 들 수 있다”라며, “이는 모두 데이터센터 전반에 놀라운 에너지 효율성을 제공하는 Arm 네어버스 플랫폼을 기반으로 한다”고 덧붙였다.

아울러, 이날 하스 CEO는 관련 시장 파트너들과 함께 AI 시장을 선도하고 있다고 밝혔다. 그 과정 속에서 실리콘 파트너가 Arm 기반 솔루션을 더 쉽고 빠르게 구축해 시장 출시 기간을 단축할 수 있도록 지원하는 클라이언트용 Arm 컴퓨팅 서브시스템(CSS)을 발표했다.

클라이언트용 Arm CSS는 플래그십 모바일 시스텝온칩(SoC)를 위한 기본 컴퓨팅 요소를 제공한다. 최신 Armv9 CPU, 이모탈리스(Immortalis) GPU, 3나노미터에서 생산 가능한 CPU 및 GPU용 물리적 구현과 최신 코어링크 시스템 메모리 관리 유닛을 특정으로 한다. 30% 이상 향상된 컴퓨팅 및 그래픽 성능을 통해 광범위한 AI, 머신러닝 및 컴퓨터 비전(CV) 워크로드를 위한 59%의 더 빠른 AI 추론으로 까다로운 실제 안드로이드 워크로드를 처리하는 빠른 Arm 컴퓨팅 플랫폼이다.

팻 겔싱어 인텔 CEO는 4일(현지시간) 대만 타이베이에서 열린 컴퓨텍스 2024에서 글로벌 미디어와 만나 질문에 답하고 있다
팻 겔싱어 인텔 CEO는 4일(현지시간) 대만 타이베이에서 열린 컴퓨텍스 2024에서 글로벌 미디어와 만나 질문에 답하고 있다

엔비디아 H100 저격 '인텔 가우디3'…가성비 '승부'

인텔(대표 팻 겔싱어)은 4일(현지시간) 대만 타이베이에서 진행된 컴퓨텍스 2024에서 데이터센터, 클라우드와 네트워크에서 에지 및 PC에 이르기까지 AI 생태계를 획기적으로 가속화할 최첨단 기술 및 아키텍처를 공개했다.

인텔에 따르면 생성형 AI의 역량을 활용하는 것은 더 빠르고 저렴해졌다. 주요 인프라인 x86은 거의 모든 데이터센터 환경에서 대규모로 운영되며, 비용 효율적인 상호운용성과 개발자 및 고객으로 구성된 개방형 생태계의 이점을 제공하면서, AI 역량을 통합하는 데 기반 역할을 한다.

인텔 제온 프로세서는 AI 워크로드에 이상적인 CPU 헤드 노드이며, AI 워크로드를 위해 특별히 설계된 인텔 가우디 AI 가속기와 함께 시스템에서 구동한다. 이를 통해 기존 인프라에 원활하게 통합된다.

대규모 언어 모델(LLM)의 훈련 및 추론을 위한 MLPerf 벤치마크 결과를 제공 가능한 엔비디아의 H100의 대안인 가우디 아키텍처는 더 낮은 총 운영 비용으로 빠른 배포 시간을 제공하는 가격 대비 성능의 이점을 제공하여 고객이 원하는 생성형AI 성능을 제공할 수 있다는 게 인텔의 설명이다.

시스템 공급업체(SP)에 제공되는 8개의 인텔 가우디 2 가속기와 범용 베이스보드(UBB)가 포함된 표준 AI 키트는 6만 5천 달러로 동급 경쟁 플랫폼 가격의 3분의 1 수준으로 예상된다. 8개의 인텔 가우디 3 가속기와 UBB가 포함된 키트는 12만 5천 달러에 판매되며, 이는 동급 경쟁 플랫폼4 가격의 약 3분의 2 수준이다.

황철주 주성엔지니어링 회장. [ⓒ주성엔지니어링]
황철주 주성엔지니어링 회장. [ⓒ주성엔지니어링]

"반도체 저평가가 문제"...주성엔지니어링 황철주 회장이 밝힌 '분할 사유'

주성엔지니어링은 지난 3일 경기도 용인 소재 R&D 센터에서 기자간담회를 열었다. 이날 황 회장은 직접 나와 회사의 상황과 기술 현황, 사업 분리 필요성 등을 설명했다.

주성엔지니어링은 지난 1993년 설립된 장비 회사다. 반도체, 디스플레이, 태양광 장비를 생산하고 있는데, 이 중 반도체 사업이 전체 매출의 75% 이상을 차지하고 있다. 웨이퍼 위에 필요한 물질을 입히는 증착장비가 핵심 제품으로, SK하이닉스 등에 공급하고 있다.

지난달 2일 사업 부문별 독립 및 책임 경영 효율성 목적으로 인적·물적분할을 추진을 발표했다.

존속회사인 주성홀딩스(가칭)는 경영 효율성 증대를 통한 핵심사업 경쟁력 및 투자 전문성 강화에 초점을, 인적분할로 신설되는 주성엔지니어링(가칭)은 반도체 장비 분야, 물적분할, 100% 자회사로 신설되는 주성에스디(가칭)는 태양광 및 디스플레이 장비를 다룰 예정이다.

이날 황 회장은 허심탄회하게 현 상황을 전했다. 먼저 최 전 회장에 관해서는 '경영권 등을 목적으로 취득했다고 판단하고 있지 않다'라고 답했다.

황 회장은 "10% 수준의 주식을 보유하고 있는 2대주주하고는 물적⋅인적 분할과 같은 회사 경영상 중대 결정을 할 때 어느정도 상의가 이뤄져야 한다"라며 "직접 이를 담당했는데, 그동안 반대한다는 입장 등을 드러내지는 않았다"라고 설명했다.

신설되는 주성엔지니어링을 누가 이끌지 '완전히 결정된 것이 없다'라는 입장을 밝혔다. 그러면서 회사가 갖고 있는 반도체 장비 난이도상, 전문성을 갖춘 인물이 회사를 이끌어야 했다고 강조했다.

SK하이닉스는 지난 4일(현지시간) 대만 타이베이 난강전람관에서 개최된 컴퓨텍스 2024에 참가해 36GB(기가바이트) 12단 HBM3E를 전시했다.
SK하이닉스는 지난 4일(현지시간) 대만 타이베이 난강전람관에서 개최된 컴퓨텍스 2024에 참가해 36GB(기가바이트) 12단 HBM3E를 전시했다.

SK하이닉스, TSMC와 HBM3E 기술 통합…'플래티넘 P51 SSD' 공개

SK하이닉스는 지난 4일(현지시간) 대만 타이베이 난강전람관에서 개최된 컴퓨텍스 2024에 참가해 부스를 구축하고 고대역폭메모리(HBM)인 HBM3E뿐만 아니라 PC OEM을 겨낭한 SSD와 자체 공급되는 SSD, CXL 메모리 등을 대거 공개했다.

눈길을 끄는 모델은 컴퓨텍스 기간 내내 각광 받았던 HBM이다. 이 곳에는 36GB(기가바이트) 12단 HBM3E를 전시했다. SK하이닉스는 이 제품과 관련해 “SK하이닉스 HBM과 TSMC의 칩 온 웨이퍼 온 서브스트레이트’ 기술 통합을 위해 협력하는 한편, HBM과 관련된 일반 고객의 요청에 대응하기 위해 TSMC와 협력하고 있다”고 밝혔다.

칩 온 웨이퍼 온 서비스트레이트(Chip on Wafer on substrate) 기술이란 인터포저라는 특수 기판 위에 로직 칩인 GPU 또는 xPU와 HBM을 연결하는 TSMC의 전용 패키징 공정을 말한다.

DB하이텍 부천사업장 [ⓒDB하이텍]
DB하이텍 부천사업장 [ⓒDB하이텍]


레거시 약세 비상 걸린 'DB하이텍'…공정 고도화 드라이브

레거시(범용) 파운드리 경쟁이 심화하면서 DB하이텍도 돌파구 마련에 나섰다. 최근 자율주행 기술 고도화로 수요가 급증하고 있는 전장용 반도체에 사업 방점으로 찍고 신규 공정 등을 도입, 고객 모시기에 나서고 있다.

28~40nm 공정에서는 CIS(이미지센서)용 백플레인, DDIC(디스플레이용 드라이버IC) 등이 주로 생산되는데, 최근 DB하이텍은 CIS 사업 확대를 위해 공정 기술 고도화에 나섰다. CIS 생산에 활용되는 글로벌 셔터, SPAD 공정 기술력을 업그레이드 한 것이다.

글로벌 셔터는 빠르게 움직이는 피사체의 이미지를 왜곡 없이 포착하는 센서이며, SPAD는 입자 수준의 미약한 빛 신호를 감지하는 초고감도의 3차원(3D) 이미지센서로, 정밀도가 높고 장거리 측정이 가능하다.

빠르게 움직이는 피사체의 이미지를 왜곡 없이 포착하는 센서로, 스마트 팩토리 구축에 필수적인 머신비전(Machine Vision, AI 기술을 활용한 이미지/영상 분석 시스템)을 비롯해 자동차, 드론, 로봇, 의료기기 등 다양한 분야에서 수요가 가파르게 증가하여 2022년부터 2029년까지 연평균 시장성장률이 16%에 이를 것으로 기대되고 있다.

구체적으로 글로벌 셔터 신공정은 라이트 실드(Light shield)와 라이트 가이드(Light guide) 기술을 적용, 5.6um 픽셀에서 PLS≥35000을 달성했다. PLS는 빛에 대한 민감도를 나타내는 개념으로 PLS가 10000 이상이면 광인식률 99.99%(Noise 발생률 1만분의 1 미만)에 달하는 상당히 높은 수준의 셔터 효율성 가진다는 의미다.

SPAD 2세대 공정은 BSI 구조로 BST(Backside Scattering Technology), BDTI(Backside Deep Trench Isolation)를 적용, 940nm 파장 기준, 광자 검출 확률(Photon Detection Probability) 15.8%의 선진 기술 수준을 갖추었다. 이에 더해, 일반 CIS의 암전류에 해당하는 DCR(Dark Current Rate) 성능을 0.69cps/um2까지 확보하여 품질을 높였다.


웨이저자 TSMC 회장을 만난 최태원 SK그룹 회장. [ⓒSK]
웨이저자 TSMC 회장을 만난 최태원 SK그룹 회장. [ⓒSK]

'HBM4도 질 수 없다'...SK 최태원 회장, TSMC 회장 만나 협력 확대 논의

최태원 SK그룹 회장과 곽노정 SK하이닉스 사장이 세계 최대 반도체 위탁생산(파운드리) 기업인 TSMC와 만나, AI 반도체 경쟁력 강화를 위해 양사 협력을 한층 강화하기로 했다.

최 회장은 6일(현지 시간) 대만에서 TSMC 웨이저자 회장 등 대만 IT 업계 주요 인사들과 만나 AI 및 반도체 분야 협업 방안 등을 논의했다.

최 회장은 "인류에 도움되는 AI 시대 초석을 함께 열어가자"고 메시지를 전하고, 고대역폭 메모리(HBM) 분야에서 SK하이닉스와 TSMC의 협력을 강화하는데 뜻을 모았다.

SK하이닉스는 HBM4(6세대 HBM) 개발과 어드밴스드 패키징 기술 역량을 강화하기 위해 지난 4월 TSMC와 기술 협력에 대한 양해각서(MOU)를 체결한 바 있다.

SK하이닉스는 HBM4부터 성능 향상을 위해 베이스 다이(Base Die) 생산에 TSMC의 로직(Logic) 선단 공정을 활용할 계획이다. 회사는 이 협력을 바탕으로 HBM4를 2025년부터 양산한다는 계획이다.

이와 함께, 양사는 SK하이닉스의 HBM과 TSMC의 CoWoS®기술 결합도 최적화한다. CoWoS(Chip on Wafer on Substrate)는 TSMC가 특허권을 갖고 있는 고유 공정으로, 인터포저 (Interposer) 라는 특수 기판 위에 로직 칩인 GPU/xPU와 HBM을 올려 연결하는 패키징 방식이다. 이를 통해 HBM 관련 고객들의 요청에도 공동 대응하기로 했다.

최 회장의 AI 및 반도체 분야 글로벌 협력을 위한 '광폭 행보'는 지난해 연말부터 계속되고 있다. AI 및 반도체 분야에서 고객들의 광범위한 욕구를 충족시킬 수 있는 글로벌 협력 생태계 구축의 중요성이 커지고 있기 때문이다.

[ⓒ한미반도체]
[ⓒ한미반도체]


한미반도체, 하이닉스향 '듀얼 TC본더' 추가 수주…1500억원 규모

한미반도체가 SK하이닉스로부터 인공지능 반도체 고대역폭메모리 (HBM) 3세대 하이퍼 모델인 '듀얼 TC본더 그리핀 (DUAL TC BONDER GRIFFIN)'을 수주했다고 7일 발표햇다.

이번 수주액은 1500억원 규모로 이로써 한미반도체는 SK하이닉스로부터 HBM용 듀얼 TC 본더로만 누적 3587억원으로 창사 최대 수주를 갱신했다. 구체적으로 지난해 하반기 1012억원, 올해 1분기 1076억원, 이번 1500억원 등이다.

곽동신 부회장은 "이번주 대만 타이베이에서 열린 테크 엑스포 '컴퓨텍스 2024'에서 엔비디아 최고 경영자인 젠슨 황이 언급한 바와 같이, 향후 차세대 GPU인 루빈과 루빈울트라 칩의 HBM 탑재 수량이 늘어날 것으로 혔다"라며 "HBM 수요 증가 대비와 원활한 TC 본더 공급을 위해 올해 상반기 여섯 번째 공장을 추가 확보하며 고객 만족 향상에 전력을 다하고 있다"라고 말했다.

삼성전자 화성 사업장. [ⓒ삼성전자]
삼성전자 화성 사업장. [ⓒ삼성전자]

HBM에 가려진 D램⋅낸드 '이익률'…삼성전자 여유 있는 이유

엔비디아 향 HBM(고대역폭메모리) 공급 결정이 늦어지며, 삼성전자를 향한 우려의 목소리가 커지고 있는 가운데 삼성전자는 그럼에도 여유있는 모습이다. 삼성전자가 전통적으로 강점을 지니고 있는 일반 D램, 낸드플래시의 감산효과가 지속, 이익률이 올라가고 있는 추세여서다.

그동안 엔비디아에 HBM을 납품해 왔던 곳은 SK하이닉스지만 제품 다양화, 물량 증가 등으로 삼성전자 등 다른 메모리 기업도 문을 두드리고 있다. 메모리 업계 안팎에선 당초 올해 2분기 정도에 삼성전자의 HBM 퀄테스트 결과를 기대할 것이라 고대했으나, 아직 결론을 짓진 못한 상태다.

젠슨 황 엔비디아 대표는 삼성전자의 HBM 납품 퀄테스트에 대해 '여전히 진행 중'이라며 무산된 것이 아님을 밝혔지만, 그럼에도 시장 안팎에선 결론이 늦어지는 것을 부정 요소로 받아들이고 있는 모습이다. 경쟁사 등이 AI 기대감 등으로 연일 주가가 고공행진하고 있는 상황에서도 삼성전자는 반영되지 못하고 있다.

주목되는 점은 HBM와 별개로 일반 D램, 낸드플래시는 삼성전자가 업계 1위를 지키고 있다는 점이다. 지난해 반도체 시장 침체로 인한 D램, 낸드플래시 등의 판가 하락이 이어지면서 삼성전자와 SK하이닉스는 감산에 돌입했고, 효과가 톡톡히 나타나고 있다. 1분기 일반 D램의 재고 수준은 예년 수준으로 돌아오며 삼성전자 반도체 사업부(DS)의 적자 탈출도 성공했다.

배태용 기자
tybae@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널