GPU가 앞당긴 AI·VR 시대…적층 반도체로 가속화
적층 반도체 기술을 통해 그래픽처리장치(GPU) 성능이 한 단계 진화하고 있다. 전 세계 GPU 시장 1위, 팹리스 업계 4위를 달리고 있는 엔비디아가 지난 4일(현지시각)부터 7일까지 미국 캘리포니아주 산호세컨벤션센터에서 진행한 ‘그래픽 테크놀로지 컨퍼런스(GTC) 2016’에서 공개한 ‘테슬라 P100’이 대표적인 제품이다.
테슬라 P100은 차세대 ‘파스칼’ GPU 아키텍처가 사용된 첫 번째 제품으로 복잡한 부동소수점(FP) 연산에 최적화됐다. 기존 ‘맥스웰’ 아키텍처 기반 솔루션과 비교했을 때 12배 성능이 더 높으며 여러 개의 GPU를 연결해 대역폭을 확장할 수 있는 NV링크를 지원한다. 새로운 반정밀도(FP16, 16비트) 명령은 딥러닝을 위해 21테라플롭스(TFlops, 1초에 1조회 연산) 이상의 성능을 제공한다. 배정밀(FP64, 64비트)도 및 단정밀도(FP32, 32비트)에서는 5에서 10TFlop를 제공한다.
무엇보다 기존 28나노 공정에서 16나노 핀펫 공정을 사용한 것이 눈에 띈다. GPU는 중앙처리장치(CPU)나 애플리케이션프로세서(AP)와 비교해 다이(Die) 크기가 크다. 트랜지스터 집적도가 상대적으로 높기 때문인데 이로 인해 미세공전 전환은 물론 수율을 높이기가 쉽지 않다. D램은 18나노, AP는 14/16나노 공정이 적용되어 있다는 점을 고려하면 더욱 그렇다.
테슬라 P100이 사용한 TSMC 16나노 핀펫 공정은 기존 반도체를 구성하는 소자 구조가 2차원적인 평면 구조였던 것에 반해, 누설전류를 줄일 수 있도록 3차원의 입체 구조로 소자를 만드는 기술이 적용됐다. 3차원 입체구조에 적용되는 게이트의 모양이 물고기 지느러미(Fin)와 비슷해 이름이 핀펫으로 붙여졌다.
메모리는 삼성전자 HBM2(고대역폭 메모리, High Bandwidth Memory) D램이 적용됐다. HBM D램은 TSV(Through Silicon Via, 실리콘관통전극) 기술을 적용해 D램 칩에 5000개 이상의 구멍을 뚫고 상하를 연결함으로써 기존의 금선을 이용한 D램 패키지에 비해 데이터 처리속도를 크게 끌어올린 제품이다. 핀펫과 마찬가지로 3D 구조를 가지고 있으며 여러 개의 D램을 수직으로 적층한 것이 특징이다.
GPU는 가상현실(VR), 인공지능(AI)과 같이 높은 데이터 처리량이 필수적인데 이 경우 메모리 대역폭이 상당히 중요하다. 테슬라 P100은 16나노 핀펫, HBM2를 통해 기존 GPU보다 한 단계 높은 성능을 제공할 수 있게 됐다. 한 업계 관계자는 “미세공전 전환과 함께 적층 반도체 기술의 우선 적용이 제품의 경쟁력으로 작용하고 있다”고 설명했다.
◆GPU 기술의 범용적 확대=GTC2016에서는 테슬라 P100 외에도 세계 최초의 딥러닝 전용 슈퍼컴퓨터 ‘엔비디아 DGX-1’, 인터랙티브 VR프로젝트 ‘마스 2030’ 등이 공개됐다. VR, AI, 자율주행차, 로봇공학, 슈퍼컴퓨터, 그래픽 디자인, 엔터테인먼트 등 GPU 컴퓨팅이 영향을 미치는 다양한 산업을 광범위하게 다룬 500개 이상의 세션 중 주요 내용이 소개됐다.
먼저 레노버는 오큘러스 리프트와 HTC 바이브 헤드셋, 엔비디아 VR 레디 인증을 받은 싱크스테이션 P500으로 두 명이 동시에 한 가상현실을 체험하는 공존 VR 체험을 제공했다. 아우디는 VR 헤드셋을 통해 사용자가 아우디 차량을 살펴볼 수 있도록 했으며 델은 HTC의 바이브 헤드셋과 조이스틱을 사용해 관람객이 다쏘시스템의 ‘가상 차고’에서 통해 차를 마음대로 개조해 볼 수 있도록 했다.
미국 존슨 스페이스 센터는 복합형 가상현실 기술을 사용해 미항공우주국 나사(NASA)의 국제 우주 정거장 체험을 제공했다. 여행 스타트업인 리얼리티스.io는 일반인의 접근이 금지된 역사적인 장소로 떠나는 여행을 가상현실로 제공하고 이 아이디어로 신흥 기업 정상 회의에서 3만달러의 상금을 받았다.
GTC2016에서 발표된 ‘검은 말벌’은 노르웨이의 프록스다이나믹이 제작한 길이 16cm 길이에, 무게 18g의 초소형 드론이다. 최대 25분 비행에 짐을 실을 수 있으며 비행 소음도 거의 없다. 탑재된 3개의 카메라로 넓은 범위까지 감지하고 스스로 장애물을 피할 수도 있다. 까다로운 조건을 맞추기 위해 특별히 초소형으로 제작된 엔비디아의 젯슨 테그라 K1 내장 시스템을 장착했다.
이번 GTC2016 세션에서 카네기멜론 대학교와 구글 브레인 팀은 GPU를 기반으로 한 음성 인식 시스템인 LAS(Listen, Attend and Spell)를 선보였다. 대부분의 딥러닝 기반 음성 인식 애플리케이션은 전문가가 제작한 발음 사전을 필요로 하는 등 음성을 문자화하는데 복잡한 단계를 거친다. 이에 비해 딥러닝 구조에서 한 단계 더 나아간 이 모델은 음성-문자 간의 직접적인 연결을 시도해 과정을 단순화했다.
한편 매년 GPU 기술을 활용해 각종 사회 및 환경 난제를 해결한 연구진에게 수여하는 ‘글로벌 임팩트’ 어워드는 미국의 듀크대학교 연구진에게 돌아갔다. 조셉 아이잣 박사가 지도하는 연구진은 GPU를 사용해 안구 광학 미세 수술의 방식을 완전히 바꿨다. 수술이 진행되는 동안 최첨단 현미경은 수 마이크로초마다 한 번씩 안구의 3D 이미지를 생성, 의사는 즉각적인 피드백을 얻을 수 있다. 엔비디아의 지포스 GTX 타이탄 블랙 GPU, 쿠다 프로그래밍 라이브러리, 3D 비전을 사용했다. 이 기술은 듀크대학교 안과 센터 및 클리브랜드 클리닉 콜 안과 연구소의 수술에 90회 이상 사용됐으며 상업적인 사용도 가능할 것으로 전망된다.
<이수환 기자>shulee@insightsemicon.com
[IT클로즈업] 본회의만 남은 AI기본법, 통과돼도 갈길 멀었다
2024-12-19 09:20:04[현장] 팝업 맛집 ‘라인프렌즈’, 이번엔 제베원…“제로즈, 널 위해 알차게 준비했어”
2024-12-19 07:30:00KT엠모바일, '1인 결합' 서비스 '아무나 SOLO' 출시…왜? [IT클로즈업]
2024-12-19 07:10:00밈 코인 투자 플랫폼 GMGN… "블록체인 기술 기반 밈 토큰 거래 혁신 패러다임 구축"
2024-12-18 17:50:02