인터뷰

‘딥러닝’ 인공지능 혁명 주도…핵심은 GPU 병렬처리

한주엽

[전자부품 전문 미디어 인사이트세미콘]

- 이용덕 엔비디아코리아 지사장

“컴퓨터가 강아지와 고양이, 사람 사진을 분간할 수 있을까요? 가능합니다. 비슷한 사진을 자꾸 보여주면서 ‘이건 사람이야’, ‘이건 고양이야’, ‘이건 강아지야’라고 학습을 시키면 됩니다. 이런 걸 딥러닝(Deep Learning)이라고 하죠. 딥러닝은 인공지능 시대를 열기 위해 넘어야 할 일종의 관문입니다. 요즘 컴퓨터 과학계의 가장 큰 화두예요.”

그래픽처리장치(GPU) 전문 업체 엔비디아의 한국 지사를 맡고 있는 이용덕 지사장을 만났다. 그에게 “GPU, 게임할 때나 중요한 것 아니냐”고 물으니 “세상을 바꾸려면 GPU가 없으면 안 된다”고 답했다. 그는 식탁 위 태블릿, 커피잔, 병, 접시, 포크 등에 텍스트로 설명을 달아놓은 사진 한 장을 보여주며 “사람이 단 게 아니라, 컴퓨터가 자동으로 인식해서 쓴 것”이라고 말했다. 단순히 ‘이건 뭐고, 저건 뭐다’에 그치지 않고 썰려 있는 바나나, 물잔 속에 든 얼음과 레몬까지 묘사돼 있었다. 사진은 미국 스탠퍼드 대학교의 컴퓨터 과학학과 소속 연구팀(Andrej Karpathy, Li Fei-Fei)이 최근 발표한 논문(Deep Visual-Semantic Alignments for Generating Image Descriptions, 2015년 4월)에서 발췌한 것이었다. 그는 “딥러닝 시대가 오고, 거기서 한 단계 더 나아가면 이처럼 학습을 시키지 않아도 되는(Unsupervised Learning) 진정한 인공지능 시대가 열릴 것”이라고 말했다.

스탠퍼드대학교 연구팀이 개발한 소프트웨어가 식탁 사진을 보고 묘사한 표현들.
스탠퍼드대학교 연구팀이 개발한 소프트웨어가 식탁 사진을 보고 묘사한 표현들.

- 그런데, 인지 능력이 왜 중요한 겁니까?

“생각해보세요. 컴퓨터가 카메라로 뭔가 찍었다면 그것이 사람인지, 장애물인지 인식할 수 있어야 다음 명령을 내릴 수 있지 않겠습니까? 요즘 무인차 얘길 많이 하잖아요. 자율 주행이 되려면 앞에 가는 차가 트럭인지, 세단인지, 자전거 타고 가는 사람인지 알아야 합니다. 이런 인식 능력을 학습으로 만들어주는 겁니다. 요즘은 소리 쪽으로도 딥러닝이 유행입니다. 사람이 말을 하면 그걸 듣고 컴퓨터가 ‘아 이 사람이 무엇을 원하고 있구나’라고 이해하는거죠. 그래야 말을 들은 뒤 뭔가 동작을 수행할 수 있어요.”

- 그것이 GPU와 무슨 관계입니까?

“컴퓨터를 학습시키려면 엄청난 파워(연산 능력)가 요구됩니다. 구글 브레인이라고 혹시 아십니까? 서버 1000개를 병렬로 연결한 인프라요. 이 인프라를 구축하는 데 든 비용이 무려 50억원입니다. 그런데 GPU를 활용하면 구글 브레인과 동등한 성능을 가진 인프라를 단 3300만원이면 만들 수 있습니다. 전기료 차이도 엄청나죠. 구글 브레인은 60만와트라는 엄청난 전기를 먹습니다.

엔비디아 GPU를 활용한 인프라는 4000와트면 충분합니다. 왜 그럴까요? 이유가 있습니다. 물리적 코어 개수가 한정되고 순차적 연산에 특화된 중앙처리장치(CPU)와 비교해 수십개 이상의 다(多) 코어 기반인 GPU는 다중 연산 특히 숫자나 알고리듬을 처리할 때 유리하도록 설계돼 있습니다. 바로 그 점을 활용하는겁니다“

이용덕 지사장이 언급한 구글 브레인과 GPU 병렬 처리 시스템의 성능 비교는 앤드류 응 스탠퍼드 대학 교수가 2012년 7년 발표한 논문(Building High-level Features Using Large Scale Unsupervised Learning)에 자세하게 나와 있다.

구글 브레인은 1000개의 구글 서버를 병렬로 연결했다. 서버 하나당 2개의 CPU가 탑재되니 총 2000개의 CPU가 쓰인 셈이다. CPU 코어 개수는 1만6000개에 달했다. 구글 브레인은 3일간 유튜브에서 얻은 200×200 해상도의 이미지 1000만개를 분석했다. 그랬더니 사람 얼굴과 고양이 얼굴을 구별해낼 수 있었다고 한다. 그러나 이러한 컴퓨팅 파워를 얻기 위해 소모되는 비용은 천문학적이다. 하드웨어 구매 비용은 이 지사장의 말처럼 50억원에 달하고, 전력 소모량 역시 60만와트로 많다. 이처럼 많은 비용이 들어가면 일반 연구소에선 도입할 엄두를 내지 못한다.

총 2000개의 CPU와 1만6000개의 코어로 구성된 구글 브레인은 3일간 유튜브에서 얻은 200×200 해상도의 이미지 1000만개를 분석한 뒤 사람 얼굴과 고양이 얼굴을 구별해낼 수 있었다. 그러나 이 같은 딥러닝을 구현하기 위해 들여야 하는 비용은 천문학적이다.
총 2000개의 CPU와 1만6000개의 코어로 구성된 구글 브레인은 3일간 유튜브에서 얻은 200×200 해상도의 이미지 1000만개를 분석한 뒤 사람 얼굴과 고양이 얼굴을 구별해낼 수 있었다. 그러나 이 같은 딥러닝을 구현하기 위해 들여야 하는 비용은 천문학적이다.

엔비디아는 자사의 GPU 가속화 서버 3대(1만8432개의 GPU 코어)면 구글 브레인과 동등 성능을 낼 수 있다고 강조하고 있다. 구축비용은 3300만원으로 저렴하고, 전기 소모량도 구글 브레인 대비 현저하게 적은 4000와트에 그친다.

이미 이 같은 사실은 앤드류 응 교수와 엔비디아가 함께 작성한 논문(Deep Learning with COTS HPC Systems)에도 잘 나타나 있다. 지난 2013년 이 논문이 국제기계학습학술대회(ICML)에서 발표되자 와이어드는 “수백만 달러에 달하는 구글 브레인을 보다 저렴한 비용으로 이용할 수 있게 됐다”고 평가했다.

- 딥러닝이 우리가 원하는 수준까지 이뤄졌다고 가정하면, 실제 어떤 것들을 할 수 있을까요?

“딥러닝이 적용될 수 있는 분야는 무궁무진합니다. 자율주행차 얘길 했는데, 의료 쪽에도 적용될 수 있죠. 뇌 사진을 찍었는데, 종양이 있는지 없는지를 사람이 아니라 컴퓨터가 판단하게 하는 겁니다. 방대한 양의 경험(데이터베이스)이 축적되면 ‘명의’라고 소문난 사람보다 더 정확하게 사진을 판독할 수 있을겁니다.”

- 현재 구체적인 사례가 있나요

“엔비디아는 다양한 파트너사와 협력해 GPU를 활용한 딥러닝 기술을 지속적으로 발전시켜 나가고 있습니다. 어도비는 딥러닝 이미지 프로세싱 도구를 구축하기 위해 엔비디아와 협력하고 있습니다. 바이두는 음성인식, 번역, 안면인식, 물체인식 등의 서비스를 위한 대량의 데이터를 처리하는데 엔비디아의 GPU를 활용합니다. 넷플릭스도 4000만 스트리밍 서비스 가입자의 영화시청 패턴을 분석하기 위해 엔비디아의 GPU를 활용하고 있는 중이죠. 넷플릭스의 패턴 분석 서비스는 사용자가 좋아할 만한 영화를 정확히 파악해 영화 추천 리스트를 업데이트해줍니다.”

실제 굉장히 많은 기업들이 엔비디아의 GPU를 활용해 대규모 연산 작업을 실시하고 있다.
실제 굉장히 많은 기업들이 엔비디아의 GPU를 활용해 대규모 연산 작업을 실시하고 있다.

- GPU로 딥러닝 외 어떤 일들이 가능합니까?

“천체물리 시뮬레이션, 기상기후 예측, 유전체 연구 등 전통적인 과학계산 영역에서 활용될 수 있습니다. 최근에는 검사 장비와 신소재 개발, 혹은 분자동역학을 이용한 신약 개발 등에도 GPU를 활용한 병렬 처리 기술이 활용되고 있습니다.”

- 그렇다면 딥러닝이나 과학계산 등, GPU 병렬처리는 어떻게 하는겁니까?

“엔비디아의 GPU 병렬처리 개발 플랫폼인 쿠다(CUDA)를 쓰면 됩니다. 쿠다는 2007년 첫 공개된 엔비디아의 독자 개발 플랫폼입니다. 병렬 프로그래밍을 단순화 해 개발자들이 다양한 소프트웨어를 엔비디아 GPU로 가속할 수 있도록 돕는 플랫폼이죠. 2015년 현재 버전 7.0이 나온 상태입니다. 엔비디아는 쿠다를 무료로 제공하고 있으며 컴파일러도 소스 레벨로 공개해뒀습니다. 쿠다 GPU 컴퓨팅 등록 개발자 프로그램에 가입한 개발자라면 자유롭게 최신 툴킷을 사용할 수 있습니다.”

- 일각에서는 쿠다가 표준이 아니라는 이유로 ‘오픈CL이 더 낫다’는 주장을 펼치기도 합니다.

“그렇지 않아요. 쿠다도 모두에게 공개돼 있습니다. 쿠다의 경우 여러 시행착오를 거치면서 개발자 중심으로 업그레이드가 이뤄진 반면, 오픈CL은 편의성이 떨어진다고 우리는 판단하고 있습니다. GPU 병렬 컴퓨팅을 활용하는 목적이 과학계산, 딥러닝 등이라면 개발 단계에서 어려움을 겪고 많은 시간을 소비해야 하는 오픈CL 보단 쿠다가 훨씬 효율적이라는 게 저의 생각입니다.”

- 실제 오픈CL보다 쿠다를 더 많이 사용합니까?

“오픈CL 사용자가 어느 정도인지는 정확하게 모르겠습니다. 다만 국내로 한정하면 아주 극소수만이 활용하는 것으로 알고 있습니다. 쿠다의 경우 지속적으로 사용자가 늘고 있습니다. 지난 2008년까지만 해도 쿠다 다운로드 수는 15만회에 불과했지만 2015년 현재 이 숫자는 300만회에 달합니다. 이 기간 동안 쿠다가 접목된 소프트웨어도 27개에서 319개로 늘었습니다. 쿠다 관련 교육 과정을 이행하는 교육 기관은 60개에서 80개, 관련 논문 또한 4000개에서 6만 개로 크게 늘었죠.”

- 쿠다 생태계를 확대하는 것이 엔비디아의 주요 전략이 될 수 있겠군요

“어떤 기술이든 생태계를 확대하는 건 매우 중요할 겁니다. 일반 PC에 엔비디아 GPU가 더해짐으로서 성능은 20배 이상 높아질 수도 있습니다. 엔비디아는 궁극적으로는 개인 모두가 GPU 병렬컴퓨팅을 활용해 수퍼컴퓨터를 사용하도록 생태계를 확대해 나가는 것이 목표입니다.”

- 쿠다 생태계 확보를 위해 현재 엔비디아코리아가 하고 있는 활동은 어떤 것이 있습니까

“2007년부터 매년 빠짐없이 쿠다 대학 투어를 돌고 있습니다. 또한 전문가들과 함께 쿠다 워크샵을 개최하고 있구요. 전국 대학과 연계해 교육 역시 정기적으로 하고 있죠. 2008년 3월 이화여대에서 최초로 쿠다 강좌를 시작했고, 부산 동명대학교는 엔비디아와의 협력을 통해 2013년 프로페셔널 솔루션 쿠다 교육 센터를 개원한 데 이어 2015년에는 GPU 교육 센터로 선정되기도 했습니다. 서울시립대, 울산과기대, 한림대 등도 GPU 리서치 센터 및 교육 센터로 선정된 바 있습니다. 작년에는 KISTI와 협력해 초병렬컴퓨팅센터(Massively parallel computing center)도 설립했습니다. 이외에도 쿠다 코딩 콘테스트, 전국 과학고 슈퍼컴 경진대회 등을 열고 있습니다.

- 본사에서 하던 GTC 행사를 한국에서도 개최한다고 들었습니다(9월 22일)

“GTC는 GPU 테크놀로지 컨퍼런스의 줄임말로 매년 미국 실리콘밸리에서 개최되는 엔비디아의 개발자 행사입니다. 올해 처음으로 한국에서 이 행사를 열게 됐습니다. 한국의 GPU 시장 규모는 크지 않지만 본사가 판단하기에 이 행사를 열 만한 가치가 있다고 판단한겁니다. 그 만큼 한국 내 쿠다 생태계는 세계 어떤 곳과 비교해도 뒤지지 않을 만큼 활성화되어 있다는 뜻이기도 합니다. 올해 행사에선 GPU를 활용한 딥러닝 분야에 관한 많은 논의가 이뤄질겁니다. 첫 행사를 성공적으로 개최해 국내에서 가장 영향력 있는 GPU 행사로 만들겠습니다.”

<한주엽 기자>powerusr@insightsemicon.com

한주엽
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널