[GTC2014] 강아지 품종까지 확인… GPU 컴퓨팅이 기계학습 주도
[디지털데일리 한주엽기자] 스탠포드 대학의 앤드류 응 교수는 구글 연구진과 협력해 2012년 7월 ‘기계학습(Machine Learning)’과 관련된 논문(제목 : Building High-level Features Using Large Scale Unsupervised Learning)을 발표했다.
기계학습이란 인공적 신경회로망(Neural Networks)과 방대한 양의 데이터를 토대로 컴퓨터가 스스로 생각하고 판단할 수 있도록 하는 방법론이다. 인간의 뇌와 흡사한 학습 알고리듬으로 사물이나 글자, 음성, 음향을 인식할 수 있다고 한다.
논문 내용은 이랬다. 우선 컴퓨팅 파워를 얻기 위해 1000개의 구글 서버를 병렬로 연결했다. 서버 하나당 2개의 중앙처리장치(CPU)가 탑재되니 총 2000개의 CPU가 쓰인 셈이다. CPU 코어 개수는 1만6000개에 달했다. 구글은 이 장비를 ‘구글 브레인’이라고 이름 붙였다. 구글 브레인은 3일간 유튜브에서 얻은 200x200픽셀의 이미지 1000만개를 분석했다. 그랬더니 사람의 얼굴과 고양이의 얼굴을 구별해낼 수 있었다고 한다.
이러한 결과가 시사하는 바는 크다. 사람이 관여하지 않아도 컴퓨터가 자율적(Unsupervised)으로 학습하고 생각할 수 있게 된다면, 보다 지능이 뛰어난 기계를 만들 수 있다. 그러나 이러한 컴퓨팅 파워를 얻기 위해 소모되는 비용은 천문학적이다. 구글 브레인과 같은 시스템을 구성하려면 500만달러의 비용이 필요하다. 소모 전력량은 무려 600kW로 일반 연구소에서 감당하기 힘든 수준이다.
앤드류 응 교수는 방법을 바꿨다. 인공 신경회로망에서 발생하는 대량의 데이터를 CPU가 아닌 그래픽처리장치(GPU)가 처리하도록 했다. 응 교수와 엔비디아는 16대의 GPU 가속화 서버를 사용해 112억 개의 파라미터를 갖춘 신경회로망을 구축했다. 이는 2012년 구글 브레인의 신경회로망보다 6.5배 큰 것이다. 그러나 구축 비용은 현저히 줄어들었다. 스탠포드대학과 엔비디아는 이 같은 결과를 실은 논문(Deep Learning with COTS HPC Systems)을 국제기계학습학술대회(ICML) 2013을 통해 발표했다. 와이어드는 논문 발표 직후 “수백만 달러에 달하는 구글 브레인을 보다 저렴하게 이용할 수 있게 됐다”고 평가했다.
젠슨 황 엔비디아 최고경영자(CEO)는 25일(현지시각) 미국 산호세에서 열린 자체 개발자 생태계 컨퍼런스 GTC(GPU Technology Conference) 2014에서 “엔비디아 GPU를 활용하면 구글 브레인과 동등한 성능을 가진 시스템을 단 3만3000달러에 구축할 수 있다”라며 “소비전력은 4kW로, CPU만 쓰는 구글 브레인과 비교하면 매우 적은 수준”이라고 말했다. 엔비디아는 이날 현장에서 뉴욕대학교가 개발한 강아지 품종을 판별 소프트웨어 데모를 보여주기도 했다.
엔비디아의 GPU 병렬 프로그래밍 언어인 쿠다(CUDA)를 활용해 이러한 기계학습 서비스를 개발하고 있는 기업도 다수다. 그래픽 소프트웨어 전문업체인 어도비는 사용자의 성향을 파악하고 포토샵 등에서 특정 글꼴 등을 추천하는 기계학습 기술을 개발하고 있다. 온라인 영상 콘텐츠 전문업체인 넷플릭스는 사용자의 영화시청 패턴을 분석하고 추천하는 기능을 개발하고 있다. 중국 검색 업체인 바이두는 얼굴 및 음성 인식, 번역, 광학문자인식(OCR), 온라인 광고 최적화에 기계학습을 활용한다. 러시아 검색엔진인 얀덱스도 웹 검색 결과의 품질을 개선하기 위해 엔비디아 GPU를 활용하고 있는 업체 가운데 하나다.
황 CEO는 이외에도 일본 자동차 전장 업체인 덴소, 온라인 사진 공유 서비스인 플리커, 페이스북과 IBM 이 엔비디아의 GPU를 활용해 기계학습 기술 및 서비스를 개발하고 있다고 밝혔다. GPU 병렬 컴퓨팅 기술이 빅데이터 분석에서 한 발 더 나아가 기계학습 분야로 보폭을 넓히고 있다.
<한주엽 기자>powerusr@ddaily.co.kr
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52