소프트웨어

[2012 금융IT 컨퍼런스] HP, 빅데이터 분석에 ‘버티카’가 효과적…입출력발생량↓&#

이대호 기자
- ‘버티카’, 칼럼기반 DBMS…12가지 인코딩 기법 제공

[디지털데일리 이대호기자] HP가 빅데이터 분석을 위한 차세대 데이터베이스관리시스템(DBMS)으로 자사의 ‘버티카’(Vertica)를 내세웠다.

22일 한국HP(www.hp.co.kr 대표 함기호)의 이전건 부장<사진>은 <디지털데일리>가 서울 플라자호텔에서 개최한 ‘2012 전망, 금융 IT 이노베이션 컨퍼런스’를 통해 자사의 DBMS인 ‘버티카’를 소개했다.

‘버티카’는 지난 3월에 HP가 인수한 DBMS 회사 이름이자 제품명이기도 하다. HP와 합병 이후 ‘버티카’에 투자가 이어졌고 통합 솔루션으로 레퍼런스를 확보 중이다.

이 부장은 “5년(2006~2011년)동안 500개 레퍼런스(고객)를 확보했다”며 “타 경쟁사가 10~20년 쌓아올린 레퍼런스 수를 5년만에 따라잡은 것”이라고 ‘버티카’의 경쟁력을 강조했다. 한국은 올 여름부터 비즈니스가 시작돼 레퍼런스를 만드는 중이다.

‘버티카’의 특징은 칼럼(Column)기반의 DBMS라는 것이다. 쿼리(Query) 수행에 필요한 칼럼만을 읽고 분석한다. 이는 정렬을 거쳐 불필요한 검색을 최소화해 효율적인 입출력환경을 제공하기 때문이다.

그는 “테이블에 칼럼이 100개 있으면 SQL(구조화질의어)가 모든 데이터를 읽어 들여 쓰지도 않는 영역까지 메모리에 올린다”며 “칼럼처리 DB는 데이터 저장을 칼럼으로 쪼개 저장하는데 이렇게 되면 100개 칼럼이 있어도 물리적으로 (중복되지 않는) 3개의 파일만 읽어 들이면 된다”고 설명했다.

이 부장은 ‘버티카’의 압축률도 강조했다. 내장된 데이터 인코딩 및 압축 알고리즘이 90% 이상의 압축률을 제공한다는 것이다. 인코딩한 채로 데이터 처리도 가능하다. 델타값과 블록 안에서 겹친 값을 처리하는 등 12가지 인코딩 기법을 활용할 수 있다.

그는 “1테라바이트 DB가 10기가 3기가로 줄어든 사례가 있다”며 “기존 DW(데이터웨어하우징) 시스템은 I/O 하드웨어에 투자할 것이냐 문제인데 버티카는 I/O에 대한 고민이 필요 없다. 기존 서버 당 필요한 I/O의 1/10 수준에도 퍼포먼스를 낸다”고 말했다.

이 밖에 이 부장은 ‘버티카’의 강점으로 ▲병렬 최적화 적재 ▲대용량 확장성 제공 ▲업무부하 관리 기능 ▲데이터 이중화에 의한 무중단 지원 등을 꼽았다.

이 부장은 “최근 하둡과 연동돼 빅데이터가 중점적으로 관리하는 파일형태의 언스트럭처(비정형)의 결과가 스트럭처(정형) 데이터로 나올 수 있다. 이를 ‘버티카’로 같이 분석하는 기능도 제공한다”고 덧붙였다.

또 이 부장은 미국의 유명 소셜게임사 징가(Zynga)도 ‘버티카’의 고객이라고 소개했다. 징가는 115개의 대용량 노드 클러스터를 사용 중이다. ‘버티카’는 소프트웨어나 하드웨어와 결합한 어플라이언스 형태, 클라우드로 서비스가 제공된다. VM웨어 같은 가상화 솔루션에도 올릴 수 있다.

<이대호 기자>ldhdd@ddaily.co.kr
이대호 기자
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널