[디지털데일리 백지영기자] ‘빅데이터’ 시대에 대비하기 위한 HP의 전략은 무엇일까. 최근 EMC와 오라클, IBM 등 경쟁사들은 ‘빅데이터’를 위해 하둡과 같은 오픈소스 소프트웨어를 자사의 솔루션에 결합시키는 작업을 하고 있다.
HP도 오픈소스 하둡을 결합시킨 솔루션과 서비스, 레퍼런스 아키텍처 등을 출시하며 경쟁에 합류했다. 경쟁사에 비해 다소 늦은 행보지만, 고객이 직접 다양한 레퍼런스를 선택해 구축할 수 있다는 개방성을 강조하고 나섰다.
하둡은 오픈소스 기반의 분산 데이터 프로세싱 기술이다. 서버의 대용량 클러스터를 이용해 단일화된 스토리지 환경을 제공, 정보를 효율적으로 관리할 수 있다.
4일부터 미국 라스베이거스에서 개최된 ‘HP 디스커버 2012’ 컨퍼런스에서 HP는 아파치 하둡을 결합시킨 다양한 솔루션 및 서비스 등을 발표했다. 이번에 발표된 것이 ▲하둡 레퍼런스 아키텍처 ▲아파치 하둡을 위한 HP 앱 시스템 ▲오토노미 IDOL과 연결된 데이터 처리 플랫폼 ▲빅데이터 전략 워크샵 등이다.
던컨 캠벨 HP 컨버지드 인프라스트럭처(CI) 담당 부사장은 “많은 기업들은 오픈소스 소프트웨어인 아파치 하둡을 도입하고 있고, 이는 많은 이점을 갖고 있다”며 “그러나 이를 위해선 플랫폼과 강력한 관리 툴이 필요하다”고 설명했다.
이에 따라 HP는 이번에 발표된 다양한 솔루션 및 서비스 등을 통해 하둡 클러스터 환경을 최적화시키기 위한 도입 및 설치 단계를 지원한다.
예를 들어 이번에 출시한 ‘아파치 하둡을 위한 앱 시스템’은 실시간 도입 버튼만 누르면 하둡 클러스터를 생성할 수 있도록 하는 것이 특징이다. 이는 자사의 x86 서버(프로라이언트 DL380 G8)과 버티카 애널리틱스 플랫폼, 네트워킹 5830 등과 통합돼 쉽게 구축이 가능하다.
또한 하둡 레퍼런스 아키텍처의 경우, 클라우데라나 호튼웍스, MapR과 같은 업체들과의 협력을 통해 고객 환경에 적합한 플랫폼 구축이 가능하도록 한다. 이는 고객들이 빅데이터를 관리하는 데에 있어서 리스크를 줄이고, 전략적 데이터 분석에 집중할 수 있게 한다는 설명이다.
이밖에도 빅데이터 전략 워크숍과 로드맵 서비스, 올웨이즈-온 서포트 서비스 등을 통해 기업이 하둡 플랫폼을 도입하는 것부터 기업에 맞는 서비스 로드맵 등을 제공한다.
캠벨 부사장은 “EMC나 오라클 등과 같은 경쟁사들은 단일화된 솔루션을 적용시키는 반면, HP는 고객에게 선택할 수 있는 권한을 준다”고 지적하며 “특히 이들 기업에 비해 HP의 아파치 하둡 솔루션은 높은 성능을 기록하고 있다”고 말했다.
실제 아파치 하둡 테라소트 벤치마크에 따르면, HP 아파치 하둡 솔루션(18노드 HP 프로라인트 DL380 G8 클러스터 기반)은 10테라바이트(TB) 이상의 데이터세트를 5128초(1.5시간) 내에 처리할 수 있다. 이는 오라클과 SGI 하둡 솔루션보다 각각 3.8배와 2.6배 빠른 것이다.