클라우드

아파치 타조, NoSQL도 품었다…0.10 버전 출시

심재석

[디지털데일리 심재석기자] 빅데이터 플랫폼 전문 업체 그루터(대표 권영길)는 오픈소스 기반의 빅데이터 분석 엔진 ‘아파치 타조’의 0.10 버전이 공개됐다고 24일 밝혔다.

아파치 타조는 대용량 데이터 웨어하우스(DW) 엔진으로, 하둡 파일 시스템(HDFS)에 저장된 데이터셋을 SQL을 통해 분석할 수 있다. 기존의 하둡 분석 프레임워크인 맵리듀스는 기술 습득이 어렵고 복잡하다는 비판을 받아왔다. 그루터 측에 따르면, 타조를 이용하면 개발자들에게 익숙한 표준 SQL을 통해 하둡 및 NoSQL 상의 데이터를 분석할 수 있다.

타조는 국내 기업인 그루터가 개발을 주도하고 있으며 구글, NASA, 마이크로소프트, 호튼웍스 등의 글로벌 기업과 다음카카오, 라인 등의 개발자들이 참여하고 있다.

이번에 발표된 0.10 버전은 다양한 데이터 포맷과 저장소를 지원하고, 기존 데이터 분석 도구와 쉽게 연결할 수 있도록 기능이 강화됐다고 회사 측은 설명했다.

특히, 표준 데이터베이스 연결 도구인 JDBC 드라이버가 개선됐다. 더 작은 용량의 파일 하나로 새롭게 디자인 돼 각종 비즈니스인텔리전스(BI) 도구, 통계 분석 소프트웨어인 R, SQL 도구 등 다양한 분석도구와 더욱 쉽게 연결할 수 있다고 고 회사 측은 강조했다. 펜타호(Pentaho), 스팟파이어(Spotfire)와 같이 기존에 사용하던 BI 도구에서 직접 타조에 연결해 대용량 데이터를 분산 처리하고, 그 결과를 바로 불러와 고급 분석과 시각화에 사용할 수 있게 된 것이다. 이를 통해 데이터 분석가들은 더욱 편리하게 타조를 사용할 수 있다.

아울러 하둡(HDFS)뿐 아니라 NoSQL 데이터베이스인 HBase를 표준 SQL로 분석할 수 있는 기능도 추가됐다.

이 외에 아마존웹서비스(AWS) 환경에서 더욱 쉽게 하둡 및 S3 에 저장된 데이터를 분석할 수 있게 됐고, 웹 데이터 전송에 널리 쓰이는 JSON 형식의 데이터를 별도의 변환 작업 없이 바로 SQL로 분석할 수 있는 기능이 추가되기도 했다.

그루터 권영길 대표는 "아파치 타조는 기존 상용 DW를 보완하거나 대체하는 빅데이터 DW 시스템으로 여러 기업에서 이미 활용되고 있다”고 전하고 “전통적인 기업 내 IT 환경 외에도 AWS, 오픈스택과 같은 클라우드 환경에서도 빅데이터를 빠르게 분석할 수 있다”라고 밝혔다.

그는 또 “기업은 타조의 도입으로 비용 대비 효과 뿐 아니라 대용량 데이터 처리에 애로사항 이었던 속도 문제를 해결함으로써 속도 문제 때문에 하둡 도입을 주저하던 기업들에게 실질적인 도움을 주어 빅데이터 분석 활성화에 큰 도움이 될 것"이라고 덧붙였다.

<심재석 기자>sjs@ddaily.co.kr

심재석
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널