소프트웨어

빅데이터 분석엔진 ‘아파치 타조’ 새 버전 출시…엔터프라이즈 활용 늘어

백지영

[디지털데일리 백지영기자] 차세대 빅데이터 분석 엔진으로 주목 받아 온 아파치 타조(Apache Tajo)의 새 버전이 최근 공식 발표됐다. 타조 개발에 주도하고 있는 그루터(www.gruter.com 대표 권영길)는 29일 아파치 재단이 데이터 통합 기능과 호환성이 한층 강화된 아파치 타조 버전 0.11.0을 공식 릴리즈 했다고 밝혔다.

타조의 새 버전은 다양한 데이터 포맷과 저장소를 지원해 데이터를 더욱 쉽게 통합하고 연계 분석할 수 있도록 한 것이 특징이다.

타조 프로젝트 의장인 그루터 최현식 박사는 “기존 DB 사용자에게 익숙한 테이블 스페이스 개념을 도입하고 JDBC 저장소를 추가해 하둡은 물론 아마존웹서비스(AWS)와 구글 등의 클라우드 저장소, NoSQL, 오라클 등의 기존 관계형 데이터베이스 시스템(RDBMS)에 흩어져 있는 데이터들을 타조로 쉽게 통합할 수 있게 됐다” 고 설명했다.

반정형 또는 비정형 데이터를 유연하게 처리할 수 있는 기능도 강화됐다. 타조는 웹 데이터 전송과 로그 저장에 널리 쓰이는 JSON 형식의 원본 데이터를 별도의 변환 작업 없이 바로 SQL로 분석할 수 있다. 새 버전에서는 중첩 구조로 이루어진 복잡한 데이터 포맷을 지원하고, 테이블 구조(스키마)를 미리 정의하지 않고도 질의 실행 시점에 자유롭게 지정할 수 있게 돼 데이터 관리와 분석이 한층 쉬워졌다.

또한 ORC 파일 형식 지원이 추가돼 다른 빅데이터 분석 솔루션과의 연계도 더욱 쉬워졌다는 설명이다. 특히 ORC 파일 형식을 많이 이용하던 기존 하이브 사용자들은 기존 데이터 그대로 타조를 이용해 3배 이상의 성능 향상을 얻을 수 있다.

한편 아파피 재단은 게임과 에너지, 광고 플랫폼 등 다양한 분야에서 타조를 빅데이터 분석에 활용하고 있는 사례가 늘고 있다고 밝혔다. 기존 엔터프라이즈 데이터웨어하우스(DW) 사용자들이 기존 시스템을 확장하거나 보완하기 위해 표준 SQL을 지원하는 타조를 도입하는 사례도 늘고 있다는 설명이다.

뮤직 서비스 멜론의 경우, 하이브로 하던 기존 분석 작업들을 타조로 전환해 최소 1.5배에서 수십 배의 성능 향상을 체감했다고 밝혔다. 멜론은 기존에 엔터프라이즈 DW시스템인 IBM 네티자에서 했던 분석 작업에도 타조를 도입해 비용 효율적인 DW 시스템을 운영하고 있다.

권영길 그루터 대표는 “타조는 이미 다양한 프로덕션 환경에서 안정적인 성능을 보장하고 있어 기술 성숙도 측면에서 엔터프라이즈 솔루션으로 성장했다”며 “이번 0.11.0 릴리즈를 계기로 타조의 엔터프라이즈 적용이 더욱 탄력을 받을 것”이라고 강조했다.

한편 그루터는 오라클, 아마존, 구글 등 글로벌 업체들과 기업 내부 및 클라우드 환경에서 타조 확산을 위한 협력을 강화하고 있다.

<백지영 기자>jyp@ddaily.co.kr

백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널