[오픈테크넷 서밋 2014] 하둡개발 환경의 편의성 위한 플라밍고 플랫폼
[디지털데일리 이상일기자] 하둡(Hadoop)은 빅데이터 분석에 있어 각광받는 기술이지만 사용하기가 쉽지는 않다. 하지만 하둡의 성능 및 활용을 최대로 이끌어내기 위한 다양한 프로젝트가 이어지고 있어 하둡 생태계는 활성화되고 있다.
13일 서울 양재동 엘타워에서 개최된 ‘오픈테크넷 서밋 2014’에서 ‘쓰기 쉬운 하둡(Hadoop) 기반 빅데이터 플랫폼 아키텍처 및 활용방안’을 발표한 오픈프론티어랩 박치완 개발자는 “빅데이터를 활용하기 위해서는 데이터 사용자가 자주, 빨리 분석을 수행해볼 수 있어야 한다. 하지만 아직은 하둡이 기존 시스템보다 다루기 어려운 것은 사실”이라고 설명했다.
오픈프런티어랩은 국내외 오픈소스 프로젝트를 수행하는 공개SW 커미터(Committer)를 지원하는 정부지원(정보통신산업진흥원) 프로그램이다.
박 개발자는 “아파치 하둡이 소개된 이후 사용하기 어렵다는 지적을 보완하기 위해 다양한 기술이 나왔다”며 “하지만 터미널 위주의 데이터가 주를 이루다 보니 기존 환경에 익숙한 개발자들에겐 생소할 수 있다”고 설명했다.
이렇다보니 하둡 기술을 쉽게 사용할 수 있는 다양한 기술도 꾸준히 소개되고 있다.
박 개발자는 “하둡 클러스터를 쉽게 배포하고 관리해 줄 수 있는 ‘암바리(Ambari)’, 하둡관련 프로젝트를 하나로 묶어 사용할 수 있게 해주는 솔루션인 ‘클라우데라 휴(Cloudera Hue)’ 등 다양한 솔루션이 나오고 있어 하둡 생태계를 확장시키는데 도움을 주고 있다”고 설명했다.
한편 이 자리에서 오픈프론티어랩에서는 정부 지원을 받아 진행하고 있는 ‘플라밍고(Flamingo)’ 프로젝트를 소개했다. 플라밍고는 웹 기반 유저환경(UI)에서 하둡 컴포넌트를 다루는 것으로 하둡 개발환경에 생소한 개발자들고 편하게 다가갈 수 있게 해준다.
기능적으로 기존에 사용하던 맵리듀스(Mapreduce)에 통합해 워크플로우(Workflow)에 적용할 수 있고 하이브 테이블(Hive Table)은 쿼리(Query)문 없이 UI로만 가능하는 등 편의성이 강조된 기능이 채택됐다.
박 개발자는 “플라밍고에선 향후 기본적으로 제공되는 컴포넌트를 보강하는 한편 하둡 2.0 지원, 아마존 EMR 등 하둡 기반 엔터프라이즈 플랫폼을 지원할 계획”이라고 밝혔다.
<이상일 기자>2401@ddaily.co.kr
농협은행마저 점포 폐쇄 릴레이 동참…경영환경 개선하기 위함이라지만 고객 편의는 '뒷전'
2024-11-24 10:46:03비트코인 9만9800달러까지 상승…돈 끌어모으는 자석?
2024-11-24 10:44:42"기세 심상치 않네" 랜섬허브 공격, 한국도 안전하지 않다
2024-11-24 09:49:38카카오뱅크, '가명 정보 활용 경진대회' 4년 연속 수상
2024-11-24 09:00:00[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50