클라우드 서비스

정부통합센터 “하둡 기반 빅데이터 플랫폼 구축”

심재석 기자

[디지털데일리 심재석기자] 정부통합전산센터의 빅데이터 플랫폼은 일단 하둡을 비롯한 오픈소스 소프트웨어 중심으로 구축할 예정입니다. 상용 소프트웨어를 배제하는 것은 아니지만, 오픈소스로 하기 어려운 부분만 상용 소프트웨어를 도입할 것입니다.

 

정부통합전산센터 하승철 정보자원관리 과장은 17 서울 대치동 서울산업통상진흥원에서 열린정부3.0 구현을 위한 빅데이터 기술 세미나에서 향후 빅데이터 플랫폼 구축 전략에 대해 이같이 밝혔다.

 

하 과장에 따르면, 정부통합전산센터는 x86 등 표준 플랫폼으로 클러스터를 구성한 후 하둡파일시스템과 맵리듀스를 비롯해, 리눅스, 오지(Oozie), 스쿱(Sqoop), 하이브, 피그, H베이스 등 오픈소스 기반의 하둡 에코시스템을 활용해 빅데이터 플랫폼을 구축할 계획이다.

 

현재 사업이 발주돼 있으며, 5월 중 사업자를 선정할 예정이다. 하 과장은 올해는 이같은 기술을 기반으로 일단 프로토타입을 만들어 볼 것이라면서 센터는 빅데이터 플랫폼을 제공하고, 부처는 데이터에만 집중할 수 있도록 할 것이라고 말했다.

 

센터 측이 그리는 그림은 제2의 아마존웹서비스와 같은 클라우드 컴퓨팅 서비스를 만드는 것이다. 클라우드 컴퓨팅은 이미 센터 내에서 확산 단계에 돌입했고, 이제는 빅데이터 차례라는 것이다. 

 

아마존은 EMR(엘라스틱 맵리듀스)라는 빅데이터 서비스를 제공한다. 사용자들이 데이터를 업로드 하면 클릭 몇 번만으로 분석 결과를 얻을 수 있다. 하 과장은 아마존과 비슷하게 가고 싶다면서 부처에 다양한 요구 있더라도 분석 플랫폼은 같이 있도록 하겠다고 밝혔다.

 

센터 측 로드맵에 따르면, 올해까지 파일럿 프로젝트를 통해 프로토타입을 만들고 내년부터 2015년까지 센터에 빅데이터 플랫폼을 구축할 예정이다. 이 때 각 부처에 빅데이터 플랫폼 서비스를 제공해 2016년 이후 전 부처에 빅데이터를 확산할 계획이다.

 

하 과장은 센터가 지향하는 빅데이터 플랫폼은 오픈 플랫폼을 지향한다면서 각 부처들이 법이 허용하는 한도 내에서 분석결과를 서로 공유하고 공개할 수 있는 체계를 만들겠다고 설명했다.

 

<심재석 기자>sjs@ddaily.co.kr

심재석 기자
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널