솔루션

[지상중계/오픈테크넷 2013] “빅데이터 분석도 새로운 방법 적용해야”

이민형 기자
[디지털데일리 이민형기자] 빅데이터(Big Data)가 IT업계의 화두로 떠오르면서 하둡과 같은 오픈소스 기반 기술이 지속적으로 거론되고 있다.

아파치(Apache)에서 진행하고 있는 아파치 하둡 프로젝트는 안정적이이서 신뢰할 수 있고, 확장이 용이하며, 분산 컴퓨팅 환경을 지원하는 오픈소스 소프트웨어다.

국내에서도 빅데이터 열풍이 불어오면서 하둡에 대한 관심도 높아지고 있는데, 한국 시장에서도 2018년께는 하둡과 관련된 시장이 1000억원을 넘어설 것으로 예측되고 있다.

21일 서울 양재동 엘타워에서 <디지털데일리> 주최로 열린 ‘오픈테크넷 서밋 2013’에서 심탁길 SK C&C 부장<사진>은 ‘성공적인 데이터 비즈니스를 위한 오픈소스 기술 활용 전략’에 대해 발제했다.

그는 “빅데이터와 관련된 시장이 지속적으로 커지고 있는 가운데, 한국 시장도 2018년에는 1000억원이 넘어설 것으로 예상되고 있다. 전망은 밝지만 이를 체감하기는 아직 힘든 것이 사실이다”라며 “빅데이터를 어떻게 활용함에 따라 기업의 비즈니스의 방향은 달라질 수 있다”고 강조했다.

심 부장은 빅데이터가 적용된 다양한 사업 유형을 소개하며 지금 모델에서 더 확장된 모델로 나아갈 수 있는 방법을 제안했다.

그는 “최근 온라인 시장의 발달로 소비자들은 획일화된 베스트 상품 구매보다 개인의 취향에 따라 상품을 검색, 구매하는 패턴을 보이고 있다. 이에 기업은 베스트셀러 상품 개발 이외에 오랫동안 판매할 수 있는 니치 마켓 마케팅에 집중하고 있는 상황”이라며 “이를 위해 기업들은 사용자들의 성별, 나이, 주거지, 직업 등으로 분석하는 방식을 사용해왔다”고 말했다.

그러나 이러한 방식은 한계점을 가진다. 개인적 성향이 점차 강해짐에 따라 소비자의 성별, 나이, 거주지, 직업 등으로 분류하긴 힘들기 때문이다.

심 부장은 “개인화 알고리즘을 통해 회원의 프로파일보다는 과거 구매정보를 바탕으로 그룹을 만들고, 이들 그룹이 공통적으로 선호하는 제품을 추천하는 방식을 써야한다”고 강조했다.

현재 이 시스템은 아마존에 적용돼 있으며 점차 적용 기업이 증가하고 있는 상황이다.

이러한 시스템을 적용하기 위해 하둡을 사용하되, 새로운 패턴을 적용해야한다고 심 부장은 강조했다.

그는 “과거 하나의 패턴으로 DB어플라이언스를 구축했다면, 이제는 앞단에 하둡 레이어를 넣고 뒤세 쿼리엔진, RDB, NoSql 등을 적용한 뒤 마지막에 DB어플라이언스를 적용하면 성능은 높아지고 고유의 영역으로 구분된다”고 설명했다.

<이민형 기자>kiku@ddaily.co.kr
이민형 기자
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널