금융IT

코스콤 빅데이터 센터 3분기 중 출범, 플랫폼·콘텐츠 제공 사업 추진

이상일

강태홍 코스콤 자본시장IT연구소장
강태홍 코스콤 자본시장IT연구소장
[디지털데일리 이상일기자] 코스콤이 자본시장을 위한 빅데이터 센터 구축을 오는 3분기까지 완료하고 연내 증권사 등을 대상으로 한 서비스를 출시한다는 계획이다. 이를 위해 4월 중으로 업체를 대상으로 센터 구축을 위한 제안요청서(RFP) 발송을 진행한다는 방침이다.

코스콤은 빅데이터센터를 별도 조직화하고 여의도 코스콤 본사에 관련 인프라를 구축할 예정이다. 우선 10억원에서 20억원 정도의 비용을 투자할 계획으로, 다만 수요 증대에 따라 분석 용량 및 데이터 크롤링이 확대될 경우 인프라 확충 및 인력 채용 등이 이뤄져야 하는 만큼 장기적으로 상당한 비용이 투입될 것으로 전망된다.

지난 27일 코스콤은 여의도 한국거래소 대강당에서 개최된 ‘빅데이터 기반의 주가예측 모델’을 주제로 빅데이터 센터 구축 방안 및 빅데이터 기반 주가 예측 서비스 추진 방안을 발표했다.

앞서 코스콤은 빅데이터 서비스를 위한 파일럿 시스템 구축을 완료하고 고도화 사업을 거쳐 지난해 12월부터 지난 1월까지 2개월 간 모 증권사를 대상으로 빅데이터 시범서비스를 진행한 바 있다.

코스콤은 이 때의 경험을 바탕으로 단기 지수 예측 모형 정교화와 예측결과, 설명변수 정제화를 이끌어 냈다.

강태홍 코스콤 자본시장IT연구소장은 “2달간 빅데이터를 활용한 자산운영에 적용해 본 결과 주가 예측을 60% 이상 적중시켰다. 60%란 수치는 업계에서 신뢰할 수 있는 수준으로 보고 있다”며 “다만 시장 급 변동 시 예측율을 재고하고 감성점수 활용도 등을 높여야 하는 과제가 도출되기도 했다”고 밝혔다.

코스콤은 빅데이터를 이용한 주가예측 서비스를 위해 비정형 데이터는 2012년 1월부터의 자본시장 데이터와 29개 연계 사이트 데이터, 과거 10년 치 뉴스 데이터를 적재했다. 또 정형 데이터의 경우 자체 보유한 10년치 7억5000여건을 초기 적재하고 한국 금융정보연구 서비스(KRDS) 마켓 데이터 및 통계청 통계 데이터 입수(10년치 100만건) 등을 진행했다.

이러한 데이터를 기반으로 코스콤은 다양한 빅데이터 소스에서의 데이터 수집/저장, 수집된 데이터 분석, 데이터 분석 결과 저장, 시각화 영역으로 시스템을 구성했다.

파일럿 시스템의 경우 총 18대의 서버로 구성돼 있다. 6대는 RDBMS(Relational Database Management, 8대는 하둡 플랫폼, 4대는 수집 및 분석 활용에 사용되고 있다. 또 SW 구성으론 분석업무 지원을 위한 대용량 병렬처리(MPP) 기반 RDBMS와 데이터 분석 툴로 ‘R’, 데이터 시각화 솔루션으로 ‘스팟파이어’를 적용했다.

한편 주가 예측 서비스에 있어 가장 중요한 분석모델에 있어선 SNS에서 오고가는 단어에 가중치를 부여한 ‘감성점수’를 이용한 단기예측 모델인 ▲하이브리드 모델과 통계 데이터를 활용한 ▲조인트 프리미엄 모델을 개발했다.

이를 바탕으로 고객은 최근 이슈화된 단어, 즉 각 종목의 ‘형태소’ 순위 중 신규로 20위 이내에 포함된 단어들을 웹으로 볼 수 있게 되는 한편 전일 종목별 예측 결과 집계표, 이전 기간의 예측 결과, 향후 5일간의 예측치 결과를 화면을 통해 제공받게 된다. 또 주가의 흐름과 예측 값의 오차를 그래프로 표시 하는 기능도 제공된다.

코스콤은 빅데이터 센터가 구축되는 대로 상용 서비스를 곧바로 진행한다는 계획이다.

한편 코스콤은 빅데이터 사업을 두 가지 방향으로 진행한다는 복안이다. 플랫폼 구축 사업과 콘텐츠 제공 사업이 그것으로 플랫폼 구축의 경우 데이터와 장비에 대한 투자여력, 분석인력이 있는 증권사에게는 코스콤의 경험과 플랫폼을 제공하는 한편 콘텐츠 사업의 경우 주가 예측 등의 콘텐츠와 지표 개발에 부담을 느끼는 증권사에 이를 제공할 방침이다.

<이상일 기자>2401@ddaily.co.kr

이상일
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널