솔루션

[EMC 미션콘트롤] 빅데이터로 본 미국대선, 승자는 누구?

이상일 기자

 

[디지털데일리 이상일기자] ‘더 휴먼 페이스 오브 빅데이터(THE HUMAN FACE OF BIG DATA)’ 프로젝트의 주요 후원사인 EMC는 이번 프로젝트를 통해 최근 100만명의 트위터리안을 대상으로 트윗 분석을 진행했다.

 

특히 이번 분석에서는 미국 대선 주자에 대한 트위터 상의 선호도 조사가 주목받았다.

 

EMC는 그린플럼 기술을 기반으로 트위터 상에서 멘션되는 글들을 분석해 트윗상에서 언급되는 미국 대선주자들을 분석했다. 오바마와 롬니 양 대선주자가 트위터에서 얼마나 등장하는 지를 통계 낸 것.

 


트위터에 한정한 결과만을 보면 오바마가 롬니를 61%대 39%로 압도하고 있다. 하지만 이는 트위터 상에서 이들 대선주자들이 언급된 빈도수만을 분석한 것이다.

 

트위터 상에서 양 후보에 대한 멘션이 부정적인지 아니면 긍정적인지를 분석하기는 쉽지 않기 때문이다. 또 트위터를 하는 모집단의 정치적인 성향을 사전에 파악하기도 힘들다.

 

그렇기 때문에 트위터에서 많이 언급됐다고 해서 오바마가 미국 대선에서 승기를 잡았다고 분석하는 것은 무리가 있다.

 

그렇다면 EMC는 왜 이러한 미 대선주자에 대한 언급 빈도 분석을 진행한 것일까? 이에 대해 EMC 마이클 호워드 그린플럼사업부 부사장은 “빅데이터는 시그널과 잡음으로 구성된다. 하지만 이것보다는 이러한 현상이 있다는 것을 인지하는 것이 중요하다”고 강조했다.

 

즉 트위터에서 단순히 특정인이 유난히 많이 언급되는 자체가 빅데이터로서 가치를 가진다는 설명이다.

 

무의미한 정보에서 유의미한 정보를 이끌어내는 빅데이터의 기본 사상에 입각해볼 때 EMC의 답변은 다소 모호한 측면이 있다.

 

하지만 EMC는 빅데이터가 사회와 결합하고 있는 시점에서 “SNS를 기반으로 한 빅데이터 분석에서 기존 통계와 같은 오차범위나 신뢰도 수준을 얘기하는 것은 넌센스”라고 지적한다.

 

EMC가 주요 후원자로 참여하고 있는‘더 휴먼 페이스 오브 빅데이터’ 프로젝트 자체에서도 사람들의 선호도를 수치화해 나타내고 있지만 그것 자체가 큰 의미를 가지는 것은 아니라는 것이 EMC의 설명이다. 

 

다만 시간의 흐름을 통해 양 대선주자에 대한 입장 변화는 눈에띄게 달라지는 것을 확인할 수 있었다.

 

 

EMC에 따르면 시간이 지날수록 양 대선후보에 대한 입장을 정리하지 못했던 트위터리안이 점차 지지후보를 굳혀가고 있음이 드러났다.

 

사진상 주황색으로 표시됐던 부분이 트위터 멘션을 통해 대선 후보에 대한 지지입장을 보류했던 사람이다. 하지만 시간이 지나자 이들이 대부분 지지후보에 대한 마음을 굳혀가는 것을 알수 있다.

 

트위터에 대한 멘션 분석을 통해 누가 대선후보가 될 것인가를 전망할수는 없지만 후보에 대한 지지도와 대선을 대하는 사람들의 심리변화를 관찰할수 있었다는 것이 EMC의 설명이다.

 

<싱가포르=이상일기자>2401@ddaily.co.kr

이상일 기자
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널