인터넷

[2017 대선] '구글 빅데이터' 대선 결과 적중했나…여론조사보다 정확하지는 않아

이대호

[디지털데일리 이대호기자] 지난 2주간의 공식 선거기간동안 주요 후보 캠프에서 여론 조사 지지율만큼 많이 언급했던것이 '구글 빅데이터'였다.

과연 구글은 제19대 대선과 관련한 민심을 어떻게 파악하고 있을까. 구글의 빅데이터 분석 서비스인 구글트렌드(trends.google.com)는 하루 단위로 검색량 기반의 관심도 변화를 살펴볼 수 있어 인터넷 민심이 어떻게 흘러가는지 파악하기에 용이하다. 그러나 네이버 대비 검색량 자체가 적어 국내 여론을 대표할 만한 의미를 부여하긴 쉽지 않다.

지난 한달간 구글트렌드가 분석한 웹검색 기반의 관심도 변화엔 인터넷 민심이 널뛰기한 상황이 잘 반영돼 있다. 대선 레이스 초부터 주목받은 안철수 후보는 지난 한달간 구글트렌드 분석 초기에서도 후보자 간 관심도 1위를 기록하고 있다.

그러다 4월 16일 문재인 후보와 잠시 역전이 일어났다가 다음날인 17일 다시 인기도 1위를 되찾는다. 공식 선거운동 시작일인 17일엔 안 후보에 관심이 쏠렸다고 볼 수 있다. 그러나 이후부터 문 후보가 관심도 1위를 이어간다.

지난달 23일엔 홍준표 후보가 인기도 1위를 차지한다. 그 즈음에 ‘돼지발정제’ 논란이 불거져 사퇴 주장이 한참 쏟아져 나왔다. 부정적 의미의 인기도였던 셈이다.

4월 말부턴 문 후보와 홍 후보 간의 인기도 다툼이 벌어진다. 이 시점부터 안 후보는 검색 관심도만 보면 동력을 잃은 것으로 보인다. 수차례 TV토론을 거치면서 부정 여론이 거세졌고 안 후보가 지지율에서 손해를 봤다는 분석이 제기됐다.

또한 안 후보를 향해있던 보수 표심도 대선 운동 막판에 가까워지면서 홍 후보에게 결집되는 현상이 나타났다. 5월 초 검색 관심도 그래프에선 홍 후보가 문 후보를 잠깐 제치기도 했다.

당시 홍 후보는 자신의 페이스북에 “미국 대선을 정확히 맞췄던 구글 트렌드는 오늘 아침(5월 2일) 기준으로 제가 43, 문재인 31, 안철수 23”이라며 “이제 승세로 돌아섰다”고 자신감을 보인 바 있다.

공직선거법상 여론조사 공표 금지 기간(5월 3일~9일), 구글트렌드 관심도를 보면 문 후보가 1위를 유지하는 가운데 홍 후보와 안 후보가 각각 2,3위를 기록했다. 관심도 비중에서도 차이를 두고 있다. 이는 9일 대선 출구조사와 득표 순위와도 맞아떨어진다.

그러나 후보 지지와 상관없이 부정적 이슈까지 포함한 웹검색 기반의 관심도 반영이기 때문에 구글트렌드가 득표 비중까지 내다보긴 쉽지 않다.

이번 대선에선 60대 이상의 표심이 홍 후보에게 쏠렸다. 인터넷보다 TV방송과 오프라인 소통에 익숙한 이들 세대의 여론을 웹검색이 잡아내긴 쉽지 않다. 검색 빅데이터가 득표율까지 잡아내기 힘든 이유다.

구글트렌드에 나타난 대선 후보자 간 지역별 관심도를 보면 전체적으로 실제 득표 비중과 비슷하게 나타났다. 대구에서 나타난 홍 후보에 쏠린 민심은 정확히 반영했다. 다만 경북에서도 홍 후보의 압도적인 득표가 나타났는데 구글트렌드엔 반영되지 않았다. 앞서 언급한대로 세대별 표심을 잡아내지 못한 결과로 분석할 수 있다.

결과적으로, 구글 트렌드 분석이 대선 결과를 어느 정도 예측했다고는 할 수 있지만 국내에선 모집단 1000명 남짓의 일반 여론 조사와 비교해 더 정확하다고 할 수는 없다.

<이대호 기자>ldhdd@ddaily.co.kr

이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널