빅데이터가 어떤 식으로 실생활에 이용될 수 있는지 명쾌하게 보여준 것이 구글 검색 빈도를 통한 독감 발병 예측이다. 구글은 사람들이 독감에 걸렸을 때 온라인에서 검색하는 대표적인 키워드 40개를 뽑은 뒤 검색 빈도를 추적해 독감 발병을 예측하는 ‘독감 트렌드’ 서비스를 2008년 개발했다. 과학전문지 네이처는 이듬해 구글 검색에서 독감과 관련된 질문의 빈도와 독감에 걸린 환자들이 병원을 찾는 빈도 사이에 상관관계가 있다는 논문을 실었다.
지난해 미국 대선의 승자는 빅데이터라는 말이 있다. 미국 주요 언론들이 대부분 힐러리 클린턴의 승리를 예측한 가운데 소셜네트워크서비스(SNS), 인터넷, 모바일 검색량을 토대로 도널트 트럼프의 승리를 예측한 수치가 실제 결과와 가장 비슷한 것으로 나왔기 때문이다. 빅데이터 분석은 각종 여론조사의 예측을 빗나가게 하는 ‘샤이(shy) 유권자’의 표심까지 읽을 수 있는 수단으로도 여겨지고 있다.
빅데이터 분석에 가장 쉽게 이용되는 것이 구글 트렌드다. 문재인 더불어민주당 대선 후보 측은 그제 ‘구글 트렌드 검색량에서 안철수 국민의당 후보가 문 후보를 앞선다’는 안 후보 측의 주장은 거짓이라고 반박했다. 안 후보가 지난달 4∼18일 문 후보를 앞선 것은 사실이지만 18일 이후부터는 다시 문 후보가 앞섰다는 것이다. 홍준표 자유한국당 후보도 어제 질 수 없다며 가세했다. 이달 들어 문재인과 홍준표가 거의 같은 수준으로 나오고 있다는 것이다.
3일부터 여론조사 결과는 선거가 끝날 때까지 공표되지 않는다. 아쉬운 대로 구글 트렌드라도 이용해볼 수밖에 없다. 선거관리위원회에선 빅데이터 조사가 여론조사에 해당하지 않아 공표에 제한이 없지만 왜곡 가능성이 있다며 주의를 당부했다. 그러나 구글 트렌드는 여론조사와 달리 누구라도 직접 확인할 수 있다. ‘문재인’을 치고 비교란에서 안철수나 홍준표를 차례로 입력해 보라. 비교 수치를 한눈에 볼 수 있는 그래프가 뜬다. 다만 한국인은 구글 검색을 많이 하지 않아 정확도는 영어권 검색보다 떨어질 수 있다는 점을 감안해야 한다.
'칼럼읽기' 카테고리의 다른 글
[칼럼 841]황창배 화백 ‘자유魂’/김종호 논설위원/문화일보/2017.05.10. (0) | 2017.06.27 |
---|---|
[칼럼 840]뜨는 권력과 언론/송평인 논설위원/동아일보/2017.05.05 (0) | 2017.06.12 |
[칼럼 838]‘스마트 쿠키’ 김정은/이진 논설위원/동아일보/2017.05.03 (0) | 2017.06.03 |
[칼럼837]심상정의 ‘약진’/송평인 논설위원/동아일보/2017.04.29 (0) | 2017.05.30 |
[칼럼 836]美 자본주의 상징 코카콜라의 추락/이진 논설위원/동아일보/2017.04.28 (0) | 2017.05.25 |