nan + nan = 2nan

[데이터 분석]구글 트렌드를 이용한 20대 대선 분석_1 본문

Statistics/Machine Learning

[데이터 분석]구글 트렌드를 이용한 20대 대선 분석_1

2nan 2022. 3. 15. 11:15
728x90

최근 빅데이터 분석에 관한 책을 읽고 있는데, 해당 글의 저자가 구글 트렌드를 통해서 지난 미 대선 당시 트럼프와 힐러리의 대선 결과를 예측하고 맞추었다는 사실을 알게 되었다.

사실 국내에서는 여러 여론조사기관이 발표하는 지지율 조사가 있지만, 이 경우 예를 들어 1000명을 대상으로 조사를 했다고 하더라도 실제 조사에 응답한 응답률은 그보다 낮을 수 밖에 없고 조사의 신뢰도에 대한 의구심이 항상 들 수 밖에 없었다. 

그래서 나도 이러한 툴을 사용해서 직접 이번 대선 결과에 대해 분석해보고 이런 결과가 나온 이유는 무엇일까?라는 생각에서 구글 트렌드를 이용해서 분석해보기로 했다.

단, 구글 트렌드가 미국에서는 구글 사용량이 대부분 높기 때문에 효과적이겠지만 우리 나라의 경우 네이버, 카카오 등 구글 이외에도 사용량이 높은 플랫폼이 존재하기 때문에 이 또한 고려를 해야 할 부분이다.

우선 글을 쓰는 당일인 3월 15일을 기준으로 세 후보(이, 윤, 안)의 지난 30일 동안 시간 흐름에 따른 관심도 변화를 확인해보았다.

 

 

 

1월 이후로 이재명 후보가 윤석열 후보를 지속적으로 앞서는 추세에 있다가, 2월 중순 경부터 엎치락 뒤치락하는 추세가 보였다. 

분명 수치가 많이 올라가거나 낮아진 날짜에는 중요한 포인트들이 있을 것이다.

1) TV 토론
2) 삼프로 대담
3) 윤 - 안 단일화
4) 태도 / 언행 관련 논란
5) 배우자 관련 논란

등.. 여러 요인들이 있을 것으로 생각한다.

가장 최근의 이슈였던 윤 - 안 단일화 발표 (3월 3일)의 수치부터 확인해보았다.

 

 

 

 

 

당시 안철수 후보의 관심도가 가장 높았고, 이에 따라 윤석열 후보의 관심도도 함께 소폭 증가해 이재명 후보와 동일한 수치임을 볼 수 있다. 그럼에도 불구하고, 3월 3일 이후 윤 후보의 관심도는 감소하고 이 후보의 관심도가 증가하는 것으로 볼 때 단일화의 영향이 어떻게 미치는지 궁금했다.

여기서 가장 궁금했던 점은, 안철수를 지지하는 지지자들이 윤석열 후보와 단일화를 했다는 이유로 윤석열 후보에게 표심이 이동할 것인지, 아니면 이재명 후보 혹은 타 후보나 무효표로 이동할 것인지에 대한 궁금함이 생겼다.

개인적인 추론에 의하면, 안철수 후보를 지지하는 지지자들은 안철수 후보의 정책이 정말 마음에 들어서 지지하는 지지자들도 있겠지만, 윤 / 이 후보에 대한 논란이 계속 커지는 상황 속에서 비교적 논란이 적은 후보이기 때문에 지지하는 층도 굉장히 많을 것이라고 생각했다. 그래서 만약 단일화를 하게 된다면, 해당 지지자들이 온전히 이동하려고 가지는 않을 것이다라고 생각했다. 또한, 단일화 이슈에 있어 이전에도 시도를 했었고 합의가 이루어지지 않아 이번에는 단일화 없이 완주를 하겠다라고 안 후보가 입장을 내놓고도, 결국 단일화를 한 상황이 재외국민 투표에서 안 후보에게 투표를 한 지지자들과 사전투표 전 날 이러한 소식을 들은 지지자들이 이에 대해 반감이 커지지 않을까라는 생각이 들었다. 

 

Comments