Focus

[빅데이터 본 세상(5) | ‘대선 주자들’ 분석해보니] 4월 초부터 문·안 양자 구도 선명 

 

최영진 기자 cyj73@joongang.co.kr
가장 많은 관심을 얻는 후보는 문재인... 개혁 이미지 강한 대선 후보 심상정

▎문재인(좌) / 안철수(우)
19대 대통령 선거가 치러지는 5월 9일까지 한 달도 남지 않았다. 4월 15일부터 16일까지 대선 후보등록이 이뤄지고, 17일부터 대선 하루 전까지 본격적으로 후보들의 선거운동이 치러진다. 선거운동 기간을 앞두고 다양한 기관에서 대선 후보들에 대한 여론조사 결과가 발표됐다. 조사방법에 따라 대선 후보의 순위가 바뀌면서 여론조사의 신뢰성도 도마에 오른 상황. 그렇다면 빅데이터로 대선 주자들을 분석하면 어떤 결과가 나올까. 문재인 더불어민주당 후보, 홍준표 자유한국당 후보, 안철수 국민의당 후보, 유승민 바른정당 후보, 심상정 정의당 후보를 대상으로 빅데이터 분석을 했다. 후보 표기 순서는 4월 12일 현재 국회 의석수를 기준으로 했다.


▎(왼쪽부터)홍준표 / 유승민 / 심상정
트렌드 분석 결과 문재인 후보가 선두 달려


대선 후보의 이름을 키워드로 3월 12일부터 4월 12일까지 1개월 동안 트렌드 분석을 했다. 후보에 대한 사람들의 관심도에 어떤 변화가 있었는지 알아보기 위해서다. 트렌드 분석을 하면 대선 후보가 뉴스·블로그·트위터에서 얼마나 많이 언급됐는지를 알 수 있다.

문재인 후보의 경우 1개월 동안 뉴스와 블로그, 트위터에서 207만1688회가 언급이 되면서 가장 많은 관심을 받은 후보로 나타났다. 그 뒤를 이어 안철수 후보가 142만9748건, 심상정 후보 24만3986건, 홍준표 후보 22만6034건, 유승민 후보 22만5133건을 기록했다. 심 후보가 홍 후보를 제치고 트렌드 분석에서 3위를 차지한 것이 이례적이다.

또 하나 눈에 띄는 현상은 안철수 후보가 4월 5일을 기점으로 트렌드 분석에서 문 후보를 앞서기 시작한 것이다. 4월 초부터 문재인 후보와 안철수 후보의 양자대결에서 안 후보가 앞선다는 몇몇 여론조사가 발표되기 시작했다. 두 후보 사이의 지지율이 요동치기 시작했고, 그 변화를 트렌드 분석에서도 확인할 수 있었다.

감성 트렌드 분석으로 후보에 대한 반응이 긍정적인지, 부정적인지 살펴봤다. 결과적으로 대선 후보들은 모두 부정적인 반응이 훨씬 많았다. 긍정적인 반응이 나온 비율은 문재인 후보가 31%로 가장 높았고, 그 뒤를 유승민 후보(30%) 안철수 후보(25%)가 이었다. 모든 후보가 공통으로 부정적인 반응이 더 많은 이유에 대해 솔트룩스 관계자는 “각 후보에 대한 부정적인 평가를 내리는 이들이 더 적극적으로 글을 올리기 때문에 부정적인 평가가 많이 나오는 것”이라고 설명했다.

모든 후보 부정적인 평가가 더 높아


후보들에 대한 긍정적인 반응을 보여주는 연관어는 어떤 게 나오는지 알아보기 위해 감성 키워드 분석을 했다. 문재인 후보의 경우 가장 많이 검색된 긍정적인 키워드는 ‘감동’이었다. 다음은 ‘감사’ ‘강하다’ ‘겸손하다’ 같은 키워드가 뒤를 이었다. 홍준표 후보의 경우에는 ‘감사하다’ ‘강단’ ‘강인’ 등의 키워드가 검색됐다. 안철수 후보의 경우 가장 많이 나온 긍정적인 키워드는 ‘강하다’였다. ‘겸손’과 ‘공정’ ‘급부상’ 등의 키워드도 많이 검색됐다. 유승민 후보는 ‘감동’ ‘감사’ 등의 긍정적인 키워드가 나왔고, 심상정 후보는 ‘가치’ ‘감사’ ‘개혁’ ‘공동체’ 같은 키워드가 나왔다.

각각의 대선 후보는 유권자에게 어떤 이미지로 각인되어 있을까. ‘AI 연관어 분석’ 기법을 사용했다. 후보들이 어떤 이미지와 연관이 되어 있는지를 알 수 있는 분석 방법이다.

문재인 후보의 경우 ‘안철수’ ‘호남 민심’ ‘네거티브’ ‘안희정’ ‘정권교체’ ‘유력주자’ ‘친노’ 같은 연관어가 검색이 됐다. 안철수 후보는 ‘문재인’ ‘홍준표’ ‘보수정당’ 같은 단어들이 많이 검색됐다. 홍준표 후보의 경우 ‘경남도지사’ ‘보궐선거’ 같은 키워드가 많이 검색됐다. 경남도지사 ‘심야 사퇴’에 대한 관심이 높았음을 보여준다. 유승민 후보의 경우 ‘바른정당’ ‘보수표’ 등의 키워드가 많이 연관되어 있고, 심상정 후보를 키워드로 하면 ‘정의당’ ‘대선후보’ ‘교섭단체’ 같은 단어가 많이 검색됐다.

마지막으로 ‘대통령’ 하면 유권자들은 무엇을 떠올릴까. AI 연관어 분석을 해봤다. ‘헌재’와 ‘파면’ 그리고 ‘황교안’ 같은 현 정국을 대표하는 키워드가 가장 많이 검색됐다.


20여 년 동안 인공지능 기반 솔루션 사업을 해온 솔트룩스가 개발한 분석 서비스 ‘아담 애널리틱스’를 이용해 빅데이터를 분석했다.

※중앙일보·JTBC가 마련한 19대 대선 관련 사이트 ‘리 셋코리아(http://news.joins.com/election2017)’에서 대선 후보에 대한 다양한 궁금증을 풀 수 있다.

1381호 (2017.04.24)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음