Focus

[빅데이터 본 세상(1) | 촛불·태극기 키워드 분석해 보니] 2월 중순 들어 ‘태극기’ 위세 강해져 

 

최영진 기자 cyj73@joongang.co.kr
콘텐트 검색 수는 촛불이 더 많아...상대 진영에 대한 부정적 단어 급증

이번 호부터 빅데이터 분석과 시각화 솔루션 ‘아담 애널리틱스’를 이용해 정치·경제·사회 핫 이슈를 풀어보는 연재를 시작한다. 아담 애널리틱스는 20여 년 동안 인공지능 기반 솔루션 사업을 펼쳐온 솔트룩스가 선보인 인공지능 플랫폼 아담(ADAMs)에 포함된 툴이다. 이 툴을 이용하면 일반인들도 쉽게 데이터를 수집·분석하고 결과물을 다양하게 시각화할 수 있다. [편집자 주]


▎지난 2월 4일 오후 서울광장 주변에서 열린 탄핵반대 태극기 집회.
아담 애널리틱스로 풀어보는 첫 번째 키워드는 ‘촛불’과 ‘태극기’다. 박근혜 대통령의 탄핵 찬성과 반대 집회의 이름이 언제부턴가 ‘촛불 집회’와 ‘태극기 집회’로 대변되고 있다. 아담 애널리틱스로 분석한 결과 촛불의 위세에 눌렸던 친박 단체들이 태극기 집회를 중심으로 세몰이를 하고 있다는 결과가 나왔다.

2월 12일 이후 태극기 콘텐트, 촛불 앞서


▎지난 2월 11일 저녁 서울 광화문 광장에서 열린 촛불집회 모습.
우선 촛불과 태극기 관련한 콘텐트 건수를 비교했다. 기간은 1월 15일부터 2월 15일까지 1개월로 했고, 뉴스와 블로그 그리고 트위터를 대상으로 분석했다. 촛불이라는 단어가 들어간 콘텐트는 1개월 동안 뉴스에서 2만2293건, 블로그에서는 5723건, 트위터에서 38만7355건이 검색됐다. 태극기로 분석한 경우 뉴스 9102건, 블로그 2384건, 트위터 20만4144건이 검색됐다. 콘텐트 검색 건수는 여전히 촛불이 많았다.


하지만 시간이 갈수록 촛불보다 태극기 키워드가 늘고 있음을 트렌드 분석에서 엿볼 수 있다. 아담 애널리틱스의 분석 방법 중 하나인 트렌드 분석은 시간별로 키워드의 변화를 지켜볼 수 있다. 먼저 촛불의 경우 1월 19일 2만378건, 2월 11일 2만 7689건의 콘텐트가 검색돼 가장 많은 관심을 받은 날로 꼽힌다. 2월 11일 이후 예전보다 낙폭이 컸다. 2월 15일에는 촛불 콘텐트가 5877건에 불과해 지난 한 달 동안 가장 낮은 관심도를 기록했다. 2월 16일에는 2000건에도 미치지 못했다.

태극기는 2월 11일 집회 이후 관심도가 커지고 있다. 태극기 관련 콘텐트가 가장 많이 검색된 때는 2월 5일(1만3022건)과 2월 12일(1만5894건)이었다. 2월 12일 이후 태극기 관련 콘텐트 수는 촛불보다 많다. 2월 13일 9620건, 14일 1만255건, 15일 7470건이 검색 됐다. 지난 1개월 동안 처음 나타난 현상이다.

일반인들은 촛불과 태극기라는 단어를 어떤 이미지와 연결하는지 알아보기 위해 ‘AI(인공지능) 연관어 분석’ 기법을 사용했다. 이 기법을 이용하면 키워드가 어떤 단어들과 연관돼 있는지 확인할 수 있다. 촛불의 경우 1월과 2월의 연관어에 변화가 컸다. 1월에는 촛불 집회, 촛불 시위, 촛불 시민, 애국 시민, 횃불, 구호, 하야, 손 피켓 같은 순으로 관련 단어가 검색됐다. 2월에 들어서면서 태극기와 관련된 연관어가 자주 등장하기 시작했다. 촛불을 검색했을 때 7번째로 함께 많이 연관된 단어가 태극기였다. 그 뒤를 이어 태극기 집회, 탄핵 반대 집회, 박근혜, 탄핵 반대 같은 단어들이 연관되기 시작했다. 태극기 집회의 영향력이 커지고 있음을 알 수 있다.

태극기로 AI 연관어 분석을 했다. 부정적 의미의 단어들이 많이 검색됐다. 1월에는 종북, 애국 국민, 탄핵 반대, 탄핵 기각, 반정부, 탄기국, 궐기, 빨갱이, 인공기 같은 단어들이 연관돼 있었다. 2월에도 비슷한 연관어가 많이 나왔다. 특이한 것은 2월 들어서 김진태 자유한국당 의원의 이름이 태극기라는 단어와 함께 많이 검색된 것이다. 촛불과 태극기라는 단어 연관어에서 현역 의원의 이름이 검색된 것은 김진태 의원이 유일하다.

아담 애널리틱스의 ‘감성 트렌드 분석’ 툴을 이용하면 키워드에 대한 사람들의 인식이 긍정적인지 부정적인지를 알 수 있다. 결론적으로 촛불에 대한 부정적인 반응이 76%가 나왔다. 긍정적인 반응은 24%였다. 태극기도 마찬가지로 부정적인 반응이 72%, 긍정적인 반응이 28%로 나왔다. 지금까지 살펴본 빅데이터 분석과 차이가 나는 결과였다.

촛불·태극기에 대한 부정적 반응 70%대


솔트룩스 엔지니어 김경민 차장은 이 결과에 대해 “촛불 집회나 태극기 집회에서 상대 진영에 대한 부정적인 단어가 많이 나오기 때문인 것 같다”고 설명했다. 이런 설명을 확인하기 위해 ‘감성키워드 분석’을 이용했다. 촛불의 경우 감성키워드에 나온 단어들은 촛불집회에서 많이 나온 ‘염병하다’ ‘불법’ ‘처벌’ ‘구속’ ‘극우’ ‘분노’ ‘해체’ ‘구태’ 같은 단어들이 검색됐다. 태극기의 감성키워드 분석 결과 역시 ‘선동’ ‘모독’ ‘빨갱이’ ‘좌빨’ ‘무효’ ‘편파’ 같은 태극기 집회에서 많이 나온 단어들이 나왔다. 집회에서 나온 부정적 단어들 때문에 촛불과 태극기에 대한 사람들의 인식이 부정적이라는 다소 이상한 결과가 나온 것이다.

1373호 (2017.02.27)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음