보건복지 Korea Institute for Health and Social Affairs www.kihasa.re.kr 제 324 호 (2016-24) 발행일 2016. 10. 10. ISSN 2092-7117 발행인김상호발행처한국보건사회연구원 (30147) 세종시시청대로 370 세종국책연구단지사회정책동 (1~5 층 ) TEL 044)287-8000 FAX 044)287-8052 2016 년소셜빅데이터를활용한통일인식동향분석 1) 송태민정보통계연구실선임연구위원 - 통일에대한찬성비율은소셜빅데이터감성분석결과 2011년 55.0%, 2012년 62.0%, 2013년 57.7%, 2014년 58.2%, 2015년 56.2%, 2016년 59.8% 로나타남. - 핵무기와통일대박이동시에언급된문서는통일에대한중립과찬성의확률이높아 통일대박론 이통일의필요성에대한인식에영향을준것으로나타남. - 통일에대한찬반, 통일방법등과관련한국민의통일의식조사와더불어소셜미디어에서수집된빅데이터를활용, 분석하면통일인식예측은더욱신뢰성이있을것으로봄. 1. 서론 현정부는 통일 을핵심국정과제중하나로설정한데이어통일에대한준비와세부정책을다양하게 추진해오고있음. 한반도신뢰프로세스를통한남북관계정상화를주요국정과제로설정한데이어 2014 년대통령의 통일은대박 이다 한마디로평화통일의기반구축에적극적으로나설것임을선언함. 통일대박론 은통일된한반도에대한비전을제시했으며, 이에대해북한의불안정한정치상황으로인한실질적 흡수통일준비라는해석부터경제적효과에중점을둔전략적판단이라는설까지다양하게제기됨. 2) 최근 한반도정세 는북한의로켓발사, 개성공단잠정폐쇄, 북한에대한유엔의강력한제재결정등으로국민의통일에대한관심과열기가다양하게변화되고있는상황임. 1) 본연구는소셜빅데이터를분석한것으로통일인식에대한공식통계로인용할수없음. 2) 최영준, 황태희, 최우선, 주형민 (2016). 박근혜정부의통일정책의정책수용성에대한실증연구 : 2013 년과 2015 년국민인식조사비교. 국제관계연구 21(1), p.6.
02 2016 년소셜빅데이터를활용한통일인식동향분석 통일에대한한국인의전반적인관심도는 2010년 52.6% 에서 2014년 82.6% 로증가하였으나 20대의무관심은다른세대에비해높은상태로지속됨. 3) 최근의남북관계는모든세대의통일인식에강하게영향을미치고있으나신자유주의통일세대 (19 30세) 는통일필요성에대한인식이낮은것으로나타남. 4) 한반도의통일은남북한의문제이자동북아주변국의미래를좌우할국제적사안이며 5) 국내차원에서는통일에대한국민적공감대형성과통일을맞이할수있는역량구축이필요함. 6) 평화로운통일한국을실현하기위해서는주변국들의반응과함께우리국민들의통일에대한인식과태도를분석할필요가있음. 7) 2. 소셜빅데이터를활용한통일인식예측모형 가. 분석대상및분석방법 본연구에서는 88 개의온라인뉴스사이트, 9 개의게시판및주요커뮤니티, 1 개의 SNS( 트위터 ), 4 개의블로그, 2 개의카페등총 104 개의온라인채널을통해수집가능한텍스트기반의온라인문서 ( 버즈 ) 를소셜빅데이터로정의함. 통일토픽 (topic) 은모든관련문서를수집하기위해 통일 이라는토픽을사용하였으며, 유사어로 남북통일, 한반도통일 이라는용어를사용함. 통일신라, 통일교, 통일전망대, 세계통일 등은불용어 (stop-words) 로처리 하여수집, 분석에서제외함. 소셜빅데이터수집은 2016. 1. 1.~2016. 3. 31.(3 개월 ) 의기간에해당채널에서요일, 주말, 휴일을고려하지 않고매시간단위로이루어졌으며 8) 수집된총 9 만 5507 건의텍스트문서를본연구의분석에포함함. 국민의통일인식을파악하는데가장효율적인예측모형을구축하기위해머신러닝의랜덤포리스트 (Random Forest), 의사결정트리, 연관규칙분석을사용함. 연관규칙의분석알고리즘으로는선험적규칙 (apriori principle) 을사용하였고, 의사결정트리형성을위한분석 알고리즘으로는 CHAID(Chi-squared Automatic Interaction Detection), 머신러닝분석에는 R 3.2.1 과 IBM SPSS 23.0 을사용함. 나. 분석결과 통일관련감성분석 (Opinion Mining) 과주제분석 (Text Mining) 통일감정키워드는문서수집이후요인분석과주제분석을통하여찬성 (13 개 : 관심, 필요, 중요, 노력, 신뢰, 평화 3) 아산정책연구원 (2015). 한국인의대북 통일인식변화, 아산정책연구원. pp.25-26. 4) 김병조 (2015). 한국인의통일인식 2007~2015. 세대별격차와세대내분화, 서울대학교통일평화연구원통일과평화 7(2), pp.3-41. 5) 김규륜 (2013). 한반도통일의미래와주변 4 국의기대. 통일연구원. p.3. 6) 송태민 (2015). 소셜빅데이터를활용한국민통일인식동향분석. 보건복지 ISSUE & FOCUS. 제 269 호. 7) 위의책. 8) 본연구를위한소셜빅데이터의수집및토픽분류는 ( 주 )SK 텔레콤스마트인사이트 에서수행함.
보건 복지 ISSUE & FOCUS 제 324 호 03 ( 평화적 ), 든든, 다행, 공감, 행복, 사랑, 위대, 대박 ), 반대 (18개: 쪽박, 천박, 경박, 빨갱이, 환장, 친절, 한심, 문제, 위협, 압박, 포기, 재앙, 혼란, 분열, 갈등, 아픔, 고통, 불신 ) 로분류하였으며찬성과반대의감정을동일한횟수로표현한문서는중립의감정으로분류함. 통일에대한주요안보와이슈는주제분석을통하여 핵무기, 정상회담, 휴전선, 남북공동선언, 간첩, 천안함, 이산가족상봉, 통일대박, 통일비용 의 9개요인으로그룹화함. 통일관련온라인문서 ( 버즈 ) 현황 2016년 1월부터 3월까지통일관련온라인문서의추이를분석한결과 [ 그림 1] 과같이북한과관련한이슈가발생하면커뮤니케이션이급증하는양상을보임. - 2016년 1월 6일북한의 4차핵실험으로인해문서량이증가하였으며특히 2월 10일북한의개성공단잠정폐쇄발표후문서량이급증한것으로나타남. 통일에대한찬성감정은대박, 평화, 필요, 노력, 중요, 사랑, 관심, 신뢰등의순으로높게나타났으며통일에대한반대감정은문제, 위협, 쪽박, 포기, 갈등, 고통, 압박, 분열등의순으로높게나타남 [ 그림 1]. [ 그림 1] 통일관련온라인문서일별추이및찬성 반대감정 2016.02.10. 2016.02.12. 개성공단잠정중단 개성공단남측인원추방 자산전면동결 2016.02.16. 북한의핵실험및 장거리미사일발사 2016.02.07. 규탄성명서채택 2016.01.16. 북한의 4차핵실험및북한발사이버위협 2016.01.22. 북한의장거리미사일발사국방부, 한 미사드배치공식협의시작 2016.02.23. 북한인민군최고사령부발표 " 청와대타격목표 " 2016.03.03. 북한 ( 원산일대 ) 기습단거리발사체발사 2016.03.29. 북한기습단거리발사체발사 미전략문제연구소, 사드 한반도배치공개권고 2016.03.10. 2016.02.13. 박대통령 북한노동계열탄도미사일 2발발사 사드배치검토 2016 년통일찬성감정 2016 년통일반대감정
04 2016 년소셜빅데이터를활용한통일인식동향분석 통일관련국민인식변화 통일의필요성에대한국민의인식은조사기관별로차이를보이나소셜빅데이터감성분석결과 2011 년 55.0%, 2012 년 62.0%, 2013 년 57.7%, 2014 년 58.2%, 2015 년 56.2%, 2016 년 59.8% 로나타남 ( 표 1). 연도 < 표 1> 연도별통일관련국민의통일인식 찬성중립반대 소셜 1) 서울대 2) KBS 3) 소셜 1) 서울대 2) KBS 3) 소셜 1) 서울대 2) KBS 3) 2011 55.0 53.7 74.4 18.3 25.0 19.9 26.7 21.3 5.7 2012 62.0 57.0 68.4 10.7 21.6 24.6 27.3 21.4 7.0 2013 57.7 54.8 69.1 8.7 21.5 21.2 33.6 23.7 9.7 2014 58.2 55.8-9.0 22.5-32.7 21.7-2015 56.2 51.0 8.3 24.3 35.5 24.8 2016 59.8 12.6 27.6 주 : 1) 본연구의소셜빅데이터감성분석결과. 2) 서울대학교통일평화연구원이매년 7 월부터 8 월사이 (3 주간 ) 1200 명을대상으로대면조사한결과. 3) KBS 방송문화연구소 (2013). 2013 년국민통일의식조사. ( 단위 : %) 개성공단중단및사드배치검토전 (2016.1.1. 2016.2.12.) 통일에대한찬성인식은 57.9% 에서이후일주 일간 9) (2016.2.13. 2016.2.19.) 62.6% 로높아졌다가일주일후 (2016.2.20. 2016.3.31.) 61.1% 로낮아짐. 이기간통일에대한반대인식은 26.9% 26.4% 29.2% 로변화함 ( 표 2). < 표 2> 개성공단중단및사드배치검토전후의국민통일인식 찬성 중립 반대 계 2016.1.1. - 2016.2.12. 7,039(57.9) 1,849(15.2) 3,279(26.9) 12,167 2016.2.13. - 2016.2.19. 2,613(62.6) 460(11.0) 1,101(26.4) 4,174 2016.2.20. - 2016.3.31. 5,039(61.1) 796(9.7) 2,408(29.2) 8,243 계 14,691(59.8) 3,105(12.6) 6,788(27.6) 24,584 N(%) 통일에대한국민인식예측모형 랜덤포리스트분석을활용하여통일인식에영향을주는주요안보와이슈요인을살펴보면 [ 그림 2] 와같이통일인식 ( 찬성, 중립, 반대 ) 에가장큰영향을미치는 ( 연관성이높은 ) 주요안보와이슈요인은 통일대박 이었으며이어핵무기, 천안함, 남북공동선언, 정상회담, 통일비용, 휴전선, 이산가족상봉, 간첩순으로나타남. 9) URL 을통해확산되는온라인문서 ( 자살등 ) 는약 3 주정도의생명주기를가지며발생후첫주에급속히전파되는경향을보인다 [National Information Society Agency(2012). Implications for Suicide Prevention Policy of Youth Described in the Social Analysis. Seoul, Korea: Author.] 에따라일주일전후에대한 인식을분석함.
보건 복지 ISSUE & FOCUS 제 324 호 05 [ 그림 2] 랜덤포리스트모델의통일인식의중요도 랜덤포리스트의중요도에나타난주요안보와이슈요인들이통일인식에미치는영향에대한로지스틱회귀분석 결과는 ( 표 3) 과같이천안함, 핵무기, 통일비용순으로찬성보다반대의확률이높으며그외통일대박, 남북공동 선언, 이산가족상봉 (p<.05), 휴전선순으로반대보다찬성의확률이높은것으로나타남. < 표 3> 통일인식에영향을미치는안보 이슈요인 1) 변수 찬성중립 b S.E. OR P b S.E. OR P 핵무기 -.412.039.663.000.330.054 1.390.000 정상회담.000.069 1.000.996.451.089 1.570.000 휴전선.271.099 1.311.006.623.125 1.864.000 남북공동선언 1.193.251 3.298.000 -.465.469.628.321 간첩.073.198 1.076.710.760.234 2.138.001 천안함 -.846.146.429.000 -.607.188.545.001 이산가족상봉.375.148 1.454.012.693.186 1.999.000 통일대박 2.577.067 13.156 0.000 3.080.074 21.764 0.000 통일비용 -.363.089.696.000 -.347.133.707.009 주 : 1) 기본범주는반대, Standardized coefficients, Standard error, odds ratio.
06 2016 년소셜빅데이터를활용한통일인식동향분석 통일인식예측모형에대한의사결정나무에서 [ 그림 3] 과같이뿌리마디의통일에대한감정비율은찬성 59.8%, 중립 12.6%, 반대 27.6% 임. - 뿌리마디하단의가장상위에위치하는요인이종속변수에대한영향력이가장높은 ( 관련성이깊은 ) 요인이므로 통일대박 이가장영향력이큰것으로나타남 ( 온라인문서에 통일대박 요인이있으면찬성은이전의 59.8% 에서 76.0% 로증가함 ). - 통일대박 요인이없고 핵무기 요인과 남북공동선언 요인이있는경우찬성은이전의 45.4% 에서 85.7% 로크게증가함. [ 그림 3] 통일인식예측의의사결정나무모형
보건 복지 ISSUE & FOCUS 제 324 호 07 ( 표 4) 와같이주요안보와이슈에대한통일인식연관성예측에서찬성확률이가장높은연관규칙은 { 통일대박 } { 찬성 } 이며세변인의연관성은지지도 0.05, 신뢰도는 0.70, 향상도는 4.57로, 온라인문서에서통일대박이언급되면언급되지않는문서보다통일에대한찬성확률이 4.57배높아지는것으로나타남. - 통일에대한반대확률이가장높은연관규칙은 { 핵무기, 천안함 } { 반대 } 이며온라인문서에서 핵무기, 천안함 이언급되면언급되지않는문서보다통일에대한반대확률이 5.92배높아지는것으로나타남. < 표 4> 안보와이슈요인에대한통일인식의연관성예측 규칙 지지도 신뢰도 향상도 { 핵무기, 통일대박 } { 중립 } 0.002700533 0.26811594 8.2815445 { 핵무기, 정상회담 } { 중립 } 0.002158341 0.19202226 5.9311688 { 핵무기, 천안함 } { 반대 } 0.001053104 0.41908714 5.9212419 { 핵무기, 통일비용 } { 반대 } 0.001459747 0.41297935 5.8349456 { 통일대박 } { 중립 } 0.013971869 0.18644775 5.7589838 { 휴전선 } { 중립 } 0.001334626 0.17273954 5.3355656 { 천안함 } { 반대 } 0.001334626 0.37426901 5.2880108 { 정상회담 } { 중립 } 0.002888215 0.16838906 5.2011882 { 핵무기, 정상회담 } { 반대 } 0.003784917 0.33673469 4.7576921 { 통일대박 } { 찬성 } 0.052488348 0.70043133 4.5726137 { 정상회담 } { 반대 } 0.004879727 0.28449848 4.0196517 { 핵무기, 휴전선 } { 반대 } 0.001219932 0.27725118 3.9172554 { 통일비용 } { 반대 } 0.002721386 0.26605505 3.7590662 { 핵무기, 통일대박 } { 찬성 } 0.005494907 0.54554865 3.5614958 { 핵무기 } { 중립 } 0.010061831 0.11222235 3.4663153 { 휴전선 } { 반대 } 0.001845538 0.23886640 3.3749204 { 핵무기 } { 반대 } 0.019060131 0.21258286 3.0035628 { 이산가족상봉 } { 찬성 } 0.001522308 0.44108761 2.8795446 { 핵무기, 휴전선 } { 찬성 } 0.001939379 0.44075829 2.8773947 { 핵무기, 정상회담 } { 찬성 } 0.004817167 0.42857143 2.7978354 { 휴전선 } { 찬성 } 0.003242725 0.41970310 2.7399405 { 정상회담 } { 찬성 } 0.006839960 0.39878419 2.6033759 { 핵무기, 통일비용 } { 찬성 } 0.001397187 0.39528024 2.5805011 { 핵무기, 통일대박 } { 반대 } 0.001574442 0.15631470 2.2085554 { 통일비용 } { 찬성 } 0.003284432 0.32110092 2.0962375
08 2016 년소셜빅데이터를활용한통일인식동향분석 3. 요약및결론 통일관련온라인문서는 2016 년 1 월 6 일북한의 4 차핵실험이후꾸준히증가하여 2 월 10 일북한의개성공단잠정폐쇄발표이후급속히증가함. 이는 2016 년상반기북한의핵실험과개성공단폐쇄로인하여남북간긴장이고조되면서국민들의관심이급증한것으로볼수있음. 통일에대한찬성비율은소셜빅데이터감성분석결과 2011 년 55.0%, 2012 년 62.0%, 2013 년 57.7%, 2014 년 58.2%, 2015 년 56.2%, 2016 년 59.8% 로서울대통일평화연구원의여론조사 10) 결과와비슷한추이를보임. 개성공단중단및사드배치검토전후통일에대한인식변화에서는찬성인식 (3.95% 상승 ) 이반대인식 (0.9% 상승 ) 보다더많이상승한것으로나타남. 통일대박, 남북공동선언, 이산가족상봉, 휴전선요인이있으면통일에대한찬성확률이높은반면천안함, 핵무기, 통일비용요인이있으면통일에대한반대의확률이높은것으로나타남. 이는통일대박, 남북공동선언등은긍정적담론을확산시키는반면천안함, 핵무기등은부정적담론을확산시키는것으로볼수있음. 핵무기와통일대박이동시에언급된문서는통일에대한중립과찬성의확률이높은것으로나타났으며핵무기, 천안함, 휴전선이동시에언급된문서는통일에대한반대의확률이높은것으로나타나 통일대박론 이통일의필요성에대한인식에영향을준것으로드러남. 최근미디어환경은다양한플랫폼과이를통해제공되는콘텐츠들로확장됨에따라 11) 통일에대한공감대형성에서소셜미디어가중요한역할을수행할수있는것으로나타남. 특히소셜미디어는통일과관련한폭넓은정보를쉽게얻을수있는곳으로담론이형성, 공유되는통로역할을함. 12) 따라서통일에대한찬반, 통일방법등과관련한국민의통일의식조사와더불어소셜미디어에서수집된빅데이터를활용, 분석하면통일인식의예측은더욱신뢰성이있을것으로봄. 13) 10) 서울대학교통일평화연구원이매년 7월부터 8월사이 (3주간) 1200명을대상으로대면조사한결과임. 11) 홍종윤 (2016). 미디어의평화통일지향성지수개발연구. 언론정보연구 53(1), pp.5-56. 12) 연세대학교산학협력단 (2014). 평화통일에대한국민공감대형성연구. 13) 송태민 진달래 (2015). 2015년소셜빅데이터기반보건복지이슈동향분석. 한국보건사회연구원, p.123. 집필자송태민 ( 정보통계연구실선임연구위원 ) 문의 044-287-8201 한국보건사회연구원홈페이지의발간자료에서온라인으로도이용하실수있습니다. www.kihasa.re.kr