S U M M A R Y 요약 1. 연구의배경및목적 국민행복을추구하는국정기조에따라수요및지역맞춤형정책의중요성이부각되면서, 국민의정책수요를시의성있게파악할수있는정책수단의필요성이증대하고있음 국민의정책수요를파악하기위해국민여론을직 간접적으로청취하고이를정책형성에반영하는노력이증대하고있음 특히, 정보통신기술의발달에따른국민들의의사소통방식변화를고려하고자인터넷소셜미디어로수집된비정형빅데이터를분석하여국민여론의트렌드와그동태를모니터링하려는움직임이커지고있음 비정형빅데이터분석의정책활용은꾸준히증가하고있지만현재까지는대부분전국적여론트렌드의수시분석에머물러, 지역별, 시기별여론트렌드의세밀한변화를파악하기어려우며이를위한새로운분석접근법필요 본연구에서는인터넷소셜미디어에반영된국민여론의시공간적변화트렌드를파악할수있는새로운분석방법론을개념적수준에서개발하고이의정책적함의를밝히고자함 비정형빅데이터, 텍스트마이닝, 시공간분석등의다양한데이터와분석기법을융합활용하여, 인터넷소셜미디어에반영된국민여론의시공간적패턴을지도를표출할수있는분석기법들을살펴보고, 이들의정책활용방향을제시함 iv
2. 여론모니터링과비정형빅데이터분석 여론모니터링의개념과방법 여론 (Public Opinion) 이란대중 (the mass) 혹은공공사안에관여하는개인들의집단적의견을말함 여론모니터링이란여론이어떠한지, 어떻게변화하고있는지그동향을지속적으로조사 분석하여정보와지식으로변환하는일련의활동을뜻함 여론모니터링의방법은분석의대상이되는여론의속성이무엇인가에따라, 여론내용에관한분석방법들과여론의형성주체에관한분석방법들로나뉨 인터넷소셜미디어기반의여론부상 1980~90 년대의 PC시대에서인터넷시대와모바일시대를거쳐지금은스마트시대로나아가고있음 인터넷패러다임의변화가스마트폰환경으로전이되면서, 최근블로그, 소셜네트워크서비스 (SNS), 위키등의소셜미디어활용이 20~40 대의젊은층을중심으로급속히증대하고있으며새로운국민여론형성의공간으로부상함 < 인터넷사용자중연령대별소셜미디어이용률의변화 > 출처 : http://www.pewinternet.org/fact-sheets/social-networking-fact-sheet (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) v
여론모니터링을위한비정형빅데이터분석의활용 인터넷소셜미디어기반의여론이부상하면서, 이들신규매체에서대량으로생산되는비정형빅데이터를여론모니터링을위해활발히사용함 미국에서는트위터의실시간분석을통해감기트렌트를모니터링하여보건정책에활용하였으며, 유럽에서는소셜미디어데이터분석을정책의다양한분야에서활용할수있도록 WeGov 등과같은툴박스를제작하여제공함 국내에서는 2013년문화체육관광부에서빅데이터분석을통해국민인식및여론변화추이를분석한바있으며, 국토연구원과국립재난안전연구원에서는빅데이터를활용한맞춤형부동산 / 도시재난 / 복지정책발굴을모색하였음 그러나, 선행연구에서활용한비정형빅데이터분석방법들은국민여론의공간적분포와시계열변이를추적하지못해, 국민수요및지역맞춤형정책지원에한계가있음 <WeGov 툴박스 > 출처 : http://www.slideshare.net/timo_wandhoefer/wegov-user-guide-toolbox-25 (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) vi
3. 여론모니터링을위한비정형빅데이터시공간분석모델 1) 기본방향및개념 본연구에서는지역및수요맞춤형정책을지원하기위해, 비정형빅데이터를위한새로운분석방법인비정형빅데이터시공간분석모델을제안함 비정형빅데이터시공간분석모델의기본방향과개념 ( 기본방향 ) 인터넷소셜미디어상의국민여론이지역별, 시기별로변화하는패턴을체계적으로분석하고지속적으로모니터링하여, 국민수요및지역맞춤형정책수요발굴을지원하고여론기반정책수립의시의성을제고함 ( 개념 ) 인터넷소셜미디어에서생성되는비정형빅데이터에크롤링, 텍스트마이닝, 시공간분석등의방법을함께적용하여, 인터넷소셜미디어에반영된국민여론의시공간적변화패턴을분석하는자료중심의여론모니터링방법 < 여론모니터링을위한비정형빅데이터시공간분석모델의개념 > vii
2) 전체구성 비정형빅데이터시공간분석모델은 1 비정형빅데이터의수집, 2 비정형빅데이터의전처리, 3 비정형빅데이터의시공간분석의세단계로구성 비정형빅데이터수집단계에서는 API 나유 무료소프트웨어를이용하여, 트위터, 페이스북, 블로그, 까페, 온라인신문등다양한인터넷소셜미디어매체에서시민들이논의한내용을지속적으로수집 저장 관리 비정형빅데이터전처리단계에서는수집된여론데이터에서광고성메시지, 욕설, 중복메시지등을제거하고, 메시지를관련된위치 / 장소정보와연계하며 ( 공간정보화혹은지오코딩 ), 메시지를정제하여키워드를추출 비정형빅데이터시공간분석단계에서는공간분포분석, 시계열데이터분석, 텍스트마이닝, 사회관계망분석등을융복합활용하여, 여론내용과형성주체의시공간적변화패턴을탐색 < 여론모니터링을위한비정형빅데이터시공간분석모델의전체구성 > viii
3) 비정형빅데이터의수집과전처리 비정형빅데이터의수집 여론모니터링을위한비정형빅데이터 ( 여론빅데이터 ) 는인터넷뉴스미디어와까페, 블로그, 트위터, 페이스북등의소셜미디어서비스에서수집가능 자료수집전인터넷소셜미디어의이용자프로파일 ( 인터넷, 모바일서비스등을구매할수있는경제력을갖춘 20~40 대의도시거주자 ) 이여론모니터링의주요대상으로적합한지사전에고려해야함 여론빅데이터의수집을위해서는크롤링, FTP, Open API, RSS, 스트리밍기술등을활용할수있음 비정형빅데이터의전처리 여론빅데이터의품질개선을위해분석에부적합하거나중복된데이터, 특히광고성및악의성스팸을사용자, 단어, URL 등의반복패턴을분석하여제거 시공간분석을위해 GPS좌표, 지명 / 장소데이터베이스, 사회관계망기반추정등을이용하여여론관련메시지를위치 / 장소와연계 ( 지오코딩혹은공간정보화 ) 공간정보화된메시지는문장단위에서단어분리, 형태소분석, 불용어처리, 키워드추출등의과정을통해주요키워드셋트로정제 4) 여론내용의시공간분석 메시지작성위치및단어사용 ( 시공간 ) 군집분석 여론내용분석의첫단계는수집된메시지들의공간분포를분석하는것으로, 메시지위치도, 메시지건수의단계구분도, 밀도분석등의방법적용가능 어디에서무슨이슈가주로논의됐는지를파악하기위해, 주요키워드가빈번히사용되는대표지점을찾아키워드를표시하는단어사용군집지분석이용가능 ix
< 단어사용군집지분석결과의예시 > 출처 : Andrienko 외. 2013. Thematic Patterns in Georeferenced Tweets Through Space-Time Visual Analytics. 4 페이지. 여론트렌드 ( 토픽 ) 및감성의시공간분석 여론트렌드의시공간적경향성을파악하기위해, 수집된메시지들을지역별로분류하고그의미와맥락에따라특정주제 ( 토픽 ) 로나누어주제별구성의시공간적변화를살펴볼수있음 여론트렌드에반영된사람들감성이어떠한시공간분포를보이는지특정지역과장소에관한사람들의평판은어떠한지를파악하기위해, 메시지및장소별감성점수를계산하여지도로표출가능 < 여론토픽 ( 좌 ) 및감성 ( 우 ) 의시공간분석결과예시 > 출처 : Andrienko 외. 2013. Thematic Patterns in Georeferenced Tweets Through Space-Time Visual Analytics. 6 페이지. 출처 : Leetaru, K. H. 2012. Culturomics 2.0: Forecasting Large-scale Human Behavior Using Global News Media Tone in Time and Space. x
5) 여론형성주체의시공간분석 메시지작성자의위치및사회관계망의공간분포분석 인터넷소셜미디어상에서여론형성을주도하는사람들이실제현실공간에서어떻게분포하는지를이해하기위해, 메시지작성자의위치, 메시지작성자별메시지작성지점들의대표위치나범위를분석할수있음 인터넷소셜미디어공간에서벌어진사람들과의상호작용, 즉사회관계망이실제현실공간에서는어떤형태를띠는지를보기위해사회관계망에참여한사람들의공간적분포를네트워트형태로시각화하여분석할수있음 메시지전파의시공간분석 여론공간상의사회관계망을공간정보화하고이를상호작용 ( 메시지 ) 의유형에따라분류해보면, 특정메시지나이슈가어떤사람과장소를매개로어떻게지리적으로확산되는지그패턴을파악할수있음 < 사회관계망기반메시지의공간적확산분석의예시 > 파란색과분홍색선은각각메시지의 1 차, 2 차 ( 리트윗 ) 전파를나타냄출처 : Ma, D. 2013. Visualization of Social Media Data: Mapping Changing Social Networks. 43 페이지. xi
4. 결론및향후과제 본연구에서제안한비정형빅데이터시공간분석모델은인터넷소셜미디어에서 형성되는여론의지역적, 시간적변화동태를파악할수있는방법을제공하므로, 지역및수요맞춤형정책수요발굴을위한정책수단으로활용할수있을것임 본연구의결과를토대로한정책제언은아래와같음 비정형빅데이터를활용한여론분석을통해국민수요와지역맞춤형정책을발굴하려는정부 / 공공기관이증가하고있으므로, 공공부문에서공동활용할수있는여론모니터링체계를구축하여정책역량강화및예산중복투자예방 비정형빅데이터시공간분석모델을 정책지도, 공간빅데이터체계구축사업 등의국가및지방사업과연계하여, 정책지도의다양성을증대하고여론관련공간빅데이터의활용성제고 비정형빅데이터시공간분석모델의정책활용을위해중앙정부및지자체내관련조직 ( 정책기획과, 국민소통과, 주민참여과등 ) 간협력체계를구축하고, 정책수요발굴시비정형빅데이터활용을권고하는업무지침마련 비정형빅데이터시공간분석모델의기본원리, 적용방법, 효과등에대해체계적교육과홍보를실시하고, 활용사례를적극개발 공유하여여론기반정책수요발굴을위한첨단분석기법을확산 연구의한계와향후과제 ( 한계 ) 2개월의짧은연구기간으로인해비정형빅데이터시공간분석모델의정책적적용을위한상세방안및실증사례를발굴하지못함 ( 과제 ) 향후비정형빅데이터시공간분석모델의실증과적용을위한구체적정책연구를수행해야하며, 비정형빅데이터의공간정보화및공간데이터와의연계분석과같은방법론적개선방안도추가로연구할필요가있음 xii