<3520BAF2C5D7C0CCC5CD20BDC3B0F8B0A3BAD0BCAE20B9E6B9FDB7D020BFACB1B85F E687770>

Similar documents
ePapyrus PDF Document

ㅇ ㅇ

장애인건강관리사업

경상북도와시 군간인사교류활성화방안

<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770>


ad hwp



<BFA9BCBABFACB1B8BAB8B0EDBCAD28C6EDC1FD292E687770>

( 제 20-1 호 ) '15 ( 제 20-2 호 ) ''16 '15 년국제개발협력자체평가결과 ( 안 ) 16 년국제개발협력통합평가계획 ( 안 ) 자체평가결과반영계획이행점검결과 ( 제 20-3 호 ) 자체평가결과 국제개발협력평가소위원회

- 2 -

°æÁ¦Àü¸Á-µ¼º¸.PDF



본연구는교육부특별교부금사업으로서울산광역시교육청으로부터예산이지원된정책연구과제임

외국인투자유치성과평가기준개발

CR hwp

13Åë°è¹é¼Ł

**09콘텐츠산업백서_1 2

09 강제근로의 금지 폭행의 금지 공민권 행사의 보장 중간착취의 금지 41 - 대판 , 2006도7660 [근로기준법위반] (쌍용자동차 취업알선 사례) 11 균등대우의 원칙 43 - 대판 , 2002도3883 [남녀고용평등법위

한국정책학회학회보

[11하예타] 교외선 인쇄본_ver3.hwp

ad hwp


<B3EDB4DC28B1E8BCAEC7F6292E687770>

CC hwp

<BFDCB1B9C0CE20C5F5C0DAB1E2BEF7C0C720B3EBBBE7B0FCB0E82E687770>


내지(교사용) 4-6부

<C0FCB9AEB1E2BCFA20BFDCB1B9C0CEB7C220B3EBB5BFBDC3C0E520BAD0BCAE2E687770>

2002report hwp


기본소득문답2

그린홈이용실태및만족도조사

고3-02_비문학_2_사회-해설.hwp


조사보고서 구조화금융관점에서본금융위기 분석및시사점

<B3EDB9AEC0DBBCBAB9FD2E687770>

2

m (-6933, `12.5.2) ( ),,,,.,. 2 2 ( ) 1 2 (( 高 ) M10 110) 2,280, H, H.. - (, ) H, H, H. - ( 引拔 ), H,. (-6933, `12.5.2) ( ),. 3 (2,280), (, ) ( 共

wtu05_ÃÖÁ¾


viii 본 연구는 이러한 사회변동에 따른 고등직업교육기관으로서 전문대 학의 역할 변화와 지원 정책 및 기능 변화를 살펴보고, 새로운 수요와 요구에 대응하기 위한 전략으로 전문대학의 기능 확충 방안을 모색하 였다. 연구의 주요 방법과 절차 첫째, 기존 선행 연구 검토

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

농업기반정비사업 계획설계기준 개편

2ÀåÀÛ¾÷

2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관

2002report hwp

Contents iii

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

제 1 호 지방자치단체녹색정보화추진동향 제 2 호 전자정부성과관리를위한평가동향 제 3 호 외국모바일전자정부추진동향 제 4 호 업무용 PC 가상화 제 5 호 증강현실구현기술현황 제 6 호 Web 기술의진화와공공서비스 제 7 호 ICT 를통한일자리창출방안 제 8 호 스마트

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

국가건설기준 설계기준 Korean Design Standard KDS : 2016 쌓기 깎기설계기준 2016 년 6 월 30 일제정


INDUS-8.HWP

CONTENTS.HWP

<BBEAC0E7BAB8C7E8C1A6B5B52E687770>

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

대학생연수용교재 선거로본대한민국정치사

01정책백서목차(1~18)

농림축산식품부장관귀하 본보고서를 미생물을활용한친환경작물보호제및비료의제형화와현장적용매뉴 얼개발 ( 개발기간 : ~ ) 과제의최종보고서로제출합니다 주관연구기관명 : 고려바이오주식회사 ( 대표자 ) 김영권 (

November Vol.90 39

Special Theme TV SNS 2015 Spring vol

Untitled-1

성능 감성 감성요구곡선 평균사용자가만족하는수준 성능요구곡선 성능보다감성가치에대한니즈가증대 시간 - 1 -

Windows Live Hotmail Custom Domains Korea

소규모 비즈니스를 위한 플레이북 여기서 다룰 내용은 다음과 같습니다. 1. YouTube 소개 2. YouTube에서 비즈니스를 위한 채널 만들기 3. 눈길을 끄는 동영상 만들기 4. 고객의 액션 유도하기 5. 비즈니스에 중요한 잠재고객에게 더 많이 도달하기

UDI 이슈리포트제 20 호 울산권개발제한구역의효율적관리방안 도시계획연구실정현욱연구원 052) / < 목차 > 요약 1 Ⅰ. 서론 3 Ⅱ. 울산권개발제한구역의현황및문제점 4 Ⅲ. 외국의개발제구역대안적관리사

슬라이드 1

IP 심화 라우팅프로토콜적용시 라우팅테이블에서 이니셜이있는네트워크를설정하는것 : onnected 직접연결된네트워크를의미한다. 그러므로라우팅은 나는이런네트워크와연결되어있다. 를직접연결된라우터들에게알려주는것 1>en 1#conf t 1(config)#router rip 1

2002report hwp


슬라이드 1

목 차 Ⅰ. 사업개요 5 1. 사업배경및목적 5 2. 사업내용 8 Ⅱ. 국내목재산업트렌드분석및미래시장예측 9 1. 국내외산업동향 9 2. 국내목재산업트렌드분석및미래시장예측 목재제품의종류 국내목재산업현황 목재산업트렌드분석및미래시

05 ƯÁý

목 차 Ⅰ. 조사개요 3 Ⅱ. SNS 이용 현황 4 1. SNS 이용률 4 2. SNS 유형별 이용률 7 3. SNS 이용 행태 8 4. SNS의 주요 기능별 중요도 및 만족도 SNS 이용의 불편 피해 16 Ⅲ. SNS와 인맥 관리 SNS를 통한

제 2 기 (2011 년 ~2014 년 ) 지역사회복지계획

제1차 양성평등정책_내지_6차안

Web Scraper in 30 Minutes 강철

2차 수사분석사례집_최종.hwp

USC HIPAA AUTHORIZATION FOR

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

위탁연구 기능경기시스템선진화방안

여수신북항(1227)-출판보고서-100부.hwp

제 2 차 (2013~2015) 어린이식생활안전관리종합계획

<C1A4C3A5BFACB1B D3420C1A4BDC5C1FAC8AFC0DAC0C720C6EDB0DFC7D8BCD220B9D720C0CEBDC4B0B3BCB1C0BB20C0A7C7D120B4EBBBF3BAB020C0CEB1C720B1B3C0B020C7C1B7CEB1D7B7A520B0B3B9DF20BAB8B0EDBCAD28C7A5C1F6C0AF292E687770>

Ⅰ Ⅱ Ⅲ Ⅳ

View Licenses and Services (customer)


00-1표지

수출및수입액현황 (2016) 6억 1,284 만달러억 1 7,045 만달러 4억 4,240 만달러 2015 년대비 15.4 % 증가 2015 년대비 11.1 % 증가 2015 년대비 1.3 % 증가 수출액 수출입차액 수입액 지역별수출액 ( 비중 ) 일본 4,129만달러

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

슬라이드 1

CC hwp


2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

allinpdf.com

Transcription:

2014-10 여론모니터링을위한비정형빅데이터시공간분석방법론연구 Spatiotemporal Analysis of Unstructured Big Data for Public Opinion Monitoring 황명화

여론모니터링을위한비정형빅데이터시공간분석방법론연구 Spatiotemporal Analysis of Unstructured Big Data for Public Opinion Monitoring

연구진연구책임황명화책임연구원 외부연구진이양원국립부경대학교교수민보경서울시립대학교강사 연구심의위원사공호상국토연구원선임연구위원임은선국토연구원연구위원김대종국토연구원연구위원김동한국토연구원책임연구원

P R E F A C E 발간사 2014년학술논문 DB 사이트 DB 피아의이용자들이가장관심을많이가진 3대연구주제중하나가 소셜네트워크서비스 (Social Networking Service: SNS) 라고합니다. 정보통신기술의발달로 SNS를이용한사람들의의사소통이보편화되고, 이러한변화상이개인의일상사와더불어사회전반에많은영향을미치고있기때문일것입니다. SNS의발달은정책분야에서도역시많은변화를일으키고있습니다. 청와대를비롯한많은정부부처와기관에서 SNS 로대변되는인터넷소셜미디어를활용하여정책을적극홍보하고국민과의소통창구를확대하고자노력하고있습니다. 하지만, 정부와공공기관의인터넷소셜미디어활용은 관 에서 민 으로의일방적정보전달통로수준으로만유지되는경향이많아아쉬움이있습니다. 정책홍보와소통창구로서의역할외에인터넷소셜미디어의정책활용방안은무엇인가? 본연구는이같은의문으로시작되었습니다. 스마트폰 1인당 1개시대이며스마트폰보급률이 79.4% 에이르는우리나라에서인터넷소셜미디어는명실상부국민여론이형성되고전파되는새로운공간입니다. 국민수요에충실하고국민이체감할수있는정책을수립 집행하여국민행복을증대하고자하는우리나라의현국정기조에서볼때, 인터넷소셜미디어라는디지털공간에서형성되는국민의여론은소중하고가치있는정보원이아닐수없습니다. 인터넷소셜미디어가국민여론을담고있는귀중한자료원이라고할때, 이자료원에서생산되는데이터를어떻게분석해야국민과지역의정책수요를보다효과적으로파악할수있을까? 본연구가던지는두번째, 그리고핵심질문입니다. 이질문에답하기위해본연구는국민여론은시시각각변화하며이변화양상은지역마다장소마다다르다는점에착안하여, 비정형시공간분석모델을제안합니다. 인터넷소셜미디어에서는방대한양의데이터가실시간으로수집되어비정형빅데이터를생산하기때문입니다. 또한, 지역별로, 시기별로변화하는국민여론의트렌드를지도 i

분석과같은시각적인방법으로포착해낼수있다면, 국민이그리고지역에서원하는정책이무엇인지보다시의적절하게파악할수있기때문입니다. 아무쪼록이번연구가국민과지역의정책수요를파악하는데효과가클것으로기대되는소셜미디어빅데이터의시공간분석을활성화하고이의정책적용방안에대한논의까지도이끌어낼수있는계기가되기를기대합니다. 끝으로본연구를수행하는데노력을아끼지않은황명화책임연구원의노고를치하하며외부연구진으로참여해주신이양원교수님과민보경강사님께도깊이감사드립니다. 2015 년 1 월 국토연구원장김경환 ii

F I N D I N G S 주요내용및정책제안 본연구보고서의주요내용은다음과같음 수요맞춤형정책발굴을위한비정형빅데이터분석의정책활용은꾸준히증가하고있지만현재까지는대부분전국적여론트렌드의수시분석에머물러, 지역별, 시기별여론트렌드의세밀한변화를파악하기어려움 인터넷소셜미디어에반영된여론의시공간적변화트렌드를파악할수있는새로운분석방법론으로서, 비정형빅데이터, 텍스트마이닝, 시공간분석등을융합활용하여지도기반으로분석하는비정형빅데이터시공간분석모델제안 비정형빅데이터시공간분석모델은비정형빅데이터의수집, 비정형빅데이터의전처리, 비정형빅데이터의시공간분석의세단계로구성 비정형빅데이터는인터넷뉴스미디어와소셜미디어에크롤링, Open API 등의방법을적용하여수집할수있으며, 데이터의품질개선과공간분석을위해불필요자료제거, 지오코딩, 문장정제등의전처리를거쳐야함 비정형빅데이터의시공간분석을위해여론의내용과형성주체에초점을둘수있으며, 구체적으로단어사용패턴과토픽 / 감성의시공간분석, 온라인사회관계망의지리적분석등의기법을활용할수있음 본연구보고서의정책제안은다음과같음 ❶ 비정형빅데이터를활용한여론분석을통해국민수요와지역맞춤형정책을발굴하려는정부 / 공공기관이증가하고있으므로, 공공부문에서공동활용할수있는여론모니터링체계를구축하여정책역량강화및예산중복투자예방 ❷ 비정형빅데이터시공간분석모델을 정책지도, 공간빅데이터체계구축사업 등의국가및지방사업과연계하여, 정책지도의다양성을증대하고여론관련공간빅데이터의활용성제고 ❸ 비정형빅데이터시공간분석모델의정책활용을위해중앙정부및지자체내관련조직 ( 정책기획과, 국민소통과, 주민참여과등 ) 간협력체계를구축하고, 정책수요발굴시비정형빅데이터활용을권고하는업무지침마련 iii

S U M M A R Y 요약 1. 연구의배경및목적 국민행복을추구하는국정기조에따라수요및지역맞춤형정책의중요성이부각되면서, 국민의정책수요를시의성있게파악할수있는정책수단의필요성이증대하고있음 국민의정책수요를파악하기위해국민여론을직 간접적으로청취하고이를정책형성에반영하는노력이증대하고있음 특히, 정보통신기술의발달에따른국민들의의사소통방식변화를고려하고자인터넷소셜미디어로수집된비정형빅데이터를분석하여국민여론의트렌드와그동태를모니터링하려는움직임이커지고있음 비정형빅데이터분석의정책활용은꾸준히증가하고있지만현재까지는대부분전국적여론트렌드의수시분석에머물러, 지역별, 시기별여론트렌드의세밀한변화를파악하기어려우며이를위한새로운분석접근법필요 본연구에서는인터넷소셜미디어에반영된국민여론의시공간적변화트렌드를파악할수있는새로운분석방법론을개념적수준에서개발하고이의정책적함의를밝히고자함 비정형빅데이터, 텍스트마이닝, 시공간분석등의다양한데이터와분석기법을융합활용하여, 인터넷소셜미디어에반영된국민여론의시공간적패턴을지도를표출할수있는분석기법들을살펴보고, 이들의정책활용방향을제시함 iv

2. 여론모니터링과비정형빅데이터분석 여론모니터링의개념과방법 여론 (Public Opinion) 이란대중 (the mass) 혹은공공사안에관여하는개인들의집단적의견을말함 여론모니터링이란여론이어떠한지, 어떻게변화하고있는지그동향을지속적으로조사 분석하여정보와지식으로변환하는일련의활동을뜻함 여론모니터링의방법은분석의대상이되는여론의속성이무엇인가에따라, 여론내용에관한분석방법들과여론의형성주체에관한분석방법들로나뉨 인터넷소셜미디어기반의여론부상 1980~90 년대의 PC시대에서인터넷시대와모바일시대를거쳐지금은스마트시대로나아가고있음 인터넷패러다임의변화가스마트폰환경으로전이되면서, 최근블로그, 소셜네트워크서비스 (SNS), 위키등의소셜미디어활용이 20~40 대의젊은층을중심으로급속히증대하고있으며새로운국민여론형성의공간으로부상함 < 인터넷사용자중연령대별소셜미디어이용률의변화 > 출처 : http://www.pewinternet.org/fact-sheets/social-networking-fact-sheet (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) v

여론모니터링을위한비정형빅데이터분석의활용 인터넷소셜미디어기반의여론이부상하면서, 이들신규매체에서대량으로생산되는비정형빅데이터를여론모니터링을위해활발히사용함 미국에서는트위터의실시간분석을통해감기트렌트를모니터링하여보건정책에활용하였으며, 유럽에서는소셜미디어데이터분석을정책의다양한분야에서활용할수있도록 WeGov 등과같은툴박스를제작하여제공함 국내에서는 2013년문화체육관광부에서빅데이터분석을통해국민인식및여론변화추이를분석한바있으며, 국토연구원과국립재난안전연구원에서는빅데이터를활용한맞춤형부동산 / 도시재난 / 복지정책발굴을모색하였음 그러나, 선행연구에서활용한비정형빅데이터분석방법들은국민여론의공간적분포와시계열변이를추적하지못해, 국민수요및지역맞춤형정책지원에한계가있음 <WeGov 툴박스 > 출처 : http://www.slideshare.net/timo_wandhoefer/wegov-user-guide-toolbox-25 (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) vi

3. 여론모니터링을위한비정형빅데이터시공간분석모델 1) 기본방향및개념 본연구에서는지역및수요맞춤형정책을지원하기위해, 비정형빅데이터를위한새로운분석방법인비정형빅데이터시공간분석모델을제안함 비정형빅데이터시공간분석모델의기본방향과개념 ( 기본방향 ) 인터넷소셜미디어상의국민여론이지역별, 시기별로변화하는패턴을체계적으로분석하고지속적으로모니터링하여, 국민수요및지역맞춤형정책수요발굴을지원하고여론기반정책수립의시의성을제고함 ( 개념 ) 인터넷소셜미디어에서생성되는비정형빅데이터에크롤링, 텍스트마이닝, 시공간분석등의방법을함께적용하여, 인터넷소셜미디어에반영된국민여론의시공간적변화패턴을분석하는자료중심의여론모니터링방법 < 여론모니터링을위한비정형빅데이터시공간분석모델의개념 > vii

2) 전체구성 비정형빅데이터시공간분석모델은 1 비정형빅데이터의수집, 2 비정형빅데이터의전처리, 3 비정형빅데이터의시공간분석의세단계로구성 비정형빅데이터수집단계에서는 API 나유 무료소프트웨어를이용하여, 트위터, 페이스북, 블로그, 까페, 온라인신문등다양한인터넷소셜미디어매체에서시민들이논의한내용을지속적으로수집 저장 관리 비정형빅데이터전처리단계에서는수집된여론데이터에서광고성메시지, 욕설, 중복메시지등을제거하고, 메시지를관련된위치 / 장소정보와연계하며 ( 공간정보화혹은지오코딩 ), 메시지를정제하여키워드를추출 비정형빅데이터시공간분석단계에서는공간분포분석, 시계열데이터분석, 텍스트마이닝, 사회관계망분석등을융복합활용하여, 여론내용과형성주체의시공간적변화패턴을탐색 < 여론모니터링을위한비정형빅데이터시공간분석모델의전체구성 > viii

3) 비정형빅데이터의수집과전처리 비정형빅데이터의수집 여론모니터링을위한비정형빅데이터 ( 여론빅데이터 ) 는인터넷뉴스미디어와까페, 블로그, 트위터, 페이스북등의소셜미디어서비스에서수집가능 자료수집전인터넷소셜미디어의이용자프로파일 ( 인터넷, 모바일서비스등을구매할수있는경제력을갖춘 20~40 대의도시거주자 ) 이여론모니터링의주요대상으로적합한지사전에고려해야함 여론빅데이터의수집을위해서는크롤링, FTP, Open API, RSS, 스트리밍기술등을활용할수있음 비정형빅데이터의전처리 여론빅데이터의품질개선을위해분석에부적합하거나중복된데이터, 특히광고성및악의성스팸을사용자, 단어, URL 등의반복패턴을분석하여제거 시공간분석을위해 GPS좌표, 지명 / 장소데이터베이스, 사회관계망기반추정등을이용하여여론관련메시지를위치 / 장소와연계 ( 지오코딩혹은공간정보화 ) 공간정보화된메시지는문장단위에서단어분리, 형태소분석, 불용어처리, 키워드추출등의과정을통해주요키워드셋트로정제 4) 여론내용의시공간분석 메시지작성위치및단어사용 ( 시공간 ) 군집분석 여론내용분석의첫단계는수집된메시지들의공간분포를분석하는것으로, 메시지위치도, 메시지건수의단계구분도, 밀도분석등의방법적용가능 어디에서무슨이슈가주로논의됐는지를파악하기위해, 주요키워드가빈번히사용되는대표지점을찾아키워드를표시하는단어사용군집지분석이용가능 ix

< 단어사용군집지분석결과의예시 > 출처 : Andrienko 외. 2013. Thematic Patterns in Georeferenced Tweets Through Space-Time Visual Analytics. 4 페이지. 여론트렌드 ( 토픽 ) 및감성의시공간분석 여론트렌드의시공간적경향성을파악하기위해, 수집된메시지들을지역별로분류하고그의미와맥락에따라특정주제 ( 토픽 ) 로나누어주제별구성의시공간적변화를살펴볼수있음 여론트렌드에반영된사람들감성이어떠한시공간분포를보이는지특정지역과장소에관한사람들의평판은어떠한지를파악하기위해, 메시지및장소별감성점수를계산하여지도로표출가능 < 여론토픽 ( 좌 ) 및감성 ( 우 ) 의시공간분석결과예시 > 출처 : Andrienko 외. 2013. Thematic Patterns in Georeferenced Tweets Through Space-Time Visual Analytics. 6 페이지. 출처 : Leetaru, K. H. 2012. Culturomics 2.0: Forecasting Large-scale Human Behavior Using Global News Media Tone in Time and Space. x

5) 여론형성주체의시공간분석 메시지작성자의위치및사회관계망의공간분포분석 인터넷소셜미디어상에서여론형성을주도하는사람들이실제현실공간에서어떻게분포하는지를이해하기위해, 메시지작성자의위치, 메시지작성자별메시지작성지점들의대표위치나범위를분석할수있음 인터넷소셜미디어공간에서벌어진사람들과의상호작용, 즉사회관계망이실제현실공간에서는어떤형태를띠는지를보기위해사회관계망에참여한사람들의공간적분포를네트워트형태로시각화하여분석할수있음 메시지전파의시공간분석 여론공간상의사회관계망을공간정보화하고이를상호작용 ( 메시지 ) 의유형에따라분류해보면, 특정메시지나이슈가어떤사람과장소를매개로어떻게지리적으로확산되는지그패턴을파악할수있음 < 사회관계망기반메시지의공간적확산분석의예시 > 파란색과분홍색선은각각메시지의 1 차, 2 차 ( 리트윗 ) 전파를나타냄출처 : Ma, D. 2013. Visualization of Social Media Data: Mapping Changing Social Networks. 43 페이지. xi

4. 결론및향후과제 본연구에서제안한비정형빅데이터시공간분석모델은인터넷소셜미디어에서 형성되는여론의지역적, 시간적변화동태를파악할수있는방법을제공하므로, 지역및수요맞춤형정책수요발굴을위한정책수단으로활용할수있을것임 본연구의결과를토대로한정책제언은아래와같음 비정형빅데이터를활용한여론분석을통해국민수요와지역맞춤형정책을발굴하려는정부 / 공공기관이증가하고있으므로, 공공부문에서공동활용할수있는여론모니터링체계를구축하여정책역량강화및예산중복투자예방 비정형빅데이터시공간분석모델을 정책지도, 공간빅데이터체계구축사업 등의국가및지방사업과연계하여, 정책지도의다양성을증대하고여론관련공간빅데이터의활용성제고 비정형빅데이터시공간분석모델의정책활용을위해중앙정부및지자체내관련조직 ( 정책기획과, 국민소통과, 주민참여과등 ) 간협력체계를구축하고, 정책수요발굴시비정형빅데이터활용을권고하는업무지침마련 비정형빅데이터시공간분석모델의기본원리, 적용방법, 효과등에대해체계적교육과홍보를실시하고, 활용사례를적극개발 공유하여여론기반정책수요발굴을위한첨단분석기법을확산 연구의한계와향후과제 ( 한계 ) 2개월의짧은연구기간으로인해비정형빅데이터시공간분석모델의정책적적용을위한상세방안및실증사례를발굴하지못함 ( 과제 ) 향후비정형빅데이터시공간분석모델의실증과적용을위한구체적정책연구를수행해야하며, 비정형빅데이터의공간정보화및공간데이터와의연계분석과같은방법론적개선방안도추가로연구할필요가있음 xii

C O N T E N T S 차례 발간사 ⅰ 주요내용및정책제안 ⅲ 요약 ⅳ I. 서론 3 1. 연구의배경과목적 3 2. 연구의범위와방법 5 3. 선행연구현황및연구의차별성 7 II. 여론모니터링과비정형빅데이터분석 13 1. 여론모니터링의개념 13 1) 여론모니터링의개념 13 2) 여론모니터링의등장배경 15 3) 여론모니터링의방법 17 2. 여론모니터링과비정형빅데이터 20 1) 인터넷소셜미디어기반의여론부상 20 2) 여론모니터링을위한비정형빅데이터의활용 23 3) 비정형빅데이터기반여론모니터링방법과활용사례 24 3. 시사점 32 Ⅲ. 여론모니터링을위한비정형빅데이터시공간분석모델 37 1. 기본방향및개념 37 1) 기본방향 37 2) 개념 39 2. 여론모니터링을위한비정형빅데이터시공간분석모델 40 xiii

3. 여론관련비정형빅데이터의수집과전처리 43 1) 여론관련비정형빅데이터의수집 43 2) 여론관련비정형빅데이터의전처리 46 4. 여론의시공간분석 50 1) 여론내용의시공간분석 50 2) 여론형성주체에관한시공간분석 63 Ⅳ. 결론및향후과제 71 1. 연구의결과및정책제언 71 1) 연구의결과와의의 71 2) 정책제언 72 2. 연구의한계와향후과제 74 1) 연구의한계 74 2) 향후과제 74 참고문헌 77 SUMMARY 83 부록1. 시민참여형여론모니터링방법과사례 85 xiv

표 차 례 < 표 1-1> 선행연구와의차별성 9 < 표 2-1> 정책거버넌스의발전 15 < 표 2-2> e-governance의발전단계와특성 16 < 표 2-3> 인터넷패러다임의진화 20 < 표 3-1> 여론빅데이터공급원의종류및예시 44 < 표 3-2> 여론빅데이터수집기술 45 < 표 3-3> 비정형빅데이터수집특성 45 < 표 3-4> 여론자료관련위치 / 장소정보의유형 47 xv

그 림 차 례 < 그림 1-1> 연구의수행체계 6 < 그림 2-1> 여론의속성 17 < 그림 2-2> 여론모니터링방법의종류 18 < 그림 2-3> 인터넷사용자중연령대별소셜미디어이용률의변화 21 < 그림 2-4> 미국시민참여국홈페이지 22 < 그림 2-5> 폭염연관어분석결과 26 < 그림 2-6> 키워드빈도시계열분석의사례 26 < 그림 2-7> 전기부족관련감성분석결과 27 < 그림 2-8> WeGov 툴박스 29 < 그림 2-9> 복지정책분야에대한국민관심도 29 < 그림 2-10> 대구시 검색어를이용한서치네트워크 31 < 그림 2-11> 농림수산식품부 트위터계정의팔로어 (follower) 네트워크 31 < 그림 3-1> 비정형빅데이터시공간분석모델의기본방향 38 < 그림 3-2> 비정형빅데이터시공간분석모델의개념 40 < 그림 3-3> 비정형빅데이터시공간분석모델의전체구성 41 < 그림 3-4> 텍스트데이터의지오코딩방법 48 < 그림 3-5> 텍스트데이터의전처리과정 49 < 그림 3-6> 비정형빅데이터전처리결과 50 < 그림 3-7> 서울시트윗의위치도및위치건수의단계구분도예시 51 < 그림 3-8> 서울지역트윗의공간밀도및등치선도의예시 52 < 그림 3-9> 단어사용군집지분석결과의예시 53 < 그림 3-10> 단어사용군집지분석의원리 54 < 그림 3-11> 분류체계기반여론토픽분석의원리 55 < 그림 3-12> 분류체계기반여론토픽분석결과의예시 56 < 그림 3-13> LDA 토픽모델링알고리즘의문서-주제모델 57 < 그림 3-14> 토픽모델링기반여론내용분석의원리 57 < 그림 3-15> 여론토픽내용구조의지역별차이 58 < 그림 3-16> 토픽모델링을활용한 Science 논의내용의경향분석 59 xvi

그 림 차 례 < 그림 3-17> 여론메시지의시공간클러스터분석결과 60 < 그림 3-18> 여론감성공간분포분석의원리 61 < 그림 3-19> 여론감성공간분포분석의예시 62 < 그림 3-20> 메시지작성자의공간분포분석을위한기초자료 63 < 그림 3-21> 사용자별메시지작성대표위치분석의예시 64 < 그림 3-22> 사용자위치자료와사회관계망자료의연계 66 < 그림 3-23> 사회관계망의지리적네트워크분석예시 66 < 그림 3-24> 사회관계망내소그룹들의공간분포비교 분석의예시 67 < 그림 3-25> 사회관계망기반메시지확산분석의예시 68 xvii

chapter I 서론

C H A P T E R Ⅰ 서론 국민행복을추구하는국정기조에따라수요맞춤형정책의중요성이부각되면서, 국민의정책수요를시의성있게파악할수있는정책수단의필요성이증대하고있다. 이장은국민의정책수요를이해하기위해인터넷, 소셜미디어등신규매체에반영된여론을모니터링할수있는비정형빅데이터시공간분석모델을개발하는연구의수행배경, 목적, 방법및선행연구와의차별성을제시하였다. 1. 연구의배경과목적 2014년 6월 4일은제6회전국동시지방선거가시행된날이다. 이번선거에서흥미로운대목은미시공간과관련된선거공약이많았다는점인데, 동네에서먹고살자, 골목까지행복한복지국가 등이그예이다. 동네, 골목 과같은주민의생활공간과함께정책관계자들은주민생활의질에도주목하고있다. 최근정부에서주도하고있는 지역행복생활권, 지역행복지표, 국토체감지표 등의아젠다는국가정책의초점이지역주민개개인의행복증대와생활만족으로옮겨갔으며, 이는곧지역과그주민의특성과수요에최적화된정책의발굴과시행이정책입안자와실무자의주요현안임을반영한다. 지역맞춤형및수요맞춤형정책의부상으로국민과지역의정책수요를시의성있게발굴하고그수립을지원할수있는정책수단에대한수요가증가하고있다. 과거에는국가이념, 전문가의견, 총량적통계를토대로국가정책수요가조사 확정된 제 Ⅰ 장서론 3

후지방자치단체로전달되는성향이강했다. 그러나이러한하향식방법은주민수요보다는정치적목표에기반한정책의우선추진 (4대강개발등 ), 정책적의사결정과정의불투명성등여러문제점을낳았다. 최근쌍방향소통, 시민참여, 협력 합의를통한정책수립패러다임이부각되어, 하향식정책과정을국민의견의직 간접적수렴을통해보완하려는움직임이커지고있다. 국가와지역의정책과정에서정부가국민여론을청취하고이를정책형성에반영하는것은새로운일이아니다. 정부는정책의제를설정하고구체적정책을결정할때설문조사, 여론조사, 정책포럼, 자문위원회, 정책협의회, 세미나, 간담회, 정책토론회등의방법을통해정책과정의시민참여를허용하고있다. 그러나, 직접적시민참여기반의정부- 시민협의수단의경우, 국민참여가형식적이기쉽고, 참여자수가제한될뿐만아니라참여자선정에유관관계자의의견과이해가반영되어수집여론의대표성이떨어진다는단점이있다. 더불어, 실제로시민참여의장을마련하는준비절차가단순하지않고상당한비용이소요되어정부-시민간직접적협의는그시행횟수가낮은편이다. 결국, 전통적정부-시민협의방법들은주요정책의제에대한공동이해의토대를다지는데에는적합하나, 변화하는국민여론트렌드를시의성있게파악하여국민과지역의수요에맞춤화된정책의발굴에는그효용성이떨어진다하겠다. 전통적정부-시민협의방법을보완하고정보통신기술의발달에따른국민들의의사소통방식변화를고려하고자, 최근인터넷, 소셜네트워크서비스 (Social Networking Services; SNS) 등신규매체로표출된국민여론을분석하고그동태를모니터링하는움직임이커지고있다. 예를들어, 문화체육관광부는 빅데이터분석을통해본 2013 년국민인식변화 (2013) 과제에서다양한소셜미디어빅데이터를분석하여, 국민생활트렌드와정책관심도를파악하고국민관심도를반영한정책방향을제시하고자하였다. 문화체육관광부와같이신규매체에서수집되는비정형빅데이터를정책에서활용하려는시도가늘어나는이유는, 이들데이터가시민들이일상사중자발적으로공유한의견을대량으로포함하고있어, 데이터분석시국민여론의정확한경향성을파악할수있기때문이다. 4 여론모니터링을위한비정형빅데이터시공간분석방법론연구

비정형빅데이터분석의정책분야활용사례는꾸준히증가하고있지만, 현재까지는대부분상용서비스를이용한전국적여론트렌드의수시분석에머물고있다. 그러나, 이들상용서비스들은대체로데이터수집, 가공, 분석과정을투명하게공개하지않고, 키워드분석, 감성분석, 연관어분석등으로제한된범위의분석기법을제공하며, 분석결과의의미해석도용이하지않다는한계점이있다. 수요맞춤형, 특히지역맞춤형정책발굴의경우, 지역별여론트렌드와그변화가중요하여비정형빅데이터분석에대한시공간적접근법이필요하다. 따라서, 기존상용서비스들은지역맞춤형정책수요발굴에적용하기어려우며, 새로운방법론이필요하다. 이러한배경으로이연구는비정형빅데이터분석을활용한기존의정책수요발굴방법을보완하고자한다. 구체적으로, 이연구의목적은인터넷, 소셜미디어등신규매체에반영된여론의시공간적변화트렌드를파악할수있는새로운분석방법을개념적수준에서개발하고이의정책적함의를밝히는것이다. 즉, 비정형빅데이터, 텍스트마이닝, 시공간분석등을융합하여, 신규매체에반영된여론의시공간패턴을지도로표출하는분석기법들을살펴보고, 이들의정책활용방향을제시하고자한다. 2. 연구의범위와방법 이연구의내용은크게세가지범위로나누어진다. 첫째, 여론모니터링의개념과등장배경을이론적으로살펴보고, 비정형빅데이터를활용한여론모니터링방법과그활용사례들을검토한다. 둘째, 비정형빅데이터기반으로국민여론을시공간적으로분석하는방법론의개념과모델을정립한다. 이때, 여론의시공간분석방법들을여론내용과형성주체에대한기법들로분류하여구체적적용방법과사례들을제시한다. 셋째, 비정형빅데이터기반시공간분석방법들의정책활용가능성및그방향에대해제언하고, 본연구의한계와향후과제를논의한다. < 그림 1-1> 은이연구의수행방법과수행체계이다. 우선, 문헌조사와이론연구를통해본연구에적용되는여론모니터링의개념을정립하고, 그등장배경및분석프레임워크를살펴보았다. 두번째로, 인터넷, 소셜미디어등신규매체의등장과 제 Ⅰ 장서론 5

그로인한국민의사소통양식의변화및비정형빅데이터의출현, 여론모니터링에있어비정형빅데이터를활용할때기대되는효과등을이론적으로고찰하였다. 다음으로, 비정형빅데이터기반여론모니터링방법들과그특징및활용사례를조사한후, 이들방법들의개선을위한시사점을도출하였다. < 그림 1-1> 연구의수행체계 다음으로, 비정형빅데이터를이용하여여론트렌드의시공간적변화를모니터링할수있는새로운분석방법론을개발하고그구체적적용방안및사례들을예시의형태로제시하였다. 먼저, 새로운시공간분석방법론의개념및기본방향을정립하고, 이론적수준에서분석방법론개발모델과그구성체계를정의하였다. 본연구에서제시하는분석방법론의실체적이해를위해, 분석방법론을구성하는상세기법들을여론의내용과형성주체를대상으로하는두그룹으로분류하고그실제적용방법과결과의예시들을문헌연구를통해정리하였다. 마지막으로, 비정형빅데이터및공간분석전문가등과의자문회의및문헌조사를통해본연구에서제시한시공간분석방법론의정책활용가능성을진단하고, 그방향에대해제언하였다. 또한, 본연구및그결과의한계를설명하고, 향후추진해야할연구과제들을도출하였다. 6 여론모니터링을위한비정형빅데이터시공간분석방법론연구

3. 선행연구현황및연구의차별성 이연구와관련된선행연구는비정형빅데이터의정책활용을모색한연구를살펴보았으며, 크게 비정형빅데이터의국토정책활용방안 에관한연구와 비정형빅데이터기반재난관리정책고도화방안 에관한연구로구분할수있다. 비정형빅데이터의국토정책활용방안 에관한연구중에서는김대종 윤서연 (2013) 의 빅데이터를활용한국토정책반응모니터링및정책수요예측방안, 이영주외 (2013) 의 공간빅데이터기반의복지 공간융합모델시범연구, 김미정외 (2013) 의 과학적국토정책을위한공간빅데이터활용방안 을구체적으로살펴보았다. 김대종 윤서연 (2013) 의연구는다양한빅데이터의국토정책활용방안을제시하였는데, 비정형빅데이터의이용측면에서는소셜미디어, 인터넷뉴스, 블로그등의비정형빅데이터와공간빅데이터의연계분석을통해부동산정책에대한국민반응을모니터링하고미래정책수요를예측하는방안을논의하였다. 이영주외 (2013) 의연구는복지통계, 복지시설관련공간자료, 복지관련소셜미디어데이터, 설문조사결과를융합하여공간빅데이터를구축하고, 이를활용하여영유아복지여건을수요와인프라의두축에서진단하는방안을제시하였다. 비정형빅데이터를장소이름및지리좌표기반으로공간정보로변환하고영유아복지시설에대한주민의견의내용과감성을공간적으로분석하여, 비정형빅데이터공간정보화의필요성및복지수요분석의활용가능성을제시하였다. 김미정외 (2013) 의연구는비정형빅데이터를포함, 각종자료를융합하여국토정책을지원할수있는공간빅데이터체계를구상하고그구축계획을수립하였다. 특히, 침수재해모니터링, 영유아복지정책지원, 임대차수요예측등의국토문제해결에있어비정형빅데이터의활용방안을모색하였다. 비정형빅데이터기반재난관리정책고도화방안 에관한연구로는최선화외 (2013) 의 비정형빅데이터수집및분석모델개발 과최선화 배병걸 (2013) 의 소셜빅데이터재난관리운영방안및이슈탐지기법연구 를검토하였다. 두연구는 제 Ⅰ 장서론 7

동일연구과제의성과로, 국가재난의전조를감지하고신속대응하기위해소셜미디어빅데이터를수집, 가공, 분석하는방법론을개발하고이를재난관리업무에적용하는방안을제시하였다. 상기검토된선행연구들은정책수요발굴, 정책에대한국민반응모니터링, 재난상황정보의신속수집등비정형빅데이터의다양한정책활용방안을제시하였다. 하지만, 이영주외 (2013) 의연구를제외한다른선행연구들은국민이나주민의견의시공간적분포패턴및그변화상을분석할수있는방법론을제공하지않아지역및수요맞춤형정책지원에는제한적이다. 이영주외 (2013) 의연구의경우, 비정형빅데이터의공간정보화와위치기반감성분석등을시도하였으나, 여론의트렌드파악이나시공간적변화상의지도표출에있어서는기존의공간분석틀을벗어나지못했다. 본연구는국민여론의공간적, 시간적변화를탐색적으로분석할수있는지도기반의비정형빅데이터분석방법론을체계화하고, 이의정책활용가능성및방향을제시한다는점에서선행연구들과차별된다. 8 여론모니터링을위한비정형빅데이터시공간분석방법론연구

구분 주요선행연구 1 2 3 4 5 본연구 선행연구와의차별성 연구목적연구방법주요연구내용 과제명 : 빅데이터를활용한국토정책반응모니터링및정책수요예측방안 연구자 ( 년도 ): 김대종 윤서연 (2013) 연구목적 : 국토정책지원을위한빅데이터활용방안마련 과제명 : 공간빅데이터기반의복지 공간융합모델시범연구 연구자 ( 년도 ): 이영주외 (2013) 연구목적 : 복지 공간융합정책지원을위한공간빅데이터활용방안모색 과제명 : 과학적국토정책을위한공간빅데이터활용방안 연구자 ( 년도 ): 김미정 김대종 이영주 (2013) 연구목적 : 공간빅데이터구축을위한추진과제도출및국토정책활용방안제시 과제명 : 비정형빅데이터수집및분석모델개발 연구자 ( 년도 ): 최선화 배병걸 다음소프트 (2013) 연구목적 : 재난분야비정형데이터수집및분석모델개발 과제명 : 소셜빅데이터재난관리운영방안및이슈탐지기법연구 연구자 ( 년도 ): 최선화 배병걸 (2013) 연구목적 : 소셜빅데이터의재난관리활용방안수립및재난이슈탐지기법개발 기존여론모니터링도구를보완하기위해, 국민여론의시공간적변화트렌드를모니터링할수있는비정형빅데이터공간분석방법을개발하고이의정책활용방향제시 < 표 1-1> 선행연구와의차별성 문헌조사 전문가자문 컨퍼런스참가 자료구축및분석 전문기업와공동연구 문헌조사 전문가자문 공간및비정형빅데이터분석 설문조사 선행연구조사 전문가들과협동인구 빅데이터분석관련전문기업과협력연구 문헌조사 분류체계, 용어모델등지식모델개발 분석모델개발 프로토타입개발 국내외문헌검토 현황조사및분석 분석기법개발및검증 문헌조사및이론연구 현황및사례조사 이론및방법개발 자문회의 빅데이터개념정립 빅데이터활용사례및정책 / 기술동향 국토정책을위한빅데이터활용모델개발 빅데이터관련기술조사및정리 빅데이터기반부동산정책반응모니터렁사례연구 공간빅데이터의개념정립및복지정책활용필요성 복지 공간융합모델정립 영유아복지여건진단을위한공간빅데이터분석 ( 비정형빅데이터를활용한복지수요분석, 공간데이터를활용한복지시설공급분석등 ) 빅데이터개념과국토정책과의관계정립 국내외공간빅데이터추진현황조사 공간빅데이터체계기본구상 공간빅데이터체계구축계획및활용모델수립 빅데이터개념정의및관련기술조사 재난관리개념정의, 유형분류, 빅데이터활용해외사례조사 재난관리분류체계, 용어모델개발 재난관리를위한비정형빅데이터모니터링모델개발 빅데이터정의및동향분석 소셜빅데이터재난관리활용현황조사및개선방안마련 소셜빅데이터기반재난전조 발생이슈탐지기법개발및실험분석 여론모니터링관련이론고찰 비정형빅데이터기반여론모니터링방법및활용사례조사 여론모니터링을위한비정형빅데이터시공간분석모델의정립및정책활용방향에대한제언 제 Ⅰ 장서론 9

chapter II 여론모니터링과비정형빅데이터분석

C H A P T E R Ⅱ 여론모니터링과비정형빅데이터분석 이장에서는여론모니터링의개념과필요성에대한이론및정책적배경을검토하고, 비정형빅데이터를활용한여론모니터링의사례를살펴본다. 먼저, 여론모니터링의의미, 정책과의연관성, 여론분석의기본틀을고찰한다. 다음으로, 인터넷소셜미디어의등장으로인한여론형성공간의변화와비정형빅데이터의대중화에대해논의한다. 마지막으로, 여론모니터링을위한비정형빅데이터활용의의의와사례들을검토한후, 방법론적시사점을도출한다. 1. 여론모니터링의개념 1) 여론모니터링의개념 일반적으로여론 (Public Opinion) 이란대중 (the mass) 혹은공공사안에관여하는개인들의집단적의견을말한다 ( 김남두, 2010). 따라서, 단순히개인의견을표출하거나하나의정보를전달하는것은여론에해당하지못하며, 여론형성에는여러시민들이특정 메시지 ( 이슈 ) 를공유하고서로관심사를교환하는 ( 박상호, 2012) 상호대화과정이수반된다. 즉, 공통관심사와이를쟁점화할수있는다수의시민이여론형성의필수조건인것이다 ( 박상호, 2012). 공통관심사에대한시민들의집단적견해라고할수있는여론의모니터링이란비교적새로운개념으로, 여론이어떠한지, 어떻게변화하고있는지그동향을 제 Ⅱ 장여론모니터링과비정형빅데이터분석 13

지속적으로조사 분석하여정보와지식으로변환하는일련의활동들을뜻한다. 민간부문의경우대부분이윤창출과증대를위해여론을모니터링하고자한다. 공공부문의경우, 여론모니터링을통해국민과의소통을활성화하고, 정책발굴 수립 평가등정부활동과정책을지원하고자한다. 정부활동과정책지원에있어여론모니터링이필요한이유는두가지이다. 첫째, 여론과시민참여를토대로한정책은민주주의의기본원칙일뿐만아니라정책과정을여러가지방식으로개선할수있기때문이다. OECD(2001) 에따르면, 여론과시민참여는정책입법안의잠정적효과에대한시민평가등새로운정보를제공하여정책의질을향상시킨다. 또한, 정책집행이성공적으로이루어질가능성을높이며, 정책관련이해당사자들이정책과정에기여할기회를제공하여정책결정과정의정통성을강화할수있다. 뿐만아니라, 정책과정의개방으로시민-정부간파트너쉽을구축할수있으며, 이는공공문제의해결을보다수월하게만들수있다. 정부활동과정책지원을위해여론모니터링이필요한두번째이유는정책거버넌스와정보통신기술이발전하면서여론의조사 수렴과같은수동적방법이아닌적극적여론이해의수단이필요해졌기때문이다. 본장의아래에서보다상세히설명하겠지만, 인터넷등전자통신수단을통해국민이정책과정에직접참여할수있는기회가증가하고있으며, 이러한변화를정책관계자와국민모두긍정적으로받아들이고있다. 한편, 인터넷과소셜미디어등온라인매체들이보편화되면서여론의형성, 소통, 정책과정반영을위한정책도구와방법에대한변화도촉구되고있다. 이의대표적인예가, 2012년미국대통령선거로빅데이터기반상시적여론분석을토대로선거전략을구사하여여론모니터링에대한사람들의관심을불러일으켰다. 1) 2010년대이후우리나라에서도여론에관한자료수집과분석을자동화하여이를선거, 정책등다양한분야에활용하고자하는시도가증가하고있다. 2) 1) http://www.ciokorea.com/news/22802 (2015 년 1 월 6 일오후 3 시 45 분최종접속 ) 2) http://www.asiatoday.co.kr/view.php?key=349917 (2015 년 1 월 6 일오후 3 시 45 분최종접속 ) 14 여론모니터링을위한비정형빅데이터시공간분석방법론연구

2) 여론모니터링의등장배경 여론모니터링이등장하게된배경요인중핵심은정책거버넌스의변화이다. 일반적으로거버넌스란 공공및사적개인들과제도들이공공목적을달성하기위해자신들의공통적인업무를관리하고, 자원을통제하고권력을행사하는무수한방법의집합이며, 갈등적인이해나다양한이해관계들이수용되면서상호협력적인행동이취해 (Commission on Global Goverance, 1995) 지는과정이다. 민주화, 세계화, 정보통신기술의발전등각종여건의변화로정책분야의거버넌스는전통적통치방식에서 e-governance 패러다임으로빠르게진화하고있다 (< 표 2-1>). < 표 2-1> 정책거버넌스의발전구분전통적통치거버넌스 e-governancne 의사결정 소수의중앙집권적의사결정 확산된분권적의사결정 다수의통합적의사결정 방향성 대의적간접민주주의 다원적협의민주주의 다수적직접민주주의 가치 효율성 (efficiency), 대응성 (responsiveness) 효율성 (efficiency), 민주성 (democracy), 대응성 (responsiveness) 민주성, 효율성, 민주적관리 (democratic management) 주체정부네트워크시민, 시장 * 출처 : 한국전산원, 2004, e-governance 구현을위한과제와전략, p.21 < 표 5> 재인용 전통적으로정책관련의사결정은정부와국민을대표하는소수의정책입안자들이전담하는관료적, 가부장적구조였다. 정책과정에국민이직접참여할수있는기회는투표등으로제한되었으며, 정책관련정보의국민공유조차드물었다. 이러한수직적, 폐쇄적거버넌스구조는정책과정의효율성과대응성을제고하여빠른경제성장을이룩하는데기여하기도했지만, 민주주의의실현과는거리가멀다는단점이있다. 1990년대중반수평적네트워크를이루는다원화된주체들의의사결정이공공활동과정책의성패를좌우하는핵심이슈로부각되고, 이는 거버넌스 라는용어로지칭되었다. 거버넌스기반의정책환경에서는정부뿐만아니라, 지방정부, 국민 ( 시민 ; 주민 ), 기업, 국제기구, 초국적기업, 풀뿌리조직, 비영리단체등에도정책과정에참여할기회가주어지며, 협의와합의를통해의사결정이내려진다. 제 Ⅱ 장여론모니터링과비정형빅데이터분석 15

정보통신기술이발전하면서거버넌스에참여하는다양한주체들이온라인네트워크와사이버공간을통해정책관련각종정보를공유하고, 정책이슈를논의하며, 관련의사결정과정에도직접참여할수있게되었다. 이와같이 정보통신기술을이용하여정책결정과정에국민의참여를확대하며, 행정업무의신뢰성, 투명성을보장하는정부형태 를 e-governance 라한다 ( 문신용, 2006). 정책및관련행정차원에서 e-governance 는대의제보다는개인과집단이정책과정에직접적, 적극적으로참여한다는특징이있다. 이때, 개인과집단은선거, 투표, 공청회등제도적으로허용된장치이외다양한방식으로정책과정에참여하고, 일방적으로정보를제공받기보다는쌍방향적소통과합의를원한다 ( 한국대통령학연구소, 2008). < 표 2-2> 와같이 e-governance 는정보제공 (e-information), 상호작용 (e-interaction), 통합 (e-integration) 의단계로발전하는데, 정보기술기반의정보제공에서정부-시민간의사소통촉진및공동의사결정으로시민의정책참여범위를확대하는방식으로진보한다. e-government 또는전자정부는개념적으로 e-information과 e-interaction 에가까우며, 시민이정보기술기반으로의사결정에직접참여하는 e-integration 단계는여전히달성해야할목표로남아있다. 발전단계 < 표 2-2> e-governance 의발전단계와특성특성 1 단계 e-information 시민들에게참여에필요한각종정보를온라인을통하여제공하는단계 ( 정부의각종정책 시책 법안 사업및선거와관련한후보자, 공약등에관한자료들 ) 2 단계 e-interaction 3 단계 e-integration 네트워크상에만들어진게시판과 e-community 등을통해의견을수렴하고, e-polling 을통하여여론을수렴하는단계 정부의각종정책및의사결정에시민들이직접참여하여의견을표출하고시민과정부가공동으로의사결정을이루어나가는단계로서, 정책에대한결정은물론, 선출직을뽑는선거등모든결정이온라인을통해이루어지는단계 (e-voting) * 출처 : 한국전산원, 2004, e-governance 구현을위한과제와전략, p.25 < 표 7> 재인용 16 여론모니터링을위한비정형빅데이터시공간분석방법론연구

3) 여론모니터링의방법 공통관심사에대한시민들의집단적견해를여론이라고할때, 여론모니터링의대상이되는여론의속성은크게내용과형성주체두가지이다 (< 그림 2-1>). 여론의내용은집단적논의의대상이되는사안, 즉사회의주요이슈, 화두, 혹은정책적주제에대한사람들의공통된생각이나견해를말한다. 한편, 여론의형성주체는이런생각이나의견을개진한사람들에해당한다. 여론모니터링에있어, 내용분석은다양한언어로표현된말과글속에서일관되게드러나는공통된아이디어와주제, 사람들의논의태도와관련된감정을간파하는데초점을둔다. 여론의형성과정에서대화와의견교환등사람들간의상호작용이반드시일어나므로, 상호관계를맺은사람들과그관계의특성을분석하는것이여론형성주체에대한분석의주가된다. < 그림 2-1> 여론의속성 < 그림 2-2> 는여론모니터링을위해활용될수있는구체적방법들을보여준다. 이들방법들은여론수집과정에서일어나는소통의방향성관점에서일방향적인소통과쌍방향적소통을기반으로방법들로분류될수있다. 또한, 여론을형성하는주체인시민참여의직접성을기준으로직접적방식과간접적방식으로나뉜다. 제 Ⅱ 장여론모니터링과비정형빅데이터분석 17

< 그림 2-2> 여론모니터링방법의종류 * Donsbach & Traugott(2008), 모효정 권복규 (2009) 등의논의를토대로도식화 < 그림 2-2> 에서가장간접적인방법은매체분석과참여관찰로, 매체분석은각종미디어에반영된논의내용의분석을통해여론을이해하고자하며참여관찰은연구자가시민들의일상사에직접관찰하면서주요화두와그특성을파악하는접근법이다. 매체가다양화되면서, 매체분석은신문, 방송, 인터넷뉴스등언론분석에서, 최근에는소셜미디어 / 빅데이터분석으로그영역을확장하고있다. 매체나관찰의기제에아니라, 시민의직접적참여가시작되는여론모니터링유형은사회및여론조사이다. 사회조사는사회적현상에관한정성적, 정량적질문들을시민들에게던져사회인식과여론의동태를분석하는접근법인반면, 여론조사는시민들의의견을묻는데주력한다. 사회조사는그구성에따라응답자의생각과의견을파악하도록설계되기도하며, 이경우사회조사와여론조사는그경계가흐려진다. 사회 / 여론조사는조사도구에따라그종류가다양한데, 한두가지의 18 여론모니터링을위한비정형빅데이터시공간분석방법론연구

간단한질문에대해다중선택답안에서일부를고르는투표형조사 (Public Opinion Polling), 직접시민을만나서조사하는대면조사, 전화, 인터넷, 핸드폰, 소셜미디어등의소통도구를기반으로하는조사들이있다. 시민참여방법들은시민중일부대표자들이특정안건에대한논의에직접참여할수있는기제를제공한후그속에서표출되는사람들의생각과의견들을수렴하고, 검토 분석하는방식으로여론을파악한다. 공청회 / 청문회 / 자문은참석자들간의사소통이다소일방향적이고시민이비교적간접적으로의사를개진하는방식으로, 시민들은주로주최기관의발표나사전에선정된의제에대해듣고질문을하거나추가의견을제공한다. 보다시민참여가활발해지는방법들이포커스그룹, 시민자문위원회, 시민배심원 / 시민패널, 합의회의이다. 소규모그룹의시민들이자유롭게토론하고질의응답하며, 필요시자문을요청한다. 사이언스숍과시나리오워크숍등은연구개발활동이나지역개발정책수립시시민들의참여를유도하고그과정에서특정이슈에대한시민들의생각과의견을읽을수있는여론모니터링방법이다. 마지막으로공론조사나시민참여형토론은특정사회적이슈나정책현안에대해시민들이숙고하고토론할기회를제공하여, 언론보도나매체에의해편향된생각과의견이아닌양질의여론을형성될수있도록한다. 본연구에서는최근두각을나타내고있는비정형빅데이터기반의여론모니터링방법에초점을둔다. 정책거버넌스의발전으로사회 / 여론조사, 시민참여등직접적시민참여기반의방법들도새로이관심을끌고있으나, 이들방법에대한논의는본연구의범위를벗어나므로본문에서는다루지않는다. 다만, < 부록 1> 에서 < 그림 3-1> 에서소개된방법들중일부대표적인방법들에대해서만간략히설명한다. < 그림 3-1> 에표시된방법들중본연구에서논의하지않은방법들에대한상세정보는 외교통상정책결정에서의의견수렴과정에관한연구 ( 한국대통령학연구소, 2008), 울산북구주민참여정책추진성과분석및제도화 ( 울산광역시북구, 2013) 등의문헌을참조할수있다. 제 Ⅱ 장여론모니터링과비정형빅데이터분석 19

2. 여론모니터링과비정형빅데이터 1) 인터넷소셜미디어기반의여론부상 1980~90 년대의 PC시대에서인터넷시대와모바일시대를거쳐지금은스마트시대로나아가고있다 ( 최진명, 2012). 이러한정보통신기술의진화로인터넷패러다임또한정보제공중심의웹1.0 에서 참여 공유 개방 의웹2.0, 그리고개별사용자의특성과요구에맞게개인화된웹의형태인웹3.0으로발전하고있다 (< 표 2-3>). 인터넷은그출현직후부터사람의의사소통을위한미디어로활용되어왔고, 따라서인터넷패러다임의진화는사람들의의사소통양식을변화시키고있으며이는다시 e-governance 의발달과맞물려정책과정에도영향을미치고있다. < 표 2-3> 인터넷패러다임의진화구분웹 1.0 웹 2.0 웹 3.0 특징 정부중심 일방향정보제공 기반기술 브라우저 / 웹저장 주류형태 전문가가제작한특제주제중심의웹사이트 시민중심 양방향정보제공 브로드밴드 Rich Link/Content Models 개인이템플릿을이용해만든블로그 / 홈페이지, 소셜미디어 개인중심 개인별정보제공 시맨틱기술 센서네트워크 데이터를자동으로처리해제공하는맞춤정보서비스 중심관계 전문가 - 방문자 이용자 - 이용자 데이터 - 이용자 * 출처 : 이혜정 (2007), 변미리 (2012) 의논의내용정리 인터넷패러다임의변화가스마트폰환경으로전이되면서, 최근많은주목을끌고있는이슈는소셜미디어의활용증대이다. 소셜미디어 (Social Media) 는 웹 2.0 을바탕으로하는인터넷기반애플리케이션의총체이며사용자가콘텐츠를만들고교환할수있도록하거나혹은소비자가스스로만든미디어 (Kaplan & Haenlein, 2010) 이다. 미디어형태측면에서소셜미디어는블로그, SNS, 위키, 마이크로블로깅, 팟캐스트등다양한미디어를포괄하며, 쌍방형의즉각적의사소통지원, 개방형서비스, 매쉬업및정보융합의용이성등의특징을지닌다 ( 고영삼, 2011). 20 여론모니터링을위한비정형빅데이터시공간분석방법론연구

Pew Research Center 에따르면, 2014 년현재약 18억의인터넷사용자가소셜미디어를이용하고있으며 3), 2013년에는성인인터넷사용자중약 73% 가, 18-29 세인터넷사용자중약 90% 가, 30-40 세인터넷사용자중약 78% 가소셜미디어를사용했다고한다 (< 그림 2-3>) 4). 국내의경우, 한국인터넷진흥원의인터넷이용실태조사에따르면, 20대의소셜미디어사용률이 87.5%, 30대가 74%, 만 6-19세가 52% 로, 국내에서도젊은층의이용률이높게나타났다 ( 이윤희, 2014). < 그림 2-3> 인터넷사용자중연령대별소셜미디어이용률의변화 출처 : http://www.pewinternet.org/fact-sheets/social-networking-fact-sheet (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) 정보통신기술기반의정보공유와온라인소통활성화에더하여, 최근소셜미디어의확산은참여행동과직접소통을증진하고정책공론장을활성화하여정책과정전반에다양한변화를야기하고있다. 많은사람들이 SNS를통해실시간으로정보를주고받으며자신들의의사를국가및지역의정책에반영하고싶어한다. 또한, 블로그, 트위터와같은소셜미디어로표출된개개인의의견이집합되어여론을형성하면서정책과정에보다강한영향력을발휘하게되었고, 심지어풀뿌리여론의형성공간을소셜미디어가대체할수있다 ( 박상호, 2012) 는평가까지받고있다. 3) http://www.statista.com/topics/1164/social-networks (2005 년 1 월 6 일오후 2 시 10 분최종접속 ) 4) 2013 년 7 월 18 일부터 9 월 30 일까지, 18 세이상의인터넷사용자 5,112 명을대상으로조사되었다 (http://www.pewinternet.org/fact-sheets/social-networking-fact-sheet; 2005 년 1 월 6 일오후 2 시 10 분최종접속 ). 제 Ⅱ 장여론모니터링과비정형빅데이터분석 21

< 그림 2-4> 미국시민참여국홈페이지 출처 : http://www.whitehouse.gov/engage/social-hub (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) 상기한바와같이소셜미디어를통한시민의정책참여수요가증대하면서, 국내외정부기관들은정책수단으로서소셜미디어의활용방안을여러모로모색중에있다 ( 서원석 조세현 송희준, 2012; Kavanaugh 외, 2012). 미국의오바마정부는 2009년시민참여국을창설하고정부-시민간의사소통을위해정보기술을적극활용중인데, 최근에는 We the People, e-타운홀미팅 등의프로그램을통해다양한 SNS를통해각종정책관련행사에시민의자발적참여를유도하고중요사안에대해서는시민들이직접참여할수있는기회를제공하고있다 (< 그림 2-4>). 국내에서도, 대통령실, 안전행정부, 문화체육관광부, 국토교통부등대다수의중앙정부기관이 SNS 계정을도입운영하여양방향소통을시도하고있으며, 국민신문고의국민제안코너나서울시의천만상상오아시스등의정책제안서비스가이루어지고있다 ( 이원태 차재권 신호철, 2012). 국가및지역정책이해당사자들도이러한변화흐름에맞춰소셜미디어를이용하여사회문제점이나정책수요에빠르게대응할필요가있다. 22 여론모니터링을위한비정형빅데이터시공간분석방법론연구

2) 여론모니터링을위한비정형빅데이터의활용 인터넷소셜미디어기반여론의부상은여론모니터링의방법론적변화를촉구하고있다. 과거에는신문, 방송, 토론회등전통적매체들을활용하여여론의동향과변화를살펴보았다. 여론이형성 표출되는공간이오프라인, 지면매체, 방송등에서온라인의인터넷소셜미디어로확대되면서, 여론모니터링의대상이되는자료의공급원역시인터넷뉴스, 까페, 블로그, 트위터등의신규매체로포함하게됐다. 인터넷소셜미디어등신규매체들은시민들의자발적의견공유와쌍방향소통을지원하는플랫폼역할을하는데, 누구나차별없이언제어디서든생각, 의견, 감정을표현할수있도록하고그결과물을디지털데이터로수집 관리한다. 이러한플랫폼환경에서수집되는여론데이터는그형태와종류가다양하며, 빠른속도로끊임없이생성된다. 결과적으로, 신규매체에서생산하는여론데이터는그크기가매우방대한빅데이터의특성을띤다. 또한, 텍스트, 사진등의형태로표현되어데이터내의구조가정해져있지않는비정형데이터의특성을보인다. 따라서, 인터넷소셜미디어등신규매체를통해수집되는여론데이터를분석 모니터링하기위해서는, 비정형빅데이터를다루어야하며이들데이터에서가치있는정보를추출할수있는정교한분석기법들이필요하게되었다. 신규매체중심의비정형빅데이터기반여론모니터링은데이터수집, 처리, 분석을위한새로운방법론을요구하지만, 전통적매체기반의접근법의한계를보완할수있다. 먼저, 신문, 방송, 토론회등전통적매체에서는포착하기어려운시민들의일상적여론활동과정책수요에대한이해를높일수있다. 비록신규매체의이용자들이 20~40 대의젊은계층으로한정되긴하지만, 이들젊은이들은출근, 식사, 업무, 친목등의일상활동을수행하면서도자유롭게의견을개진하고교환할수있다. 지면, 스튜디오, 회의장등공식적공간에서논의하기어려운주제들도타인을의식할필요가없는신규매체에서는진솔하게논의될수있다. 그러므로신규매체에서수집된비정형빅데이터를여론모니터링에활용할경우, 보다신선하고다양한여론을포착하고국민들의실질적인정책수요를발굴할가능성이높아진다. 제 Ⅱ 장여론모니터링과비정형빅데이터분석 23

다음으로, 비정형빅데이터기반여론모니터링은여론트렌드변화를보다신속히포착할수있게한다. 기존의여론모니터링방법에서는소수의전문가들이발품을팔아자료를수집하고매체의내용을일일이읽고분석하는과정을거쳐야하므로, 여론트렌드의파악속도가느리다. 반면, 트위터, 페이스북등인터넷소셜미디어는실시간으로여론관련메시지를생산하며이들데이터는크롤링, API 등의방법으로자동으로수집할수있다. 따라서, 크롤링, 텍스트마이닝, 사회관계망분석등다양한정보기술과분석기법을융합활용하여, 자동 / 반자동화된여론트렌드추출이가능해진다. 결과적으로, 여론의경향성과변화패턴을파악하는속도가빨라지게된다. 3) 비정형빅데이터기반여론모니터링방법과활용사례 컴퓨터의대중화, 인터넷사용량의폭발적증가, 모바일애플리케이션과소셜미디어의확산등으로오늘날의세계는바야흐로빅데이터시대에진입하였다. 21세기의원유라고도불리는빅데이터의활용이기업이윤, 정부정책, 행정의효율성을좌우할것으로예측된다 (Goes, 2014). 우리나라의경우특히빅데이터에대한관심이높은데, 국가및지역정책을위한빅데이터활용방안을다양한각도에서모색중이다 ( 김대종 윤서연, 2013; 김미정외, 2013; 이석주외, 2013; 최선화 배병걸, 2013). 본소절에서는인터넷뉴스, 소셜미디어등신규매체에서생산하는비정형빅데이터를이용하여국민여론의현황과동태를분석하는방법론과그활용사례들을살펴본다. 5) (1) 텍스트마이닝기반매체분석 1 개요 인터넷뉴스, 소셜미디어등신규매체는다양한규모의언론집단과시민개개인이 국가와지역의정책에관한정보, 생각, 의견, 감정을서로교환하고소통할수있는 5) 소셜미디어의국가 / 지역정책활용방안에대해서도많은논의가있으며, 정책홍보및국민소통을위한소셜미디어의활용전략을관해서는서원석 조세현 송희준 (2012) 과광운대학교산학협력단 (2014) 의연구를참조하길바란다. 24 여론모니터링을위한비정형빅데이터시공간분석방법론연구

여론형성의새로운창구가되고있다. 이들매체는접근이쉽고, 사용자가원할때자유로이, 대부분자발적으로자료를제공할수있으며, 공유된자료가인적, 기술적네트워크를타고빠르게전파될수있을뿐만아니라, 한번수집된자료는상당기간지속적으로축적한다는장점이있다. 신규매체를통해수집되는자료는텍스트, 이미지, 동영상등그형태가다양한데, 그중텍스트자료가주를이루고그양이방대하다. 따라서, 신규매체에반영된여론과정서적반응이어떠한지, 이들패턴은어떻게변하는지를보기위해서는방대한양의텍스트자료를자연어처리하고계량분석하는텍스트마이닝방법들이활용된다. 일반적으로텍스트마이닝은그의미를찾기힘든텍스트기반의자료에서새로운정보를발견해내는일련의방법과기술들을총칭하며 ( 솔트룩스, 2008), 여론모니터링의맥락에서자주이용되는텍스트마이닝기법으로는동시출현단어분석, 키워드빈도분석, 감성분석, 이슈 / 토픽추출등이있다. 동시출현단어분석이란수집된텍스트문서에서키워드들이동시출현하는패턴을파악해내는분석기법이다. 예를들어, 하나의트윗에서동시출현한키워드의쌍을추출하고전체문서집합에서키워드쌍별발생빈도와연결관계를분석하면, 트위터상의주요관심이슈와그연계성의변화를추적할수있게된다 ( 진설아외, 2013). 키워드중특정주제어를선택하고이와동시출현한다른키워드간의관계를살펴보는분석을특히연관어분석이라고하며, 키워드들을주제별로분류한후연관어분석을실시하면주요이슈간의관련성을보다구조적으로파악할수있는장점이있다. 연관어분석의사례는 < 그림 2-5> 와같다 ( 최선화 배병걸, 2013). 키워드빈도분석은특정문서집단내에서자주언급되는키워드들을추출하고이들이언급되는빈도에따라순위를부여하는분석방법이다. 이방법에서키워드의순위는단순빈도로결정될수있으나, 동시출현단어분석으로도출된키워드간의네트워크그래프를기반으로그중심성에따라순위가계산 ( 페이지랭크등 ) 되기도한다 ( 진설아외, 2013). 키워드빈도분석을실시간이나일정시간간격으로수행하여사람들의관심사가어떻게변하는지그추이를탐색할수있다. < 그림 2-6> 은키워드빈도를시계열분석한사례이다. 제 Ⅱ 장여론모니터링과비정형빅데이터분석 25

< 그림 2-5> 폭염연관어분석결과 * 출처 : 최선화 배병걸 (2013) 그림 3.9(p.55) 발췌 < 그림 2-6> 키워드빈도시계열분석의사례 * 출처 : 김대종 윤서연 (2013) < 표 4-13>(p.108) 발췌 26 여론모니터링을위한비정형빅데이터시공간분석방법론연구

감성분석이란 텍스트에나타난사람들의태도, 의견, 성향과같은주관적인데이터를분석하는자연어처리기술 ( 신수정, 2014) 이다. 2012 년미국대선에서이기법이이용되면서그인기가상승하였으며, 최근에는민간이나공공에서마케팅도구로서도입하고있다. 감성분석은표본으로선택된사람들에게긍정 / 부정등을묻지않고대량의텍스트자료에서사람들의정서상태를추정함으로써대중의반응을 ( 반 ) 자동으로분석한다는장점이있다. 자료수집, 감성과관련된문장요소만을추출하는주관성탐지, 추출된키워드들이긍정인지부정인지를계량화하는극성탐지의세단계를거쳐감성분석이이루어지며 ( 신수정, 2014), 그결과는 < 그림 2-7> 과같이키워드나문서를몇가지의감정카테고리로분류하는형태를띤다. < 그림 2-7> 전기부족관련감성분석결과 * 출처 : 최선화 배병걸 (2013) 그림 3.10(p.56) 발췌 마지막으로이슈 / 토픽추출은방대한텍스트나멀티미디어자료에서특정주제나이슈, 주제그룹들을자동으로파악, 추출하는분석기법이다 (Sobkowicz 외, 2012). 이슈 / 토픽추출에대한접근법은다양한데, 일반적으로감독분류 (Supervised Classification) 와무감독분류 (Unsupervised Classification) 로구분할수있다. 감독분류에서는분석가가특정이슈나토픽에관한것이라판단한일련의훈련 ( 학습 ) 용문서를선택하고이문서들의단어구성, 문장구조등을통해이슈 / 토픽을찾아내는 제 Ⅱ 장여론모니터링과비정형빅데이터분석 27

분류모델을먼저개발한다. 이후, 그모델을신규로확보된문서들에적용하여미리선정된이슈 / 토픽중하나로할당한다. 반면, 무감독분류에서는특정문서군내에포함된단어들을그맥락과의미를기반으로유사도에따라몇개의그룹으로분류한후포괄적인주제어를부여하는방식을취한다. 두방법모두이슈 / 토픽추출시유용하나, 여론분석에서있어주요관심이슈가미리파악된경우에는감독분류가보다효율적이며, 여론상태에대한선입견없이인터넷뉴스, 소셜미디어등에서회자되는공통이슈를파악하고자한다면무감독분류가더적합하다하겠다. 2 활용사례 텍스트마이닝기반매체분석의대표적사례는 2009 년 H1N1 독감유행시미국에서트위터기반으로실시간감기트렌드분석을한것이다 (AAPOR, 2014). Chew Eysenbach(2009) 는 H1N1, swine flu 라는키워드를포함한트윗을수집 분석하여, 이들메시지가주로정보전달을목적으로생성되었으나독감과같은질병에대한사람들의태도나경험을보여주는좋은자료라고보고한바있다. 유사하게, Paul Drezde(2009) 는감기에관한트윗메시지의양과미국질병통제센터에서발표한공식감기통계가높은연관관계에있음을보여주고, 소셜미디어자료가장시간에걸친건강관련모니터링에효과적으로주장하여미국의보건정책에시사점을제시한바있다. 유럽에서는유럽연합위원회 (European Commission) 차원에서정책관련의사결정자들이다양한소셜미디어와이들매체에서수집된자료에서주요이슈와토픽을추출할수있도록지원하는소프트웨어프로그램을개발하는 WeGov 프로젝트를진행하였고그산출물로 WeGov 툴박스를제작한바있다 (Addis 외, 2010). < 그림 2-8> 은 WeGov 툴박스의메시지검색및토픽분석결과화면을보여준다. 국내에서는 2013 년문화체육관광부에서 빅데이터분석을통해본 2013 국민인식변화 과제를수행하면서국민인식및여론변화추이파악을위해특정주제어의언급량분석, 감성연관어분석등을실시한바있다 (< 그림 2-9>). 또한, 안정행정부국립재난안전연구원에서소셜미디어빅데이터를활용한맞춤형재난관리운영방안을연구한바있다 ( 최선화 배병걸, 2013). 특히, 이연구에서는재난관련감성분석, 28 여론모니터링을위한비정형빅데이터시공간분석방법론연구

재난이슈탐지기법등을개발하고이를활용하여소셜미디어를실시간모니터링함으 로써재난관리단계별맞춤화된정보서비스를개발할것을제안하였다. < 그림 2-8> WeGov 툴박스 * 출처 : http://www.slideshare.net/timo_wandhoefer/wegov-user-guide-toolbox-25 (2015 년 1 월 6 일오후 2 시 10 분최종접속 ) < 그림 2-9> 복지정책분야에대한국민관심도 * 출처 : 문화체육관광부 (2013) 슬라이드 #16 발췌 제 Ⅱ 장여론모니터링과비정형빅데이터분석 29

부동산정책의효과및관련수요예측에있어서도텍스트마이닝기반의소셜미디어매체분석이유용함을보여주는연구도있다. 김대종 윤서연 (2013) 은부동산임대차관련정책에대한국민반응을모니터링하는데감성분석, 키워드빈도분석이유용하며, 주요키워드빈도의추이분석을통해떠오르는부동산수요도파악가능함을제시한바있다. (2) 여론형성에관한사회관계망분석 1 개요 텍스트마이닝방법의초점은여론내용의이해에있다. 여론모니터링에있어여론의내용파악과함께중요한이슈는누가여론형성을주도하고여론이어떻게파급되는가이다. 소셜미디어의경우, 메시지의작성자, 응답자, 청취자, 재전파자등의정보가기록되기때문에여론형성과전파의경위나패턴을분석할수있다. 사회관계망분석이특히이러한패턴분석에유용하며, 그결과는국가와지역의정책과정에필요한여론을수집할때소셜미디어상의여론형성을어떻게주도하면되는지, 또는여론내용분석시어떠한점에주의하면되는지에대한정보를제공한다. 사회관계망분석은 특정사회시스템에서어떤구성요소들이어떤구도의관계망을형성하고있는지를나타내는데유용한연구방법이다 ( 조성은외, 2011). 이정의에따라, 소셜미디어이용자들의세계를온라인상의사회시스템으로간주할수있다. 이경우구성요소는소셜미디어이용자개인, 트위터에서는트위터계정을보유하고트윗활동을하는이용자가되며, 누가메시지를생성하고누가이메시지를팔로잉 (following) 하는지를네트워크형태의자료로구성하고이를시각화하면트위터상에서이슈가어떻게형성되고전파되는지를보다쉽게이해할수있다. 서치네트워크 (Search Network) 와에고네트워크 (Ego Network) 는트위터이용자간의관계망분석시자주활용되는시각화기법이다 ( 전채남, 2011). 서치네트워크는동일키워드를포함한트윗메시지를작성한이용자들간의관계를시각적으로보여준다. < 그림 2-10> 이그예인데, 네트워크상의노드가녹색일수록더많은 30 여론모니터링을위한비정형빅데이터시공간분석방법론연구

메시지를작성하고있고노드의크기가클수록많은팔로어 (follower) 가있음을 뜻한다. < 그림 2-10> 대구시 검색어를이용한서치네트워크 * 출처 : 전채남 (2011) 슬라이드 #21 발췌 < 그림 2-11> 농림수산식품부 트위터계정의팔로어 (follower) 네트워크 * 출처 : 조성은외 (2011) 슬라이드 #19 발췌 제 Ⅱ 장여론모니터링과비정형빅데이터분석 31

반면, 에고네트워크는특정트워터이용자를대상으로이이용자와다른이용자들이어떤관계망을형성하고있는지를보여준다. 에고네트워크에서는중앙노드는선택된특정이용자를, 다른노드들은선택된이용자를팔로잉하거나팔로잉된이용자를, 선의굵기는두이용자간에상호응답, 즉상호소통이잦았음을뜻한다. < 그림 2-11> 는에고네트워크의예시이다. 2 활용사례 사회관계망분석의국내활용사례로는농림수산식품부와대구시의트위터운영실태를분석한연구와경상북도의도민맞춤형계획수립의경우가있다. 조성은외 (2011) 는 2011 년농림수산식품부의트위터계정운영실태를사회관계망기법으로분석하여, 정부-시민간온라인소통을개선하고수집되는여론자료의질을향상시킬수있는방향을제시하였다. 전채남 (2011) 은대구시트위터와페이스북의운용결과분석에서치네트워크, 에고네트워크등시각화중심의사회관계망분석을적용한후, 대구시의시민소통효과를제고하고 SNS 상여론형성과정을개선할수있는방안을제안하였다. 마지막으로, 더아이엠씨 (2014) 는경상북도의요청으로도청홈페이지와네이버, 다음등포털사이트에서수집된빅데이터를사회관계망으로분석하여문화관광, 창의경제등의분야에대한정책수요를제시하였다. 3. 시사점 본장에서논의한여론모니터링의개념, 방법, 비정형빅데이터활용사례등을종합해보면, 민주주의와함께시작된여론모니터링이시민참여의확산, 신규매체 ( 소셜미디어등 ) 와방법론 ( 텍스트마이닝등 ) 의발달로그중요도와활용도가함께높아지고있음을알수있다. 정책지원의관점에서보았을때, 여론모니터링방법론의최근변화는네가지시사점을던져준다. 첫째, 중앙및지방정부는시민을정책과정의주요주체로전제하고이들의목소리를직간접적으로들을수있는다양한여론창구를마련하고지속적으로운영해야 32 여론모니터링을위한비정형빅데이터시공간분석방법론연구

한다. 민주주의의개념상시민이정책과정의중심이되는것은당연함에도불구하고, 그간시민들의목소리, 즉국민여론을수렴하는것은실효성이낮은형식적겉치레로여겨지는경우가많았다. 사회 / 여론조사의확산, 공론조사와시민참여형토론의이용증대, 소셜미디어등시민참여의대안출현등은정부와시민모두국민참여의중요성에대한인식을바꾸고있고, 여론을형성할수있는다채로운환경과방법이실제로존재함을말한다. 따라서, 정책관계자들도이러한여론환경의변화에대응할수있는여론모니터링체계를구축하여다양한방식으로표출되는정책수요를빠짐없이포착할수있는역량을갖추어야한다. 둘째, 소셜미디어의활용영역을정책홍보뿐만아니라국민소통과여론모니터링의부문으로까지확대하고, 이를제도적으로뒷받침할수있는조치가필요하다. 소셜미디어의이용이보편화되면서이들신규매체를활용하여정책홍보효과를제고하려는정부의다양한노력이있었다. 여론모니터링에있어서도소셜미디어는막대한영향을끼치고있는데, 소셜미디어로수집된여론의빅데이터분석사례가그증거라하겠다. 이처럼소셜미디어의용도가다양화되고있음에도불구하고, 중앙및지방정부의대표포털이나소셜미디어는여전히정부주도의일방적정책홍보의창구수준에만머물고있다. 국민이쉽게참여할수있고정부-국민간소통이활발히이루어지며, 이런참여와소통의발자취들을빅데이터분석등의수단으로지속적으로모니터링되어참여 소통이정책과정에지속적으로반영될수있는제도적기반마련이필요하다. 셋째, 맞춤형지역정책마련을위해지역단위에서여론의공간적분포와시계열변이를추적할수있는여론모니터링방법의개발이필요하다. 사회 / 여론조사의경우과거국가단위에서, 특정이벤트시기에만실시되는것이, 이제는광역시와시군구단위의자체정기조사로그형식이변형되고있다. 빅데이터기반의여론모니터링도문화관광부사례처럼전국단위에서실시되기도하지만, 최근에는지방자치단체내부에서지역수요의시의성있는이해를위해빅데이터분석기법을활용하는사례가조금씩등장하고있다 ( 경상북도사례 ). 이와같이점진적증가를보이는지방자치단체의정책수단수요에부응하기위해, 지역여론의변화와분포패턴을추적분석할수있는새로운여론모니터링방법들을개발해야한다. 제 Ⅱ 장여론모니터링과비정형빅데이터분석 33

넷째, 여론모니터링을정책과정에서쉽게활용할수있도록공동정책자산개념의여론모니터링가이드와툴킷 (Toolkit) 을개발해야한다. 시민의직접참여를통해서든, 빅데이터분석을통해서든다양한정부기관과조직에서여론모니터링을활용하는사례가늘고있다. 여론모니터링의구체적초점과내용은기관과사안에따라달라지겠지만, 적용방식이나필요한분석기법들은유사하다. 따라서, 기관별로여론조사나데이터분석을위한외부용역사업을진행하기보다는, 유럽연합위원회의 WeGov 사례처럼여론모니터링의다양한수요자들이함께사용할수있는소프트웨어툴킷이나상세방법론가이드를개발하여범부처적차원의플랫폼을통해공유하는것이효율적예산사용을위해바람직하다하겠다. 34 여론모니터링을위한비정형빅데이터시공간분석방법론연구

chapter III 여론모니터링을위한비정형빅데이터시공간분석모델

C H A P T E R Ⅲ 여론모니터링을위한비정형빅데이터 시공간분석모델 이장은인터넷, 소셜미디어등신규매체에반영된여론의시공간적변화상을탐색할수있는비정형빅데이터시공간분석모델의기본방향과개념을정립하고, 상세분석기법과그적용사례를정리하였다. 본장에서제시한분석모델의핵심은비정형빅데이터에반영된여론의주요트렌드를파악하고, 이의시공간적변화경향을추적하는것이다. 여론모니터링에있어여론내용과형성주체가주요관심사가되므로, 두측면에서여론시공간분석기법의상세적용방법을살펴보았다. 1. 기본방향및개념 1) 기본방향 지금까지여론모니터링의개념, 분석방법, 활용사례를살펴보았다. 상기의검토결과에서도출된시사점중하나는소셜미디어, 인터넷뉴스등새로운매체를통해형성되는국민여론을보다적극적으로모니터링하고이를위한분석방법들도체계적으로활용할필요가있다는것이다. 특히, 지역및수요맞춤형정책지원을위해서, 실시간으로생성되는여론데이터에서트렌드를파악하고이의시공간적변화를추적할수있는새로운분석방법을개발하여이를중앙및지방정부를위한공동정책수단으로발전시켜나갈필요가있다고강조하였다. 이시사점에대한대응으로, 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 37

본장에서는신규매체에서시시각각변화하는국민의견에서여론의경향성을찾아내고이를시공간적으로분석할수있는방법론을제안하고그개발모델을이론적으로정립한다. < 그림 3-1> 은본연구에서제시하는비정형빅데이터시공간분석모델에서추구하는기본방향과목표를보여준다. 정책과정에서이용됐던기존의여론모니터링은대부분리서치회사에서선정한표본인구나, 간담회, 공청회, 시민위원회등에초대된시민대표들의생각과의견을조사하는방식으로이루어졌다. 그결과, 기존방법들은최근에등장한인터넷뉴스나소셜미디어등의신규매체에서형성되는여론을충분히반영하지못했다. 또한, 시민조사나시민직접참여형여론모니터링방법들은특정행사시기에만실시되거나, 그시행간격이너무길어빠르게변화하는여론의신속한포착이어려웠다. 뿐만아니라종래의여론모니터링방법은지역별여론의차별화양상이나, 여론표출의시공간적변이에대한체계적접근을시도하지않아, 수요및지역맞춤형정책수요발굴을지원하는데한계가있었다. < 그림 3-1> 비정형빅데이터시공간분석모델의기본방향 38 여론모니터링을위한비정형빅데이터시공간분석방법론연구

비정형빅데이터시공간분석모델은기존여론모니터링방법의취약점을개선하여, 정책발굴및수립의시의성과정책의수요충족도를제고하고자한다. 이를위해인터넷뉴스, 소셜미디어등새로운매체공간에서형성되고있는여론의체계적분석을지향하며, 그수단으로서텍스트마이닝, 사회관계망분석, 시공간분석등다양한분석기법의융합활용을시도한다. 6) 무엇보다도여론이공간과시간의축상에서끊임없이변화한다는사실에중점을두고, 시기와지역별여론트렌드의파악과이의시공간적변화를지속적으로모니터링하는데초점을둔다. 2) 개념 비정형빅데이터시공간분석모델은인터넷뉴스, 소셜미디어등신규여론매체에서생성되는비정형빅데이터에크롤링, 지오코딩, 텍스트마이닝, 사회관계망분석, 시공간분석등의방법론을함께적용하여, 신규매체에반영된국민여론의시공간적변화패턴을분석하는자료중심의여론모니터링방법이다. < 그림 3-2> 는비정형빅데이터시공간분석모델의핵심개념을도식으로보여주는데, 신규매체를통해드러나는국민여론의내용과그형성과정의주요트렌드는무엇인지, 그리고이는시공간적으로어떻게변화하는지를살펴보는것이주요특징이다. < 그림 3-2> 에표현된모델의또다른특징은, 텍스트마이닝, 사회관계망분석, 공간분석등의과정을실시간으로수집되는여론자료에계속적으로적용할수있는체계를수립하고자한다는점이다. 이런체계구축을통해단발성의여론분석과정책수요발굴이아닌, 여론과정책수요의지속적모니터링을지원할수있다. 6) 본연구에서제안하는비정형빅데이터시공간분석모델은선행연구들에서사용된비정형빅데이터분석기법들을토대로한다. 그러나, 본연구의모델은기존분석기법들을활용하여비정형빅데이터의내용및관련속성의시공간적측면을분석하는데초점을두며, 여러연구에서산발적으로활용된분석기법들을여론모니터링이라는목적하에포괄적분석모델로종합한다. 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 39

< 그림 3-2> 비정형빅데이터시공간분석모델의개념 2. 여론모니터링을위한비정형빅데이터시공간분석모델 여론모니터링을위한비정형빅데이터시공간분석모델 (< 그림 3-3>) 은크게세가지요소로이루어진다. 첫번째요소는여론빅데이터수집을관장한다. 트위터, 페이스북, 블로그, 까페, 온라인신문등다양한여론매체에서시민들이논의한내용을 API나유 무료소프트웨어를이용하여지속적으로수집한다. 여론의시공간패턴을살펴보는것이본연구에서제안한분석모델의주요목표이므로, 자료수집시위치나장소에관한검색조건이적용되어자료작성자의프로파일이나자료내용에위치나장소를포함한문서와메시지들만수집하게된다. 또한, 정책적관심사에따라특정주제어들을검색조건으로사용하여, 분석할자료의내용적범위를축소할수도있다. 수집된자료들은텍스트값으로구성되며, 파일이나데이터베이스형태로저장 관리된다. 40 여론모니터링을위한비정형빅데이터시공간분석방법론연구

비정형빅데이터시공간분석모델의두번째요소는자료전처리지원을목적으로한다. 인터넷과소셜미디어공간은누구에게나개방되어있기때문에, 광고성메시지, 욕설, 중복메시지등분석할필요가없는자료도포함하고있다. 이들쓰레기자료의제거가비정형빅데이터전처리의첫단계이다. 다음으로, 여론자료의지역별분류와여론의공간분포패턴분석을지원할수있도록소셜미디어메시지나인터넷뉴스등의문건을특정위치나장소에할당하는공간정보화 ( 지오코딩 ) 단계를거친다. 지리적으로참조된여론자료가만들어지면, 여론내용의경향성을보다잘파악할수있도록텍스트메시지내의문장들을단어로분리하고, 형태소분석과불용어처리로메시지마다주된키워드만을남겨둔다. < 그림 3-3> 비정형빅데이터시공간분석모델의전체구성 < 그림 3-2> 에서제안된모델의세번째요소는수집된메시지와문서들에시공간분석을적용하는것이다. 본연구의 2장에서논의한것처럼, 여론모니터링시분석의대상이되는여론의속성은내용과형성주체로분류할수있으며, 시공간분석은이두가지속성에차례로적용할수있다. 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 41

여론의내용분석은수집된메시지나문서와관련된위치들의공간적밀도를살펴보는것에서시작하여, 키워드별빈발 ( 집중 ) 위치를지도로표출하는단계로발전한다. 다음으로, 행정구역이나관심사유사도등여러기준으로지역을분류하고, 지역별시민들의논의내용을대표주제로요약하여여론트렌드를파악한다. 이때, 자료전처리단계에서공간화된메시지와문서들은그참조위치에따라사전에정의된지역으로할당된다. 지역별여론의대표주제는키워드와상위주제들의관계를정의한분류체계나토픽모델링 7) 과같은텍스트마이닝기법을이용하여자동혹은반자동으로추출한다. 지역여론의주요토픽에대하여관련논의내용의구조를상세히파악해야하는경우, 동시출현단어분석과그래프시각화기법들을추가적용하여토픽별주제네트워크를제작할수도있다 ( 강범일외, 2013). 여론내용의트렌드가파악되면, 여론에투영된사람들의감성적태도, 즉긍 부정정도의공간패턴을분석한다. 여론자료에시간속성이포함된경우, 위에서논의된공간분석방법들을월, 분기등일정시간간격으로적용하여, 그변화동향을검토할수있다. 이때, 시계열지도, 애니메이션등을활용하여여론내용의시공간적변화를손쉽게살펴볼수있어야한다. 또한, 메시지나문서들간의시공간거리를계산하여, 일정공간거리내에서특정시간대에최소몇건이상의문서와메시지가생성된시공간클러스터들을탐지하고, 클러스터별주요토픽구성을분석할수있다. 비정형빅데이터에시공간분석을적용할때, 두번째주요분석대상은여론형성의주체이다. 즉, 신규매체라는사이버공간상에서여론형성에참여하는사람들은누구인지, 사이버공간상에서활발히상호작용하는사람들이지리적으로도인접한지, 사이버공간상에서의여론전파가지리적공간에서는어떤모습을띠는지등이분석의초점이된다. 여론내용분석의경우와같이, 여론형성주체에대한분석도매체이용자나메시지 / 문서작성자의공간적분포와이의시간적변화를살펴보는것으로시작한다. 다음으로, 댓글 8), 팔로잉 9), 리트윗 10) 등의형태로의견을교환함으 7) 토픽모델링은대량의문서묶음에서사용된키워드들의동시사용패턴을토대로이문서묶음을대표하는주요토픽들을추출해내는텍스트마이닝기법으로, 본장의 4 절에서상세히설명한다. 42 여론모니터링을위한비정형빅데이터시공간분석방법론연구

로써상호작용하는사람들의사회관계망을추출하고이를지리적공간으로투영하여, 사회관계망의공간적범위와그변화상을분석한다. 마지막으로, 리트윗, 링크, 공유등의방식으로특정생각과의견이확산된경우, 생각과의견의원천생산자와 2 3 차전달자의사회관계망을구분하고이들을지도상으로표출하여사이버공간상의정보확산이실제지리공간에서는어떤구조를띠며, 그구조가시간이흐르면서어떻게변화하는지를살펴본다. 본장의아래절들에서는비정형빅데이터시공간분석모델의개별구성요소를이루는자료수집 처리 분석기법들의상세내용을설명한다. 3. 여론관련비정형빅데이터의수집과전처리 1) 여론관련비정형빅데이터의수집 본연구에서대상으로하는여론관련비정형빅데이터 ( 이하 여론빅데이터 ) 의수집에있어가장먼저논의해야할이슈는자료의대표성이다. 본연구의 2장에서논의한것처럼, 인터넷뉴스, 소셜미디어등의신규매체는대다수의국민보다는인터넷, 모바일서비스등을이용할수있는경제력을갖춘 20~40 대의도시거주자들이주로이용하며, 남성보다는여성의이용비율이다소높다 ( 이윤희, 2014). 따라서, 여론빅데이터를수집하고자할때먼저여론모니터링의대상이신규매체이용자들의프로파일에해당하는지고려해야만한다. 여론빅데이터의공급원은크게인터넷뉴스미디어와소셜미디어서비스로구분할수있다. < 표 3-1> 은여론빅데이터의주요공급원과그예시를보여주는데, 이들자료는크롤링 (Crawling), FTP(File Transfer Protocol), Open API(Application Programming Interface), RSS(Really Simple Syndication), 스트리밍 (Streaming) 서비스등의기술을활용하여수집할수있다 (< 표 3-2>). 8) 인터넷게시물밑에남길수있는짧은글 (http://ko.wikipedia.org/wiki/ 댓글, 2015 년 1 월 4 일오후 8 시 15 분최종접속 ) 9) 트위터등의 SNS 에서다른사람이쓴글을구독하는행동 10) 트위터서비스이용자가다른사람이쓴글을그대로자신의게시물로등록하는행동 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 43

데이터공급원대분류소분류 인터넷뉴스미디어 소셜미디어서비스 인터넷뉴스서비스 인터넷신문 인터넷멀티미디어방송 까페 클럽 동호회블로그 미니홈피 마이크로블로깅 < 표 3-1> 여론빅데이터공급원의종류및예시 정의 / 예시 신문등의진흥에관한법률 에따른신문, 인터넷신문, 뉴스통신진흥에관한법률 에따른뉴스통신, 방송법 에따른방송및 잡지등정기간행물의진흥에관한법률 에따른잡지등의기사를인터넷을통하여계속적으로제공하거나매개하는전자간행물 예 : 네이버뉴스, 법률뉴스, 부동산114 인터넷뉴스서비스등 컴퓨터등정보처리능력을가진장치와통신망을이용하여정치 경제 사회 문화등에관한보도 논평및여론 정보등을전파하기위하여간행하는전자간행물 광대역통합정보통신망등을이용하여양방향성을가진인터넷프토토콜방식으로일정한서비스품질이보장되는가운데텔레비전수상기등을통하여이용자에게실시간방송프로그램을포함하여데이터 영상 음성 음향및전자상거래등의콘텐츠를복합적으로제공하는방송 까페 / 클럽의예 : 다음까페, 네이버클럽등 동호회의예 : 사진동호회 포토아지트, 쇼핑몰동호회 내가게 등 블로그의예 : 다음 / 네이버블로그, 이글루스, 티스토리등 미니홈피 : 싸이월드미니홈피등 수평적서비스 ( 다양한정보제공 ): 트위터, 페이스북등 수직적서비스 ( 특정관심분야정보만제공 ): 핀터레스트, 허핑턴포스트, 팹닷컴, 인스타그램, 패쓰, 포스퀘어등 인스턴트메신저 카카오톡, 구글플러스, 네이트온, 버디버디등인맥관리서비스 페이스북, 마이스페이스, 링크나우, 토씨등가상현실서비스 세컨드라이프, 싸이월드미니라이프등 * 출처 : 한국정보화진흥원 빅데이터전략연구센터 (2012), 김위근 김춘식 (2010) 여론빅데이터공급원의유형에따라적용가능한자료수집기술이다른데, < 표 3-3> 은매체유형별자료수집방법을보여준다. 크롤링은뉴스, 블로그, 인터넷까페, 트위터, 페이스북, 포스퀘어등다양한매체에서생성되는자료를수집하는데적용가능하다. 한편, Open API는유료혹은무료 API를제공하는서비스들에만적용할수있으며, 서비스에따라제공하는 API 종류가다르다. 예를들어, 트위터서비스의경우무료로이용가능한 Search API와 Public Streaming API를제공하며, 유료로이용할수있는 Firehose Streaming API도함께제공한다. 유료로서비스하는 Firehose Streaming API는사용자가공개를동의한모든트윗메시지를제공한다. 그러나, 무료서비스인 Search API와 Public Streaming API는수집된트윗메시지중일부만샘플링을통해제공한다. 44 여론모니터링을위한비정형빅데이터시공간분석방법론연구

Public Streaming API는검색시점부터생성된메시지중검색조건에맞는것들을 1% 무작위샘플링하여지속적으로제공한다. 11) 한편, Search API 는검색어가반드시필요하며검색조건에부합하는메시지중검색시점부터 6~9일전에생성된것들위주로자료를제공하나, 그결과조차도트위터에서수집한전수데이터는아니다. 12) 구분 특징 비고 크롤링 SNS, 뉴스, 웹정보등인터넷상에서제공되는웹문서 정보수집 웹문서수집 FTP TCP/IP 프로토콜을활용하는인터넷서버로부터각종파일을수신 파일수집 Open API < 표 3-2> 여론빅데이터수집기술 서비스, 정보, 데이터등을어디서나쉽게이용할수있도록개방된 API로데이터수집방식제공 다양한어플리케이션을개발할수있도록개발자와사용자에게공개 실시간데이터수집 RSS 웹기반최신정보를공유하기위한 XML 기반콘텐츠배급프로토콜콘텐츠수집 인터넷에서텍스트, 음성, 오디오, 비디오데이터를실시간으로실시간스트리밍지속적으로수집할수있는기술데이터수집 * 출처 : 미래창조과학부 한국정보화진흥원 빅데이터전략센터 (2014) 의 < 주요데이터수집기술 > 표 (p.14) 재구성 수집방법 휴대전화 이메일 < 표 3-3> 비정형빅데이터수집특성 논문 / 특허 뉴스블로그인터넷카페 트위터 페이스북 포스퀘어 데이터베이스 크롤링 RSS Streaming Open API Agent 수집간격 1분 1시간 1개월 1시간 6시간 6시간 1분 20분 1일 최소수명주기 3개월 6개월 5년 5년 3년 2년 1년 1년 6개월 * 출처 : 최광선 (2012) 11) 트위터 Streaming API 에관한상세정보는 https://dev.twitter.com/streaming/public(2014 년 12 월 10 일오후 11 시 55 분최종접속 ) 를참조할있다. 12) 트위터 Search API 에관한상세정보는 https://dev.twitter.com/rest/public/search(2014 년 12 월 10 일오후 11 시 55 분최종접속 ) 를참조할있다. Search API 의경우 1 회추출가능한메시지건수, 시간당 API 호출건수, 트위터계정별최대메시지반환건수등여러제약이있기때문에, 이들제약의조합으로인해검색조건에부합하는트윗메시지전수를추출하는것은가능하지않다. 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 45

트위터 API의예시에서설명한것처럼, 특정매체에서여론빅데이터를수집할때가능한모든데이터를수집할수도있지만분석의관심사나데이터처리능력에따라각종검색조건을부여하는경우가많다. 본연구의분석모델은여론트렌드의시공간적변이에초점을두므로, 검색조건에공간적범위가사용되는경우가많다. 예를들어, 트위터 Search API를이용할때 near: 국토연구원 within:15km 와같은연산자를이용하여특정위치나장소로부터일정거리이내에서작성된메시지만을추출할수있다. 그러나트위터와달리문서와특정위치 / 장소를연결할수없는경우도있다. 이때, 분석목적에부합하기만하다면, 먼저가능한모든문서를수집하고각문서내에서위치 / 장소관련단어들을추출하여잠정적위치정보를부여한후 ( 다음소절참조 ) 특정공간범위에해당하는문서들만을뽑아낼수있다. 공간적범위외에도시간범위나특정주제어를검색조건으로이용할수있다. 다양한기술로수집된여론빅데이터는관리를위해그원본을파일이나데이터베이스로저장해둔다. 데이터베이스가이용되는경우, 데이터의용량과수집주기, 여론트렌드분석과시공간분석의실시간지원여부에따라관계형부터 NoSQL 데이터베이스등여러기술중서비스목적에부합하는것으로선택할수있다. 2) 여론관련비정형빅데이터의전처리 < 그림 3-3> 에서볼수있듯이, 수집된여론빅데이터는여러단계의전처리과정을거친다. 이중첫단계는분석에부적합거나중복된데이터항목을제거하여수집된여론데이터의품질을개선하는것이다. 텍스트기반의온라인문서나메시지 ( 이하 메시지 ) 가주를이루는여론빅데이터에서데이터품질에영향을미치는가장큰요소는광고성혹은악의성스팸이다. 스팸의여과를위해다양한기법이적용될수있는데, 동일사용자가동일 URL이나단어를포함한메시지를빈번히작성하는경우, 특정매체에서생성한메시지를소수의사용자가독점하는경우, 특정사용자가유사내용의메시지를지속적으로작성하는경우를집중관리한다 ( 하수욱외, 2012). 46 여론모니터링을위한비정형빅데이터시공간분석방법론연구

여론빅데이터전처리의두번째단계는본연구에서제시한시공간분석모델에 서매우중요한데, 메시지를위치 / 장소와연계, 즉지오코딩하는공간정보화이다. < 표 3-4> 는신규매체에서수집된메시지와관련된위치 / 공간정보의유형과그 의미를설명하고있다. 구분위치 / 장소유형설명 / 의미 문서 / 메시지 문서 / 메시지의작성자 작성위치 / 장소 언급위치 / 장소 등록위치 / 장소 IP 등록위치 / 장소 < 표 3-4> 여론자료관련위치 / 장소정보의유형 좌표 ( 예 : 126.9,37.8), 위치 / 장소이름 ( 예 : 안양시, ** 아파트 ), 이동경로 좌표, 위치 / 장소이름 좌표, 위치 / 장소이름 좌표, 위치 / 장소이름 특정위치 / 장소에서논의된생각과의견으로, 반드시해당위치 / 장소에관한생각과의견은아니나그위치 / 장소와관련되어있을가능성이높음 한사용자가작성한문서 / 메시지들의작성위치 / 장소정보가일정기간이상누적될경우, 이사용자가활동하고있는공간의범위와그일관성을파악할수있으며이를통해작성위치 / 장소가그사용자의거주지나직장일가능성을추정할수있음 특정위치 / 장소에관한생각과의견 특정위치 / 장소에서활동한다고밝힌사용자의생각과의견이나, 그사용자가반드시관련위치 / 장소에서거주하거나일한다고는볼수는없음 문서 / 메시지가시스템을통해등록되는경우, 작성자의등록위치 / 장소가아닌시스템운영 IP가등록된위치 / 장소가주로기록됨 여론을포함한메시지는작성, 언급, 작성자위치 / 장소정보를포함하는데, 각각의미하는바가다르다. 메시지가특정위치와장소를언급하고있는경우, 그위치 / 장소및해당지역에관한여론으로간주할수있다. 반면, 메시지에작성혹은작성자의위치 / 장소가메타데이터의형태로추가되어있는경우, 이들자료에기재된내용은그위치 / 장소에머물렀던사람들의여론으로반드시그위치 / 장소에관한논의라고는할수는없다. 다만, 작성혹은작성자의위치 / 장소를포함하므로그위치 / 장소와관련성은높을것으로간주할수있다. 또한, 특정사용자의메시지를작성한위치들을일정기간 (3개월 13) 등 ) 이상수집할수있고, 이기간 13) 한국에서는상주의개념을 3 개월로한정하여 1 3 개월간계속살았거나, 2 3 개월을살지않았어도앞으로그곳에서살기간과이미살아온기간을합쳐 3 개월이상이되거나, 3 역시 3 개월을계속거주한일이없지만앞으로 3 개월이상을계속살것으로예상되는장소를상주지로규정 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 47

동안사용자가일관되게특정위치와시점에서메시지를작성했다면그위치를거주지 ( 이른아침이나저녁시간 ) 나직장 ( 낮시간 ) 으로간주할수있다. 이경우, 수집된메시지들은지역주민이나주요활동인구의여론으로볼수있다 (Andrienko 외, 2013; Ghosh Guha, 2013). < 그림 3-4> 는텍스트데이터의지오코딩시사용되는주요기법들을보여준다. 트위터등신규매체에서수집된메시지가 GPS 기반의작성위치나작성자의위치를명시한경우, 추가적인공간정보화가반드시필요하지는않다. 그러나, 분석목적에따라메시지위치를포함하는상위행정구역이나집계지역을파악하는지오코딩을수행할수있다. < 그림 3-4> 텍스트데이터의지오코딩방법 * 출처 : 하수욱외 (2012) 의논의내용재구성 신규매체에서수집되는메시지중상당수는정확한작성 / 작성자위치를포함하고 있지못하며, 메시지내에서장소이름을언급하거나메시지작성자의등록장소를 텍스트값으로명기한경우가많다. 이경우, 장소이름에해당하는단어들을추출하고 하였다. (http://terms.naver.com/entry.nhn?docid=1110027&cid=40942&categoryid=3161 2; 2015 년 1 월 4 일오후 10 시 44 분최종접속 ) 48 여론모니터링을위한비정형빅데이터시공간분석방법론연구

지명 / 장소명 /POI 14) 데이터베이스나지오코딩서비스를통해해당장소에관한지리좌표나행정구역등위치참조정보를계산해야한다. 이때, 메시지내에여러장소이름이언급되거나관련시공간맥락정보가부재하여장소이름이나타내는정확한위치가불분명할수있다. 이경우, 분석목적에따라장소와관련된위치를결정하는규칙을설정해야하며, 관련예는이영주외 (2013) 의연구를참조할수있다. 여론모니터링시수집된메시지와그작성자에관한위치정보가전혀없지만, 관련위치정보를추출해야하는경우도있다. 이경우, 메시지작성자의사회관계망데이터를추출하여작성자친구나지인들의위치정보를기반으로작성자가활동하는주요공간범위를추정하는방법이있다. 그러나, 그추정결과의신뢰도가낮으므로여론빅데이터의시공간분석시유의해야한다. 여론빅데이터전처리의나머지단계에서는메시지나문서에포함된문장들에서실제분석에쓰일주요키워드들만을정제하여뽑아낸다 (< 그림 3-5>). 이를위해먼저메시지를구성하는문장들을구문단위로세분하고 ( 문장분리 ), 각구문을구성하는단어들의형태소를분석하여 ( 형태소분석 ) 명사, 동사, 형용사, 부사등과같은주요품사를포함하는단어들만남긴다. 남겨진단어들에서조사, 어미등불용어를모두처리하여 ( 불용어처리 ) 주요키워드들만을추출한다 ( 키워드추출 ). 분석필요에따라, 키워드들은서로통합되기도하고유사의미의다른키워드로대체되기도한다. < 그림 3-5> 텍스트데이터의전처리과정 14) Points of Interest 의약자로주요랜드마크, 건물, 상점, 시설물등사람들의관심을많이끄는장소들의위치정보를포함한데이터베이스 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 49

여론빅데이터전처리의결과 < 그림 3-6> 과같은구조의분석용초기자료가만들어진다. 본연구에서는여론의지속적시공간분석을위한체계구축을지향하며, 이경우 < 그림 3-6> 에제시된초기자료가효율적분석을위해재구조화되기도한다. 추가적데이터변형은분석기법에따라달라지며, 이에대해서는세부분석기법을다루는다음소절에서논의한다. < 그림 3-6> 비정형빅데이터전처리결과 4. 여론의시공간분석 이소절에서는여론의내용과형성주체의시공간패턴을분석할수있는다양한방법들을설명한다. 이영주외 (2013), Andrienko 외 (2013), Ghosh Guha (2013), Leetaru(2011), Ma(2012), Neuhaus(2013) 의연구등국내외최신연구결과를토대로이들분석방법의기본원리와적용사례를제시한다. 1) 여론내용의시공간분석 (1) 메시지작성위치의공간분포분석 인터넷까페, 트위터, 페이스북등의신규매체를이용하는국민들은어디에서무슨이슈에대해주로논의하고, 이패턴은어떻게변할까? 여론모니터링시누구나쉽게제기할수있는질문이다. 수집한여론데이터를이용하여이질문을답하고자할때, 먼저수집된메시지가어디에서작성됐는지그공간분포를살펴볼수있다. 메시지작성위치의공간분포를분석하기위한기법은다양하며, < 그림 3-6> 과같은구조의기초분석자료에이들기법을그대로적용할수있다. 가장단순한분석방법은개별메시지의언급위치를지도상에점으로뿌려주거나, 50 여론모니터링을위한비정형빅데이터시공간분석방법론연구

격자, 읍면동, 시군구등의구역을기반으로메시지작성건수를단계구분도의 형태로표현하는것이다. < 그림 3-7> 은서울시를대상으로한가상의사례로, 159 건의트윗의위치와그건수를단계구분도로나타낸예시이다. < 그림 3-7> 서울지역트윗의위치도및트윗건수의단계구분도예시 메시지위치지도나단계구분도외에, 메시지작성이주변지역에비해특별히활발한핫스팟지역이어디인지분석할필요가있다. 이경우, 분석의초점은면적, 인구등메시지모집단관련변수대비실제메시지작성건수가기대이상으로높은지역을찾는것이다. 점밀도 (Point Density), 커널 (Kernel) 밀도분석등이핫스팟분석에자주활용된다. 커널밀도분석의경우일정간격의격자지도를생성하고, 각격자의중심점에서특정반경내에있는점들의커널밀도를계산한후그합계를표준화한결과를연속면 (Surface) 의형태로표현한다. 각종밀도분석의결과는그밀도값을일정간격으로구분하여등치선도 (Isolines) 의형태로도나타낼수있다. < 그림 3-8> 은서울지역에서생성된트윗메시지의공간밀도를연속면과등치선도로나타낸예시이다. 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 51

< 그림 3-8> 서울지역트윗의공간밀도및등치선도의예시 * 출처 : Neuhaus(2013) 의 Figure 9.73 (p.335) (2) 단어사용군집지분석 앞서논의했듯이, 어디에서무슨이슈를논의하는가는여론분석시자주제기되는질문이며, 이에대한답은여론의지역차를이해하는데핵심적역할을할수있다. 지역별여론이슈를직관적으로파악할수있는분석방법중하나는 Andrienko 외 (2013) 가소개한단어사용군집지분석 (Term-usage Cluster Analysis) 이다. 이방법에서는메시지에포함된주요단어들이기대이상으로빈번히사용되는지점들을찾고, 지명대신이지점들과관련된단어들을지도상에표현한다. < 그림 3-9> 는단어사용군집지분석의결과를예시적으로보여주는데, 미국시애틀지역에서작성된위치기반트윗메시지들을이용하였다. 52 여론모니터링을위한비정형빅데이터시공간분석방법론연구

< 그림 3-9> 단어사용군집지분석결과의예시 * 출처 : Andrienko 외 (2013) 의 Figure 2(a) (p.4) 단어사용군집지분석의원리는 < 그림 3-10> 에서설명하고있다. < 그림 3-6> 의기초분석자료에서모든메시들에포함된키워드들중고유한것들을추출한다. 이때, 각고유키워드를포함한메시지들의위치와시점, 즉시공간좌표를함께추출하여벡터행렬형태로저장한다. 다음으로, 고유키워드관련시공간좌표행렬에 k-means 군집분석을적용하여, 고유키워드를포함하고시공간거리가가까운메시지들로구성된소수의시공간핫스팟들을찾아낸다. 이군집분석과정을고유키워드각각에적용한후, 키워드별로추출된핫스팟들의중심점과메시지밀도를계산하여, 고유키워드의가중치로할당한다. 마지막으로, 각키워드와연관된가중치와시공간핫스팟들의중심점좌표를이용하여, 키워드를지도상에표시하여 < 그림 3-9> 와같은단어사용군집지도를만들어낸다. 지도상에표시된모든키워드는시간좌표를가지므로, 슬라이드바 (Slide Bar) 와같은탐색적분석도구를이용하여단어사용공간패턴의시간적변화를동적으로살펴볼수있다. 또한, 분석가가특정키워드를선택하면, 이와연관된모든메시지들의위치를지도상에표시하여특정이슈가논의되는공간적범위도세밀하게분석할수있다. 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 53

< 그림 3-10> 단어사용군집지분석의원리 * 출처 : Andrienko 외 (2013) 의논의내용을토대로도식화 (3) 여론트렌드분석 ( 토픽분석 ) 여론관련메시지의작성위치및주요단어가중점으로사용된군집지역탐색등은여론데이터의전반적시공간분포패턴파악에유용하다. 그러나, 이들결과는방대한여론빅데이터내에숨어있는주요토픽및트렌드를보여주는데에는한계가있다. 메시지작성위치지도나밀도의경우대부분인구밀도와유사한공간패턴을보여많은정보를제공하지는못한다 (Andrienko 외, 2013). 한편, 단어사용군집지분석의경우지도시각화를위해 k-means 군집분석을통해추출된시공간핫스팟들의중심지를이용하는데, 이들핫스팟의위치는그의미의해석이쉽지않다 (Andrienko 외, 2013). 키워드이상의유의미한정보를끌어내기위해서는, 메시지들을그의미와맥락에따라특정주제그룹으로분류하고이주제들의시공간패턴을분석할필요가있다. 이를위한두가지방법이분류체계와토픽모델링기반의여론토픽분석이다. 54 여론모니터링을위한비정형빅데이터시공간분석방법론연구

1 분류체계기반방법 < 그림 3-11> 은분류체계기반의방법의분석원리를도식화한것이다. 이분석방법의첫단계는여론주제들을정의한온톨로지나주제트리등의분류체계를정의하는것이다. 다음으로, 수집한메시지를구성하는고유키워드들을추출한다. 세번째단계로, 각각고유키워드가어떤주제에해당하는지를결정하여, 행은키워드이고열은주제이며셀의값은 1이나 0을포함하는이진행렬인 Feature Vector 를생성한다. 네번째로, 사전에정의되었거나 ( 행정구역등 ), 메시지작성위치의시공간적거리분석으로도출된 (Voronoi Tessellation 등 ) 지역구분체계를이용하여, 각소지역에서작성된메시지들을추출한다. 다섯번째로, 각지역메시지별로 Feature Vector 를추출하여합산한다. 마지막으로, Feature Vector 합산결과를토대로, 지역메시지에서자주논의되는여론주제들의분포를차트지도로시각화하여지역별주요여론토픽을직관적으로표출한다. < 그림 3-12> 는미국시애틀에서생성된트윗메시지에분류체계기반의방법을적용한사례로, Voronoi Tessellation 을통해소지역경계를결정하였다. < 그림 3-11> 분류체계기반여론토픽분석의원리 * 출처 : Andrienko 외 (2013) 의논의내용을토대로도식화 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 55

< 그림 3-12> 분류체계기반여론토픽분석결과의예시 * 출처 : Andrienko 외 (2013) 의 Figure 3 (p.6) 2 토픽모델링기반방법 여론토픽분석을위한두번째방법은토픽모델링 (Topic Modeling) 이다. 토픽모델링은텍스트자료내단어들의사용빈도를통계적으로분석하여전체입력자료를관통하는잠재주제들을추출해내고이주제들간의연관관계나시간적변화를살펴보는텍스트마이닝알고리즘이다 (Blei, 2012). 토픽모델링에대한접근법은다양한데, Latent Dirichlet Allocation(LDA) 방법이가장단순하면서도널리활용되고있다 (Blei, 2012). < 그림 3-13> 에서볼수있듯이, LDA 방법은텍스트자료들은알려지지않은여러주제로구성되어있고, 이주제들은다양한단어들로표현된다고전제한다. 또한, 텍스트자료내문서마다이주제들의구성비율이다르며, 이비율을결정하는확률분포가존재한다고전제한다. 이러한전제들하에, LDA 기법은문서내주제구성비율을결정짓는확률분포를추정하며, 그과정에서전체텍스트자료를주도하는주제들과그주제들을구성하는주요단어집합들을찾아낸다. LDA 기법의상세작동원리와통계및컴퓨팅측면에대해서는 Blei(2012) 의논문을참조할수있다. 56 여론모니터링을위한비정형빅데이터시공간분석방법론연구

< 그림 3-13> LDA 토픽모델링알고리즘의문서 - 주제모델 * 출처 : Blei(2012) 의 <Figure 1>(p.78) 발췌 < 그림 3-14> 토픽모델링기반여론내용분석의원리 토픽모델링기반의여론트렌드시공간분석의원리는 < 그림 3-14> 와같다. 사전에정의되었거나 ( 행정구역등 ), 특정분석으로도출된 (Voronoi Tessellation 등 ) 지역구분체계를이용하여, 각지역에서작성된메시지들을추출한다. 지역별메시지에 LDA 토픽모델링을적용하여, 주요토픽과이를구성하는키워드들을 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 57

도출한다. LDA 토픽모델링의경우빈번하게동시언급되는키워드그룹을추출하여여론토픽의존재는보여주지만, 각토픽의이름은분석가가키워드를기반으로할당해야한다. 이때키워드구성이조금상이하더라도동일토픽이름을할당할수있는데, 그이유는동일토픽이라도다른키워드들을통해표현될수있기때문이다. 토픽이름이결정되면, 지역메시지각각이특정토픽에연관될확률을행렬형태로계산하고, 전체지역메시지가각토픽에연관될평균확률을계산한다. 이결과값을이용하여, 지역별여론의토픽분포를 < 그림 3-12> 와유사한차트지도의형태로표현할수있다. 또한, 동일토픽에대하여지역별키워드구성네트워크를생성하여, 같은토픽에대한여론이라도그상세내용은지역마다어떤차이를보이는지분석할수있다. 진보적성향의지역 A와보수적성향의지역 B가있고, 두지역주민들이모두 경제민주화 라는토픽에대해관심을보였다고가정해보자. < 그림 3-15> 는 경제민주화 라는공통토픽에대한상세논의내용을주제네트워크로표현한것이다. 비록여론의주요토픽이동일할지라도, 진보적인지역 A에서는경제민주화의효과 ( 재벌개혁등 ) 에대한관심이높은반면, 보수적인지역 B에서는경제민주화에대한우려 ( 대기업, 경쟁력등 ) 를보다많이표출하였다. < 그림 3-15> 여론토픽내용구조의지역별차이 * 출처 : 강범일외 (2013) 의 < 그림 1>(p.324) 재구성 58 여론모니터링을위한비정형빅데이터시공간분석방법론연구

토픽모델링의주된장점은방대한여론자료를대표토픽들로요약할수있다는것이다. 이에더해, 주요토픽의시간적변화상을지속적으로분석할수있다는점에서토픽모델링은여론모니터링에유용하다. < 그림 3-16> 은 1880년부터 2002 년까지수집된 Science 잡지기사에토픽모델링을적용한결과이다. 이그림에서볼수있듯이, 토픽모델링을활용하면여론을구성하는주제들과이의세부키워드구성이시간의흐름에따라어떻게변화하는지, 그추이를보다효과적으로모니터링할수있다. < 그림 3-16> 토픽모델링을활용한 Science 논의내용의경향분석 * 출처 : Blei(2012) 의 <Figure 5>(p.81) 중일부발췌 (4) 메시지의시공간클러스터분석 어디에서무슨주제들의여론이주로형성되는가라는기본의문이만족되면, 여론형성활동이특히활발하거나저조한지역은어디이고, 이러한예외적현상이벌어진시기는언제인지등의추가질문을던질수있다. 예를들어, 어린이보호구역관련정책수요가높은지역을찾고싶을때, 최근어린이보호구역에대한논의가예외적으로활발했던시공간클러스터를찾아클러스터별상세토픽을분석할수있겠다. 일정기준이상의형성활동이특정시기에만집중되어분석가가특별히관심을쏟아야하는예외상황을포착하기위해서, 시공간클러스터분석을여론관련 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 59

메시지에적용할수있다. < 그림 3-6> 의기초분석자료를보면, 모든메시지는시공간좌표를가진다. 이들 3차원좌표를이용하여개별메시지간의시공간적거리를계산할수있다. 다음으로, 최소메시지건수, 메시지간최대공간거리, 메시지간최대시간거리등의기준을적용하여, 메시지들의시공간클러스터를찾아낼수있다. < 그림 3-17> 은미국시애틀에서생성된트윗메시지들의시공간클러스터를보여주는데, 이때적용된클러스터기준은최소 10건의메시지, 최대 500m의메시지간공간거리, 최대 15분의메시지간시간거리였다. < 그림 3-17> 에서시공간클러스터들은그공간범위에따라크기가달라지며, 공간범위가유사하나시간범위가다를경우중첩된원들로표현되었다. 또한, 각클러스터내에포함된메시지들에여론토픽분석을적용하여, 클러스터별여론토픽구성을차트의형태로표현하였다. < 그림 3-17> 여론메시지의시공간클러스터분석결과 * 출처 : Andrienko 외 (2013) 의 <Figure 6>(p.8) 발췌 60 여론모니터링을위한비정형빅데이터시공간분석방법론연구

(5) 메시지감성의시공간분석 본연구의제2장에서논의한것처럼, 특정이슈에대한사람들의태도나성향을파악하고자할때감성분석을주로이용한다. 대체로감성분석은여론전반에반영된사람들의정서 ( 긍정 / 부정 ) 를살펴볼때활용된다. 하지만, 시공간적맥락에서여론에반영된사람들의감성은어떤시공간분포를보이는지, 특정지역 / 장소에관한사람들의평판은어떠한지도분석할수있다. 여론에반영된감성의공간분포를분석하는가장단순한접근법은위치참조된메시지들을지도상에점의형태로뿌리고, 이들의색상을메시지의긍 / 부정점수에따라다르게표현하는것이다 (< 그림 3-18>). < 그림 3-18> 여론감성공간분포분석의원리 여론메시지의긍 / 부정점수를활용하여, 메시지에언급된도시나장소들에관한 사람들의언급태도나성향도분석할수있다. 먼저, 수집된여론데이터에포함된 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 61

모든장소 / 도시를추출한다. 다음으로, 각장소 / 도시를포함한모든메시지들의평균감성점수를계산하여이들장소 / 도시에할당한다. 세번째단계로, 두개이상의장소 / 도시를동시언급하고있는메시지들을추출하고, 함께언급된장소 / 도시를선으로연결한다. 네번째로, 각선의끝점에해당하는두도시 / 장소들을동시포함한메시지들을추출하고, 이들의평균감성점수를선에할당한다. 마지막으로, 주요장소 / 도시및이들을잇는선을네트워크지도형태로표출한다. < 그림 3-19> 는 2005년뉴욕타임즈에서언급된도시와랜드마크에관한감성분석로, 초록색지역은그지역관련긍정적논의가많으며빨간색지역은부정적논의가많음을뜻한다. 여론데이터에포함된장소들에대해감성분석을적용할경우, 유사한분석결과를산출할수있다. < 그림 3-19> 여론감성공간분포분석의예시 * 출처 : Leetaru(2012) 의 <Figure 12> 발췌 62 여론모니터링을위한비정형빅데이터시공간분석방법론연구

2) 여론형성주체에관한시공간분석 (1) 메시지작성자의공간분포분석 인터넷까페, 트위터, 페이스북등의온라인매체를이용하여여론형성을주도하는사람들이실제현실공간에서는어디에위치할까? 온라인이라는가상의공간에서활동하므로여론형성주체들의실제지리적분포에는아무런경향성이없을까? 아니면, 실제지리적으로가까이사는사람들이온라인매체에서도활발히의견을주고받는것일까? 여론형성주체에관한이러한질문들도여론모니터링에있어중요한역할을하는데, 이는온라인매체상의여론형성과정에대한이해를높일수있을뿐만아니라, 온라인매체와실제지리공간상에서의여론형성이어떻게연관되어있는지를파악할수있도록도와주기때문이다. 여론형성주체들의공간분포를파악하기위해서는, 수집된여론데이터를작성한사람들의활동위치나장소와관련된기초분석자료를먼저구축해야한다. 트위터, 페이스북등의 SNS 서비스에서는사용자가서비스를가입할때사용자주소나거주 / 활동지를기입하도록하므로, 이들정보를활용하여메시지작성자의위치 / 장소를파악할수있다. 또한, 사용자가작성한메시지들의작성위치도사용자가활동하는공간적범위를보여줄수있는데, 이경우하나의위치나장소가아닌이동경로와같은일련의위치정보들을수집해야한다. 여론형성주체인메시지작성자들의공간분포분석을위한기초자료는 < 그림 3-20> 과같은구조를가진다. < 그림 3-20> 메시지작성자의공간분포분석을위한기초자료 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 63

메시자작성자의위치자료가구축되면, 이들위치의공간분포를분석할수있다. 메시지작성위치에대한공간분석의경우와마찬가지로, 위치도 (< 그림 3-7>, 단계구분도 (< 그림 3-7>), 밀도분석 (< 그림 3-8>) 과같은기법을이용하여메시지작성자들의공간분포패턴을탐색할수있다. 또한, 사용자별메시지작성위치들의대표점을추출하여그분포의공간적변이를살펴볼수있으며, 메시지작성위치들을연결하는이동경로들의밀도 (Line Density) 를분석하여여론형성활동이어디에서보다활발한지살펴볼수있다. < 그림 3-21> 은사용자별대표적메시지작성위치를보여준사례로, 미국시애틀에서트위터사용자들이트윗을작성한위치를기반으로사용자별이동경로를추출하고, 이이동경로의대표점 (Medoid) 을원으로표시하였다 (Andrinko 외, 2013). < 그림 3-21> 사용자별메시지작성대표위치분석의예시 * 출처 : Andrienko 외 (2013) 의 <Figure 9>(p.10) 발췌 64 여론모니터링을위한비정형빅데이터시공간분석방법론연구

(2) 사회관계망의공간분포분석 인터넷까페, 트위터, 페이스북등신규매체에서여론은매체이용자들간의상호작용을통해형성된다. 면대면소통을통해의견이조성되는오프라인의여론공간과달리, 온라인공간에서는친구맺기, 댓글, 팔로잉, 리트윗등의특수한행위를통해사람들간의소통이이루어진다. 온라인매체에서어떤사람의친구는누구인지, 이사람의메시지에누가댓글을달았는지, 이사람의메시지들을리트윗하는사람들은누구인지등의정보를추출하여매체이용자들간의사회관계망을추출 분석할수있다. 2장에서설명한것처럼, 여론데이터에숨어있는사회관계망을분석하는기존의방법들은대부분사회관계망의공간적측면을고려하지못했다. 그러나, 신규매체에서특정이슈에관한논의를주도하는사람들이실제공간에서어디에위치하고있고, 이들의사회적관계가어떤공간적범위에서형성되고있는지를살펴볼수있다면여론의성격 ( 지역적 / 전국적 ), 잠정적여론확산경로등의파악에유용할수있다. 온라인매체이용자들의위치 / 장소정보를추출하고, 의견교환이활발한이용자그룹들의상호작용을네트워크형태로지도상에표출하여이의변화를모니터링할수있다면, 온라인사회관계망의시공간적특성을보다쉽게이해할수있다. 사회관계망의시공간분석을위해서는여론관련메시지작성자들의위치자료 (< 그림 3-20>) 와함께, 어떤사람이누구와어떤의견교환을언제했는지에대한정보가필요하다. 개념적으로이는노드 (Node) 와링크 (Link) 로구성된네트워크혹은그래프로표현될수있다. 데이터구조측면에서는노드 ( 사람 ) 의쌍들이교환한정보 ( 의견 ) 와시점을나열한표로표현될수있다. 사회관계망의공간적분포를분석하기위해서는, 노드-링크의사회관계망자료가사용자위치자료와연계되어야하며, 이는 < 그림 3-22> 에서도식으로표현하고있다. 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 65

< 그림 3-22> 사용자위치자료와사회관계망자료의연계 < 그림 3-22> 와같은공간정보화된사회관계망자료가구축되면, 사회관계망의지리적위치를보여주는다양한분석을실시할수있다. 우선, 상호작용을한사용자들의위치를연결한지리적네트워크형태로분석할수있으며, 이때사용자의기준위치는기본주소, 메시지작성대표지점등다양하게변경할수있다. < 그림 3-23> 은사회관계망의지리적네트워크를분석하는예시로, Ding Ma라는이용자의트위터친구들의공간분포를사회관계망과함께보여준다. < 그림 3-23> 사회관계망의지리적네트워크분석예시 * 출처 : Ma(2013) 의 <Figure 5-15>(p.44) 발췌 66 여론모니터링을위한비정형빅데이터시공간분석방법론연구

여론데이터기반의사회관계망분석에있어, 논의내용을토대로관심이슈가유사한소그룹들을추출하고이들의공간적범위가어떻게다른지살펴볼있다. 예를들어, 구제역확산과롯데월드싱크홀관련이슈를논의한메시지들을수집하고, 이들메시지의작성자들이어디에어떻게분포하는지를비교할수있겠다. < 그림 3-24> 는사용자그룹별공간분포를비교 분석하는가상의예이다. 구제역확산과같은문제에대해서는메시지작성자의분포가 < 그림 3-24> 의 Community 4와같이광범위하게, 롯데월드싱크홀과같은문제에대해서는메시지작성자의분포가 < 그림 3-24> 의 Community 124와같이국지적으로나타날수도있다. < 그림 3-24> 사회관계망내소그룹들의공간분포비교 분석의예시 * 출처 : Comber 외 (2012) 의 <Figure 4>(p.295) 발췌 (3) 메시지전파의시공간분석 여론데이터내에숨어있는사회관계망은사람들간의소통과상호작용이어떻게이루어지는지를보여주기때문에, 특정이슈가사람들사이에서어떻게전파되는지를알고자할때유용하다. 공간정보화된사회관계망의경우사람들간의상호작용을현실공간으로투영시킬수있는데, 이를분석하면특정메시지나이슈가사람을매개로어떻게지리적으로확산되는지알수있다. 구체적으로, 제 Ⅲ 장여론모니터링을위한비정형빅데이터시공간분석모델 67

트위터라는서비스는리트윗이라는과정을통해 1차생성된메시지를다른서비스이용자에서 2차전파할수있는기능을제공한다. 따라서, A라는사람이작성한 구제역발생 이라는트윗메시지는 1차로 A의팔로어인 B에게전달된후, 리트윗을통해 B의팔로어인 C에게까지전달될수있다. A-B, B-C 간의메시지전달을 1차, 2차확산으로구분하고이를지도상에표출하면, 구제역발생 이라는이슈가 A, B, C 세사람을통해 A가사는경기도안성에서 B가사는경기도안양을통해 C가사는서울로확산되는것을알수있다. < 그림 3-25> 는일본지진에관한트윗메시지가사회관계망을통해지리적으로확산되는과정을일반그래프, 네트워크지도, 애니메이션을이용하여보여주는분석기법의예시이다. < 그림 3-25> 사회관계망기반메시지확산분석의예시 * 파란색과분홍색선은각각 1 차, 2 차 ( 리트윗 ) 전파를나타냄. * 출처 : Ma(2013) 의 <Figure 5-13>(p.43) 발췌 68 여론모니터링을위한비정형빅데이터시공간분석방법론연구

chapter Ⅳ 결론및향후과제

C H A P T E R Ⅳ 결론및향후과제 이장에서는지금까지수행한연구결과를요약하고정책제언을제시하였다. 본연구의한계와함께, 비정형빅데이터시공간분석모델의실증과적용을위한향후연구과제도제안하였다. 인터넷소셜미디어에서생산되는비정형빅데이터에서여론의시공간적변화트렌드를탐지하는분석모델은여론의지역적, 시간적변화동태를모니터링할수있는방법론을제공하여국민의정책수요에시의성있게대응하기위한정책수단으로활용될수있을것으로기대된다. 1. 연구의결과및정책제언 1) 연구의결과와의의 본연구는국민들의새로운의사소통창구로떠오른인터넷과소셜미디어에서생성되는비정형빅데이터를시공간적으로분석하여여론의지역적, 시간적변화동태를파악할수있는방법론을제안하였다. 이방법론은기존의여론모니터링방법에서찾아내기어려웠던여론내용의지역적, 시기적차이, 여론형성주체들의시공간적상호작용을지도와차트등으로시각화할수있는새로운분석기법을제공하였다는데그학술적의의가있다. 또한, 여론관련비정형빅데이터의수집, 공간정보화, 정제, 시공간분석등분석체계를정립하여, 후속연구와사업들을위한방법론적가이드를제공하였다. 제 Ⅳ 장결론및향후과제 71

정책적측면에서, 본연구는국민여론기반의맞춤형정책수립에적용가능한비정형빅데이터시공간분석방법을개발하여중앙및지방정부가여론모니터링시활용할수있는정책수단을제공했다는데의의가있다. 국가의정책기조가국민행복과소통을지향하면서, 지역과국민의수요에근거한맞춤형정책발굴이그어느때보다도중요하다. 인터넷소셜미디어에서형성된여론이국민의정책수요를보여줄수있는유용한정보원으로인식되고있으나, 이들매체에서쏟아지는방대한양의데이터에서지역과국민의정책수요를찾아내는일은쉽지않다. 본연구에서제안한비정형빅데이터시공간분석모델은인터넷소셜미디어상의국민여론이지역과시기에따라변화하는양상을포착할수있는시각적분석방법론을제공하여, 비정형빅데이터의정책활용가능성을제고할수있다. 2) 정책제언 본연구의결과를토대로국민수요와지역맞춤형정책구현을위한세가지정책제언을할수있다. 먼저, 본연구에서제안한비정형빅데이터시공간분석모델을활용하여정책인프라성격의여론모니터링체계를구축할필요가있다. 근래에비정형빅데이터기반여론분석을통해국민수요및지역특성에맞춤화된정책을발굴하려는정부 / 공공기관이증가하고있다. 기관마다초점을두고있는정책은다르지만, 비정형빅데이터를수집하고분석하는과정과방법론은크게다르지않다. 그럼에도불구하고, 현재는기관마다별도로비정형데이터의수집과분석을위한서비스를구매하거나구축하고있다. 이러한기관별산발적접근법은비정형빅데이터분석을위한유사기능들을구축하는데중복투자를유발할수있어예산의낭비가우려된다. 또한, 비정형빅데이터분석서비스의구매나구축에적지않은비용이필요하므로, 예산을충분히확보하지못한기관들의경우비정형빅데이터의활용을고려조차할수없다. 따라서, 여러공공 / 정부기관들이함께사용할수있는정책인프라성격의여론모니터링체계를구축 공유하여, 데이터와여론기반의정책수요발굴을위한공공부문의정책역량을강화할필요가있다. 72 여론모니터링을위한비정형빅데이터시공간분석방법론연구

두번째로, 비정형빅데이터시공간분석모델을 정책지도, 공간빅데이터체계구축 등의국책사업과연계할필요가있다. 비정형빅데이터시공간분석모델은인터넷소셜미디어상에서형성되는국민여론의시공간적변화패턴을시각적으로분석할수있는방법을제공한다. 최근광주광역시광산구, 서울시등을중심으로추진된정책지도사업은정책관련사회현상을지도로표출함으로써, 정책과정의여러단계를지원하고자한다. 비정형빅데이터시공간분석모델은그간정책지도에서많이다루지않았던국민여론의지도표출을지원하므로, 정책지도의한유형으로발전할수있는가능성이크다. 또한, 국토교통부에서현재중인 공간빅데이터체계구축사업 에서는비정형빅데이터를공간화한다종의융합데이터를생산할예정이다. 따라서본연구에서제안한비정형빅데이터시공간분석모델과연계하면, 국토교통부에서신규로생산할융합데이터의활용도를제고하는데기여할수있다. 마지막으로, 비정형빅데이터시공간분석모델의정책활용을활성화하기위해서제도기반마련및교육 홍보의강화가필요하다. 현재여론분석및모니터링은중앙부처와지방자치단체내에서도정책기획과, 국민소통과, 주민참여과등여러부서에서산발적으로추진되고있다. 이러한산발적접근법은여론모니터링에대한예산중복투자를가져올수있을뿐만아니라, 투자대비효용가치가낮은모니터링성과품을산출하는결과를초래할수있다. 따라서, 관련조직간협력적거버넌스체계와공동의정책수단을구축하고, 정책관련여론분석을위한비정형빅데이터활용에관한업무지침를수립하여비정형빅데이터시공간분석모델의정책활용을위한제도적기반을마련해야한다. 비정형빅데이터시공간분석모델의정책활용활성화를위해서는이모델의기본원리, 적용방법, 효과등에대해체계적교육과홍보도필요하다. 특히, 맞춤형정책지원관련비정형빅데이터시공간분석모델의활용사례를적극개발 공유하여여론기반정책수요발굴을위한첨단분석기법을정책수립가, 연구자, 일반국민등다양한수요자층에확산할필요가있다. 제 Ⅳ 장결론및향후과제 73

2. 연구의한계와향후과제 1) 연구의한계 본연구에서는여론모니터링을보완할수있는분석방법론의하나로비정형빅데이터시공간분석모델을제안하였다. 2개월의짧은연구기간으로인해본연구는연구내용과범위의측면에서몇가지한계를가진다. 먼저, 연구의내용측면에서는비정형빅데이터의정책활용시고려해야할데이터의정책적유의성을보다심도있게다루지못하였다. 비정형빅데이터가인터넷소셜미디어에서주로생산되고이들신규매체의이용이젊은계층을중심으로널리확산되고있으므로, 여론모니터링및여론기반정책수요발굴시비정형빅데이터를활용하는것은타당한접근법이다. 그러나, 신규매체의이용계층이제한적이고이들을통해수집된여론관련메시지들에포함된위치정보의의미또한여러가지로해석될수있기때문에, 비정형빅데이터가보다유용하게활용될수있는정책과그렇지못한정책들을구분하여데이터의분석및해석방안에대해보다명확히논의할필요가있다. 다음으로, 연구범위의측면에서본연구는비정형빅데이터시공간분석모델을개념적으로정립하였지만, 실제데이터를활용한분석모델의실증및구체적적용사례까지는발굴하지못하였다. 비정형빅데이터시공간분석모델의정책현장활용을위해, 이후계속해서자료수집, 분석방법론, 정책적용방안등에대한검토와후속연구가필요하다. 2) 향후과제 본연구에서제안한비정형빅데이터시공간분석모델의지속적인발전을위해향후추진해야할과제는다음과같다. 먼저, 분석모델의실증과적용을위한구체적인정책연구사례를발굴해야한다. 이를위해앞서언급한 정책지도, 공간빅데이터체계구축 등의국가사업과연계한융합연구를추진할필요가있다. 74 여론모니터링을위한비정형빅데이터시공간분석방법론연구

다음으로기술및방법론적측면에서비정형빅데이터시공간분석모델을보다정교화할필요가있다. 비정형빅데이터의시공간분석을통해유용한정보를추출하기위해서는메시지, 문서등의비정형데이터를공간정보화하는과정이매우중요하다. 비정형빅데이터가그크기가방대함에도불구하고, 정확한지리좌표를포함한데이터는그비율이높지않다. 따라서, 비정형데이터를공간정보로변환할수있는다양한기술들을개발하고이들의유용성을검증하는과정이필요하다. 이에더하여, 비정형빅데이터의유형과수집원에따라적용가능한공간정보화방법이무엇이며그실효성은얼마나되는지평가하여, 여론모니터링을위한비정형빅데이터활용의실제적가이드라인을제시할필요가있다. 방법론적으로는여론의내용과형성주체의분석에중점을둔비정형빅데이터시공간분석모델을국토공간관련정형데이터와연계 활용할수있는방안을마련해야한다. 정책관계자들이여론모니터링을통해잠재적정책수요를탐지한후에는, 여론상의정책수요가실제국토공간현황과어떻게맞물려있는가라는의문을제기할것이다. 이런의문에체계적으로접근할수있는분석모델을개발하여, 비정형빅데이터시공간분석모델의실효성을보다강화할필요가있다. 제 Ⅳ 장결론및향후과제 75

R E F E R E N C E 참고문헌 강범일 송민 조화순. 2013. 토픽모델링을이용한신문자료의오피니언마이닝에대한연구. 한국문헌정보학회지제47권제4호 315~334. 고영삼. 2011. 미디어패러다임변화에따른정부의소셜미디어커뮤니케이션방향. IT & Future Society 제13호. 한국정보화진흥원. 광운대학교산학협력단. 2014. 국민중심의소통활성화방안연구. 광운대학교산학협력단. 김규원 신형진 권기욱. 2013. 대구사회조사를활용한지역정책개발방안연구. 대북경북연구원. 김남두. 2010. 미디어융합환경에서의여론형성재구조화에관한연구 (Ⅱ): 6.2 지방선거기간인터넷이용자의뉴스이용행태에대한사례분석. 정보통신정책연구원. 김대종 윤서연. 2013. 빅데이터를활용한국토정책반응모니터링및정책수요예측방안. 국토연구원. 김미정 김대종 이영주. 2013. 과학적국토정책을위한공간빅데이터활용방안. 국토연구원. 김위근 김춘식. 2010. 한국의인터넷뉴스서비스. 한국언론진흥재단. 김춘석. 2013a. 공공갈등해결의대안적기제로서공론조사. 한국지방정부학회학술발표논문집 2013권 1호 pp. 480-493. 한국지방정부학회. 김춘석. 2013b. 숙의 ( 熟議 ) 여론조사기법으로서 시민참여여론조사 와 2가지실행사례 (www.hrc.co.kr/renewal/newsletter/data/131203.pdf). 참고문헌 77

김형호 송경재. 2011. 한국적타운미팅의가능성과한계에관한연구 : 평택채소마을사례를중심으로. 지방행정연구제25권제3호통권 86호 pp.269-288. 더아이엠씨. 2014. 도홈페이지및포털사이트빅데이터분석을통한 정부3.0 도민맞춤형계획수립 용역최종보고서. 라도삼. 2014. 2030 서울문화플랜수립을위한기본구상. 서울연구원. 모효정 권복규. 2009. 사회여론수렴방법으로서의시민합의회의 : 이종이식문제를중심으로. 생명윤리정책연구제3권제1호 pp.91-109. 문신용. 2006. e-거버넌스의활성화를위한과제와발전방향 시민참여를중심으로. 한국행정연구원. 문화체육관광부. 2013. 빅데이터분석을통해본 2013 국민인식변화. 문화체육관광부. 미래창조과학부 한국정보화진흥원 빅데이터전략센터. 2014. 빅데이터활용단계별업무절차및기술활용매뉴얼 (Version 1.0). 미래창조과학부 한국정보화진흥원. 박상호. 2012. SNS의여론형성과정과참여행태에관한고찰. 한국언론정보학보통권 58호 pp.55-73. 박한우. 2012. 저비용고효율 SNS로여론읽기. 미디어포럼. 변미리. 2012. 빅데이터를활용한시정모니터링활용방안 ( 내부자료 ). 서울시정개발연구원. 2012. 서울시민 100인, 2030년미래서울을말하다시민원탁토론최종보고서 ( 내부자료 ). 서원석 조세현 송희준. 2012. 정부신뢰와소통제고를위한 Public Relations 시스템구축사업 : 소셜미디어를이용한정부 PR 체계구축방안. 한국행정연구원. 솔트룩스. 2008. 텍스트마이닝홈 : 텍스트마이닝의정의. 솔트룩스. 신수정. 2014. 글에서감정을읽다 감성분석의이해. IDG Tech Report. 심재웅. 2003. 공론조사의소개및그실행의장단점과문제점. KOSOMAR 세미나자료집. 심재웅. 2013. 정책과정과공론조사의활용. KIPA 조사포럼 vol.4. 한국행정연구원사회조사센터. 안전행정부. 2013. 국민여론조사및정책수요조사결과보고서. 울산광역시북구. 2013. 울산북구주민참여정책추진성과분석및제도화방안. 78 여론모니터링을위한비정형빅데이터시공간분석방법론연구

이석주 연지윤 천승훈. 2013. 빅데이터를이용한교통정책개발및활용성증대방안. 한국교통연구원. 이영주 임은선 차미숙 이재용 이호상 박재희 이지원. 2013. 공간빅데이터기반의복지 공간융합모델시범연구 : 영유아복지공간진단을통한복지정책지원방안. 국토교통부. 이원태 차재권 신호철. 2012. 스마트미디어환경에서 SNS이용과정책참여활성화방안연구. 방송통신위원회. 이윤희. 2014. 국내 SNS의이용현황과주요이슈분석. Focus 4. 이혜정. 2007. 미래유비쿼터스정부의진화, Government 3.0. 유비쿼터사회연구시리즈제29호. 한국정보사회진흥원. 전채남. 2011. SNS 를활용한지방자치단체커뮤니케이션방안에관한연구 : 대구시의 SNS 활용을중심으로. 조성은 박지영 박한우. 2011. 웹2.0 시대소셜미디어를이용한정책홍보전략 : 농림수산식품부의트위터활동을중심으로. 진설아 허고은 정유경 송민. 2013. 트위터데이터를이용한네트워크기반토픽변화추적연구. 정보관리학회지제30권제1호 pp.285-302. 최광선. 2012. 비정형 Big-Data 활용을위한아키텍처및시스템환경구축사례. 최선화 배병걸. 2013. 소셜빅데이터재난관리운영방안및이슈탐지기법연구. 국립재난안전연구원. 최선화 배병걸 다음소프트. 2013. 비정형빅데이터수집및분석모델개발. 국립재난안전연구원. 최진명. 2012. 빅데이터시대의데이터활용과전략, 지역정보화동향분석제3호 (2012.4 월 ). 한국지역정보개발원. 하수욱 남광우 류근호. 2012. 마이크로블로그기반의공간지식추출기법연구. 한국공간정보학회지제20권제2호 129~136. 한국대통령학연구소. 2008. 외교통상정책결정에서의의견수렴과정에관한연구. 한국전산원. 2004. e-governance 구현을위한과제와전략. 참고문헌 79

한국정보화진흥원 빅데이터전략연구센터. 2012. 빅데이터시대! SNS의진화와공공정책. IT & Future Strategy 제 13호. Addis, M., Taylor, S., Nasser B. I., Joshi, S., Karamagioli, E., Wandhoefer, T., Fallon, F., Fletcher, R., Wilson, C. 2010. New Ways for Policy-makers to Interact with Citizens Through Open Social Network Sites A Report on Initial Results. Internet, Politics, Policy 2010: An Impact Assessment (IPP2010). American Association for Public Opinion Research. 2014. Social Media in Public Opinion Research: Report of the AAPOR Task Force on Emerging Technologies in Public Opinion Research. Andrienko, G., Andrienko, N., Bosch, H., Ertl, T., Fuches, G., Jankowski, P., and Thom, D. 2013. Thematic Patterns in Georeferenced Tweets Through Space-Time Visual Analytics. Computing in Science & Engineering May/June: 2-12. Blei, D.M. 2012. Probabilistic Topic Models. Communications of the ACM 55(4): 77-84. Chew, C. and Eysenbach, G. 2010. Pandemics in the Age of Twitter: Content Analysis of Tweets During the 2009 H1N1 Outbreak. PLoS One 5(11) e14118. Comber, A., Brunsdon, C., Batty, M., Neuhaus, F., and Gray, S. 2012. Geographical Analysis of Social Network Data. Proceedings of the AGILE 2012 International Conference on Geographic Information Science 293-392. Commission on Global Governance. 1995. Our Global Neighbor. Denhardt, J. V. and Denhardt, R. B. 2011. The New Public Service: Serving, not Steering. Donsbach, W. and Traugott, M. W. (Eds.) 2008. The SAGE Handbook of Public Opinion Research. Los Angeles London New Delhi Singapore: SAGE Publications. 80 여론모니터링을위한비정형빅데이터시공간분석방법론연구

Ghosh, D. and Guha, R. 2013. What Are We Tweeting About Obesity? Mapping Tweets with Topic Modeling and Geographic Information System. Cartography and Geographic Information Science 40(2): 90-102. Goes, P. B. 2014. Big Data and IS Research. MIS Quarterly 38(3): iii-viii. Kaplan & Haenlein. 2010. Users of the World, Unite! The Challenges and Opportunities of Social Media. Business Horizons 53(1): 59~68. Kavanaugh, A.L., Fox, E.A., Sheetz, S.D., Yang, S., Li, L.T., Shoemaker, D.J., Natsev, A., Xie, L. 2012. Social Media Use by Government: From the Routine to the Critical. Government Information Quarterly 29: 480-491. Leetaru, K. H. 2011. Culturomics 2.0: Forecasting Large-scale Human Behavior Using Global News Media Tone in Time and Space. First Monday 16(9). Lukensmeyer, C. J. 2005. PARTICIPATORY METHODS TOOLKIT A practitioner s manual(www.kbs-frb.be or www.viwta.be). Ma, D. 2013. Visualization of Social Media Data: Mapping Changing Social Networks. Master Thesis. Univ. of Twente. Neuhaus, F. 2013. Urban Rhythms: Habitus and Emergent Spatio-temporal Dimensions of the City. PhD Dissertation. UCL. OECD. 2001. Citizens as Partners: Information, Consultation, and Participation. Paris. Paul, M. J. and Dredze, M. 2011. You Are What You Tweet: Analyzing Twitter for Public Health. Fifth International AAAI Conference on Weblogs and Social Media: 265~272. Sobkowicz, P., Kaschesky, M., Bouchard, G. 2012. Opinion Mining in Social Media: Modeling, Simulating, and Forecasting Political Opinions in the Web. Government Information Quarterly 29: 470-479. 참고문헌 81

S U M M A R Y SUMMARY Keywords: Public Opinion Monitoring, Spatiotemporal Analysis, Unstructured Big Data Recently, a lot of efforts have been made to identify policy demands hidden in public opinions created through the Internet social media (ISC). Nonetheless, methodological challenges still remain to differentiate delicate changes in the trends of public opinions across space and time. This study aims to overcome such challenges by developing a new model for spatiotemporal analysis of unstructured big data from ISC and directing their uses in public policies. Conceptually, our model seeks to combine the applications of text mining, social network analysis, spatiotemporal analysis to unstructured big data from ISC so that it can become a data-centric method for public opinion monitoring. The ultimate goal of this model is to support timely identification of policy demands tailored to the needs of the public and regions by enabling the continuous analysis and monitoring of spatiotemporal patterns in public opinions from ISC. Methodogically, our model consists of three stages for the collection, preprocessing, and spatiotemporal analysis of unstructured big data. The first stage of our model involves the incessant gathering, storage, and management of messages that include discussions of the public on ISC. Oftentimes, this stage SUMMARY 83

necessitates the use of open APIs, and free or commercial software agents for the crawling of documents from ISC. The second stage of our model involves three tasks: 1) removal of advertisements, swearwords, and redundant messages; 2) linking messages to their associated locations/places (geocoding or spatialization); and 3) conversion of individual messages into a set of substantive terms. The final stage of our model focuses on exploring spatiotemporla patterns in the contents and creators of public opinions through the mixed applications of spatiotemporal analysis, time series data analysis, text mining, social network analysis, and etc. In specific, the contents of public opinions can be understood by analyzing spatiotemporal variations in the locations of message posting, spatio-temporal clusters of term usage, and topical and emotional trends hidden in a corpora of messages/documents. Meanwhile, the analyses of the locations and social networks of message authors could reveal the spatiotemporal distributions and interactions among the creators of public opinions. The model proposed in this study contributes to the literature of public opinion research by providing a new analytical framework that can detect and visualize spatiotemporal patterns in the contents of public opinions as well as interactions among the creators of such opinions. For a policy standpoint, the proposed model is expected to develop into a software infrastructure for the shared use by various public institutions for the purpose of public opinion monitoring. 84 여론모니터링을위한비정형빅데이터시공간분석방법론연구

A P P E N D I X 부록 1. 시민참여형여론모니터링방법과사례 1. 사회 / 여론조사 1) 개요 사회 / 여론조사는최근 도시지표, 도시정책지표, 삶의질지표, 사회지표 등의이름하에다양한정부기관에서실시하고있다. 오늘날사회구조가빠르게변화하고있고이를반영하여국가및지역의정책방향을설정하고관련의사결정을내리기위해서는근거가될만한기초자료들이필요한데, 사회 / 여론조사는이들자료를수집 제공할수있는효과적정책수단이기때문이다. 사회조사의대표적인예는시민서베이이다. 1970~80 년대처음등장했을때만해도대표성이낮고체계적이지못했으나, 여러차례의시행착오과정을거쳐시민들의수요를대변하는주요자료원의역할을하고있다. 우리나라최초의사회조사는 1977 년통계청에서실시한 한국의사회지표 조사인데, 이때조사항목은사회적관심사항, 삶의질관련사항등시민의주요관심사였고그결과는정부의사회개발정책수립을위한기초자료로활용되었다. 이후가족, 복지, 사회참여, 노동, 소득과소비, 문화와여가등영역으로조사항목을확대하고있으며 2008년에는사회조사로그명칭을공식변경하였다. 15) 통계청의사회조사를포함한시민서베이는시민의생각과의견을묻는데유용하며정량적정보를지속적으로생산한다는장점이있다. 하지만, 조사설계가잘못될경우결과가왜곡될수있으며, 일회성서베이의경우여론의빠른변화를반영하기어렵다는단점도있다 (Denhardt & Denhardt, 2011). 15) http://kostat.go.kr/survey/society/index.action (2015 년 1 월 9 일오후 5 시 44 분최종접속 ) 부록 1. 시민참여형여론모니터링방법과사례 85

사회조사와더불어여론조사는시민의생각과의견을파악하고자할때자주활용된다. 최근소셜미디어의대중화로, 우편, 전화, 인터넷기반여론조사의대안으로써소셜여론조사가실시되고있는데 (American Association for Public Opinion Research, 2014), 질병확산, 선거캠페인, 산업계의의사결정등이주요활용분야이다 ( 박한우, 2012). 아래표는일반여론조사와소셜여론조사의특성이어떻게다른지를보여준다. < 일반여론조사와소셜여론조사의비교 > 구분 일반여론조사 소셜여론조사 모집단 알려져있음 매체에따라다름 표본대상 일반인전체 인터넷및 SNS 이용자 표본방식 확률적샘플링 매체에따라다름 ( 대개비확률적, 편의적 전문가샘플링 ) 조사주제 모든이슈가능 사회적흥미를끌거나주목받는이슈 분석단위 개인단위의조사개인보다는집합적수준 ( 자기응답식데이터 ) ( 이용자가남긴메시지및링크데이터 ) 분석데이터특성 객관적응답이많음 대화형부터링크까지다양한형태 조사대상의특성 알려져있음 매체에따라다름 대상별가중치 동등함 조사목적및분석기법에따라다름 대상자의수집 조사자가선별 매체에따라다르나, 자발적참여자가많음 조사방법 집전화위주 API를이용한데이터의자동수집 ( 휴대전화보완시도 ) ( 최근에는설문조사로보완시도 ) 여론수집방식 조사자의요청 응답자의자발적동기 조사의비강제성 낮음 높음 조사비용 높음 낮음 조사규모 수백명 최대수십억개의메시지및링크 조사간격 월별 ~ 연도별 일별 ~ 주별 출처 : 박한우, 2012 2) 활용사례 독일, 미국, 일본등해외여러국가들에서국가및지역정책을지원하기위해사회 / 여론조사를실시하고있다. 가령독일의경우, 연방교통건설부의지원으로정통한여론조사기관이독일자전거클럽과공동으로교통수단과선호도, 교통수단이용현황, 자전거용도와대중교통연계등에대한설문조사를실시하고, 그결과를토대로자전거가미래교통수단으로부상할것을예측하고자전거길확장등에 86 여론모니터링을위한비정형빅데이터시공간분석방법론연구

대한정책을수립하였다 ( 머니바이크, 2013년 1월 18일자 ). 미국과일본에서는국가단위에서의사회변화를모니터링하고다른국가와의비교자료를구축하기 General Social Survey(GSS) 를실시하고있다. 16) 또한, 뉴욕과동경등의도시단위에서도도시의발전현황을점검하고장단기적발전전망에맞는정책입안을위해도시정책지표를모니터링하고있다. 더불어, 미국의휴스턴은 1982 년부터교육, 범죄, 이동성과교통, 환경문제에대한평가등시민태도변화를조사하고있다. 국내에서도각지역사회의사람들이무슨생각으로어떻게살아가고있는지를모니터링하기위해다양한사회조사를실시하고있다. 다음의표 < 사회조사를시행중인국내지역 > 에정리된것처럼, 서울을비롯한부산, 인천, 광주, 울산등의광역기초단체를비롯해세종특별자치시와제주특별자치도, 서울의강남구, 마포구, 중구, 경상북도의구미시, 전라남도의순천시, 여수시, 광양시등의기초자치단체에서도지역사회조사를실시하고이를토대로다양한지표를생산하고있다. 이중서울시는 2003 년부터서울서베이기본계획을수립하여매년 2만가구를대상으로가구현황, 주거와생활, 세대와계층, 복지, 교통, 환경등다양한분야를조사하고있으며, 그결과를기반으로 1인가구, 베이비부머, 중산층, 시민행복등에대한지역정책수립의기초자료를제공하고있다. 또한 2006 년부터는마포구를시작으로총 7개의자치구가자체적으로사회조사를실시하여구민들의정책수요를파악하고지역정책수립의기초자료로활용하고있다. 사회조사를지역정책과정에적극활용하고있는또다른국내지역은대구시이다. 대구시의경우, 사회조사를활용하여지역민이처해있는현실을파악함과동시에 SWOT분석을통하여이를지역정책에반영하고자하는노력을기울이고있다. 2011 년부터대구사회조사를시작하였고, 설문을통해대구지역현안에관한주민생 16) GSS 는미국시카고대학교 NORC(National Opinion Research Center) 에서 1972 년부터매년시행되고있는국제적인사회과학조사이다. 한국은한국종합사회조사 (Korean General Social Survey; KGSS) 란이름으로 2003 년부터이조사에참여하고있으며, 2012 년현재한국을포함한미국, 영국, 중국등 49 개국이정치및사회의식, 일상생활등의내용을다룬반복핵심모듈과특별한주제연구를위해개발된모듈들을그설문내용으로하고있다 (http://www.kossda.or.kr/w02_01e.asp 2014 년 12 월 13 일오후 1 시 15 분최종접속 ). 부록 1. 시민참여형여론모니터링방법과사례 87

각을조사하고한걸음더나아가조사된자료를이용하여다양한지표를산출하고있다. 대표적예가주민행복지수와청년희망지수로, 현재의사실뿐만아니라미래의발전가능성까지를분석하여고용기회개선, 고용불안정개선, 세대간갈등해소등의정책을제언하였다 ( 김규원 신형진 권기욱, 2013). 대구시와서울시의사례를종합해보면, 결국사회조사는단기적으로현안이슈에대한기초자료를제공하지만, 장기적으로는시정운영을위한정책판단의근거를제공할수있음을알수있다. < 사회조사를시행중인국내지역 > 구분광역기초단체특별자치시 ( 도 ) 기초자치단체 서울특별시대전광역시경기도강원도경상남도경상북도전라남도전라북도충청남도충청북도 해당지역서울, 부산, 대구, 인천, 광주, 대전, 경기, 강원, 충북, 충남, 전남, 전라, 경남세종, 제주중구, 강남구, 마포구, 광진구, 강동구, 중랑구, 성북구대덕구, 중구, 유성구용인시, 성남시, 부천시, 군포시, 하남시, 양평군, 여주군, 오산시태백시, 춘천시, 원주시진해시, 울주군구미시, 상주시여수시, 광양시, 순천시전주시, 군산시계룡시, 아산시청주시, 천안시, 옥천군 사회조사와함께여론조사도국내지역정책을지원하는데활발히이용되고있다. 광주시의회는사업추진이지연되고있는도시철도 2호선건설여부에대해서시민여론조사를실시하고, 공청회나 TV 토론회등도개최하여정책추진여부에대한최종판단을내리겠다고결정한바있다 (news1 뉴스, 2014년 11월 5일자 ). 또한, 안전행정부는 2013 년정부가추진했던정책에대한인식수준, 성과평가, 향후중점추진분야등에대해일반국민, 공무원, 전문가를대상으로여론을파악하고 2014년업무계획수립의기초자료로사용하였다 ( 안전행정부, 2013). 88 여론모니터링을위한비정형빅데이터시공간분석방법론연구

2. 공론조사 1) 개요 공론조사란 James S. Fishkin 교수가제안한과학적여론조사와소집단토의가접합된공론수렴의새로운방식으로일반여론조사에대한대안으로제시되었다 ( 심재웅, 2003). 일반여론조사는조사와관련된이슈를시민이충분히생각할겨를없이조사상황에서반사적으로떠오르는의견을표출하거나언론보도의영향을반영하는경향이있다 ( 김춘석, 2013b). 즉, 일반적으로시민들은정치, 사회현안들에대해많은정보를접하지않은상태로자신의의견을형성하게된다. 세부적인사항을면밀히살펴본뒤의견을형성하기엔너무많은시간과노력이들며, 그러한투자대비시민개개인에게돌아오는이익은눈에보이지않기때문이다. 결국시민들은사운드바이트 17) 와헤드라인에의존하고이데올로기나당파성에기대어자신의의견을형성하게되는경우가많다. 이에새롭게등장한방법이공론조사로, 특정주제에대해정보를폭넓게제공하고토의를통해그주제에대한이해도와관심도를제고함으로써보다의미있는응답을적극적으로이끌어내는조사방법이다. 공론조사와일반여론조사의구체적차이점은다음의표에정리하였다. 2) 활용사례 공론조사는 1994년 4월영국에서 늘어나는범죄문제에대한대책 을주제로처음실시되었다 ( 심재웅, 2003). 미국의경우, 1996년 1월 국정의제토론회 에서공론조사를채택했으며, 이후외교정책, 의료보험, 교육정책, 미래정책등에대한주제에관한논의에서도실시되었다. 또한, 중국저장성원링현은지역예산할당과 17) 인상적인한마디혹은짧은코멘트를지칭하며, 화제인물의짤막한육성발언이나연설, 성명의한구절등이그예이다. 방송, 특히뉴스프로에인용삽입되는경우가많다 (http://endic.naver.com/enkrentry.nhn?sln=kr&entryid= 878e2c9f24254d22b4d5631914b7767c&query=soundbite; 2015 년 1 월 9 일오후 5 시 52 분최종접속 ). 부록 1. 시민참여형여론모니터링방법과사례 89

운영을위해 3 번의공론조사를시행하였으며, 마카오에서는 2012 년에언론법과 언론인윤리에대한공론조사가실시되었다. < 일반여론조사와공론조사의비교 > 구분 일반여론조사 공론조사 목적 What the public thinks 파악 What the public would think 파악 참여자특성 고립된개인 공론장 (public sphere) 의주체로서의개인 참여자관심도 (attention) 낮음 높음 제공되는정보 (information) 적음 많음 참여자숙의정도 (deliberation) 낮음 높음 참여방식 수동적 능동적 커뮤니케이션방식 일방향 쌍방향 출처 : 김춘석, 2013a 국내에서는 2003년북한산국립공원관통서울외곽순환도로등과같은사회적갈등과관련해서처음공론조사가도입될예정이었으나무산되었고, 2005 년재정경제부의 8.31 부동산대책에대한논의를시작으로공론조사가본격활용되었다. 이후, 2007년부산항만공사가부산북항재개발마스터플랜선정을위해, 2011년경찰청에서 3색신호등도입에따른갈등해소를위해공론조사를실시한바있다 ( 심재웅, 2003; 김춘석, 2013a). 3. 시민참여형토론 1) 개요 시민참여형토론은정책관계자들이서로의말에귀를기울일수있는토론의장을마련하여단순한정보교환이상의효과를거두고자할때이용가능하다. 구체적으로, 지역문제에대해토의하는과정을통해정책관계자들은서로에게배울수있는기회를얻게되고친밀감을형성할뿐만아니라, 지역에대한소속감을강화할수있다 (Denhardt & Denhardt, 2011; 서울시정개발연구원, 2012). 시민참여형 90 여론모니터링을위한비정형빅데이터시공간분석방법론연구

토론은타운홀미팅 (Town Hall Meeting), 워크아웃타운미팅 (Workout Town Meeting), 오픈스페이스 (Open Space), 월드카페 (World Cafe), 시민원탁회의 (The 21 st Century Town Meeting) 등다양한방식으로진행가능하다. 시민참여토론방법들의특징을정리하면아래표와같다. 구분 토론방식 실시연도참여규모 타운홀미팅 지역사회구성원전체가마을회관 ( 타운홀 ) 에모여토론하고의사결정 워크아웃타운미팅조직의불필요한업무를없애기위해현장직원들이참가하는토론워크샵 오픈스페이스 자기가원하는발언을하고관심있는사람들이모여자유로운토론을진행 월드카페 주최즉에서테이블마다서로다른주제를선정하여토론자리를옮겨다니는방식으로진행 시민원탁회의 소규모집단과기술을결합한포럼 17 세기초반 1986 1985 1995 1995 마을단위소수 ~200 명소수 ~200 명최소 20 명이상 500 명 ~5,000 명 출처 : 서울시정개발연구원 (2012) < 시민참여토론방법들의특징 > 먼저, 타운홀미팅은영국식민지시대미국뉴잉글랜드지역의통치시스템에서유래된것으로, 최근미국대선토론회에서이용되면서대중들에게많이알려졌다. 타운홀미팅을통해지역사람들은한자리에모여토론을한후대표를선출하고, 투표를통해법과정책, 행정절차에대해결정을내렸기에미국의민주주의를발전시킨기초가되었다는평가를받기도한다 ( 김형호 송경재, 2011). 오늘날의타운홀미팅은정책결정권자또는선거입후보자가주민들을초대하여정책또는주요이슈에대해설명하고, 의견을듣는비공식적공개회의로지역사회에정보를제공하고토론결과를피드백하는것을목적으로한다. 최근에는정치인뿐아니라기업의최고경영자들도회사와관련된현안또는상황을임직원과공유하는의사소통의장으로타운홀미팅을활용하기도한다. 타운홀미팅은오프라인뿐만아니라온라인을통해서도이루어지며이를 e- 타운홀미팅 (e-town hall meeting) 이라고한다. 예를들면, 미국의백악관에서실시하는 부록 1. 시민참여형여론모니터링방법과사례 91

타운홀미팅은실제오프라인에서평균적으로 100여명안팎의국민이참여하지만, 이를백악관홈페이지를통해인터넷으로생중계하여 18) 훨씬많은국민들이인터넷을통해타운홀미팅에참여할수있다. 또한, 참여자들은궁금한사항에대해서는온라인을통해실시간으로대통령에게질문을할수있고, 이견이있는내용에대해서는토론을할수있기때문에큰호응을얻고있다 ( 이원태 차재권 신호철, 2012). 19) 둘째, 워크아웃타운미팅은 1986년토마스에디슨이시작하였으며, 1980년대미국 GE 의잭웰치가재활성화하였다. 이방법의핵심은효과적인의사소통과문제해결을위해, 마을회의를하듯이자유스럽고거침없는분위기에서토론을진행하는것으로, 필요한경우옷차림규정을없애거나상관의배석을금지하기도한다. 궁극적으로워크아웃타운미팅의목표는모든구성원이공유할수있는워크아웃핵심과제를도출하고, 함께문제를해결하면서조직의능률향상은물론, 구성원간의신뢰와협업능력을제고하는것이다. 셋째, 오픈스페이스는북미의조직전문가인 Harrison Owen이커피브레이크에서영감을얻어제시한방법으로, 틀과격식을최소화하여자유로운분위기속에서효과적인논의결과를끌어내는토론방식이다. 오픈스페이스에서회의주최자는 시간 과 장소 와같은뼈대만준비하고, 참여자가스스로행사내용과진행자를채워가는참여자주도의토론회이다. 진행방법은세션별로개요와주요논제를정하고, 참석자는참가한세션에대한관심이떨어지거나, 더욱생산적인토론을원한다면언제든자유롭게세션을바꿀수있다 ( 서울시정개발연구원, 2012). 20) 넷째, 월드카페는 Juanita Brown 과 David Isaacs 가제안한것으로카페와같은공간에서창조적인토론을통해지식의공유나생성을유도하고자하며, 지식과지혜는딱딱한회의실에서만들어지는것이아니라, 열린공간에서이루어지는사람들간의토론을통해형성된다 라는모토를가지고있다. 진행방법은최소 20명이상의 18) http://whitehouse.gov/live (2015 년 1 월 9 일오후 5 시 52 분최종접속 ) 19) https://www.facebook.com/maumceo/posts/473467326037377 (2015 년 1 월 9 일오후 5 시 52 분최종접속 ) 20) http://www.openspace.kr (2015 년 1 월 9 일오후 5 시 52 분최종접속 ) 92 여론모니터링을위한비정형빅데이터시공간분석방법론연구

참여자를대상으로, 4-5인의소그룹을구성하여각소그룹별로상이한주제로토론을하다가정해진시간이되면그룹대표만남겨두고모두다른그룹으로이동한다. 이런그룹이동을몇차례거치면월드카페의모든참석자간에지식이공유되는효과를얻을수있다 ( 서울시정개발연구원, 2012). 21) 마지막으로 21세기타운미팅은복잡한공공정책문제 22) 에대한의사결정과정에시민의직접적이고개별적인목소리를반영하기위한수단으로서미국의아메리카스픽스에서개발하였다. 이방법에서는시민들이숙의과정을통해의제에대해다양한의견을낼수있고, 토론후에는구체적이고실질적인실행계획을만들어의사결정과정에토론결과가반영될수있는구조를갖추고있다. 토론과정은맥락설정, 가치의명확화, 권장사항개발, 레포팅이라는 4가지단계로이루어지며, 한가지의제를두고모든참가자가동시에토론할수있다. 한테이블은 1명의퍼실리테이터 (facilitator) 와최대 10명의토론자로구성되며, 퍼실리테이터는토론자의발언내용을발언자의언어로정확하게노트북에입력하고, 중앙에서는실시간으로입론내용을취합하여테마별로분석한후, 권장할만한추진사항들을추출하고이들의우선순위와선결추진여부를무선투표시스템으로현장투표하여결정하는방식이다. 2) 활용사례 시민참여형토론방법들은해외주요도시에서지역정책수립시적극활용하고있다. 대표적인예로는 2012년시카고문화플랜 (Chicago Cultural Plan 2012), 멜버른의예술전략 (Melbourne Arts Strategy), 뉴욕의세계무역센터재건축계획수립등이있다. 우선시카고문화플랜은시카고미래문화와경제성장을위한체계를만들고시카고예술분야에서창의성, 혁신, 우수성을가진글로벌중심지로거듭나는데 21) http://theworldcafe.com (2015 년 1 월 9 일오후 5 시 52 분최종접속 ); http://userexperience.tistory.com/258 (2015 년 1 월 9 일오후 5 시 52 분최종접속 ) 22) 21 세기타운미팅에적합한공공업무의 3 가지범주로는 1) 계획및경제개발, 2) 예산과자원할당, 3) 정책형성이있다 (Lukensmeyer, 2005). 부록 1. 시민참여형여론모니터링방법과사례 93

중추적역할을하는것을목표로하였다. 이목표달성에있어서계획수립과정자체도중요시하여, 시민과함께문화플랜의비전을창조하는데초점을맞추었다 ( 라도삼, 2014). 시카고문화플랜은크게연구분석, 시민참여, 비전및방향설정의세단계로나누어추진되었는데, 시민참여단계에서는미래의예술과문화를위해총 4,700 명이넘는시카고시민들 8번의타운홀미팅, 20여번의지역사회와의대화, 소셜미디어를통한시민과의지속적인교류, 10번의부분별미팅등을통해향후 25년의문화분야의발전방향을제시하였다. <2012 년시카고문화플랜수립을위한타운홀미팅 > 출처 : City of Chicago, 2012 뉴욕시의세계무역센터재건축이시민형참여토론의두번째활용사례이다. 뉴욕시는 9.11 테러로폐허가된세계무역센터를재건축하는과정에시민들을참여시키고그들의생각을재건축계획에반영하였다. 이과정에서가장혁신적인활동은 Listening to the City 라는시민포럼으로, 다양한배경을가진약 4,300 명의시민이참여하여세계무역센터재건축에관한생각을말하고경청하였다. 이포럼은시민간의상호배움의장이되었을뿐만아니라, 공무원들도시민들의고충과조언을들을수있는상호이해의기회가되었다 (Denhardt & Denhardt, 2011). 94 여론모니터링을위한비정형빅데이터시공간분석방법론연구