지방자치단체의빅데이터도입을위한제언 *1) Ⅰ. 서론 최근정부는정부 3.0 비전선포식을하자마자공공데이터잠재력에주목하고, 데이터기 반의새로운성장동력을찾기위해지난 2013 년 6 월 공공데이터제공및이용활성화에관 한법률 을제정했다. 공공데이터는정부나지방자치단체또는산하기관이보유하고있는공 공목적으로사용할수있는데이터를말한다 ( 이만재, 2011). 공공부문에서의빅데이터분석 과활용에대한수요가크게증가하고있는추세이다. 정부가가진데이터를전면개방해서 제공한다면정부 3.0 에서강조하는투명한정부, 서비스정부를국민의자발적인참여로만들 어낼수있다. *** 이논문은 2013 년도광운대학교교내학술연구비지원에의해연구되었음. *** 제 1 저자 *** 교신저자
비단우리만공공데이터에주목하는것은아니다. 미국 영국 EU 등세계각국도정부투명성제고와경제활성화를위해경쟁적으로공공데이터개방과활용정책을추진하고있다. 미국은 2013년 5월, 오바마 2기의열린정부를완성할오픈데이터정책을발표하였다. 이정책의핵심은정부에서만든모든데이터의무조건적인개방이다. 또한영국의캐머런수상은활용도가높은공공데이터를구체적으로적시하고각부처가빠르게개방하라는지시를내렸다. EU는이미 2011년에 27개회원국의모든공공데이터를의무적으로개방하라는오픈데이터전략을수립했고, 2013년 6월에 공공정보재활용지침 을개정하였다. 공공데이터를더많이개방할수록더많은가치를발견할가능성은커진다. 공공데이터는정부가주어진역할을제대로수행하고있는지를감시하는데에도활용할수있으며국민생활을더편리하게하는서비스를개발하는데에도활용할수있다. 이에따라정부차원의빅데이터확보와활용을통해신산업과일자리창출등을추구함으로써국가의산업경쟁력향상을도모하고있으며재난방재, 질병방지, 치안, 물가관리등공공서비스영역에서예상하지못한불규칙한사건의예측및예방등사회현안을해결하기위한빅데이터활용이증가하는추세이다 ( 이응용, 2012). 미국정부는빅데이터이니셔티브를통해공공정책각분야에빅데이터분석을전방위적으로확산해국가적난제해결에나서고있다. 우리정부도최근정부3.0 비전을발표하면서데이터기반의과학적정책수립에나서고 6대분야에걸쳐 21개의시범사업을추진할예정이다. 하지만국내공공분야의빅데이터활용은여전히초기단계에머물러있다. 공공기관들은경제, 일자리, 교통, 교육, 보건, 복지, 안전, 행정효율화등다양한분야에서빅데이터를도입해보고자하는의지는강하지만국내의경우주요선진국에비하여기술격차가존재하고, 아이디어및데이터는있으나빅데이터분석환경및활용경험이부족하고전문인력도부족한실정이어서서비스도입에어려움을겪고있는상황이다. 본고에서는주요선진국의빅데이터추진전략을살펴보고국내외의사회, 의료 보건, 금융, 교통, 재난 국방 치안과같이다섯가지공공부문에적용된대표적인빅데이터사례를 32개선정하여전반적인동향과시사점을정리하였다. 지자체의성공적인빅데이터도입을위해서사전준비가필요하다. 지자체의빅데이터도입시고려할사항들과지역정보화관점에서지자체의준비사항을살펴보았다.
Ⅱ. 주요선진국의빅데이터추진전략 빅데이터는기업뿐아니라국가의경쟁력에도지대한영향을미친다. 주요국가의정부및지자체들은빅데이터분석을향후국민편익향상, 공공서비스효율화, 시민복지향상, 선제적정책, 미래전략수립을위한중요한수단으로인식하고있다. 세계각국이이처럼공공데이터의빅데이터활용에주력하는이유는데이터가가진무한한가치때문이다. 주요국가의정부및지자체가빅데이터를활용하는방향은크게두가지로볼수있다. 첫째는빅데이터기반의국가미래전략을추진하고있다는점과둘째로빅데이터를사회현안해결을위한새로운방법으로활용함으로써공공서비스의효율화를추구하고있다는점이다. 미국, 영국, EU, 싱가포르와같은선진국들을시작으로빅데이터의활용은국가차원의전략으로확산되고있는데, 그추진현황을살펴보면다음과같다 ( 빅데이터전략연구센터a, 2012). 미국은범정부차원의빅데이터거버넌스체계를구축하였다. 미국대통령과학기술자문위원회 (PCAST) 1) 는 2010년 12월모든연방정부는빅데이터전략수립이필요하고, 이를위해연방정부수준에서의빅데이터관련기술투자의필요성을제시 (Design a Digital Futur e) 2) 하였다. 이에과학기술정책실 (OSTP) 3) 은 2억달러규모의 빅데이터연구개발이니셔티브 (Big Data R&D Initiative) 를발표 (2012.3) 하였다 ( 빅데이터전략연구센터c, 2013). 과학기술정책실은 NITRD 4) 빅데이터협의체인 빅데이터고위운영그룹 (BDSSG) 5) 을구성하였고이그룹은빅데이터연구개발의조정과이니셔티브목표의확인등빅데이터계획을주도 1) President s Council of Advisors on Science and Technology 2) Every Federal agency needs to have a big data strategy. 3) Office of Science and Technology Policy 4) Federal Networking and IT R&D 의약자. 2002 년부터추진되고있는연방정부차원의범부처 IT R&D 프로그램으로대규모네트워크, 고성능컴퓨팅시스템, 소프트웨어, 정보관리등기술분야의연구개발은물론신기술이사회와경제및노동에미치는영향등을분석하는등다양한연구영역이상호유기적으로연계되어진행 ( 한국인터넷진흥원, 2012) 5) Big Data Senior Steering Group
적으로추진하고있다. 미국정부 (data.gov) 는클라우드기반의개방형데이터플랫폼을제공하여개별부처가보유한공공데이터를쉽게공유할수있도록하고있다. 또한연방정부에서는다양하고도방대한텍스트데이터와지리정보를제공하여상세한정보를바탕으로정부정책을결정하고제안하도록하고있다. 영국은공공데이터에쉽게접근하도록공개하여데이터의활용기회를증대시키고있다. 이를위해내각사무처는 공개데이터연구소 (Open Data Institute) 를설립하고공개데이터활용을통해비즈니스모델개발과데이터생태계구축을지원하고있다. 영국의기업혁신기술부 (BIS) 는공공정보를개방하고접근성을높여데이터기반의가치창출을위해 데이터전략위원회 (Data Strategy Board) 를 2012년 3월설립하였다. 영국정부는데이터전략위원회를통해오픈데이터전략 6) 에 2013년 4월부터 700만파운드를지원할계획이며, 각부처가무료로데이터를공개할수있도록적극지원할예정이다. 이에기업혁신기술부 (BIS) 를비롯한총 16개부처 7) 는부처별특성에맞는 오픈데이터전략 (Open Data Strategy) 을 2012년 6월발표하였다. 각부처는데이터공유플랫폼 (data.gov.uk) 8) 의재정비를통하여검색기능개선, 정보이용방법의단순화, GIS 데이터의시각화등보유목록에대한접근성강화및서비스활성화방안을모색하고있다. 또한팀버너스리 (Tim Berners-Lee) 가데이터품질과재이용성을평가하기위해개발한평가방법을기준으로정부의각부처가공개하는오픈데이터평가를도입하였다. EU 는금융위기극복과사회의복잡성을이해하기위한 FuturICT 와불확실한미래탐구를 6) 상세내용은 Ⅲ. 사회현안해결을위한주요국의빅데이터추진전략 참조 7) 16 개부처는내무부, 기업혁신기술부, 지역사회지방정부부, 노동연금부, 교육부, 국제개발부, 에너지기후변화부, 외무부, 보건부, 국세청, 국방부, 법무부, 재무부, 교통부, 문화매체체육부, 환경식품농촌부이다. 8) 2012 년현재 Linked Data 형태로 8,400 개의데이터세트제공
위한 iknow 프로젝트를추진하고있다. FuturICT는지구신경망시스템, 전체지구시뮬레이터와글로벌참여플랫폼을구현하여세계변화의방향과새로운지식을탐구하고있다. iknow 프로젝트에서는전세계의약신호 (weak signal) 과와일드카드 (wild cards) 9) 를포착함으로써, 미래의전략적이슈와대응에필요한지식을발굴하고있다. 싱가포르의국가안보조정사무국 (NSCS) 은국가안전의위협요소에대한평가와주변환경변화를탐지하여새로운기회를발굴하는 RAHS 10) 프로그램을 2004년부터운영하고있다. RAHS 프로그램은싱가포르의환경탐색을통해획득한데이터를분석하여국가에심각한영향을미칠수있는잠재적위험요소와불확실성요소를탐색하고머지않은장래에다가올주요이슈들을예측하고발견하는기능을수행한다. RAHS 프로그램은싱가포르해안의안전확보를위해해상상황인식프로젝트를추진함으로써, 해상테러, 해안침투등해안영역에서의안전을확보하고조류독감이싱가포르에들어옴으로써벌어질수있는미래시나리오를연구하고대응방안을마련하는등의성과를거두고있다 11). 일본정부는동일본대지진을계기로데이터의중요성을재인식하고빅데이터를국제경 쟁력강화를위한전략적자원으로평가하고있다. 수많은데이터를실시간으로수집 전송 분석등에활용하여과제해결에연계하고수십조엔의데이터활용시장의창출을목표로하 고있다. 문부과학성이추진하는 정보폭발 (Info-plosion) 프로젝트 (2005 년 2011 년 ) 의추진목 표는폭증하는다양한정보로부터필요정보를추출하는기술, 대량의정보를안전하고안정 적으로관리하고운용하는기술, 인간과유연한상호작용으로쉽게정보를활용할수있는기 술등을개발하여선진적인 IT 서비스를인간사회에적용하는것이다. 경제산업성이추진하 9) 약신호는사회변화의시작을가리키는신호로서, 미래에발생할가능성이있는사건을의미하고, 와일드카드는발생가능성이매우낮으나, 발생했을경우엄청난사회적영향을미칠수있는사건을의미한다. 10) Risk Assessment Horizontal Scanning 11) http://www.mindef.gov.sg/imindef/publications/pointer/journals/2007/v33n3/feature2.html
는 정보대항해 ( 情報大航海 ) 프로젝트 의추진목표는많은정보중에서사용자가원하는정보를정확하게검색 분석하는기술을개발하는것이다 ( 조문래, 2012). 총무성은차기 ICT 전략인 액티브재팬전략 (Active Japan ICT) 의 5대중점영역 12) 에 빅데이터이용과활용에의한사회 경제성장 을포함 (2012.7) 시키고, 빅데이터및오픈데이터를통한신규시장창출을위해 2013년 89.3억엔의예산을투자할계획이다 ( 일본총무성, 2012). 일본은데이터개방, 기반기술연구개발, 표준화, 활용인재확보, 사물간통신촉진, 규제개선등산학관이제휴하여위의전략을추진하고성과평가방법을마련하는등민간분야를고려하면서빅데이터활용활성화정책을추진하고있다. 한국정보화진흥원은빅데이터를기반으로중장기미래전략수립을지원하는빅데이터전략연구센터를개설 (2012.4) 하였다. 여기서는산 학 연 관이협력할수있는빅데이터국가전략포럼 13) 을지원하고있으며, 빅데이터기반미래사회대응전략수립, 빅데이터글로벌선진사례연구, 공공부문데이터분석및활용방안등의연구를수행하고있다. 국가정보화전략위원회는빅데이터를활용한스마트정부구현안을제시하는등국가차원의사업을추진하고있으며빅데이터활용추진단이신설되어빅데이터경쟁력을높이기위한국가 사회적기반확보에나서고있다. 앞서살펴본주요선진국의빅데이터추진전략과활용에나타난시사점을요약하면다 음과같다. 12) 액티브재팬전략실현을위한 5 대추진전략 : 1) 액티브데이터전략 ( 빅데이터이용과활용에의한사회경제성장 ), 2) 액티브라이프전략 ( 적극적이고쾌적한생활환경실현 ), 3) 리치콘텐츠전략 ( 풍부한콘텐츠개발및플랫폼실현 ), 4) 안심안전고신뢰 ICT 전략 ( 세계최고수준의사이버보안환경실현 ), 5) 액티브커뮤니케이션전략 ( 견고하고유연한 ICT 인프라구축 ) 13) http://bigdataforum.or.kr
미국, 영국, 싱가포르는 2,000년대중반부터빅데이터분석을통해자국의안전과새로운기회를포착하기위한수단으로정부차원의노력을집중하고있다. 특히국가위기관리등범정부차원의분석과제를발굴하고여기에빅데이터를적용하고있다. 그밖에빅데이터협력체계를범정부차원에서구축, 각부처가보유한데이터의연계 및활용을촉진하고있으며의료, 복지, 교육등국민생활과직결된분야에빅데이터를적극활용함으로써다양한국민맞춤형서비스개발과국가혁신을주도하고있다. 2000년대후반, 스마트기기가본격적으로보급되면서개인및조직의행태를추론할수있는비구조화된데이터의급속한증가로빅데이터의중요성이대두되었다. 이러한대용량데이터는데이터간의관계성을통합하여가시적으로표현됨으로써사실에근거한정책의사결정을지원하고있다. 각국정부는비정형 대용량데이터에대하여다양한분석이가능하도록정부주도로신기술을개발하고, 빅데이터의분석 활용을위한연구에대학 민간부문이자발적으로참여하도록지원하고있다. 또한데이터과학자에대한중요성을인지하고인재확보와내부역량강화에도노력하고있다. 공공데이터가지닌무한한경제적가치를발굴하도록하기위하여공공데이터의개방과공유는필수적이다. 공공데이터의개방 공유환경조성을위하여각국정부는정보공개를위한제도적기반을마련할뿐아니라플랫폼조성을위한오픈 API 14), Linked Data( 이만재, 2011) 등기술적기반도제공하고있으며재난방재, 범죄예방및치안, 테러, 보건 의료, 복지향상등공공데이터제공을위한플랫폼 ( 예 : data.gov) 도구축하고있다. 각국의개방된공공데이터를살펴보면 2013년 1월현재, 미국은 392,000종, 영국 8,000여종, 싱가포르 5,000여종인데반하여한국은 400여종으로미미한상태이다 ( 정보통신정책연구원, 2013). EU는공공데이터의개방과재이용을통한직간접적인경제적효과가 1,400억유로에달 14) 웹사이트내부데이터를외부에서활용할수있도록공개된프로그래밍인터페이스
할것으로예측했다. 영국정부가구축한공공데이터포털에축적돼있는 8,000개남짓한데이터셋의경제적가치는 160억파운드로추산되고있다. 우리나라역시전문가에따라차이는있지만공공데이터를전면개방해서잘활용하면 2017년까지 15 52만명의일자리가창출된다고예측하고있다. Ⅲ. 공공부문의빅데이터활용사례 문헌연구를통해국내외공공부문에적용된빅데이터사례를 32 가지선정하였으며, 이는 사회, 의료 보건, 금융, 교통, 재난 국방 치안과같이다섯가지적용분야로분류하였다. 먼 저각사례의요점을설명한후전반적인동향과시사점을정리해본다. 빅데이터분석은주요일간지, 소셜데이터, 혹은민원센터의로그데이터를이용하여사회이슈의자동감지와특정주제에대한동향분석을통해잠재적정책수요의발굴이가능하다. 또한지역별이슈를도출할수있으며지역별맞춤형대국민서비스전략수립에도활용할수있다. 1 사회통합을위한민원동향분석사례한국국민권익위원회에서는연간 300만여건의민원을분석, 민원동향분석시스템을구축해민원발생원인을차단하고, 행정서비스의만족도를제고시키고있다 ( 민원정보분석센터, 2013). 2011년에는이시스템을기반으로이민자민원현황을분석하여신규정책수립및제도개선을지원하였다. 2 구제역민원현황분석사례한국국민권익위원회는 2010년안동지역구제역민원현황을분석하여관련기관에제공하고, 이후추가로정책에활용하기위해 2011년국민신문고접수민원을대상으로민원분석보고서를작성하였다. 이보고서는질병및전염병관리와관련한사회이슈를분석, 맞춤형민원서비스를달성한사례로꼽히고있다 15).
3 자살문제해결을위한사례서울의모종합병원과소셜분석전문기업이공동으로 SNS 텍스트마이닝기법을사용하여자살위험이높은시기를예측하는시스템을세계최초로개발하였다. 연구팀은 2008년 1 월 1일부터 2009년 12월 31일까지국가자살통계와 SNS 상에서자살이나자살관련단어의빈도를비교하는방식으로블로그나트위터등에서 ' 힘들어죽겠다 ' 거나 ' 자살하고싶다 ' 는등의용어가많아지면국내에서자살률이높아진다는사실을규명했다. 이프로그램을 2010년자살통계에적용한결과, 정확률이 79% 였다. 앞으로 SNS와빅데이터분석을더광범위하게활용하면정확도를 90% 대까지끌어올릴수있을것으로기대되며, 국가차원에서활용하면좀더효율적인자살예방사업을펼칠수있을것으로기대된다 ( 권정은외 1인, 2012). 4 미국콜로라도주교육부통합자료시스템사례미국콜로라도주교육부는데이터관리원칙을바탕으로주전체에걸쳐서통합자료시스템을개발하였고, 데이터에쉽게접근할수있도록하였다. 이시스템은 178개초중고학교지구와 28개공립대학들로부터학생들의복지, 소득, 인력데이터를수집해하나의통합플랫폼에제공함으로써학생들의학업성취도를취학전시기부터대학졸업전단계까지분석할수있게해준다 16). 의료및복지지출데이터, 민원센터로그, 소셜데이터, 해당기관홈페이지및포털게시판, 주요일간지등을통합분석하면의료보험비용분석을통한사업최적화, 부당청구방지, 복지정책입안과만족도분석, 지역별복지불균형해소등의문제를해결할수있다. 공중보건분야에서는전국의의료데이터를연계하여전염병발생과같은긴박한순간에빠른의사결정을할수있게하여준다. 15) 안동 예천구제역피해농가 36 가구보상, 국민권익위원회블로그, 2011 년 6 월 30 일, http://blog.daum.net/loveacrc/4063 16) 빅데이터전략연구센터 (2013), 새로운미래를여는빅데이터시대, p.194.
5 환자임상정보분석사례 2011년미국의 세톤헬스케어패밀리 라는병원이 IBM의인공지능슈퍼컴퓨터왓슨 (Watson) 의 의료용콘텐츠및예측분석기술 을이용하여환자데이터를분석하였다. 이기술은방대한양의환자데이터에서임상정보를추출 분석해미래를예측하고대비함으로써환자의재입원과병원방문횟수를감소시킬수있었다 17). 6 1000 유전체프로젝트사례 1000개유전체프로젝트는 2008년 1월영국, 미국, 중국이합작하여다양한인종으로구성된인간 1000명의유전체를 3년내해독하는국제프로젝트로써그동안데이터용량이너무커서일부연구자들만사용할수있었으나, 향후컴퓨팅서비스에대한비용만요구할계획이다 18). 7 단백질데이터은행사례미국립보건원은전세계단백질구조관련데이터저장및유통촉진을위해 단백질데이터은행 을운영하고있다. 미국, 영국, 일본이공동운영하는이사이트는현재 8,000여개의단백질구조데이터를저장하고있으며, 매달 1 테라바이트규모의단백질데이터가축적되고, 매달 140개국 21만 1,000여명의사용자가방문하고있다 19). 8 Pillbox 프로젝트를통한의료개혁사례미국은국립보건원사이트를통한알약검색정보를활용하는 필박스 (pillbox) 프로젝트 를수행하였다. 필박스를통해수집된빅데이터를통해후천성면역결핍증 (HIV) 등관리대상인주요질병의분포, 연도별증가등에대한통계치확보가가능하게되었고, 연간약 560억원을절감할수있었다 20). 17) 상게서, p.418 18) 빅데이터전략연구센터 (2012), 빅데이터로진화하는세상 : Big Data 글로벌선진사례, pp.68 71. 19) 상게서, p.161 20) 상게서, pp.72 75.
9 구글검색어분석을통한독감예보서비스사례실시간으로독감이검색되고있는추이를보여주고있는구글의독감예보시스템은독감, 인프루엔자등감기와관련된검색어쿼리의빈도를조사, 구글독감동향 (Google Flu Trends) 이라는독감확산조기경보서비스를만들었다. 이서비스는미국보건당국보다한발앞서시간및지역별독감유행정보를제공하고있다 21). 10 LA 카운티육아서비스보조금부당청구적발사례 LA 카운티는증가하는육아서비스관련사기범죄에전문적인사기단이연루된것으로추정하여빅데이터분석을통해보조금수령인과서비스공급자를파악후사기행위에연루될가능성이큰대상과기금의대량손실이발생할우려가있는분야를예측하여조사우선순위를결정하고있다. 육아서비스부당청구적발로연간 $7M $31M 비용절감을하였고부정거래검출정확도를 85% 로향상시켰다 22). 11 동식물및인체전염병확산대응사례영국은글로벌차원의동식물및인간의전염병에효과적으로대응하기위해정책을제시하고, USN, 데이터마이닝, 유전공학, 생물정보학등을이용하여 HIV/AIDS, 말라리아등다양한전염병에대한전망과대응방안을마련하였다. 또한위성으로부터농작물의색깔분포등특징을파악한후, 농작물의위치, 건강상태에대한정보를추가로수집하여풍향과기타지리적요소를근거로농작물전염병의이동경로를파악한다. 이러한정보를바탕으로전염병확산에대응하기위한농작물전염병영향예측시스템을개발하였다 (Steinberg and Bowman, 2004). 12 영국의비만대책수립사례영국정부는 2050년까지남자의 60%, 여자의 50% 가비만이될것임을밝히고, 매년 499 억파운드가소요될것으로전망하였다. 따라서비만문제는더이상개인의문제가아닌사회적문제임을선언하고, 향후 40년간영국사회의비만문제를효과적으로대응하기위해서빅데이터를통한과학적근거를기반으로정부, 기업, 시민사회의공조하여지속가능한비만 21) 상게서, pp.88 89. 22) 한국지역정보개발원 (2012), 빅데이터시대의데이터활용과전략, 지역정보화동향분석제3호, p.8
대책을수립하였다 23). 13 싱가포르조류독감시뮬레이션사례본연구의목적은조류독감이싱가포르에전염됨으로써벌어질수있는미래시나리오를연구하고대응방안을마련하는것이다. 조류독감상황에대한시스템맵이구축되어분석가들이지역에서벌어지는독감출현의위협수준들을평가한다 24). 14 농축산물유통정보분석사례농축산물에대한이력정보부터농축산물의토질, 온도와습도, 일조량, 농약및유통경로등유통정보를분석함으로써안전한먹거리시스템을강화하는데에도빅데이터가활용되고있다 25). 조세, 금융거래데이터와소셜데이터의통합분석을통하여, 금융거래이상징후, 조세회피와탈세등의패턴감지와조기대응력확보, 금융및조세정책에대한시민인식과지역별, 기간별동향에대한분석을수행하는데빅데이터분석을활용할수있다. 빅데이터기반탈세방지시스템은세무분야에서도큰성과를나타내고있다. 최근정부가지하경제양성화를추진하는것도세원확대없이는복지재원마련이어렵기때문이다. 빅데이터를탈세방지에접목한뉴욕주의사례는시사하는바가크다. 15 탈세방지시스템통한국가재정강화사례미국국세청 (IRS: International Revenue Service) 은사기성납세신고및환급에의한탈세유형적발을목적으로운영하고있는 RRP(Return Review Program) 에빅데이터실시간분석기법을적용하는프로젝트를추진하였다. 빅데이터솔루션을기반으로빅데이터에서이상징후를찾아내고, 예측모델링을통해과거행동정보를분석해사기패턴과유사한행동을 23) 빅데이터전략연구센터 (2013), 새로운미래를여는빅데이터시대, p.61 24) 빅데이터전략연구센터 (2013), 새로운미래를여는빅데이터시대, pp.42 43. 25) 상게서, p.49.
파악하며, 소셜네트워크분석에기반한범죄네트워크분석기능을통해문제점을찾아낸 다 26). 16 탈세방지시스템사례미국의뉴욕주는빅데이터를탈세방지에접목한탈세방지시스템인 CISS(Case Identification & Selection System) 를개발하여환급사기적발에큰성과를거두었다. CISS 도입이후부양가족의허위신고와판매세허위환급이사라졌다. 빅데이터기반탈세방지시스템은세원이한정된반면탈세나탈루수법은갈수록지능화되고있는한국등여러국가에서사기방지에혁신을일으킬수있을것으로기대된다 27). 17 미국주정부세금시스템사례 미국오하이오와오클라호마주정부가국세청데이터와고용데이터를연동하여신규세 원, 미납세금확인등에활용하고있다 ( 정용찬, 2012). 18 금융감독원의저축은행여신상시감시시스템사례 2012년 12월 16일금융감독원은여신상시감시시스템을구축하여 2013년 1월부터본격가동하였다. 저축은행의여신관련정보를이용하여데이터마이닝기법인연관성분석을통해불법및부실혐의여신을사전에탐지할수있다. 금융감독원은심도있는현장여신검사를할수있게되고, 저축은행스스로불법및부실여신취급을자제하도록하는예방효과를기대할수있다 28). 19 한국석유공사국내유가예보서비스사례 한국석유공사는 2011 년말, 데이터분석전문회사와협력하여유가예보시스템을개발하 였다. 고유가에따른소비자부담을감소시키기위해유가의단기미래가격을예측하여제공 하는오피넷시스템을구축한것이다. 오피넷웹서비스를통해국내 1,300 여개의주유소로 26) 빅데이터전략연구센터 (2013), Big Data 글로벌 10 대선진사례, pp.6 8. 27) 빅데이터! 세금도둑도잡는다?, 머니투데이, 2013 년 7 월 16 일, http://news.mt.co.kr/mtview.php?no=2013071511335624582&type=1 28) " 정신못차리는저축은행 ", 서울경제, 2013 년 9 월 22 일, http://economy.hankooki.com/lpage/finance/201309/e20130922163311117490.htm
부터수집된휘발유가격정보를제공한다 29). 도로센서네트워크, 사건사고로그, 날씨, 명절및스포츠등의이벤트데이터와빅데이터 에기반한교통흐름모델링과예측, 최적화시스템구현, 교통신호체계와유지보수정책에 반영이가능하다. 20 서울시심야버스노선최적화서울시는시민들의휴대폰통화량을기반으로한 KT의유동인구데이터와시가보유한교통데이터를융합 분석해최적의심야버스노선을구축했다. 시민들이자정부터새벽 5시까지심야시간대에사용한휴대폰콜데이터 30억여건과시민들이이용한심야택시승 하차데이터 500만건의빅데이터를융합하여분석한결과가반영되었다. 이어기존의버스노선과시간 요일별유동인구및교통수요패턴을분석하고, 노선부근유동인구가중치를계산하는등재분석을거쳐최적의노선과배차간격을도출했다. 이번심야노선구축은행정데이터만활용하던과거의시정책에서민 관이구축한빅데이터를융합했다는데의미가있으며도시교통정책에빅데이터를활용한사례이다 30). 21센서데이터를활용한지능형교통안내시스템사례일본은센서데이터를활용한지능형교통안내시스템은실시간으로 GPS 데이터를분석하여최적의교통정보를사용자에게전달하는서비스를제공한다. 택시및정보제공에동의한내비게이터사용자로부터얻어진교통상황과관련된데이터를종합분석하여실시간으로출발지에서목적지까지의최적경로를안내한다. 사용자에게최적의교통상황및경로를안내함으로써에너지효율을높이고, 교통체증을감소시키는효과를거두었다 31). 29) 빅데이터전략연구센터 (2012), 빅데이터로진화하는세상 : Big Data 글로벌선진사례, pp.42 45. 30) 서울시, 빅데이터로심야버스노선구축, 중앙일보, 2013 년 7 월 2 일, http://article.joins.com/news/article/article.asp?total_id=11959173&ctg=1213 31) 빅데이터전략연구센터 (2013), Big Data 글로벌 10 대선진사례, p.9.
22밀라노교통상황예측사례교통흐름에영향을주는다양한정보들을종합적으로분석하여최적의교통안내서비스를제공하고있으며, 5분에서 15분간격으로수집된데이터를분석하여향후 2 24시간후의교통상황예측이가능하다 32). 센서데이터, CCTV, 소셜데이터로부터도심내의문제를조기파악하거나재난의조기감지하고대응할수있으며도시민과재난지역의시민목소리를바르게이해, 응급시활동에반영할수있는정책의제발굴에활용이가능하다. 뿐만아니라국가안보, 국방, 치안분야업무에도적용가능하다. 23재난관리청실시간재난모니터링사례미국의공공기관인재난관리청 (FEMA) 은재난에신속하게대응할수있도록소셜미디어및타정부기관과연계시스템을구축하였다. 페이스북, 트위터등의소셜미디어를통하여위기상황과구조요청정보를획득하여실시간으로응답하거나위기관리담당자에게긴급상황메시지를전달할수있게되었다. 재난관리청은약 3만명의팔로워를거느린트위터페이지를운영하고소셜미디어글의모니터링에주력하였다 ( 국가정보화기획단, 2010). 24수해관리프로젝트사례영국해안의침식은가정과경제에큰위협을가하고있으며, 수백만명이이위험에노출되고있으며, 해마다홍수에대한피해가 20배씩증가하고있다. 이처럼영국을순식간에위협할수있는잠재적위험에대한위험관리프로젝트을통해 30 100년이후를대비한위험관리대책을마련하였다. 이프로젝트를통하여기후변화, 강의형태, 생태계의변화등홍수피해를줄수있는데이터기반의과학적의사결정을지원하고있다 33). 32) 빅데이터전략연구센터 (2012), 빅데이터로진화하는세상 : Big Data 글로벌선진사례, pp.14 15. 33) 빅데이터전략연구센터 (2012), 선진국의데이터기반국가미래전략추진현황과시사점, IT&Future Strategy 제 2 호, p.21.
25맨홀안전관리사례뉴욕시는오랫동안맨홀뚜껑이폭발하는사고가이어져왔다. 이에미국의통계학자신시아루딘은뉴욕시의맨홀 5만1000개에관련된방대한데이터로예측변수 106가지를산출하고, 이를바탕으로터질위험이있는맨홀을예측했다. 그리고이후심각한사고를일으킨맨홀의 44% 가, 루딘이지목한 위험성상위 10% 에포함된것으로나타나분석의유용성이입증되었다 34). 26테러예측시스템사례 9.11 테러이후, 국토안보부를중심으로테러및범죄방지가주목을받았다. 따라서국토안보부의과학기술국에서블로그, 소셜미디어, 수범사례등범정부적빅데이터를수집하고분석하여예측체계를도입하였다. 특히, 사이버안보를위해빅데이터를활용한클라우드보안인프라를구축하였다 35). 27해상상황인식프로젝트사례싱가포르국방부는미국합동군사령부그리고북대서양조약기구와공동으로해상안전확립을위해해상상황인식프로젝트를추진하였다. 해상테러, 해안침투등해상상황에관한의사결정을지원하기위해위크시그널과예상시나리오등정보처리와시각화를수행하였다 (Lim, 2007). 28범죄예방시스템으로안전지역사회구축사례샌프란시스코는빅데이터분석을활용하여과거 8년동안범죄가발생했던지역과유형을세밀하게분석하여후속범죄가능성을예측함으로써범죄를사전예보하는시스템을구축하였다. 이는과거범죄에대한통계정보를제공하는것과달리새로운범죄가능성정보를제공한다는것에큰의미가있다. 정책적시사점은과거범죄자및범죄유형을소셜네트워크를통해지속적으로관찰함으로써그와관련된조직및범죄에대한예방이가능하다는것이다 36). 34) 빅데이터 세계를꿰뚫다, 시사인라이브, 2013 년 7 월 26 일, http://www.sisainlive.com/news/articleview.html?idxno=17271 35) 빅데이터전략연구센터 (2013), 새로운미래를여는빅데이터시대, pp.69 70.
29유전자색인시스템사례 FBI는유전자감식결과도출된고유한패턴을데이터베이스에저장, 검색할수있도록해당법안을개정하고구축된유전자데이터베이스를기초로입력대상, 활용범위등을지속적으로확장시켜효율적인범죄자감식시스템을마련하였다. 유전자정보은행 CODIS (Combined DNA Index System) 는미제사건용의자및실종자에대한 DNA 정보 1만 3,000 건을포함한 12만명의범죄자 DNA 정보를보유하고있다 37). 30소셜네트워킹분석을이용한범죄예방사례미국워싱턴주노동산업부는소셜네트워킹분석을통해개인범죄연루자와사기범죄조직을파악함으로써사기행각을적발하고, 주변인들의범죄공모여부, 범죄조직과의연관성등을파악하고있다 38). 31수배자위치추적프로그램사례위치추적서비스 MetaCarta는 AI와빅데이터를접목하여수천개의서류를분석하고그결과를대규모지리데이터베이스를이용하여상호검증하도록하여위치를정확히제시해준다. 즉, 수배중인사람의이름이나관련키워드를입력하면그사람의소재위치를정확하게지도에맵핑해주는프로그램이다. 이서비스는범죄활동의패턴을추적하여그활동패턴이집중되는위치를찾아내는데활용이가능하다 39). 32스마트 CCTV를이용한사회안전망사례 USN, CCTV 등사회전반에 IT 기기가보급됨에따라데이터분석에의한사회안전망서비스는지속적으로진화하고있다. 특별한움직임이감지되었을때만움직이는스마트 CCTV는보안관서에정보를제공함으로써실시간으로사회안전을확보하는데기여하고있다. 또한이른새벽낯선사람들의움직임등부자연스러운행동패턴을탐지함으로써경찰서나보안서비스업체에경보를발령하는등진화하고있다 40). 36) 빅데이터전략연구센터 (2013), Big Data 글로벌 10대선진사례, pp.40 41. 37) 빅데이터전략연구센터 (2013), Big Data 글로벌 10대선진사례, p.38. 38) 빅데이터전략연구센터 (2013), 새로운미래를여는빅데이터시대, p.184. 39) 상게서, p.419.
Ⅳ. 주요국의공공부문빅데이터활용사례분석 III장에서논의한 32개국내외공공부문의빅데이터활용사례를 < 표 1> 에정리하였다. 마지막 3개열가운데 데이터유형 열은분석대상인소스데이터의형태분류에관한것이며, 정형과소셜 ( 비정형소셜미디어데이터 ) 두가지로분류하였다. 지역범위 열은사례의적용지역범위를표시하며, 지자체 (R: Regional), 전국 (N: National), 그리고전세계 (G: Global) 세가지로분류하였다. 끝으로사례가적용된국가명을기재하였다. 32개사례중에서 의료 보건 분야와 재난 국방 치안 분야가각각 10건으로가장많고, 금융분야 5건, 사회분야 4건, 교통분야 3건순이다. 데이터형태는정형데이터사례가소셜데이터사례보다 3배이상많았다. 즉, 네티즌들이블로그, 트위터에기재한의견들을텍스트마이닝기법에의해분석한사례보다는이미수집되어있는정형의공공데이터를분석한사례가더많다는의미이다. 아직은소셜미디어데이터같은비정형 ( 텍스트 ) 데이터분석내용을해석할수있는인력이부족하고, 크롤링이나자연어처리같은기술적인진입장벽이존재하기때문이다. 적용분야번호사례내용 / 효과데이터유형 사회 의료 보건 1 민원동향분석시스템 : 국민권익위원회 300만건민원분석구제역민원현황분석 : 국민권익위원회 민원발생원인차단, 행정서비스만족제고 지역범위 국가 소셜 N 한국 2 질병및전염병관리, 사회이슈분석, 맞춤형민원서비스 소셜 N 한국 3 자살예측시스템 SNS 1.5억건실시간분석 소셜 N 한국 4 콜로라도주교육부, 중고대학학생들의소득, 복지, 학업성취도분석인력데이터수집 정형 R 미국 5 세톤헬스케어패밀리병원, 환자임상정보분석 재입원과병원방문횟수감소 정형 R 미국 6 국립보건원게놈프로젝트난치병치료, 신약개발정형 G 미 영 중 7 단백질데이터은행매달 140 개국 21 만명방문정형 G 미 영 일 8 Pillbox 프로젝트 의료개혁, 알약검색정보, 연간 560 억원절감 정형 N 미국 40) 빅데이터전략연구센터 (2012), 선진국의데이터기반국가미래전략추진현황과시사점, IT&Future Strategy 제 2 호, p.9.
금융 교통 재난 국방 치안 9 구글독감예보 감기관련검색어쿼리빈도 소셜 N 미국 10 LA카운티육아서비스부당청구적발비용절감, 부정거래보조금수령사기적발검출정확도향상 정형 R 미국 11 영국전염병대응책 농산물및인간의전염병확산대응 정형 G 영국 12 영국비만대책수립 개인문제가아닌사회적문제로인식 정형 N 영국 13 조류독감시뮬레이션 조류독감미래시나리오연구하고싱가정형 N 대응방안마련포르 14 안전한먹거리시스템강화 농축산물의토질, 온도, 농약, 유통경로분석 정형 N 미국 15 국세청탈세방지시스템 국가재정강화 정형 N 미국 16 뉴욕주탈세방지시스템 환급사기적발 정형 R 미국 17 오하이오주, 국세청데이터와오클라호마주신규세원, 미납고용데이터연동세금확인 정형 R 미국 18 금융감독원여신상시감시연관성분석을통한불법및부실시스템혐의사전탐지 정형 N 한국 19 석유공사국내유가예보오피넷웹서비스 ( 국내 1,300개서비스주유소휘발유가격정보 ) 정형 N 한국 20 서울시심야버스노선최적화 자정 새벽 5시까지사용한휴대폰콜데이터와심야택시승 하차데이터융합 정형 R 한국 21 지능형교통안내시스템 센서데이터활용 정형 R 일본 22 밀라노최적교통안내 5 15분간격교통정보분석, 향후이탈정형 R 서비스 2 24시간교통상황예측리아 23 재난관리청, 재해정보소셜미디어글모니터링, 팔로워알리미서비스 3만명 소셜 N 미국 24 수해위험관리프로젝트 해안침식, 홍수 정형 N 영국 25 뉴욕시맨홀안전관리 맨홀 5만개관련데이터로예측변수 106가지산출 정형 R 미국 26 국토안보부테러및범죄방지 테러예측체계구축 소셜 N 미국 27 해상안전시뮬레이션 싱가포르국방부, 미국합동군싱가정형 G 사령부, NATO 포르 28 샌프란시스코범죄예방시스템 안전한지역사회구축 정형 R 미국 29 FBI 유전자색인시스템 단시간범인검거체계 정형 N 미국 30 워싱턴주노동산업부개인범죄연루자와사기범죄조직소셜네트워크분석파악 소셜 R 미국 31 위치추적서비스 범죄활동패턴추적, 위치추적 소셜 R 미국 32 사회안전망서비스, 실시간 USN, CCTV 등특별한움직임감지 소셜 N 미국
빅데이터적용의지역범위를살펴보면전세계 (G) 에적용된사례보다는전국 (N) 과지자체 (R) 에적용된사례가각각서너배씩많이출현하고있다. 우선은국가단위나지자체단위적용에집중되고있다. 국가분포를보면미국이 17개로가장많고, 다음으로한국 6개, 영국 3개, 싱가포르 2개, 그리고일본과이태리가각각 1개순이다. 그리고미국, 영국, 중국이공동개발한게놈프로젝트와미국, 영국, 일본이공동개발한단백질데이터은행사례가각각 1개씩있다. 또다른관점에서전세계공공부문빅데이터사례의동향이나패턴을파악해보기위하여 < 표 2> 와같이가로축에는데이터유형을, 세로축에는적용지역범위를설정하고 < 표 1> 에정리된내용에맞게각사례를배치하였다. 비록 32개의사례에불과하지만, < 표 2> 로부터다양한시사점을도출할수있다고판단된다. 이표를종합적으로분석하기위해다음과같이세가지측면 ( 전세계일반현황, 한국과전세계비교, 국내현황비교 ) 에서비교하였는데, 이때적용분야, 지역범위, 데이터유형, 국가라는 4가지관점을가미하여분석하였다. 지자체 (R) 전국 (N) 전세계 (G) 정형 4 콜로라도교육부 - 학생관리 5 미국세톤헬스케어 - 환자진료 10 LA 카운티 - 육아보조금사기 16 뉴욕주 - 탈세방지 17 주정부 IRS- 신규세원발굴 20 서울시 - 심야버스노선결정21일본 - 지능형교통안내22밀라노 - 최적교통안내25뉴욕시 - 맨홀안전관리28샌프란시스코 - 범죄예방 8 미국 Pillbox- 의료개혁 12 영국 - 비만대책수립 13 싱가포르 - 조류독감대응 14 미국 - 농축산물유통정보 15 미국 IRS- 탈세방지 18 한국금융감독원 - 여신감시 19 한국석유공사 - 유가예보24영국 - 수해위험관리29미국 FBI- 유전자색인시스템 6 미영중 - 국립보건원게놈프로젝트 7 미영일 - 단백질데이터은행 11 영국 - 전염병대응27싱가포르 - 해상안전 소셜 30워싱턴주 - 사기범죄예방31미국 - 범죄패턴추적 1 한국 - 민원동향분석 2 한국 - 구제역 3 한국 - 자살예측 9 미국 - 구글독감예보23미국재난관리청 - 재해정보26미국국토안보부 - 테러예측32미국 - 사회안전망
첫째, 전세계일반현황은 (1) 정형데이터사례가소셜데이터사례보다 3배가량많다 ( 데이터유형 ). 소셜미디어가급증하고있으므로향후소셜분석사례가증가할것으로예상한다. (2) 지자체 (R) 가전국 (N) 보다소셜데이터사례비중이적다. 즉, 소셜데이터분석은지자체보다는국가단위에서진행되는경향이있다 ( 지역범위 / 데이터유형 ). (3) 전세계수준에서진행되는빅데이터사례가상대적으로적으며, 그나마있는 4가지사례도모두정형데이터분석사례이다 ( 지역범위 / 데이터유형 ). (4) 소셜데이터분석은사회분야와재난 국방 치안분야에만적용되고있다 ( 적용분야 / 데이터유형 ). 둘째, 한국과전세계차이점은 (1) 한국은미국과비교해볼때지자체사례비중이적다 ( 국가 / 지역범위 ). (2) 미국은교통분야를제외하고 4개분야 ( 총 17건 ) 에걸쳐서고르게적용되고있으며, 한국은사회분야 (3건), 금융분야 (2건), 교통분야 (1건) 에, 영국은의료 보건분야 (2건) 와재난분야 (1건) 에적용되고있다 ( 적용분야 / 국가 ). (3) 한국은전국적인수준의소셜데이터사례비중은높은편이다 ( 국가 / 지역범위 / 데이터유형 ). 마지막으로, 국내비교는 (1) 지역범위측면에서보면지자체 ( 서울시심야버스노선결정사례 1개 ) 사례보다는전국단위사례 (5개) 가더많다는점이특징이고 (2) 적용분야측면에서보면 5개적용분야중사회, 교통, 금융분야사례는있으나, 의료 보건분야와재난 국방 치안분야는없다. 북한과대치하고있는한국으로서국방분야빅데이터사례가없다는것이아쉬운데, 대북감청데이터를텍스트마이닝분석하면북한의동향에대한이해를향상시킬수있을것이다. 이밖에잠재적빅데이터활용부문은학교폭력예방, 지자체기관및기관장평판분석, 국가 R&D 전략분석, 맞춤형민원서비스, 내부감사, 물가관리등실로헤아릴수없이많다. 정부및공공데이터의공개의폭이넓어지고, 소셜미디어데이터의누적량증가, 그리고텍스트마이닝기술이더욱발달하게되어비정형소셜데이터에기반한빅데이터분석사례는지속적으로증가할것으로전망된다. 이메일, 게시판, 소셜데이터의분석은담합등악습을바로잡고국가를투명하게운영하는효과를기대할수있다. 정부의원활한정책추진과국정운영을위하여다양한사회갈등을해소하고, 보다효율적이고효과적인국가성장과시민만족도향상을위한공공기관의소셜미디어활용이높아질것을기대해본다.
Ⅴ. 성공적인빅데이터추진을위한제언 전자정부를통해고도화된시스템과축적된공공데이터를빅데이터에어떻게활용하느냐는우리나라차세대정보화정책의핵심과제이다. 일반적인빅데이터활용의주요성공요소는데이터의자원화, 데이터를가공하고분석 처리하는기술, 데이터의의미를통찰하는인력등 3가지로볼수있다. 본장에서는우리나라지자체의빅데이터추진전략에고려할사항들과지역정보화관점에서지자체의준비사항을살펴본다. 지자체빅데이터추진전략에고려할첫번째가지자체보유데이터에대한현황분석이다. 데이터의자원화를위해서는활용할수있는빅데이터를찾아내는것이우선이다. 이를위하여지자체는어디에어떤데이터를어느정도보유하고있는가를우선적으로파악하여야한다. 공공데이터에대한현황분석이선행되어야만향후필요한인프라의수준과수집가능하지만빠져있는의미있는데이터의존재여부등을파악할수있다. IV 장에서언급한한국과미국의빅데이터활용현황을비교해볼때한국의지자체사례비중이상대적으로적은것은지자체보유데이터에대한현황분석이미흡한것에기인한바가적지않다고판단된다. 공공데이터의효율적인파악을위해서는지자체의정형, 비정형등모든데이터를공공 DB로구축하는것이가장효율적이다. 지자체는보유한공공데이터를수집 저장 보관 관리 분석 공유하는측면과함께활용할수있는외부빅데이터자원을발견하고확보하는노력도중요하다. 또한지자체는공공과민간부분의데이터개방, 공유및 활용을촉진하기위한산 학 연 관간의제휴와협력기반을마련하여야한다. 서울시심야노선구축은행정데이터만활용하던과거의시정책에서민 관이구축한빅데이터를융합했다는데의미가있다. 서울시는 KT와 MOU를맺고, 외부빅데이터자원인휴대전화이력데이터에서유동인구통계정보를얻을수있었다. KT 역시휴대전화이력데이터는매우가치있지만프라이버시이슈때문에잘활용되고있지못하는데이터를공익차원에서분석하고, 프라이버시를침해하지않는수준에서통계정보를제공함으로써데이터의활용가치를높일수있었다. 서울시의심야버스노선구축은지자체가공공과민간부분의
데이터개방, 공유및 활용을위하여제휴와협력기반을마련한좋은본보기이다. 중앙정부가공공부문의성공적인빅데이터활용을위하여는지방정부의참여가빅데이터전략의핵심방향이되어야한다. 지방정부의데이터파악및확보는국가공공DB 구축에기초가될뿐만아니라빅데이터를통해지방정부의실효성있는정책을개발하는데필요하기때문이다. 지방정부에어떤데이터가있는지, 특정지역에어떤정책이필요한지등은지방정부가가장잘알고있다. 지방정부는특정지역의기후와경제활동등다양한지역정보를분석해지역문제를해결하고실효성있는정책을만들어낼수있다. 두번째로는지자체가데이터를축적하고분석하기위한인프라현황에대한분석도필요하다. 선행된데이터현황에대한분석결과에따라어느정도의컴퓨팅인프라가필요한지, 현수준의인프라를가지고충분히추진가능한지등에대한의사결정이필요하기때문이다. 인프라현황에대한분석은컴퓨팅자원과같은기술적인인프라뿐만아니라빅데이터관련기술개발및활용에요구되는조직, 인력등소프트웨어적인프라에대한현황분석도함께이루어져야한다. 기술적인인프라측면에서는빅데이터를지자체의혁신전략으로활용할수있도록빅데이터플랫폼, 빅데이터분석기술및데이터분석기법에대한이해가선행되어야한다. 즉지방정부의실효성있는정책을개발하는데있어빅데이터관련기술을적극적으로활용하는것이중요하다. 빅데이터프로젝트는설계, 분석, 실행이라는세가지주요단계로구성된다. 일반적으로각단계중어느하나라도자동화되거나빅데이터를처리하는컴퓨터알고리즘에맡길수있는부분은없다. 지자체에서확보하여야할빅데이터인력의중요한역할은지방정부가가지고있는의문이나문제, 전략적과제등을이해하고분명히표현할수있도록도와주며이를빅데이터분석프로젝트의설계에반영하는것이다. 빅데이터분석으로부터이제까지몰랐던의미를추출해내는것은아직까지 사람 의영역이다. 이를위해서는빅데이터를관리하고분석할수있는데이터과학자의양성과확보가무엇보다중요한과제이다. 지자체는내부인력을데이터과학자로양성하는지속적인교육정책뿐만아니라외부전문가를확보하기위한노력도병행되어야한다.
II장의주요선진국의빅데이터추진전략에서공통적으로발견되는것은공공데이터의개방과공유이다. 공공정보개방정책의대표적모범사례는미국정부의 data.gov 이다. 이것은총 65만여개의데이터세트를다양한형태로제공하고있어공공정보소비자의의도와취향에맞게사용이가능하다. 미국정부는 data.gov를이루는핵심메커니즘과코드등을인터넷에전격공개 (2011.12) 하여공공정보관련산업분야의주도권을강화하고있다. 공공데이터의공유와개방의문제는비단빅데이터활용에만해당되는것이아니라효과적인대민서비스를개발하고공공정보에기반한빅데이터생태계구축및관련산업활성화를위해서도필요한사항이다. 지방정부가공개한데이터를활용하는민간기업의활발한참여는빅데이터의개방과도입을통해새로운시장이열림으로써정체된정보통신시장을활성화하고경쟁력강화, 고용창출등의경제효과를기대할수있다. 빅데이터를위해민간기업이보유하고있는데이터를개방, 공유하는것은현실적으로쉽지않다. 그러나공공기관데이터의개방, 공유의활성화는향후민간기업의데이터를점진적으로개방하는문화조성도가능할수있으므로매우중요한의미를갖는다. 지자체도정부의데이터개방정책에적극적으로참여하여야한다. 우리나라정부는 공유자원포털 ' 을통해 441종의데이터를제공하고있다. 서울시도 2012년 5월 ' 열린데이터광장 ' 서비스를개시하고 50여종의데이터를개방했다. 하지만미국정부가 39만종, 캐나다와영국이각각 1만3,000종과 8,700여종의데이터를제공하는데비하면아직미미한수준이다. 이러한데이터의개방과공유는지자체단위로까지이같은흐름이이어져야빅데이터생태계구축및관련산업활성화를앞당길수있다. 지자체는공공데이터의개방과공유에적극나서고민간기업이이를기반으로실제사업화하고서비스를제공할수있도록지원하여야한다. 이를위하여지자체는수요자 ( 민간 ) 를대상으로공공정보에간편하게접근하고수집할수있도록정보목록서비스, 공공정보신청안내, 정보보유기관연계등의서비스를지원하여야한다. data.go.kr 은공공데이터포털로서우리나라의대표개방창구로서의역할을수행하고있
다. 그러나현재공개되는통계청에서제공하는수치로표시된데이터를제외하고대부분의데이터는문서자료등과같은비정형데이터이므로표준화된데이터세트를공개할필요가있다. 이를위하여여러기관에서표준화된 OPEN API 41) 를기반으로개발할수있는플랫폼을구축하여제공함으로써지자체가공개한데이터를이용한민간기업의애플리케이션개발을장려할수있다. 표준화된 OPEN API를지자체에서개발, 제공하기는어렵지만지자체가오픈플랫폼을활용하여보유하고있는공공데이터를개방공유함으로써민간사업자의참여를유도하고관련산업활성화와지방정책수립에집단지성의효과를극대화하는것은지자체의몫이다. 미국 Socrata사는공공데이터를개방하고자하는연방정부, 공공기관을대상으로공통된플랫폼을구축해주는사업을하고있다. Socrata의플랫폼은표준화된데이터세트를제공하기위한 API, 클라우드시스템, 시각화시스템등을제공하며시카고, 시애틀, 오레곤, 워싱턴등지방정부가이플랫폼을이용하고있다. 지자체의오픈플랫폼제공을위해서는미국 Socrata사의사례를참고할필요가있다. 최근공공기관에서소셜미디어를활용하는사례가많이나타나고있다. 우리나라 85개지방자치단체를분석대상으로소셜미디어활용과관련한설문조사에서 84.7% 인 72개지방자치단체에서현재소셜미디어를활용하고있다 ( 서진완외, 2012). 따라서지자체의빅데이터활용을위한소셜데이터의확보는가능한것으로판단된다. 소셜미디어를정부및공공기관에서활용하는사례나잠재적활용분야는매우다양하다. 정부의정책과정부간행물에대한홍보와 PR, 민원서비스, 고객 ( 주민 ) 에대한정보제공, 자연재난과위기발생시정보전파와대응요령등전달, 캠페인실시, 필요인력채용통로로활용, 조직내커뮤니케이션통로활용등다양한분야에서활용이이루어지고있다. 하지만아직우리나라에서구체적으로소셜미디어를빅데이터에활용한사례는많지않다. III장의빅데이터활용사례에서보는바와같이공공부문에서의비정형데이터와소셜미디어의활용이늘어나는추세이므로지자체에서도빅데이터의성공적인추진을위하여소셜데이터를활용 41) OPEN API(Application Programming Interface) 란자신이보유한정보나애플리케이션들을네트워크를통하여정보시스템에서활용할수있도록공개하는기술
할필요가있다. 지자체에서빅데이터의성패는데이터의대부분을차지하는비정형데이터의 활용에서갈릴수도있기때문이다. 중앙정부 ( 미래부와한국정보화진흥원 ) 는빅데이터도입에관심있는정부부처, 지자체, 공공기관, 기업을대상으로사업기획, 데이터현황분석및개인정보보호등에문제가없는데이터연계방안, 데이터형태 규모를고려한적정기술등을제공하는빅데이터컨설팅사업을추진하고있다. 지자체는이러한사업을통해지자체의빅데이터도입을통한지방정책역량을향상시킬수있을뿐만아니라, 민간기업과의협력방식으로추진하여빅데이터초기시장및새로운비즈니스창출에기여할수있을것으로사료된다. 빅데이터도입방법은케이스마다다르고, 지방정부의상황에따라다르다. 지방자치단체에서추진하는빅데이터사업의유형은크게분석환경구축형과분석서비스활용형으로대별할수있다 ( 한국정보화진흥원, 2012). 분석환경구축형은빅데이터분석과활용을위해지자체가분석시스템과운영환경을구축하여확보하기위한사업유형이다. 이와대조적으로분석서비스활용형은지자체가분석환경을자체구축하지않고, 외부분석업체의데이터와분석환경을활용하거나, 지자체내시스템을외부분석업체의분석시스템과연계하여활용하는방식이다. 분석환경구축형은장기적이고지자체조직전체에빅데이터인프라를우선도입하는방식이고분석서비스활용형은데이터기반으로문제해결을위한목표지향적인도입방식으로볼수있다. 지자체가분석환경구축형을선택하여조직전체에빅데이터인프라를도입의경우많은예산이필요하고, 장기적인구축이예상되기때문에최고경영자의승인과지속적인지원이필수적이다. 이러한점을고려하면우리나라지자체의환경에서는도입을검토하는단계에서좌절할가능성이높다고판단된다. 대부분의지방정부는현재해결해야하는당면과제를안고있기때문에문제해결이라는목표를중심으로빅데이터도입을검토하는것이조직전체의빅데이터인프라도입보다현실적인방안이라할수있다. 현안문제를정의하고이에대한해결책으로빅데이터를활용하
는접근은소규모예산으로단기간에실행할수있으며부서단위에서의사결정으로도가능할수있다. 이과정을통해데이터기반문제해결의가능성을검증하고, 향후본격적인빅데이터도입타당성을마련하는기회로활용할수도있다. 즉, 지방정부는현재지자체가당면한문제나시급히해결해야할분야등빅데이터활용의효과가뛰어난분야를선정하고집중적인투자와기술개발을통해성공사례를만든후보다많은분야로점차확대할필요가있다. 이러한점을고려할때지방정부의초기빅데이터도입은문제해결을위한목표지향적인도입방식인분석서비스활용형이상대적으로적합하다고사료된다. Ⅵ. 결론 폭증하는데이터가경제적자산이되는 빅데이터시대 가도래하면서국가의경쟁력에도지대한영향을미치게되었다. 이에따라미국 영국 EU 등세계각국도경쟁적으로공공데이터를개방하고빅데이터기반의국가미래전략을추진하고있으며빅데이터를사회현안해결을위한새로운방법으로활용함으로써공공서비스의효율을높이고있다. III장에서살펴본공공부문의빅데이터사례는사회, 의료 보건, 금융, 교통, 재난 국방 치안과같이다섯가지적용분야에편중되어있으나다양한분야로확산되고있는추세이다. 이에반하여한국의경우, 공공데이터의빅데이터적용분야도매우한정되어있을뿐만아니라, 지역정보화차원에서의빅데이터활용도매우미흡한편이다. 따라서지자체는위의적용분야이외에다양한적용분야를개발할필요가있다. 또한 SNS의급격한확산으로비정형소셜데이터에기반한빅데이터분석의활용사례가증가할것으로예상되므로소셜데이터의확보, 지자체의당면한문제를정의하고이를빅데이터분석에적용, 결과를해석할수있는내부인재의양성및빅데이터적용기술의이해를높이는등의준비가요구된다. 지자체의성공적인빅데이터추진을위하여는사전에철저한준비가필요하다. 이를위하여지자체는보유하고있는공공데이터와인프라현황에대한분석이선행되어야한다. 인프라현황에대한분석은컴퓨팅자원과같은기술적인인프라뿐만아니라빅데이터관련기술개발및활용에요구되는조직, 인력등소프트웨어적인프라에대한현황분석도함께이루어져야한다. 지자체는오픈플랫폼을통한공공정보의개방과공유문화확산에도주력하여
민간사업자의참여를유도하고관련산업활성화와지방정책수립에집단지성의효과를극대화하여야한다. 마지막으로지자체의성공적인빅데이터도입을위하여는중앙정부의공공분야빅데이터지원사업을활용할필요가있으며도입초기에는문제해결을위한목표지향적도입방식인분석서비스활용형접근법이상대적으로보다적합하다고사료된다. 참고문헌 국가정보화기획단 (2010), 공공부문의성공적인소셜미디어도입및활용전략, 한국정보화진흥원, CIO Report, Vol.24, p.11. 권정은, 정지선 (2012), 소셜분석으로살펴본청소년자살예방정책의시사점, 새로운미래를여는빅데이터시대, 정보화진흥원보고서, pp.321-352. 민원정보분석센터 (2013), 민원키워드중심으로살펴본국민신문고출범이후민원분석, 국민권익위원회연구보고서. 빅데이터국가전략포럼 (http://bigdataforum.or.kr) 빅데이터전략연구센터 a(2012), 선진국의데이터기반국가미래전략추진현황과시사점. 한국정보화진흥원연구보고서. 빅데이터전략연구센터 b(2012). 알기쉬운공공부문빅데이터분석활용가이드 v1.0. 한국정보화진흥원연구보고서. 빅데이터전략연구센터 a(2013). 데이터기반국가미래전략을위한정책과제. 한국정보화진흥원연구보고서. 빅데이터전략연구센터 b(2013). Big Data_ 글로벌 10대선진사례. 한국정보화진흥원연구보고서. 빅데이터전략연구센터 c(2013). 새로운미래를여는빅데이터시대. 한국정보화진흥원연구보고서. 서진완 남기범 김계원 (2012). 지방자치단체의소셜미디어활용현황분석과의미. 한국행정학보제46권 1호 : 131 155. 이만재 (2011). 빅데이터와공공데이터활용. Internet and Information Security. 제2권2 호. 이응용 (2012). 빅데이터시대, 새로운가능성과해결과제. 인터넷 & 시큐리티이슈 : 한국인터넷진흥원, 2012년 2월호 : 4 26. 일본총무성 (2012). 知識情報社會の實現に向けた情報通信政策の在り方 : Active Japan ICT 戰
略, 자료39-3-2, 2012.7.12 재구성. 정용찬 (2012), 빅데이터혁명과미디어정책이슈, KISDI Premium Report, p.10. 조문래 (2012). 美 日의 Big Data R&D 전략과우리나라의대응과제. IT R&D 정책동향 : 정보통신산업진흥윈. Colin Upstill, Matthew Addis, Freddy Choi, Steve Taylor, and Rowland Watkins(2010). Infectious Diseases: Preparing for the Future, Office of Science and Innovation, University of Southampton IT Innovation Centre. Lim, Irvin(2007), Comprehensive Maritime Domain Awareness, Journal of The Singapore Armed Forces, Vol.33 No.3. President's Council of Advisors on Science and Technology(2010). Design a Digital Future: Federally Funded Research and Development in Networking and Information Technology. White House: Executive Office of the President. Steinberg, Alan & Christopher Bowman(2004). "Rethinking the JDL Data Fusion Levels". National Symposium on Sensor and Data Fusion. 42) 김신곤 : 제 1 저자, 연세대학교경영학과를졸업하고서울대학교대학원경영학과에서경영학석사 ( 재무관리 ), Georgia State University 에서 CIS (Computer Information Systems) 석사와경영정보학박사를취득하였다. 코리아로터리서비스 (KLS) 에서즉석복권을개발하였고현재광운대학교경영학부교수로재직중이다. 주요관심분야는경영정보시스템, 시스템다이나믹스, 비즈니스인텔리전스, CRM, 빅데이터등이다 (shinkon@kw.ac.kr). 조재희 : 제 2 저자 / 교신저자, 연세대학교경영학과를졸업하고 Miami University(Ohio) 에서경영학석사, University of Nebraska-Lincoln 에서경영정보학박사를취득하였다. 펜타시스템테크놀로지와 LG CNS 에서컨설턴트로근무하였고, 현재광운대학교경영학부교수로재직중이다. 주요관심분야는데이터자산의전략적활용, 다차원모델링, 데이터웨어하우스, 비즈니스인텔리전스, CRM, 빅데이터등이다 (mis1@kw.ac.kr). < 논문접수일 : 2013. 9. 2 / 게재확정일 : 2013. 9. 22>