새로운기술패러다임으로서빅데이터 : 쟁점과과제 박진서한국과학기술정보연구원정책연구팀선임연구원 jayoujin@kisti.re.kr 박경석한국과학기술정보연구원과학기술빅데이터연구실선임연구원 gspark@kisti.re.kr 이용호한국과학기술정보연구원정책연구팀선임연구원 stylee@kisti.re.kr 정책초점 Ⅰ. 빅데이터에대한사회적관심의급부상 빅데이터에대한관심이뜨겁다. 국내외유수의시장분석기관은앞다퉈빅데이터가주도할거대한시장규모를예측 발표하고있으며, 대중매체에서는연일빅데이터활용사례를언급하며빅데이터관련시장의급성장과정에서한국이뒤쳐지지않기위해서보다적극적인관심과투자의필요성을강조하고있다. 정부또한빅데이터활용의잠재력을극대화하기위해다양한정책을수립 시행하고있다. 지난 6월관계부처합동으로 정부 3.0 추진기본계획 을발표하였고현재 60 개의정보공유및시스템연계 통합과제와 21 개의빅데이터시범과제를추진하고있다. 제3차과학기술기본계획에서빅데이터는 30 대중점기술로선정되었으며, 미래창조과학부는최근빅데이터활용을통해사회문제를해결하고자일자리, 청소년복지, 소상공인지원, 보건의료분야에서 4개의빅데이터사업화컨설팅과제를선정한바있다. 한편빅데이터에대한열광과기대의반대편에는여전히우려와냉소의시선이존재한다. 최근빅데이터에대한기술영향평가에서는빅데이터활용능력에따라경제적양극화가심화될수있고, 국내빅데이터분석이외국계기업에의존하고있기때문에국가정보의대외유출위험이초래될수있으며, 데이터독점에따른빅브라더정부의출현가능성과프라이버시침해등다양한우려의시선을보내고있다 ( 미래창조과학부, 2013). 전사적자원관리 (ERP), 고객관계관리 (CRM), 웹서비스 (Web Service) 등한시대를풍미했던엔터프라이즈 IT 기술처럼빅데이터도그냥유행어에그칠것이라는냉소적인시각도제기되고있다 ( 전승우, 2012). 열광과기대그리고우려와냉소가공존한다는것은신기술혹은미래기술에대한자연스러운사회적반응이다. 신생기술 (emerging technologies) 의발전과정에는해당기술의발전을촉진하는유인기제 (inducement mechanism) 와저해기제 (blocking mechanism) 가동시에존재하기때문에기술을둘러싼사회적갈등은기술발전과정에있어서필연적으로내재하게된다 (Bergek et al., 2010). 따라서빅데이터를새로운기술패러다임혹은새로운기술혁신체제로파악하고자한다면무 제 23 권제 3 호 17
정책초점 엇보다빅데이터를둘러싼기술생태계의발전을가로막는저해기제와잠재적인사회적갈등을어떻게해소할지가중요한정책적고려대상이되어야한다. 본글에서는이러한측면에서빅데이터를둘러싼쟁점을정리하고정책과제를제시하고자한다. 1. 과잉기대의정점에위치한빅데이터빅데이터에대한관심이비교적최근에급부상하였다는데에는이론의여지가없을것이다. 아래 [ 그림 1] 에서와같이 2011 년하반기이후빅데이터 (big data) 라는검색용어의사용이급격히증가하였고, 구글과네이버의검색빈도증가패턴이매우유사함을알수있다. 반면미국톰슨로이터가운영하는 WoS(Web of Science) 에서 big data 를키워드로주제검색을한결과는 209 편에불과하였다. 이는 빅데이터 가현재까지는학술적으로핵심적인키워드혹은독자적인학문분과로자리매김되지않은상황을반영하는것이다. 즉빅데이터는지식의전통적인확산과정인 학계 산업계 사회 라는경로가아니라그반대인사회적관심과기대로부터촉발되었다는특징을지니고있다. [ 그림 1] 구글과네이버의 빅데이터 (big data) 검색빈도및 WoS 학술논문의시계열변화 1) Google WoS Naver 1) 네이버는 2007 년, 구글은 2004 년이후부터검색어통계를제공하고있으며, 네이버, 구글, WoS 검색결과는모두 2013 년 6 월 24 일기준이다. 18 과학기술정책
가트너의기대곡선 (hype cycle) 2) 은현재상황에서빅데이터가대중매체에서집중적으로홍보되고있는일종의과잉기대의정점에서있음을보여주고있다 ([ 그림 2] 참조 ). 가트너의기대곡선에신생기술 (emerging technologies) 로써빅데이터가처음포함된해는불과 2012 년이었다. 미국대선에서오바마의빅데이터활용전략, 트위터등과같은소셜서비스분석에대한수요증가, 구글의플루 (flu) 트렌드를통한질병의예측가능성, 빅데이터를활용한일부기업의소비자마케팅성공사례등다양한데이터활용사례들이언론에집중조명되면서이모든것을아우르는상징으로서 빅데이터 가자리매김된것이다. 정책초점 [ 그림 2] 가트너의기대곡선 자료 : Gartner(2013). 가트너의기대곡선이시사하는바는특정기술이과잉기대라는일종의버블상태를거치면서해당기술이과도한사회적기대를충족시킬수없어지면서급격히매력을잃게되고, 이전의기대가과장이었다는것을인식하는동시에부정적인측면이강조되어대중의관심에서점차멀어지게된다는점이다. 이러한환멸기 (Trough of Disillusionment) 를거쳐비록언론의주목을받지는못하지만해당기술에대한현실적기대가충족되면서시장에서생존하는기술로정착하게된다. 물론이과정에서도태되는기술도존재한다. 빅데이터의경우과잉기대의정점을지나환멸기에진입했다는전망도나오고있다 (Sicular, 2013). 미국의 350 개기업 IT 임원중에빅데이터프로젝트로효과를보았다는응답이 7% 에불과하였다는조사결과 3) 는서서히거품이꺼져가는하나의징조로보인다. 2) 가트너의 hype cycle 은과장광고곡선혹은과대광고곡선으로번역되기도하나이러한과장광고가기본적으로기대 (expectations) 를반영하는것으로보기때문에본글에서는기대곡선으로표현하였다. 제 23 권제 3 호 19
정책초점 2. 빅데이터의등장배경빅데이터에대한다양한시선이존재함에도불구하고, 빅데이터라는개념이주목받게된기술및사회적배경은명확하다. 간단히요약하면첫째, 기술진보에따른데이터의저장및처리능력의확대, 반대로데이터저장및처리비용의급격한감소, 둘째, 트위터등으로대변되는비정형데이터의급격한증가와이에따른분석의필요성이높아지고있기때문이다. 무엇보다 2000 년대들어서기술진보로인한데이터저장능력이급격히증가하였다. Yiu(2012) 와 OECD(2013) 는데이터저장능력의연평균성장률을약 50% 로추정하였는데, [ 그림 3] 은 1986 년부터 2007 년까지데이터스토리지의변화추이를보여주고있다. [ 그림 3] 데이터스토리지의변화추정 : 1986~2007 자료 : Hilbert & Lόpez(2011), KISTI 재가공. 빅데이터가주목받는또다른배경에는데이터저장방식이기존의아날로그에서디지털로의급격한전환과관련있다. 1986 년의경우 VHS 카세트, 사진등아날로그비율이전체의 99% 이상인반면에 2007 년에는광학스토리지, 디지털테이프등디지털비율이전체의약 94% 로완전히역전되었다 (Hilbert & Lόpez, 2011; MGI, 2011). 3) 전자신문 (2013), 빅데이터효과거둔기업고작 7%... 원인은잘못된접근방식, 5 월 15 일. 20 과학기술정책
[ 그림 4] 아날로그 vs 디지털데이터저장방식의변화 : 저장량과비중 정책초점 자료 : Hilbert & Lόpez(2011), KISTI 재가공. 데이터저장능력이향상되고저장방식의디지털전환이가속화되면서동시에소비자의데이터저장비용은급감하였는데, 하드디스크드라이버 (HDD) 의경우기가바이트당매년 40% 씩감소하였다 (OECD, 2013). 데이터저장비용뿐만아니라데이터처리비용도급속히감소하고있는데, 예컨대 DNA 유전자시퀀싱처리비용의경우매년 60% 씩감소하였다 (OECD, 2013). 데이터저장및처리비용이감소하는동시에데이터처리능력은급속히증가하였다. [ 그림 5] 는연산능력의증가추이를보여주고있는데범용목적의계산능력은연평균 58%, 특수용도의계산능력은연평균 83% 씩성장한것으로나타났다 (Hilbert & Lόpez, 2011; MGI, 2011). [ 그림 5] 연산능력의증가추이 : 범용및특수용도 ( 단위 : 1010 MIPS(million instructions per second)) 자료 : Hilbert & Lόpez(2011), KISTI 재가공. 제 23 권제 3 호 21
정책초점 한편, 스마트폰을이용한 SNS(Social Network Service) 사용량은 2000 년대후반급격히증가하였다. PC 에서의 SNS 사용량은 2008~2010 년연평균 11%, 스마트폰에서 SNS 사용량은같은기간에연평균 28% 나급증하였다 (MGI, 2011). 모바일데이터트래픽은 2016 년까지 10.8 exabyte 로증가할것으로예상되는데이러한모바일트래픽의성장은대부분스마트폰과태블릿사용의급격한증가에서기인한것이다. 4) 소셜및모바일서비스사용의증가는비정형데이터분석에대한수요로이어졌다. IBM 보고서에따르면전세계정보의 80% 는비정형 (unstructured) 데이터이며, 비정형데이터의증가율은정형데이터증가율의 15배에이른다 (Zikopoulos et al., 2012). 5) 데이터저장및처리기술의발전, 비정형데이터의급격한증가로인하여과거에는불가능한것처럼보였던대규모데이터에대한분석이가능해짐에따라기업과공공부문에서는 실시간분석을통해창출되는가치 에주목하게되었다 (Kirkpatrick, 2013). 6) 물론빅데이터라는용어를직접적으로사용하지는않았지만이미 데이터주도혁신 (data-driven innovation) 이란개념을통해데이터를활용하여새로운부가가치를창출할수있는가능성에주목하는움직임은지속적으로있어왔다. 예컨대 OECD(2013) 는빅데이터를데이터주도혁신의한예로파악, 빅데이터가혁신을유인하고경제성장에기여할수있는가능성을전제로논의를전개하고있다. 데이터주도혁신은 R&D 에서부터제품, 공정, 마케팅, 조직등사회경제전분야에영향을줄것으로전망되고있다. Ⅱ. 새로운기술패러다임으로서빅데이터 - 쟁점들 빅데이터가다양한사회적기대를충족시킬수있을지혹은일시적인유행에머무를지는아직열려있는문제이다. 이절에서는빅데이터를둘러싼몇몇쟁점들을간략히소개하고자한다. 이는현재빅데이터의발전을가로막는저해기제로서작용하고있으며, 역으로빅데이터기술생태계가향후해결해야할역돌출 (reverse salient) 의문제이자정책지원과정에서반드시고려해야할사항이기도하다. 물론, 데이터소유권의문제와이에따른데이터통합의근본적인어려움, 데이터통합은기술적문제가아니라사회적합의과정이라는주장, 기술적기회과사업적기회로서빅데이터를구분해야한다는의견, 하둡 (Hadoop) 등빅데이터관련이슈를단지 IT 인프라문제로환원하는것에대한우려, 과학기술빅데이터와사회과학빅데이터의전혀다른특성들, 빅데이터관련기술이과연새로운것인가에대한논쟁등본글에서다루는이슈이외에도다양한쟁점들이산적해있음을주지해야할것이다. 4) Forrester(2012), Mobile is the new face of engagement, NESSI(2012) 에서재인용하였음. 5) IDC 도비정형데이터가전체데이터의 80% 이상을차지하는것으로보고하였다 ( 전승우, 2012). 6) Kirkpatrick(2013) 은세가지측면에서의실시간 (real time) 데이터분석에주목하였다. 첫번째는이상징후에대한초기감지와이를통한신속한반응이가능한실시간이벤트분석 (real-time events), 두번째는현재시점에서모집단의활동과동학에대한분석을통해더욱효과적인프로그램의기획과집행이가능하도록하는실시간트렌드분석 (real-time trends), 마지막으로행태변화에대한실시간평가를통해프로그램의신속한조정을가능케하는실시간평가 (real-time evaluation) 이다. 22 과학기술정책
1. 비정형데이터의분석가능성과한계일반적으로정형혹은비정형데이터에대한구분은데이터를관리하는시스템 (DBMS) 에스키마 (schema) 가존재하느냐여부로결정하는데, 이런비정형데이터에는텍스트형식으로저장된데이터, 이미지, 음성, 멀티미디어등이포함된다. 앞에서언급한바와같이빅데이터의급부상배경에는무엇보다 SNS 로대변되는비정형데이터와관련이있으나, 여전히비정형데이터의근본적인속성들과관련된문제가제기되고있다. SNS, 스마트폰, 태블릿 PC 등모바일환경이급속히확장되면서비정형데이터에대한분석의중요성또한더욱부각되고있음에도비정형데이터에대한분석이과연유용한지에대해서는회의적인시각이팽배하다. 우선블로그나트위터정보그자체가왜곡될가능성이존재한다. 블로그나트위터에대한감성분석 (sentiment analysis) 혹은오피니언마이닝 (opinion mining) 에는근본적인한계가존재하는데, 예컨대은어, 사투리, 빈정대거나과장하는어투, 역설, 약어등이일상적으로담긴진술의의미를과연현재의기술수준에서제대로분석할수있을지, 앞으로가능할지, 텍스트마이닝을통해특정진술에서그진술을대표하는키워드를얼마나정확하게추출할수있는지는여전히회의적이다 (Global Pulse, 2012). 특히대규모데이터를대상으로하는분석에서는수리모형에맞게어떤형태로든데이터는축소되기마련인데, 편향되고왜곡된정보혹은주관적인정보가많은비정형데이터를수집하고정량화하는과정에서데이터에내포된의미가왜곡되어분석결과의신뢰성이하락될수있다는지적도있다 (Boyd & Crawford, 2012; 전승우, 2012). 이처럼비정형데이터를분석하고그결과를올바로해석하기까지는현재의기술수준이따라잡지못하고있는게현실이다. 가트너는 2012 년빅데이터요소기술에대한기대곡선을통해시맨틱웹 (Semantic Web) 기술이안정기에다다르기까지는 10년이상이소요될것으로예측하였다. 현재비정형데이터에대한분석은맥락을이해하는것보다는단어의출현빈도, 단어와단어간의관계를보여주는것에그치는실정이다. 특히, 비정형데이터가영어가아니라한글일경우비정형데이터의분석가능성과한계는더명백해진다. 정책초점 2. 빅데이터를활용한문제해결가능성 : 상관관계와인과관계의혼동빅데이터그자체가중요한것이아니라빅데이터를어떻게활용하고분석할지가더중요하다는것에는대부분동의를할것이다. 그러나여전히빅데이터를통해도출된결과가과연얼마만큼신뢰할수있을가에는의구심이존재한다. 빅데이터를통해도출된결과는많은경우통계적인상관관계를보여주는경우가대부분이다. 인과관계를밝히는것은전혀다른문제이다. 그럼에도인과관계와상관관계를혼동할경우, 특정정책적선택이전혀엉뚱한결과를보여줄가능성이매우높아진다 (Global Pulse, 2012; NESSI, 2012). 빅데이터분석의바람직한사례로자주언급되는구글의플루트렌드를보자. 7) 구글의플루트렌드가플루를포함한일반적인호흡기질환을예측하는 제 23 권제 3 호 23
정책초점 데어느정도도움이될지도모르나플루자체를예측하는데에는한계가있다는지적 (Global Pulse, 2012) 이있으며, 구글의플루트렌드가미국질병관리센터의예측보다 25% 정도낮다는연구결과도발표되었다 ( 전승우, 2012). 빅데이터는문제해결을위한수단이자도구이지그자체가해결책이아니다. 예컨대공공부문에서빅데이터를활용한다고해서 MGI(2011) 등이추정한것과같은비용절감이나세수증대등의효과가정말나타날것인가? 공공부문의도덕적해이와부패, 정경유착, 담합구조등이단순히빅데이터로환원하여분석한들그해결책을찾을수있을까? 3. 빅데이터의인식론적한계 Boyd 와 Crawford(2012) 는보다근본적인차원에서빅데이터에대해인식론적문제를제기하고있다. 데이터분석의핵심은 해석 인데데이터의규모와상관없이해석에는연구자의주관적인한계와편견이내재할수밖에없다. 따라서이들은마치빅데이터를통해 객관적이고정확한 분석이가능하다고말하는것은실재를호도하는것이라고비판한다. 아울러규모가더큰데이터가항상더좋은데이터가아니라고주장한다. 이들은대표적인비정형데이터인트위터를통해다양한패턴을조사한학술연구에서조차스스로트위터데이터의한계를지적하고있다며, 무엇보다트위터가애초에분석하고자했던모집단을대표하는것이아니라고지적한다. 실제분석에사용되는빅데이터와전체 ( 모집단 ) 데이터는동일한것이아니기때문에샘플데이터의특성을명확히설명하지못한다면데이터셋의사이즈자체는무의미하다고주장한다. 오히려 Boyd 와 Crawford(2012) 는빅데이터보다 small data 의가치를인식하는것이점차더중요하게될것이라고전망한다. 4. 빅데이터와기술종속의문제빅데이터라는용어자체는구글, 아마존, 페이스북, 트위터등글로벌기업에서자사의서비스개선을위해적극적으로도입된것이며, 특히이러한서비스가국경을가로지르는인터넷에기반하고있다는것에주목해야한다 (NESSI, 2012). 국내에서도이미빅데이터시장에서글로벌기업의독과점현상과향후기술종속의문제가빈번히지적되고있다. 현재 IBM, 오라클등글로벌기업들이국내비즈니스분야와공공부문빅데이터처리분야에서초기시장을선점하고있는상황이고 ( 교육과학기술부외, 2012), 외국계글로벌기업에의존한빅데이터분석으로인해정보의대외유출등과같은위험을초래할수있는가능성도매우높다 ( 미래창조과학부, 2013). 따라서국내빅데이터시장이주로글로벌기업의기술에의존하고있기때문에빅데이터활성화를위해서는무엇보다국내의데이터분석인프라구축이시급하다 ( 김한나, 2012). 이러한상황에서적절한대비책이없다면정부의성급한빅데이터산업진흥정책이오히려글로벌기업의국내시장독과점을고착화하는바 7) 구글의플루트렌드는 http://www.google.org/flutrends/intl/en_us/ 참조, 구글의연구결과는 <Ginsberg, J. et al.(2009), Detecting influenza epidemics using search engine query data, Nature, Vol. 457, pp. 1012~1014> 참조. 24 과학기술정책
람직하지않은정책결과를초래할수도있다. 아울러빅데이터산업이형성되었을때시장에서가장높은부가가치를창출할수있는정보원천인이용자 ( 소비자 ) 데이터는구글, 페이스북, 애플, 아마존, 야후등글로벌기업들이이미만들어놓은진입장벽을극복하기어려운게현실이다. 자칫국내시장활성화라는작은욕심으로인하여데이터는글로벌인터넷기업으로부터구매하고, 데이터처리와분석은글로벌 IT 기업에의존하는돌이킬수없는소탐대실의과오를범할수있다. 정책초점 5. 공공부문의비효율성과빅데이터많은보고서들이공공부문의비효율성을빅데이터를통해어느정도개선할수있다고주장한다. 미국과독일에서는빅데이터를활용하여예산을절감하였다는사례도보고되고있다. 실제공공부문에서낭비되는예산에대해다양한추정치가존재하며, 빅데이터를활용하여공공부문에서직접적으로효과를얻을수있는영역에서이러한비효율성을제거할수있는가능성은매우높다. 그러나빅데이터를활용한공공부문의비용절감효과의규모에대해서는논란의여지가있다. 예컨대, 유럽의 23 개정부에서빅데이터로인한행정관리비용절감추정액은 15~20% 로추정되며, 이는 1,500 억유로 ~3 천억유로에해당된다 (MGI, 2011). 이추정액에는공공정보 (PSI) 에대한광범위한접근과효과적이용으로부터발생하는편익은포함되지않았다고한다 (OECD, 2013). Yiu(2012) 는 MGI(2011) 의방법론을적용하여영국공공부문의빅데이터활용가치를추산한결과연간약 160 억파운드에서 330 억파운드로나타났다. 그러나 Cebr(2012) 은영국공공부문의빅데이터활용가치를부정적발에서 20 억파운드, 성과관리에서 36 억파운드규모의비용을절감할것으로추정하였는데이는 2012~2017 년까지의누적액이다. Yiu(2012) 와 Cebr(2012) 의전망치는많은차이를보여주고있다. MGI(2011) 는운영효율화를위한비용절감의경우, 전체예산의 20~25% 가비용절감이가능한영역이고이중빅데이터를활용하여절감가능한비중을 15~20% 로추정하고있다. 이러한전망치가과연타당한지에대해서는여전히의문시된다. 6. 데이터개방전략과빅데이터정책빅데이터관련정책에있어서데이터개방전략을마치빅데이터활성화를목적으로하는정책으로오인하는경우가종종있다. 물론데이터개방전략이빅데이터시장활성화에어느정도도움이될수있겠지만, 유럽을중심으로추진되고있는데이터개방전략은빅데이터시장활성화그자체보다는기본권으로서의정보접근권확대에서출발했다고보아야할것이다. 주요선진국의오픈데이터정책은정보접근권을하나의인권으로서보장하기위해시행되고있다. 정보접근권은 정보에대해자유롭게접근할수있는권리로서정보의자유또는알권리의기초가되는개인의기본적인권 ( 안석모, 2013) 을의미하며, 유럽의회의 행정정보에대한접근과정보의자유에관한권고 혹은인터넷접속권을표현의자유와동등한기본권으로규정하거나 (EU), 제 23 권제 3 호 25
정책초점 국민의기본권으로법제화하는노력 ( 핀란드 ) 등을통해정보공개및정보격차해소를위한목적으로추진되고있는것이다 ( 안석모, 2013). 과연우리나라빅데이터에대한논의에서많은주목을받고있는사례인영국의오픈데이터정책과 EU 의데이터개방전략 (Open Data Strategy: ODS) 이빅데이터진흥을위한적절한사례인가에대해서는더많은논의가필요할것으로보인다. 물론, EU 의데이터개방전략은단순히데이터에대한접근뿐만아니라정당한목적의 재사용권한 도함께보장하고있기때문에데이터를활용한상업용서비스를개발하고판매하는것도허용한다는측면에서빅데이터시장활성화와관련이있을수도있다. 그러나 EU 의데이터개방전략은 빅데이터 혹은 시장활성화 그자체보다는공공정보및데이터에대한보편적접근과개방의원칙아래진행되어왔다고보는것이더적절하다. 최근우리나라도공공데이터이용권을폭넓게보장하는내용의 공공데이터의제공및이용활성화에관한법률 이지난 6월국회를통과, 3개월후법이시행될예정이나, 데이터개방이전에데이터의생성, 데이터품질관리, 데이터연계가더중요한문제로지적되고있다. Ⅲ. 빅데이터정책의주요과제 - 프라이버시와보안 빅데이터와관련하여가장쟁점이되고있는이슈가프라이버시와보안이다. 프라이버시는개념, 법률, 기술적측면모두에서빅데이터와관련하여현재가장민감한이슈이며 (DFD, 2013; Feldman et al., 2012; Global Pulse, 2012; NESSI, 2012; 김한나, 2012), 대부분프라이버시는기본적인인권의하나로간주되고있다 (Global Pulse, 2012). 아울러프라이버시에대한논의는개인정보유출등과같은데이터보안논의와직결된다. 1. 프라이버시프라이버시 (privacy), 특히정보와관련된정보프라이버시권은 프라이버시에영향을미칠수있는자신에관한정보를정보주체가스스로통제할수있는권리 를의미하며, 따라서프라이버시를침해하는행위는 개인정보의수집 이용 제공 유통등을통해이루어지므로개인정보의수집, 이용과이에대한통제문제 와연결된다 ( 안석모, 2013). OECD 대부분의국가들은 1980 년제정된 프라이버시보호및개인정보의유통에대한지침 (OECD Guidelines Governing the Protection of Privacy and Transborder Data Flows of Personal Data) 에근거하여다양한형태로개인의프라이버시를보호하고있으나, 빅데이터활용을위한개인정보의재사용과관련하여서는한계점을노출하고있다. 특히, 개인정보를포함한데이터의양이급증하고개인정보를재사용하는행위자들이늘어날수록프라이버시에대한적절한보완책이필요하다고지적하고있다 (OECD, 2013). 26 과학기술정책
EU 에서도인터넷공간에서프라이버시보호를위해다양한조치들을시행하고있다. 2011 년에는 e- Privacy Directive European Cookies Law 가제출되었고, 2013 년 EU Privacy Proposals 에는 인터넷에서잊혀질권리 (The European right to die (be forgotten) on the Internet) 가포함되었다 (George & Dowson, 2013). 우리나라의경우, 국가정보화전략위원회 (2011) 는향후추진과제로 개인정보익명성보장체계확립 을위해첫째, 개인정보와프라이버시보호관련기본원칙을체계화하고, 둘째, 빅데이터의안전한공유와유통을위해보다강화된보안대책을마련하고, 셋째, 데이터의개방 공유 활용에따른정부의공동데이터활용가이드라인을마련해야한다고적시하였다. 적절한프라이버시보호가없다면빅데이터기술로부터의혜택도없을것이다 라는지적 (NESSI, 2012) 에서알수있듯이, 프라이버시는단순히빅데이터산업의발전을저해하는장애물이아니라빅데이터산업을위해서넘어야할과제로인식되어야한다. 무작정산업진흥을위해프라이버시를약화시키기보다는 프라이버시보전형데이터마이닝 (privacy-preserving data mining) (NESSI, 2012) 과같이빅데이터와프라이버시간의긴장을완화할수있는다양한방법을모색하는것이더현명한처방이될것이다. 정책초점 2. 보안 프라이버시와함께개인정보유출등과같은보안문제가더욱중요하게부각되고있다 (DFD, 2013; Feldman et al., 2012; OECD, 2013). 빅데이터와관련하여중요한사회적이슈중하나가데이터누출 (data breaches) 이다. 2008~2009 년하트랜드결제시스템 (Heartland Payment System Inc.) 해킹공격으로인해약 1억 3천만건의신용카드및직불카드정보가누출되었으며, 2010~ 2011 년소니플레이스테이션네트워크 (Sony s PlayStation Network) 는해킹으로인해 1억 4백만건의개인식별정보가유출되었다 (OECD, 2013). 국내또한보안의사각지대로 2012 년방송통신위원회가국회에제출한자료에따르면 2011~2012 년 2년간개인정보유출건수는 6,325 만여건에달하였다. 8) 따라서데이터공유와개방을촉진하면서동시에사이버테러나해킹등으로인한데이터유출을방지하기위한보안가이드라인제정및관련기술의개발이절실하다. 그러나 Feldman 등 (2012) 이지적하였듯이기존의데이터를클라우드로이동하는데여전히많은저항이있으며, 현재인터넷, 클라우드컴퓨팅, 데이터풀링등모든측면에서데이터보안의문제가제기되고있다. 빅데이터활용이증가하더라도기존의프라이버시강화라는추세를변화시키지는못할것이며오히려정보보안과리스크를어떻게관리할지가프라이버시와연결되어더큰이슈와과제로부각될것이라전망하고있다 (DFD, 2013). 8) 강동원의원실보도자료 (2012), 최근 2 년간개인정보유출건수 6,325 만여건 참조. 2011 년 4 월현대캐피탈 175 만명, 7 월 SK 컴즈 3,500 만명, 8 월한국엡손 35 만명, 11 월넥슨 1,320 만명등 2011 년에 5,030 만명의개인정보가유출되었고, 2012 년의경우 5 월 EBS 422 만명, KT 휴대전화가입자 870 만명등보도자료발표시점 (2012 년 10 월 ) 까지누출된개인정보는 1,292 만명에달하였다. 이러한개인정보유출건수는 알려진것 이기때문에실제개인정보유출건수는더클것으로예상된다 (http://blog.naver.com/kdwon53/60172608677). 제 23 권제 3 호 27
정책초점 3. 빅데이터 - 다부처정책통합이전제결론을대신하여우리는빅데이터정책주체로서공공부문의역할은빅데이터관련정책이개별부처의범위를넘어서는다부처정책통합으로반드시추진되어야한다고판단한다. 앞에서언급하였듯이신생기술을둘러싼새로운기술혁신체제의발전과정에는유인기제와저해기제가동시에존재하는데이는전통적인기술혹은산업과는전혀다른정책적시사점을주고있다. 유인기제가해당기술에대한사회적기대를반영하는것이라면저해기제는해당기술이가지는잠재적갈등이상존함을의미한다. 빅데이터시대에서공공부문의역할이주목받는이유는공공부문이다양한데이터를생산하는주체이자동시에사회현안문제의효율적해결을위해다양한데이터를필요로하는수요의주체라는점, 또한적절한규제혹은진흥정책을통해빅데이터생태계에영향을미치는정책의주체이기때문이다. 따라서빅데이터정책에는데이터의생산자와수요자로서정부의바람직한역할과함께동시에빅데이터유인기제를강화하는진흥정책과저해기제를해소하기위한규제정책이적절히혼합되어야한다. 신기술이가지는특성중의하나는해당기술의발전방향이아직열려있다는것이다. 따라서공공부문의 R&D 정책은단지해당기술의유인기제를강화하는역할뿐만아니라저해기제를해소하기위한다양한기술적가능성까지염두에두어야한다. [ 그림 6] 빅데이터시대에서정부의역할 [ 그림 6] 에서와같이공공부문에서데이터를생산하는주체, 데이터를필요로하는주체, 규제부처, 진흥기관, R&D 정책의주체는모두다르다. 정부내에서조차빅데이터에대한이해관계가다 28 과학기술정책
를수있기때문에, 빅데이터를둘러싼다양한쟁점과과제들을해결하기위해서는무엇보다공공부문과함께민간부문의이해관계자들까지포함하여공통의비전을만들어나가기위한다양한합의과정이필요하다. 따라서빅데이터분야는다른정책보다정책통합혹은통합적혁신정책 ( 성지은 송위진, 2010) 이더욱절실한영역이다. 빅데이터가만병통치약이아님에도불구하고빅데이터자체의활용효과만을일방적으로과장하는행태를정부는지양해야하며, 빅데이터를통해해결하려는사회문제가더중심에자리매김되어야할것이다. 빅데이터로모든 데이터관련정책 을포괄하는것은불가능하다. 수단이목표가되어서는안된다. 정책초점 참고문헌 교육과학기술부 행정안전부 지식경제부 방송통신위원회 국가과학기술위원회 (2012), 스마트국가구현을위한빅데이터마스터플랜. 국가정보화전략위원회 (2011), 빅데이터를활용한스마트정부구현 ( 안 ). 김한나 (2012), 빅데이터의동향및시사점, 방송통신정책, 제24 권제19 호. 미래창조과학부 (2013), 2012 년도기술영향평가결과 ( 안 ) - 빅데이터 (Big Data) 분석기술과활용, 국가과학기술심의회. 성지은 송위진 (2010), 탈추격형혁신과통합적혁신정책, STEPI Working Paper, 2010-03, 과학기술정책연구원. 안석모 (2013), 정보인권보고서발간배경및의의, 정보인권보고서발간기념공동학술대회 (2013.06.14., 동국대학교 ) 자료집, pp. 3~13. 전승우 (2012), 빅데이터에대한기대와현실, LG Business Insight, LG경제연구원. Bergek, A., Jacobsson, S., Hekkert, M. and Smith, K.(2010), Functionality of Innovation Systems as a Rationale for and Guide to Innovation Policy, in Smits, R. E., Kuhlmann, S. and Shapira, P. (eds.), The Theory and Practice of Innovation Policy - An International Research Handbook, pp. 115~144, Edward Elgar. Boyd, D. and Crawford, K.(2012), Critical Questions for Big Data - Provocations for a cultural, technological, and scholarly phenomenon, Information, Communication & Society, Vol. 15, No. 5, pp. 662~679. Cebr(2012), Data equity: Unlocking the value of big data, Report for SAS, SAS. DFD(Department of Finance and Deregulation)(2013), Big Data Strategy - Issue Paper, Commonwealth of Australia. Feldman, B., Martin E. M. and Skotnes, T.(2012), Big Data in Healthcare - Hype and Hope, 제 23 권제 3 호 29
정책초점 Dr. Bonnie 360. Gartner(2013), Press Release - Gartner s 2013 Hype Cycle for Emerging Technologies Maps Out Evolving Relationship Between Humans and Machines(http://www.gartner.com/newsroom/id/2575515). George, E. and Dowson, I.(2013), Big Data in Finance - Entrepreneurs Edition, London New Finance. Global Pulse(2012), Big Data for Development: Challenges & Opportunities, Global Pulse. Hilbert, M. and Lόpez, P.(2011), The World s Technological Capacity to Store, Communicate, and Compute Information, Science, Vol. 332, pp. 60~65. Kirkpatrick, R.(2013), Big Data and Real-Time Analytics for Agile Global Development, Friday Seminar on Emerging Issues - Big Data for Policy, Development and Official Statistics, 22 February 2013, United Nations, New York. MGI(2011), Big data: The next frontier for innovation, competition, and productivity, McKiensey Global Institute. NESSI(2012), Big Data - A New World of Opportunities, NESSI White Paper, NESSI. OECD(2013), Exploring Data-Driven Innovation as a New Source of Growth: Mapping the Policy Issues Raised by Big Data, OECD Digital Economy Papers, No. 222, OECD Publishing. Sicular, S.(2013), Guest Post: Big Data is Falling into the Trough of Disillusionment (http://blogs.gartner.com/svetlana-sicular/guest-post-big-data-is-falling-into-the-tr ough-of-disillusionment/). Yiu, C.(2012), The Big Data Opportunity - Making government faster, smarter and more personal, Policy Exchange. 한국정보화진흥원역 (2012), 빅데이터로인한기회 - 보다빠르고스마트한맞춤정부만들기, 동향분석, I-4, 한국정보화진흥원. Zikopoulos, P., Eaton, C., deroos, D., Deutsch, T. and Lapis, G.(2012), Understanding Big Data - Analytics for Enterprise Class Hadoop and Streaming Data, McGraw Hill. 30 과학기술정책