연구보고서 빅데이터활용현황및정책과제 연구 2014. 7
목 차 Ⅰ. 빅데이터산업의전망과활용사례 / 1 1. 빅데이터산업의전망 / 1 2. 빅데이터활용사례 / 1 Ⅱ. 빅데이터산업육성의필요성 / 4 1. 국내빅데이터산업의문제점 / 4 2. 빅데이터산업육성정책의필요성 / 6 Ⅲ. 개인정보유출사고가빅데이터산업에미치는영향 / 7 1. 개인정보유출사고와빅데이터산업 / 7 Ⅳ. 빅데이터산업육성을위한정책과제 / 8 1. 가치있는공공부문데이터개방과인식의전환 / 8 2. 건전한빅데이터생태계조성및중소 중견기업육성 / 9 3. 전문인력양성 / 10 4. 수요창출을위한선도사업추진및 Best Practice 확보 / 11 5. 프라이버시보호문제와규제완화 / 12 Ⅴ. 결론및시사점 / 13
I. 빅데이터산업의전망과활용사례 1. 빅데이터산업의전망 빅데이터는 21세기원유 라불리며, IT 금융 유통등다양한산업분야의새로운패러다임이자신성장동력으로부상 빅데이터 : 대량으로수집한데이터를활용하여가치있는정보를추출하고생성된지식을바탕으로능동적으로대응하거나변화를예측하기위한정보화기술 ( 국가정보화전략위원회 ) ICT 인프라시장의성숙이후신규비즈니스영역으로주목 * Davos 포럼 ( 12.1) 에서는빅데이터를 12 년도가장중요한기술로지목 빅데이터산업시장은높은수준의성장을이어나갈것으로전망 글로벌시장규모는연평균 27% 성장해 17년 324 억달러규모에이를것으로전망 (IDC, 2014) * 15 년까지는소프트웨어및서비스부문이시장의대부분을차지, 15~ 17 년까지는인프라부문의높은성장세예상 국내시장의경우 15년기준 2.6억달러, 20년에는 8.9억달러로연평균 24% 의성장을보일전망 ( 한국과학기술정보연구원, 2013) * 15 년세계빅데이터시장의약 1.6% 비중을점유할것으로전망 2. 빅데이터활용사례 주요국정부는빅데이터시장활성화를위한공공정보공개, 빅 데이터기반공공서비스제공등다양한사업추진 1
미국은 2억달러규모의빅데이터연구개발이니셔티브를추진하며, 기술확보, 사회각영역의활용, 인력양성의 3가지측면에집중적예산투자 영국은 2012 년 6월발표된오픈데이터전략에따라각부처는의료, 교육, 세금, 고용, 기상, 지리데이터등에대해 2015 년까지순차적으로개방예정 < 표 1> 각국가별정부보유정보개방현황비교 구분미국영국 EU 추진시기오바마정부 ( 09~) 고든브라운총리 ( 09~) EU 집행위부위원장 ( 11~) 총괄전략 Open Government Initiative POI(Pow of Information) 보고서 ODS(Open Data Strategy) 전략 법률제도 정보자유법 (FOIA: Electronic Freedom of Information Act)(1966) 공공정보재이용규칙 (The Reuse of Public Sector Information Regulations)( 05) 공공정보재이용지침 (Directive on Reuse of Public Sector Information)( 03) 개방창구 data.gov( 09. 5 월 ) data.gov.uk( 10. 1 월 ) pan-european 데이터포털 글로벌기업중심으로빅데이터시장주도 Ford 는차량에설치된센서를통해운전자의주행습관뿐만아니라주행환경에대한데이터를수집. 수집된빅데이터를분석해고객의숨은니즈 (needs) 를찾아내신제품에반영 Zara 는빅데이터분석을통해현재유행하는패션트렌드를즉각반영한다품종소량생산전략을통해급성장. Zara 는상품수요의예측, 매장별적정재고산출, 상품별가격그리고운송계획까지모두실시간으로수집되는빅데이터분석을통해의사결정을내림 2
< 표 2> 글로벌빅데이터시장및대표기업 순번 시장분류 대표기업및서비스 1 Technologies Hadoop, Hadoop mapreduce, HBASE, Cassandra 2 Analytics Infrastructure Hortonworks, EMC, clouera, NETEZZA 3 Operational Infrastructure TERADATA, HADAPT, Couchbase, Informatica 4 Infrastructure As A Service Amazon, Windows Azure, Google BigQuery 5 Structured Databases Oracle, SQL Server, MYSQL, IBM, Sybase 6 Data As A Service kaggle, factual, GTNIP, INRIX 7 Log Data Apps splunk, looggly, sumologic 8 Vertical Apps bloomreach, MYRRIX 9 Ad/Media Apps Media Science, TURA, collective 10 Business Intelligence Oracle, IBM, Microsoft, SAP, Cognos 11 Analytics and Visualization TERADATA, SAS, Palantir, Opera * 자료 : Dave Feinleib(2012), 김사혁 (2013) 외국기업의경우다양한활용사례들이존재하는반면국내기업의경우 활용분야가제한적이고수익을창출하는구체적활용사례도찾아보기 어려움 < 표 3> 국내외빅데이터활용사례 구분국내해외 금융 유통 통신 제조 삼성화재 : 빅데이터분석솔루션 ( 보험사기위험예측시스템개발 ) 으로보험사기고위험군분석 신세계인천명품관 : 고객구매이력을역추적해핵심고객에타깃마케팅으로구매유도 KT : 지역기반분석서비스에지역별유동인구정보결합, 지역별소비자구매능력을분석하여기업및자영업자에게제공예정 삼성반도체 : 반도체제조공정중발생하는센서데이터를이용하여불량률을감소시킬예정 미국특수보험사 어슈어런트솔루션 : 빅데이터분석정보를고객관리에활용, 고객해약및직원이직방지미국유통기업 Sears Holdings : 캠페인, 쿠폰, 오퍼등을개별고객단위로개인화하는 Shop Your Way 멤버십제공영국통신사 O2, 보다폰, EE : 조인트벤처 Wave를설립하여미디어, 로열티, 트랜잭션, 데이터분석등모든요소가연결된모바일경험을기업및개인고객에게제공미국자동차제조회사 Ford : 차량에설치된센서로고객의운전습관분석, 신차에대한니즈파악 * 자료 : KT 경제경영연구소 (2013), 2014 년 ICT 10 대주목이슈. 3
Ⅱ. 빅데이터산업육성의필요성 1. 국내빅데이터산업의문제점 우리나라에서빅데이터에대한논의는 2011 년중반부터활발해짐 2011 년 5월맥킨지연구소 (McKinsey Global Institute) 의빅데이터보고서가출간되고빅데이터의경제적효과가발표되면서빅데이터는향후경제성장의새로운동력으로각광받음 그후세계경제포럼 (World Economic Forum) 에서빅데이터의중요성이다시강조되면서국내외연구기관들은빅데이터가제시하는비전과경제사회적효과에대해활발히논의함 - 12 년이우리나라빅데이터의원년이될것이라는기대감확산 그러나현재우리나라빅데이터산업의발전은당초예상했던것보다훨씬더디게진행되고있음 기업경영자들은여전히빅데이터투자에대한수익성에확신을하지못하고있는상태이며선두기업들조차도빅데이터관련파일럿테스트수준에머무름 정부와산업계가방대한데이터를수집및저장하고이를활용하고있지만아직데이터분석과활용은전통적방식에크게의존 정부3.0 의추진등으로정부와민간의활용이늘어나고있으나국내시장의한계점존재 국내시장규모가너무작고, 수익모델에대한우려등으로본격적투자가이루어지지않고있음 4
< 대한상의빅데이터활용현황조사결과 > 1. 귀사의빅데이터활용현황은? 1 이미활용중이다 (7.5%) 2 활용계획이있다 (10.9%) 3 계획이없다 (81.6%) 2. 빅데이터를어느분야에활용하고있거나할예정입니까?( 복수응답가능 ) 1 마케팅 (47.3%) 2 관리 운영 (41.9%) 3 연구 개발 (20.4%) 4 고객서비스 (36.6%) 5 전략기획 (24.7%) 3. 빅데이터활용의가장큰걸림돌은무엇입니까? 1 데이터분석역량및경험부족 (19.6%) 2 적합한데이터관리솔루션의부재 (12.5%) 3 투자대비수익 (ROI) 의불투명성 (15.1%) 4 빅데이터에준비되지않은기업문화 (15.9%) 5 시스템구축비, 관리비등예산부족 (19.4%) 6 정보보호및안정성에대한우려 (17.5%) * 조사대상 : 국내기업 500 개사대상조사기간 : 14 년 6 월 13 일 ~ 14 년 6 월 19 일조사방법 : 전화및팩스 빅데이터핵심기술에서도 2 4 년의기술격차가존재해외국의솔루션들에 의해시장이잠식당하는현상이발생할우려 또한빅데이터분석전문가, 데이터관리자등고급인력이크게부족하고빅데 이터산업을체계적으로지원할수있는정책안이나법 제도적근거등이미흡 < 표 4> 빅데이터핵심기술격차 수집관리 연산처리 분석 주요분야 이기종데이터융합 데이터저장관리 분산 병렬처리 공개 SW 기술 ( 하둡기반 ) 세계최고기업 5 국내기술보유기업 격차 Sqoop, Flume 인포매티카데이터스트림즈 2 년 HBASE, HDFS 맵리듀스, Tez 오라클 IBM, 구글 분석솔루션 - IBM, 구글 분석도구 R, Mahout, Hive, Pig SAP, SAS 알티베이스, 티맥스, 큐브리드 넥스알, 그루터, 클라우다인, NHN 솔트룩스, 다음소프트, EC 마이너 넥스알, 그루터, 야인소프트 2 년 3~4 년 2 년 2~3 년 * 자료 : 미래창조과학부 (2013), 창조경제및정부 3.0 지원을위한빅데이터산업발전전략
2. 빅데이터산업육성정책의필요성 빅데이터는기업의생산성, 경쟁력제고및소비자와정부에상당한잉여를가져올것으로평가됨 12년세계경제포럼 (WEF, 2012) 에서발행한 Big Data, Deep Impact 는금융, 의료, 행정, 교육등다양한분야에서빅데이터가활용되어새로운부가가치를창출할것으로전망 최근소비자들은웹, SNS 등에서소비활동을하고있어소비자들의 검색기록이나소통내용을분석하여마케팅에효과적으로활용가능 빅데이터활용은생산성증가등다양한경제적효과를가져올것으로예상 미국의경우빅데이터활용시산업별로 0.5 1% 의생산성이증가할것으로예측되었고, EU의경우공공분야에빅데이터활용시부정및오류에따른손실감소, 세수증대등으로비용효과가 1,500 3,000 억유로에달할것으로예측 (McKinsey, 2011) 국내의경우국가정보화전략위원회 (2011) 는공공분야에서빅데이터를활용할경우에경제효과를 10.7 조원으로전망 우리나라는빅데이터에대한인식부족등으로선진국과상당한격차를보이고있어정책적인뒷받침필요 우리나라는통신 제조업이발달해있어성장잠재력이매우큰상황이나인식부족, 시장의불확실성등으로활용은매우저조하여적극적인촉진책필요 또한빅데이터가사회적으로확산되고국민적호응을얻기위해서는국가적전략및산업육성정책필요 6
Ⅲ. 개인정보유출사고가빅데이터산업에미치는영향 1. 개인정보유출사고와빅데이터산업 최근수년간발생한개인정보유출사고로인해개인정보보호중요성대두 개인정보보호에대한중요성이강조되면서빅데이터산업의성장에는부정적인영향을미칠것으로전망 보호중심의규제가강화되고개인정보의수집목적외사용이금지되면서기존에추진되는사업들도지연되거나규모가축소될수있는상황 현상황에서 14 년 5월발표된미국의빅데이터 & 프라이버시소위원회의빅데이터정책권고는많은시사점제공 미국의빅데이터 & 프라이버시소위원회는빅데이터가제시한기회와도전을평가하고, 관심및정책개발을위한구체적인권고안제시 (The White House, 2014) 생명을구하는빅데이터, 더나은경제활동을만드는빅데이터, 납세자의세금을절약하는빅데이터등의유용성강조 < 미국정책권고안내용 > 1 빅데이터시대에서소비자가자신의개인정보가어떻게사용되는에대해명확하고이해가능하며합리적인기준을얻을자격이있기때문에소비자프라이버시권리장전을개선 2 행정부의 2011 년사이버보안법안제출에따라단일국가정보유출침해표준을제공하기위한정보유출법안통과 3 개인정보보호정책은연방정부가아닌미국시민의개인식별정보를처리하는방법에반영 4 학생들의데이터를공유하거나부적절하게사용되는것으로부터학생들을보호하면서더나은학습결과를도출하는목적을위해사용되도록노력 5 연방정부는보호계층에차별적인영향을미칠빅데이터분석에의해용이하게결과를확인하고사례를식별할수있는전문기술을구축해야하기때문에차별을중단하기위한기술의전문성확장 6 온라인의보호기준을보장하기위해전자통신프라이버시법을개정 * 한국정보화진흥원, 2014 7
Ⅳ. 빅데이터산업육성을위한정책과제 1. 가치있는공공부문데이터개방과인식의전환 주요선진국빅데이터정책의공통점은공공데이터개방을통한민간이용활성화 정부가보유한데이터를공개하여정부행정의투명성및효율성을향상시키고, 국가안전및위험관리, 치안, 의료, 교육, 복지, 환경등사회전반에걸쳐공공부문에서의빅데이터활용가능성을높이고있음 우리나라역시공공데이터개방을추진중이나민간이활용하기에는현재개방되는데이터의양과질이불충분 2013 년월드와이웹재단과오픈데이터연구소가각국정부의오픈데이터정책현황을분석한결과전체 77개국중우리나라는 12위차지 < 표 5> 오픈데이터지표국가순위및한국지표 세부지표순위국가명 ODB 평점준비성실행력영향력 1 영국 100 100 79.91 100 2 미국 95.26 86.67 100 93.38 3 스웨덴 95.20 83.14 71.95 85.75 4 뉴질랜드 81.88 65.49 89.81 74.34 5 노르웨이 91.88 70.98 46.15 71.86 12 한국 77.19 54.90 24.56 54.21 활용가치있는공공데이터의개방위해정부보유정보의지식재산권완화필요 우리나라는저작권법에따라공공데이터의재산권인정하는유럽식제도따름 - 미국은데이터에대한자유로운접근을위해재산권을인정하지않음 미국중심의데이터유통편중이심화되는현실을생각할때공공데이터의지식재산권인정제도에대한재검토필요 8
2. 건전한빅데이터생태계조성및중소 중견기업육성 빅데이터생태계를구성하고있는대기업, 중소기업, 소비자가모두 빅데이터를통해발전해야하며, 여기서 빅데이터생태계의균형발 전 이라는당면과제속에서정부의역할모색필요 정부는건전한생태계하에서중소 중견기업육성을위해빅데이터생태계내기업의적극적참여를보장하고, 시장에서효과적인가치사슬이구성될수있도록개방형네트워크 (open network) 구축촉진 정부와기업, 소비자간협력모델을개발하고, 자립기반이약한중소기업을위한빅데이터인프라구축유도 3. 전문인력양성 빅데이터산업성장할수록전문인력수요급증예상 한국정보통신진흥협회는 17 년까지빅데이터인력 1만 4,000 명이필요할것으로예상 삼성경제연구소가 12 년 5월발표한자료에따르면국내빅데이터전문인력은 100 명안팎에불과 정부양성계획과더불어산학협력등추가적양성수단병행필요 정부는빅데이터기술경쟁력확보, 분석역량제고를위해 2017 년까지빅데이터전문인력 5,000 여명양성계획발표 ( 미래창조과학부, 13, 빅데이터산업발전전략 ) - 그러나이는수요인력을충족시키기에는부족 인력수급의불일치를해소하기위해서는직접적인교육을통한신규인력양성과더불어산학협력을통한간접적인양성병행필요 9
데이터사이언티스트로불리는고급인력에대한재평가 데이터분석과경영전략자문을수행하는데이터사이언티스트는고급인력임에도불구하고개발자와똑같은인력으로평가를받아초급, 중급, 고급등의노임단가를받음 - 빅데이터관련인력에대한가치를인정받을수있는풍토를조성하는것이중요 4. 수요창출을위한선도사업추진및 Best Practice 확보 활용사례또는모범사례 (Best Practice) 에대한분석과홍보는빅데이터서비스간경쟁을촉진해서비스의질적제고를기대할수있고, 빅데이터도입을시작하는기업에게좋은벤치마킹소스가될수있음 정부차원에서수요창출을위한선도사업추진및 Best Practice 를확보하는전략을추진하는것이필요 대표성있는선도시범사업을발굴 추진함으로써초기시장활성화추진 선도사업추진및 Best Practice 활용은강력한추진의지를가지고예산이수반된투자가이루어져야할것 - 관련선도사업과 Best Practice 의추진에대한명확한일정과추진내용에대한투명화및홍보가더불어이루어지는것이중요 < 표 6> 빅데이터산업발전전략수요측면주요세부과제 10
선도시범사업및대형 Flagship Project 추진 6 대유망산업에선도활용프로젝트추진 빅데이터분석활용센터활성화 빅데이터경진대회주기적개최 빅데이터사업수요예보제 빅데이터도입가이드및개인정보활용가이드마련 - 공공 민간의관심이높고파급효과가큰과제중심확대 ( 스마트센서시범사업시데이터비즈니스실증 ) - 빅데이터유망 6대산업분야선정등을통해관련산업및빅데이터산업동반발전 * 의료 건강, 과학기술, 정보보안, 제조, 소비 거래, 교통 물류 - 데이터기반비즈니스나실습을희망하는중소벤처 대학등에 Shared Service 를제공하는센터본격운영 고도화 - 미캐글방식 * 등을벤치마킹해데이터과학자급인재본격발굴및데이터스타트업기업육성 * 데이터과학자대상대표적인예측모델링경합대회 - 국가정보화시행계획등을통해주요기관의빅데이터추진계획조사및사전수요예보실시 ( 안행부공동 ) - 공공 민간기관이빅데이터활용능력을자가진단할수있는체크리스트형태가이드를제작 보급하고, - 개인정보보호와데이터활용이조화될수있도록사례집및가이드등발간 ( 방통위 안행부등관계부처협력 ) * 자료 : 미래창조과학부 (2013), 창조경제및정부 3.0 지원을위한빅데이터산업발전전략 5. 프라이버시보호문제와규제완화 빅데이터사업에가장큰위험요소로프라이버시문제가주목받고있음 빅데이터를활용한새로운가치창출은소비자후생에긍정적인영향을줄수있다는점을고려하여규제완화 현재개인을식별할수없는데이터가다른데이터와결합해개인식별이가능하게되는상황도개인정보에준하는정보보호규제가적용중 기술발전과개인정보보호의조화지속적모색 11
Ⅴ. 결론및시사점 빅데이터에대한논의가활발히진행되고있으나활용은예상보다더디게진행 11 년을기점으로빅데이터에대한논의가진행된이후수년간빅데이터에대한관심이증가하고있지만우리나라의빅데이터활용은예상외로저조 공공데이터개방이확대되고있고민간의활용도점차늘어나고는있으나국내시장규모가협소하고, 수익에대한우려등으로본격적투자가이루어지지않고있어외국의기업들이국내빅데이터비즈니스시장을선점할우려가있음 빅데이터핵심기술에서도 2 4 년의기술격차가존재해외국의솔루션들에의해시장이잠식당하는현상이발생할수있음 빅데이터분석전문가등고급인력이크게부족한것도문제 체계적으로지원할수있는법 제도적근거등이선진국에비해상대적으로미흡 최근개인정보유출사고또한빅데이터확산에걸림돌로작용 빅데이터산업육성을위한정책과제 (S.P.E.E.D) 제시 Share public data( 공공데이터개방 ) Promote small & medium enterprises( 중소 중견기업육성 ) Educate to train experts( 전문인력양성 ) Endeavor to generate demand( 수요창출 ) Deregulate( 규제완화 ) 12
참고자료 IDC (2014), 전세계빅데이터기술및서비스전망보고서. IDG (2013), 사례로보는빅데이터성공가이드, IDG Deep Dive. KT경제경영연구소 (2013), 2014년 ICT 10대주목이슈, ISSUE CRUNCH SPECIAL REPORT. 김방룡외 (2014), 특허분석을통한빅데이터기술개발동향, 한국전자통신연구원김사혁 (2013), 빅데이터산업생태계분석동향, 방송통신정책, 정보통신정책연구원, 제25 권 13호, 통권 558호. 미래창조과학부 (2013), 창조경제및정부3.0 지원을위한빅데이터산업발전전략. 손상영 (2013), 빅데이터, 온라인마케팅과프라이버시보호, 정보통신정책연구원 KSIDI Premium Report. 손상영 김사혁 (2012), 빅데이터시대의새로운정책이슈와이용자중심의활용방안연구, 방송통신정책연구 12-진흥 -097, 방송통신위원회. 신윤성외 (2014), 개인정보보호와빅데이터기술의산업화, e-kiet 산업경제정보, 산업연구원, 제584 호, 2014-09. 한국과학기술정보연구원 (2013), 빅데이터산업의현황과전망. 한국정보화진흥원 (2014), 빅데이터 & 프라이버시소위원회빅데이터정책권고, ICT Issues Weekly, 2014. 5. 8. 한국정보화진흥원 (2013), 오픈데이터지표 : 2013 년국제보고서. Dave Feinleib (2012), The Big Data Landscape, Forbes. MGI (2011), "Big data: The next frontier for innovation, competition, and productivity. The White House (2014), FACT SHEET: Big Data and Privacy Working Group Review. (http://www.whitehouse.gov/the-press-office/2014/05/01/factsheet-big-data-and-privacy-working-group-review) WEF (2012), Big Data, Big Impact: New Possibilities for International Development. 13