IT & Future Strategy 데이터브로커를통해본데이터활용촉진전략방향 제 7 호 (2016. 11. 30.) 목차 Ⅰ. 데이터브로커는데이터활용기업 / 1 Ⅱ. 데이터생태계와데이터브로커 / 8 Ⅲ. 데이터활용촉진을위한전략과제 / 18
IT & Future Strategy(IF Strategy) 보고서는 21세기한국사회의주요패러다임변화를분석하고이를토대로미래지능화시대의주요이슈를전망, IT를통한해결방안을모색하기위해한국정보화진흥원 (NIA) 에서기획, 발간하는보고서입니다. IF Strategy 는미래의 만약을대비한전략 을담은보고서를의미합니다. NIA 의승인없이본보고서의무단전재나복제를금하며, 인용하실때는 반드시 NIA, IT & Future Strategy 보고서 라고밝혀주시기바랍니다. 보고서내용에대한문의나제안은아래연락처로해주시기바랍니다. 발행인 : 서병조 작성 - 한국정보화진흥원 (NIA) 정책본부 ICT 미래전략팀 백인수수석 (053-230-1282, insu@nia.or.kr) 보고서온라인서비스 - www.nia.or.kr
요약 데이터브로커는데이터기반 (Data-Driven) 비즈니스중한분야 o 데이터기반은직관과개인의경험보다는데이터에의한활동프로세스를의미 - 데이터브로커는고객데이터를수집, 재판매, 가공, 분석하거나다른기업들과데이터를공유하는기업을지칭 o 미국에서는데이터브로커관련비즈니스가 1950년대부터등장 - 인터넷, 이메일, 모바일이보급되기이전부터우편을통한직접마케팅을위해소비자데이터를수집, 가공하기시작 - 브로커기업들은공공정보, 사회조사, 카달로그등오프라인데이터를수집했고, 수십년간축적된데이터는지금까지중요한데이터로활용 미국은데이터수집, 활용에대한무조건금지보다투명한유통관리에초점 o 미국은개인정보보호를위한접근방식이경제적 기술적관점을중시하고, 사적자치원칙을중시해개인데이터에대한정부간섭을최소화 - 그러나, 미국도개인데이터에대한무분별한수집과오용을막기위해 1970년공정신용보고법을시작으로개인데이터이용기업의투명성강조 o 또한, 미국정부및의회는데이터브로커산업의투명성문제에주목하고이를개선해데이터산업을올바른방향으로유도 - 데이터브로커현황분석및공개, 데이터수집및유통현황에대한포털구축, 연차정보발간등투명한개인데이터유통환경구축을위한가이드제시 o 미국은데이터브로커에대한면밀한실태조사, 지침설정등을통해데이터거래금지보다는투명성강화를통한안전한유통가이드라인마련에노력 데이터가치사슬全분야에관여하는데이터브로커비즈니스모델 o 데이터는데이터화및수집, 수집된데이터의가공및분석, 분석결과를통한의사결정및활용등의가치사슬로엮여있음 o 데이터브로커는데이터가치사슬全단계에참여해부가가치획득 - ( 데이터화및수집 ) 旣보유하고있거나고객이필요로하는데이터를자체수집하고브로커간거래를통해획득후판매
- ( 데이터분석 ) 데이터를가공, 조합, 활용해데이터분석결과를판매하거나, 고객에따른맞춤형데이터분석 판매 - ( 의사결정및활용 ) 데이터브로커의데이터나분석결과를활용하는것은구매자의영역이나, 데이터브로커에게데이터분석을통한특정업무를위탁하는경우가해당 ( 기사작성, 타켓고객에대한직간접홍보등 ) < 데이터브로커의주요비즈니스모델 > 직간접마케팅 사기및위험방지 데이터제공 타겟고객선정 기업간협업중계 마케팅분석 신원분석 사기탐지 데이터브로커가고객의의뢰를받아고객이가지고있는명단에필요한항목을추가로제공 특정한조건에해당되는소비자명부작성제공 특정마케팅을위해고객명단을데이터브로커에게보내면가능성이있는고객을선별해주는서비스 두사업체가협업시각자의고객정보를공유하기를원치않을경우, 데이터브로커가중간에서고객정보를결합, 분석하여각기업이필요로하는정보제공 고객데이터분석을통해행동을예측하는것을목적으로한서비스 어떤미디어채널, 어떤지역등이최적인지분석하는서비스 은행과같은금융기관이고객신원을인증하는데도움을주기위해거래건별로위험점수를산출, 제공하는등의방법으로신원확인을지원 민간영역뿐아니라정부보조금지원을받기위해공공기관에제출한소득정보의진위여부도판단하는등공공부문에도활용 정확한사람찾기 기업이보유하고있는고객에대한세부정보를제공하는서비스로주로정부나소셜미디어사이트와같이공개된정보를기초로작성된다양한정보로구성 데이터분야활성화를위해데이터산업에대한새로운시각과전략필요 o 미국의데이터기반비즈니스가활성화되고, 부가가치를창출할수있는것은개인을식별할수없는익명데이터활용이자유로운것이큰요인 - 데이터수집에대한우려를개선하고, 데이터가공및분석비즈니스활성화를위해정부및공공분야내부의선도적인전략과제추진필요 과제 1 과제 2 과제 3 o 정부내정부데이터브로커설립 - 정부부처의데이터수집, 가공, 분석을지원하는데이터전문업무담당 o 데이터기반국가정책결정제도도입 - 과학적의사결정, 데이터활용활성화를위해데이터분석기반국가정책결정체계마련 o 정부데이터가공 Factory 사업추진 - 데이터분석에앞서데이터전처리및변환과정을전문적으로대행하는데이터가공사업추진
데이터브로커를통해본데이터활용촉진전략방향 1 Ⅰ 데이터브로커는데이터활용기업 브로커 : 독립된제 3 자로서타인간의상행위의매개를업으로하는사람 1) 브로커 는단어자체에부정적인이미지를내포 2) 승부조작 1 차공판브로커조씨와 ' 엇갈린진술 개인회생브로커무더기적발, 변호사명의빌려총 562 억부당수임 가이드 브로커 업자 ' 한통속제주中관광객명의대포폰개통 경영난처한병원이용해 보험사기 브로커등 104 명적발 데이터브로커 역시해커, 개인정보거래, 빅브라더등으로 우려와논란의이미지로일반인들에게비춰지고있음 Shocked to learn how data brokers are watching you? - CBS News Michelle Obama's ID details hacked from data brokers - BBC News The Hacked Data Broker? Be Very Afraid - Wall Street Journal How Data Brokers Threaten Consumer Privacy - The Huffington Post 1) 두산백과사전 2) 한국정보화진흥원빅데이터플랫폼활용 (2015 년, 2016 년국내뉴스데이터분석 )
2 데이터브로커는데이터를수집, 가공, 판매하는데이터활용 데이터기반 (Data-Driven) 비즈니스중한분야 - 데이터기반 (Data-Driven) 은직관과개인의경험보다는데이터에의한활동프로세스 3) 를의미하며 - 데이터브로커는고객데이터를수집, 재판매, 가공, 분석하거나다른기업들과데이터를공유하는기업들을지칭 4) 하며데이터기반 (Data-Driven) 여러비즈니스중하나로볼수있음 - 빅데이터산업은데이터를매개로하는산업의특성을감안할때기반산업, 지원산업, 활용산업으로분류 5) 분류주요내용주요기업 기반산업 지원산업 활용산업 빅데이터관련장비제조업빅데이터관련소프트웨어개발업빅데이터설비임대 / 운영대행업 시스템구축및솔루션제공업컨설팅및사업서비스업기타지원 데이터유통업데이터가공업기타활용 IBM, HP, EMC 등오라클, SAS, SPSS 등구글, 아마존, MS 등 IBM, 오라클, SAS 등 Axiom, Corelogic, Datalogix 등 3) Wikipedia 4) Federal Trade Commission 인용, 수정 5) 빅데이터산업과데이터브로커 ( 정용찬, 2015) 내용및표인용 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 3 오바마대통령당선에도기여한미국데이터브로커산업 미국에서는데이터브로커와유사한비즈니스가 1950 년대부터등장 6) - 인터넷, 이메일, 모바일이보급되기이전부터우편을통한직접마케팅을위해소비자데이터를수집, 가공하기시작 7) - 기업들은공공정보, 사회조사, 카달로그등오프라인데이터를수집했고, 수십년간축적된데이터는지금까지중요한데이터로활용 1963년미국에우편번호코드 (Zip) 가도입된이후, 우편광고회사들은우편번호코드와코드에거주하는소비자의구독잡지종류, 음식구입, 정치적성향등과같은개인특징데이터를추정해마케팅에사용하기시작 1974년사회학자조나단로빈은 PRIZM (Potential Rating Index for Zip Markets) 이라는최초의개인평점데이터목록을개발했고, 이는연방통계국의인구통계데이터, 소비자설문조사데이터를우편번호와조합해우편광고시장에활용 8) 스마트폰 SNS 확산, 클라우드컴퓨팅 빅데이터기술발전으로정보 수집양이폭증하면서데이터브로커산업에대한관심과우려증가 - 데이터브로커산업은 SNS 등온라인데이터, 온오프라인구매 내역, 공공기록등의정보를수집해개인의프로필을구성 판매하며수십억달러규모의시장으로확대 9 개데이터브로커 (Axiom, Corelogic, Datalogix, ebureau, ID Analytics, Intelius, PeekYou, Rapleaf, Recorded Future) 총매출 (2012 년 ) 은약 4,570 억원수준 9) - 특히, 9/11 테러범검거, 미국대선등데이터브로커의역할이알려 지면서데이터브로커의수집데이터, 비즈니스모델등에관심증가 6) Wikipedia 7) A Review of the Data Broker Industry: Collection, Use, and Sale of Consumer Data for Marketing Purposes (COMMITTEE ON COMMERCE, SCIENCE, AND TRANSPORTATION, 2013) 8) Michael J. Weiss, The Clustering of America (1988). 9) DATA BROKERS(Federal Trade Commission, 2014)
4 참고 오바마대통령선거캠프와데이터브로커 o 美오바마대통령당선에데이터브로커가중요한역할 - 오바마캠프는빅데이터분석을통해설득가능한유권자를파악하고이에 대한맞춤형선거운동개진 - 특히빅데이터분석을위해서오바마캠프는엑시옴, 아리스토텔레등과같은 데이터브로커회사들로부터필요한데이터를구매또는지원받음 데이터브로커 아리스토텔레 아리스토텔레가보유한유권자데이터는주소, 전화번호, 사진, 나이, 직업, 가족구성원, 인종, 결혼여부, 취미등기본정보는물론, 과거지지후보, 정치후원금기부내역, 인터넷구매행동, 보유차종, 신용카드사용액, 물품 구매내역등이상세하게축적돼있으며개인당데이터종류가최대 500 건에달함 데이터시장의가능성을예측한존아리스토텔레필립스 (John Aristotle Phillips) 는 아리스토텔레 라는회사를 1983 년설립하고, 30 년가까이데이 터를수집 소비자마케팅사에서사들인개인정보, 유권자가직접제공한정보, 소셜 미디어에서수집한정보등다양 이회사의자체데이터베이스 아리스토텔레 360 에서수집한미국유권 자만무려 1 억천여만명에이름 - ( 데이터수집 ) 데이터브로커로부터구매한데이터, SNS 등온라인에서수집한데이터, 자원봉사자등현장에서수집한데이터등각종데이터를수집하고이를정제하여통합 - ( 타깃설정 ) 다양한고급통계예측기법을활용, 유권자들을수십개의그룹으로분류하였고, 오바마에대한 지지확률, 투표참여확률, 설득가능확률 이라는세가지핵심지표를통해전략실현에가장중요한그룹들이어떤것인지분류 - 이를통해투표에적극적이지않은지지자와투표에적극적이지만상대방을약하게지지하는사람을타깃으로집중공략 - 유권자한사람에대한종합적인이해를가능 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 5 미국은데이터수집, 활용에대한무조건금지보다투명한유통관리에초점 프라이버시를기본권으로인식하고있는 EU 와달리미국은 정보프라이버시권이재산권에속해 10) 개인데이터유통이활성화됨 - 그러나, 미국도개인데이터에대한무분별한수집과오용을 막기위해연방거래위원회의 1970 년공정신용보고법 11) 을 시작으로개인데이터이용기업의투명성강조 빅데이터산업활성화에따라개인데이터를수집, 유통하는 데이터브로커산업에대한관심도높아짐 - 2012 년이후연방거래위원회, 의회, 회계감사원등의데이터 브로커산업에대한투명성요구가확대되고, - 특히, 스포키오社가개인데이터의부적절한활용으로적발된 이후연방거래위원회는데이터브로커 9 개회사 12) 에대한데이 터의수집, 활용, 유통실태분석에착수 스포키오 (Spokeo) 는온라인, 오프라인의수백명정보원으로부터데이터를수집해개인프로파일데이터를작성하고이를이력서이상의정보라고내세워기업의채용담당자에게판매하였으며, 개인신용에대한정확한정보작성을의무화하는 공정신용보고법 (FCRA: Fair Credit Reporting Act) 에위반되어처분 (80 만달러벌금부과 ) - 이를통해미국데이터브로커산업의현황이대략적으로알려 지게됨 ( 연방거래위원회 2014 년 5 월 Data Brokers 보고서발간 ) 미국정부및의회는데이터브로커산업의투명성문제에주목 하고이를개선해데이터산업을올바른방향으로유도 - 데이터브로커현황분석및공개, 데이터수집및유통현황에 대한포털구축, 데이터대한연차정보발간등투명한개인 데이터유통환경구축을위한가이드제시 10) 잊혀질권리와표현의자유, 그리고정보프라이버시 ( 박정훈, 2013) 11) Fair Credit Reporting Act(Federal Trade Commission, 1970) 12) Axiom, Corelogic, Datalogix, ebureau, ID Analytics, Intelius, PeekYou, Rapleaf, Recorded Future)
6 미국정부및의회는데이터브로커에대한면밀한실태조사, 지침설정등을통해데이터거래금지보다는투명성강화를 통한안전한유통가이드라인마련에노력 1970 년 1997 년 Fair Credit Reporting Act 제정 Selfregulatory Individual References Services Group ( IRSG ) 구성 개인신용정보판매회사에대한관리, 고객데이터수집, 활용에대한고지관리, 투명성등강화 연방거래위원회는데이터브로커의투명성관리를위해자율규제를위한개인참조서비스그룹구성 다만, 자율규제원칙이데이터브로커투명성의부족을규제하기에는부족함을명시 2012 년연방거래위원회 Privacy Report 발간 연방거래위원회는 2012 년 Protecting Consumer Privacy in an Era of Rapid Change: Recommendations for Businesses and Policy makers 보고서발간 데이터브로커의비즈니스유형과현황을분석 2009 년처음으로제안된 Data accountability and Protection act 법안을갱신 데이터브로커투명성강화를위해마케팅목적으로활용하고판매한개인데이터에대해고객스스로어떻게수집하고어떤데이터인지를확인할수있는포털사이트개설권고 2013년 2013년 2014년 2014년 회계감사원및의회의데이터브로커투명성강화조치 미상원상무과학교통위원회데이터브로커현황분석보고서발간 연방거래위원회 Data Brokers : a Call for Transparency and Accountability 보고서발간 미상원 Data Broker Accountability and Transparency Act, The Data Accountability and Trust Act 발의 회계감사원 (Government Accountability Office) 은 Practices of data brokers 발간 의회는기술의변화, 개인데이터관련시장의증대, 데이터브로커산업의투명성부족등에따른변화를반영하기위한입법추진고려 미상원의상무, 과학, 교통위원회는데이터브로커가개인데이터를어떻게수집, 편집하고판매하는지에대한조사결과에대한보고서발간 데이터브로커는고객보호를위한법적인강제조치가없고최소한의투명성을가지고마케팅목적으로개인데이터거래 미연방거래위원회는데이터브로커의데이터수집및거래현황을분석하기위해데이터브로커대표 9 개회사에대한개인데이터수집과관련된정보제출명령 제출된자료를기반으로데이터브로커산업현황을파악하고투명성부분의문제점을분석해투명성강화를위한필요가이드라인제시 미상원의원 Jay Rockefeller, Ed Markey Data Broker Accountability and Transparency Act 발의 : 데이터브로커의투명성증대를위해데이터브로커가수집한유용한개인데이터정보요청이주요내용 미하원의원 Bobby L. Rush 와 Joe Barton The Data Accountability and Trust Act 발의 : 적어도 1 년에 1 회데이터브로커가수집한유용한개인데이터정보요청이주요내용 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 7 데이터기반마케팅은디지털시대미국자유시장의연료 미국디지털마케팅협회는데이터브로커에대한의회질의에 데이터기반마케팅은디지털시대의미국의자유시장엔진이돌아가게하는연료가되고있다. 13) 라고답변 - 전통적인마케팅에서디지털시대마케팅으로진화하는데있어데이터의필수불가결한역할을이야기하고있음 - 단지, 마케팅에국한된현상이아니라정치, 경제, 행정, 의료, 국방등국가사회전분야가데이터기반사회로진화중 14) 지능정보사회의핵심자원으로데이터가주목 15) 받으면서데이터에대한수요가급증하고있음 - 데이터의수집과활용은더욱중요한산업분야가될것임 2014년미국마케팅분야의 데이터가공및거래활용관련산업 은 2020억달러의경제적가치와약 97만개의일자리창출효과 (DDMI(Data-Driven Marketing Institute) - 데이터분야산업발전을위해소비자의동의, 신뢰를기반으로투명한데이터유통및활용을위한합의와논의가필요한때 본보고서는데이터브로커를국내에서활성화하자는목적이아니라, - 데이터브로커를단순히개인데이터를수집해판매하는기업이아닌, ( 빅 ) 데이터를수집 가공해비즈니스化한데이터활용산업분야의성공사례로접근함으로써 - 상대적으로취약한우리나라데이터기반경제, 데이터기반공공서비스등의경쟁력강화를위한데이터활성화전략수립에활용가능 13) www.cio.com(2014.3.27.) 14) 정지훈의미래세계 데이터기반사회 ( 경향신문, 2016.6.10.) 15) 한국지능정보기술산업의국제경쟁력현황및제고방안 ( 산업경쟁포럼세미나, 2016.6)
8 Ⅱ 데이터생태계와데이터브로커 데이터가치사슬과데이터브로커산업의비즈니스모델 데이터는데이터화및수집, 수집된데이터의가공및분석, 분석결과를통한의사결정및활용등의가치사슬로엮여있음 < 미국, OECD 의데이터전략단계별역할과기능 16) > 단계 주체 역할 및 기능 데이터화및수집데이터분석의사결정및활용 데이터공급자 ( 정부, 민간, 개인 ) 데이터수집인프라구축 데이터신뢰성확보 데이터공유및확산 프라이버시, 보안기술연구 하드 / 소프트웨어제공자 데이터컨설팅제공자 데이터분석인프라구축 데이터분석신뢰성확보 데이터분석라이브러리수집및관리 프라이버시, 보안기술연구 데이터기반정책개발자및사업자 정부, 민간등협력방안마련 전문인력양성 의사결정지원수단개발 창업지원 데이터가치사슬은데이터자체 ( 양과품질 ), 관련인프라, 저장 및분석기술둥관련생태계의발전에좌우됨 - 오픈소스기반의 ( 빅 ) 데이터분석기술의발전, 클라우드 컴퓨팅을통한저렴한저장비용등데이터인프라와기술 분야는비약적으로발전 - 데이터는공공데이터개방, IoT 등을통한데이터화확대등 이용가능한데이터가증가하였으나, 여전히高가치데이터는 생산자독점, 개인정보침해등문제로유통이어려움 16) THE FEDERAL BIG DATA RESEARCH AND DEVELOPMENT STRATEGIC PLAN(NITRD, 2016), Data-Driven Innovation Big Data for Growth and Well-Being(OECD, 2015) 수정 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 9 - 데이터활용의필요성은체감하고있으나, 자체해결하기에는투자력, 기술력등이부족해국가전반적으로데이터활성화저조 데이터브로커는데이터가치사슬全단계에참여해부가가치획득 - ( 데이터화및수집 ) 旣보유하고있거나고객이필요로하는데이터를자체수집하고브로커간거래를통해획득후판매 - ( 데이터분석 ) 데이터를가공, 조합, 활용해데이터분석결과를판매하거나, 고객에따른맞춤형데이터분석 판매 - ( 의사결정및활용 ) 데이터브로커의데이터나분석결과를활용하는것은구매자의영역이나, 데이터브로커에게데이터분석을통한특정업무를위탁하는경우가해당 ( 기사작성, 타켓고객에대한 직간접홍보등 ) < 데이터브로커의주요활동 > 단계 데이터수집 데이터정제및상품화 데이터판매 주요활동 정부및공공분야, 소셜미디어등접근가능한온라인분야, 카달로그사업자등민간분야에서데이터수집 자체적인수집이외에데이터브로커간데이터유통 데이터브로커는수집한데이터자체를판매하기도하지만, 데이터의상품성을높이기위해여러데이터간조합과분류작업을통해의미있는새로운데이터집합 ( 분류 ) 을만들거나, 분석결과를제품화함 데이터는직간접적인마케팅목적, 사기거래방지등을위한리스크경감목적, 특정타겟고객발굴목적으로가공 데이터브로커는고객요구에따라보유하고있는원천데이터를판매하거나, 새로운데이터를수집해판매 보유하고있는데이터를기반으로고객이원하는결과를데이터분석을통해제공하며이를통해매출증대 데이터브로커는공공, 법률, 도소매, 보험, 언론, 금융등다양한분야의고객을대상으로판매
10 데이터브로커의주요활동 17) 1 주요데이터와수집방법 데이터브로커는정부및공공데이터, 민간상업 / 거래데이터, 온라인소셜데이터, 타브로커보유데이터등수집 - ( 정부 / 공공데이터 ) 연방정부, 주정부, 공공기관등에서법적, 제도적으로공개하거나공개청구를통해수집가능한데이터를수십년간축적중 인구통계정보, 주소, 선거구등행정정보, 사회보장국사망자명부, 주소변경정보, 연방법원의파산정보, 전문직면허정보, 부동산, 유권자, 자동차등록정보등 - ( 민간상업 / 거래데이터 ) 온오프라인의소매상거래업체, 신문, 잡지사, 카달로그회사등을통해데이터를구매하거나, 개인웹브라우저의방문이력정보등을동의하에수집 소매업과카탈로그회사의거래내역, 결재방법, 구매품목, 잡지사의구독자정보, 전자상거래, 뉴스, 여행사이트, 금융회사의거래정보등 - ( 온라인소셜데이터 ) 온라인소셜서비스, 블로그등의웹사이트를대상으로계약을통해데이터를구매하거나, 웹크롤링방법을통해데이터수집 - ( 他데이터브로커보유데이터 ) 다른데이터브로커가보유하고있는데이터에대한데이터브로커간거래활발 미 FTC 조사결과조사대상 9개회사중 8개회사가데이터브로커간거래중 미 FTC 조사결과조사대상 9개회사모두소비자로부터직접적인데이터수집은하지않는다고밝힘 17) DATA BROKERS(Federal Trade Commission, 2014) 수정 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 11 데이터브로커는오프라인으로발간되는인쇄정보를구매하거나, 온라인상의데이터를크롤링등의방법으로수집 - 데이터브로커는온라인화되지않은발간물, 정부및공공기관에서보유하고있는인쇄물에대해서는직접인쇄물을구매하거나디지털화하는방식으로데이터를수집 전화번호부, 정부및공공기관의각종명부, 정보공개신청을통해발급받을수있는자료등 - 온라인데이터는웹크롤링방법으로데이터를수집하거나, 소셜미디어, 카드사, 인터넷상거래등온라인비즈니스업체와의계약을통해사용자들의데이터를구매, 수집 카드회사, 인터넷상거래회사등은소비자동의를기반으로소비자가다양한기기에서어떤상품을검색하고, 구매하고, 결제하는지등의데이터를수집하며, 효과적인마케팅을위해온라인마케팅전문회사등데이터브로커에게수집한데이터를전달또는판매함 또한, 소비자들은자신의컴퓨터, 스마트폰등의웹브라우저나앱등을통해인터넷사용중不知不識간에웹상의전문데이터수집업체들이설치해놓은프로그램 18) 을통해자신의인터넷사용데이터가수집업체로전달되며데이터수집업체는이러한데이터를데이터브로커에게판매 블루카이라는회사는이러한방법으로전세계 10억명의평균 50가지정보를확보하고있으며, TRUETe에따르면가장인기많은 100개싸이트의경우 1,300개의데이터수집전문회사가사용자의쿠키를모니터링 18) 온라인상의소비자데이터를모으기위해쿠키, 웹비콘 (web beacons), e-tag 등기술을활용하며, 소비자가특정웹사이트를방문할때남는쿠키정보등을활용해데이터를수집하는게일반적이나, 타인이보낸링크를클릭할때브라우저쿠키정보가전송되는경우도있음
12 데스크탑, 노트북등 PC 보다스마트폰등모바일기기를통해더정확한정보수집이가능 (PubMatic 에따르면데스크탑계정이계정당 50~70 개정보를담고있다면모바일계정은정확한위치를포함해 100개넘는데이터필드정보를담고있으며, 모바일사용자는보통쿠키를남기는브라우저보다앱을사용하기때문에앱개발업체에서디바이스ID 를사용해정보식별가능 ) 2 데이터가공및활용방법 데이터브로커는수집, 축적된데이터를기반으로특별한데이터베이스를구축 - 기존에축적된데이터, 업데이트된데이터, 신규로수집된데이터등을분석목적에맞게분류, 조합, 연결하는데이터가공작업을진행 수집된데이터를요소별 ( 나이, 성별, 인종, 지역, 소득, 학력, 직업등 ) 로세분화하고, 각요소간여러조합을통해다양한상관관계등을분석해원하는분석결과를도출 - 또한, 데이터브로커는수집된데이터로단순한가공및분석에만그치지않고, 통계, 빅데이터분석등을통해고객행동예측모델을개발하는등다양한분야의새로운비즈니스모델로진화중 - 이러한데이터브로커의분석결과활용은광고, 마케팅, 선거등사용자데이터분석이절대적으로필요한분야에급속도로확산 데이터브로커가구축한위치, 기기, 결혼여부, 소득, 직업, 쇼핑행태, 여행계획등의특별한데이터베이스는광고배너의실시간으로경매 19) 와결합돼가치가무한확장중 19) ICT 기술의발달로온라인배너광고에대한실시간경매는 150밀리세컨 (0.15초) 에완료가능 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 13 3 데이터상품의판매와정보보호노력 데이터브로커는데이터를수집해판매하는유통중심모델과고객이요구하는분석결과를위해필요한데이터를수집하고이를가공, 분석해판매하는맞춤형비즈니스모델로구분가능 - 데이터브로커는데이터의소유권을이전하는개념의데이터판매가아니라, 계약을통한사용권라이센스를제공하는개념으로데이터를판매 데이터는 API의형태로사용자에게제공되며, 일반적으로데이터사용기간에따른가입 / 해지계약체결 데이터는기본나이와위치정보는일반적으로인당 0.0005 달러 ( 약 0.55원 ) 에판매하며쇼핑이력과소셜네트워크사용정보값은더고가에판매되고있음 < 주요개인데이터상품과거래가격 20) > 20) 파이낸셜타임즈, 소비자천명당개인정보가격 ( 달러 )
14 미국파이낸셜타임즈의웹사이트에서는주제별로개인데이터 항목의다양성에따라개인데이터가얼마의가치를갖고 있는지확인할수있음 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 15 - 데이터브로커의맞춤형비즈니스모델은직간접마케팅 (Marketing Products), 사기및위험방지 (Risk Mitigation Products), 정확한사람찾기 (People Search Products) 서비스로구분 21) 미 FTC 조사결과조사대상 9개데이터브로커의총매출은 2012년기준 4억 2천6백만달러, 이중마케팅분야는 1억9천6백만달러, 사기위험분야는 1억7천 8백만달러, 사람찾기분야는 5천3백만달러수준임 직간접 마케팅 데이터제공타겟고객선정기업간협업중계 데이터브로커가고객의의뢰를받아고객이가지고있는명단에필요한항목을추가로제공 특정한조건에해당되는소비자명부작성제공 특정마케팅을위해고객명단을데이터브로커에게보내면가능성이있는고객을선별해주는서비스 두사업체가협업시각자의고객정보를공유하기를원치않을경우, 데이터브로커가중간에서고객정보를결합, 분석하여각기업이필요로하는정보제공 마케팅 분석 고객데이터분석을통해행동을예측하는것을목적으로한서비스 어떤미디어채널, 어떤지역등이최적인지분석하는서비스 사기및 위험 방지 신원분석 사기탐지 은행과같은금융기관이고객신원을인증하는데도움을주기위해거래건별로위험점수를산출, 제공하는등의방법으로신원확인을지원 소비자가회사에제출한정보가정확한지를확인하는것과같은민간영역뿐아니라정부보조금지원을받기위해공공기관에제출한소득정보의진위여부도판단하는등공공부문에도활용 정확한사람찾기 기업이보유하고있는고객에대한세부정보를제공하는서비스로주로정부나소셜미디어사이트와같이공개된정보를기초로작성된다양한정보로구성 21) 빅데이터산업과데이터브로커 ( 정용진, 2015) 의내용인용및표로재정리
16 데이터브로커의지나친데이터이용에대한반발증가로데이터브로커산업에대한규제강화와업체들의자발적노력증대 - 데이터브로커는사생활과연관되지않은익명의쿠키, 디바이스 ID를사용하는것이기때문에개인정보보호문제가없다고주장 - 그러나, 숫자로판별되는이계정들을데이터브로커가보유하고있는다른데이터속성들과결합할경우특정개인을판별할수있는가능성내포 - 美 FTC는데이터브로커가소유하고있는정보에소비자가접근할수있도록하고, 개인정보와취급방법에대해소비자가단일창구에서확인할수있는웹사이트를구축할것을제안 FTC는자체적으로 Reclaim your name 정책을통해데이터를어떻게수집하고이용하는지에대해서알수있도록소비자에게권한을부여하고, 자신의정보가데이터브로커에의해서마케팅목적으로판매되고있다는것을안다면사후거부 (opt-out) 를설정할수있으며 신용, 보험, 고용및기타혜택등과같은의사결정을위해이용되는정보의오류를정정할수있는기회를제공 - 데이터브로커액시옴 (Acxiom) 은자체적으로소비자가직접자신의개인정보수집과활용현황을확인하는사이트 `About The Data. com 운영을시작 - 빅데이터활성화, 지능정보기술발전에따라개인데이터를수집, 유통하는데이터브로커산업에대한관심이증가하고있으며, 투명성확보를위한규제강화와기업자체노력이병행되는상황 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 17 참고 데이터브로커의주요서비스와고객 22) 요약 1 데이터수집 o 데이터브로커가수집하는데이터는정부및공공데이터, 민간데이터로구분가능하며웹크롤링, 인쇄정보구매등을활용 - 정부 / 공공데이터는인구통계정보, 주소, 선거구등행정정보, 사회보장국사망자명부, 주소변경정보, 연방법원의파산정보, 전문직면허정보, 부동산, 유권자, 자동차등록정보등 - 민간상업정보로는소매업과카탈로그회사의거래내역, 잡지사의구독자정보, 전자상거래, 뉴스, 여행사이트, 금융회사의거래정보, 다른데이터브로커의보유정보등 2 데이터가공 o 수집된데이터는기존데이터와연결, 가공, 재분류등판매를위한상품화의과정을거침 - 데이터브로커는고객에게原데이터를판매하기도하지만고객특성을분석하여새로운고객군정보를생성판매함 - 유사한특성을가진고객군으로분류하기위해데이터를요소별로결합하거나, 고객의행동을예측하기위한모형을개발함 3 제공서비스 o ( 마케팅 ) 고객이가지고있는명단에필요한항목을추가하거나, 구매가능성높은고객을선별하거나, 광고효과극대화를위한예측등수행 o ( 리스크관리 ) 고객으로부터발생할수있는위험을감소시키기위한서비스로신원식별과사기탐지서비스제공 o ( 사람찾기 ) 정부나소셜미디어사이트와같이공개된정보를기초이름, 주소, 전화번호, 이메일주소. 결혼기록, 생년월일, 범죄전과, 이혼경력, 취미 / 관심사, 부동산소유와거래내역, 친지, 고용기록, 재산소유내역등고객에대한세부정보제공 4 주요고객 o 자동차, 에너지, 교육, 의료, 보험, 통신, 미디어, 금융등다양한산업분야에서데이터브로커의서비스를이용 o 연방정부, 주정부, 정치단체등비영리조직에서도서비스를이용하고있으며, 특히 Acxiom 社는 9.11 테러시테러가담자 19 명가운데 11 명에대한데이터보유, 테러리스트검거에활용 23) 22) DATA BROKERS(Federal Trade Commission, 2014) 23) 이것이빅데이터기업이다 ( 삼성경제연구소, 2015)
18 Ⅲ 데이터활용촉진을위한전략과제 데이터분야활성화를위해데이터산업에대한새로운시각과전략이필요한때 우리나라의경우데이터를수집, 가공, 유통하는데이터관련시장자체가협소하며, 데이터브로커라고분류할만한기업도없으나, - 유통측면에서는공공데이터개방정책추진, 데이터유통채널신설등으로점진적으로확대중 이름운영주요내용 API STORE SKT, Big Data Hub DB 진흥원, 데이터스토어 공공데이터포털 보건의료빅데이터개방시스템 KTH SKT DB 진흥원 한국정보화진흥원 건강보험심사평가원 개인 기업모두회원가입후 API 형태의데이터업데이트가가능하며, DB 컨텐츠를직접수급하여 API 형태로제작하여제공 SKT 의고객통신서비스기반데이터를 API, Table, Chart, Map, Report 등의다양한데이터유형으로제공하며웹상에서데이터정보를시각화하거나개별다운로드가능 API상품과데이터상품으로나누어등록 관리하며판매자는 API방식 또는 DB상품중개방식 중원하는판매방식을선택하여상품등록가능 약 2 만여건의공공데이터를오픈 API, 파일데이터, 표준데이터로제공하며시각화등다양한방식으로제공및유통하여국민편의제공 민간기업, 프로그램개발자, 인터넷이용자를대상으로손쉽게직접응용프로그램과서비스를개발할수있도록병원 약국정보서비스등보건의료데이터지원 - 데이터개방및유통채널이확대되고개방되는데이터양도증가하고있으나, 원 (Raw) 데이터유통에만국한 - 데이터를분석, 가공해재판매하는비즈니스는아직미미하며이는가공할만한양질의데이터와분석전문가모두가부족함에따른한계점 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 19 참고 우리나라데이터유통채널현황 o (KTH, API STORE) 개인 기업모두회원가입후 API 형태의데이터업데이트가가능하며, DB 컨텐츠를직접수급하여 API 형태로제작하여제공 - 지도, SMS, 주소정제등 2,960 개의 API 를제공하며, 상품별 API 상품정보와개발가이드, 가격정보등을제공하여이용편의성제고 - 이용자의데이터 2 차가공이가능하도록지원하며 DB 컨텐츠를 API 로자체제작하여유통 데이터현황 (16.8.10. 기준 ) : 일 API 사용량 ( 지도 API 제외 ) 190 만, 유로 API 개수 42 개, API 사용고객수 3,345 명 o (SKT, Big Data Hub) SKT 의고객통신서비스기반데이터를 API, Table, Chart, Map, Report 등의다양한데이터유형으로제공하며웹상에서데이터정보를시각화하거나개별다운로드가능 - 데이터이용신청을통해전체데이터의다운로드및필터링이가능하며이용신청하지않거나로그인하지않은상태에서는미리보기로제공된데이터만 Chart 및 Map 구현가능 - 일자별, 요일별, 시간대별, 시군구읍면동을기준으로발생하는통화량및멤버십포인트적립 / 사용등의통계데이터를매월업데이트하여제공 - 자체적인데이터가공은이루어지지않으며, DATA 매쉬업서비스 를통해 SKT 통신데이터와타데이터와의결합및데이터분석지원 데이터현황 (16.8.10. 기준 ) : 총 52 종의데이터제공, 누적데이터 631 건 SK 텔레콤통신데이터 (T 데이터 ) 외전국시외버스노선정보, 국내항공운항정보, 전국고속버스운행정보, 디자인통합이력정보, 콜택시이용분석등의데이터상품도일부제공 o (DB 진흥원, 데이터스토어 ) API 상품과데이터상품으로나누어등록 관리하며판매자는 API 방식 또는 DB 상품중개방식 중원하는판매방식을선택하여상품등록가능 - (API 상품 ) API 의경우 5 만원이하의월간정액제상품으로출시, 예제소스와 API 이용정보도함께사용가능 - ( 데이터상품 ) 이미지, 텍스트, 동영상등의데이터상품을 xml, csv, txt 등의형태로직접등록 유통가능, 250 개이상의데이터상품이중개 데이터현황 (16.8.10. 기준 ) : 데이터 API 5,739 종, 거래건수 1,456 건 o ( 한국정보화진흥원 _ 행정자치부, 공공데이터포털 ) - 약 2 만여건의공공데이터를오픈 API, 파일데이터, 표준데이터로제공하며시각화등다양한방식으로제공및유통하여국민편의제공 데이터현황 (16.8.10. 기준 ) : 파일데이터 14,957 건, 오픈 API 1,980 건, 표준데이터 12 건 o ( 건강보험심사평가원, 보건의료빅데이터개방시스템 ) - 민간기업, 프로그램개발자, 인터넷이용자를대상으로손쉽게직접응용프로그램과서비스를개발할수있도록병원 약국정보서비스등보건의료데이터지원 병원 약국정보서비스등보건의료데이터 8 종 ( 세분류 37 종 ) 지원, 연구자의필요에따라약 150 만명에 해당하는환자표본데이터등총 4 개 DB 데이터셋생성 제공하여연구및 R&D 사업에활용하도록지원
20 데이터기반산업활성화를위한정책에새로운시각과접근이필요한시점 - 가치있는데이터가개방 유통될수있는환경을조성하고, 빅데이터산업활성화를위한다양한정책추진중 아직까지정부, 기업들이원하는데이터를쉽게획득하기어려우며, 자체적으로데이터분석이어려운경우데이터분석전문업체를통해분석결과를활용하는것도쉽지않음 - 미국의데이터브로커나데이터기반비즈니스가활성화되고, 데이터를활용해부가가치를올릴수있는것은개인을식별할수없는익명데이터활용이자유롭기때문 국내에선 빅브라더 에대한우려와데이터남용가능성때문에익명데이터조차활용하기쉽지않음 데이터유출등범죄행위에대한처벌은강화돼야하지만익명데이터의사용자체를무조건규제하는상황은개선할필요가있음 24) - 데이터수집에대한우려를개선하고, 데이터가공및분석비즈니스활성화를위해정부및공공분야내부의선도적인전략과제추진필요 가장민감하고가치가높은데이터를축적하고있는곳은정부및공공기관 정부및공공기관내부에서고가치데이터를안전하게유통하고, 정부내독립된제3의기구에서데이터를전문적으로가공, 분석해활용하는성공케이스발굴이필요 24) KT 경제연구소 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 21 전략과제 1 정부내정부데이터브로커설립 정부부처의데이터가공과분석을지원하는데이터전문기구설립 정부는정책을계획하고, 실행현황을파악하고, 효과를검증하는데데이터분석의필요성인식하고있으나, - 수시로발생하는정책기획중, 담당공무원이관련데이터를찾아, 가공하고, 분석하는과정은현실적으로불가능 - 민간데이터브로커와같이데이터활용을유기적으로지원해줄수있는데이터분석기구가없는경우정부및공공기관이데이터를효과적으로활용하는것은불가능한상황 대부분부처가 ( 빅 ) 데이터분석이필요할경우이를사업화해별도의사업을추진하고한정된데이터분석결과를활용 데이터분석기구는다음과같은업무를수행 - ( 데이터수집및가공 ) 대부분부처의정책개발에필수적으로필요한기초데이터수집하고공무원이손쉽게활용가능한수준으로가공처리 - ( 데이터현황및기본분석정보제공 ) 기구가수집하고있는데이터에대한수집경로, 활용현황등에대한정보를제공하고수집데이터를기반으로데이터동향분석등실시 - ( 데이터분석 ) 부처및공무원의데이터분석요청에따라기존보유하고있는데이터와추가수집한데이터를조합해맞춤형데이터분석제공 데이터분석기구는데이터의안전한유통, 개인정보보호를전제로필요데이터에대한접근및수집허가가필수
22 전략과제 2 데이터기반국가정책결정제도도입 과학적의사결정, 데이터활용활성화를위해데이터분석기반의국가정책결정제도수립 정책입안시, 사건사고발생시과학적인원인규명보다는정치적사유에따른정책수립 집행으로국민신뢰도저하 정책 사업의질적수준을제고하기위하여정책의필요성, 효과등을합리적으로분석하고이에기초한과학적 비정치적정책개발, 수립, 집행, 평가추진 데이터분석기반국가정책결정제도도입을위한구체적방안 25) 1 부처에서산출하는정책파급효과에대한질적개선을위해객관적인데이터를활용하고보조금등각종정책결과에국민이의문을가질때각부처나공공기관은기본적으로객관적데이터를사용해설명책임을다할것 2 데이터분석을통한정책수립과평가를함에있어객관적지표를사용해타당성을높이고, 초기시행착오를적극권유 3 대규모투자시시행하는예비타당성분석, 사전타당성조사에앞서관련데이터를수집, 분석함으로써정보누락, 주관적평가의문제를사전에예방함 4 데이터를효율적으로활용하기위해부처능력을배양하고데이터분석기구활용의무화 데이터를용이하게수집 가공분석할수있는범부처데이터분석기구를활용하고, 데이터및분석결과에대한공유를촉진하며, 데이터분석설계, 해석할수있는능력배양 25) 미백악관 2013 년 7 월에 증거와혁신에관한아젠다 내용인용, 수정 IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 23 전략과제 3 정부데이터가공 Factory 사업추진 데이터분석에앞서데이터전처리및변환과정을전문적으로대행하는데이터가공사업추진 데이터분석시 80% 의시간과노력을데이터전처리과정에할애 26) - 데이터를분석하려면우선내외부의데이터를수집하고, 일목요연하게정리한뒤, 언제든꺼내볼수있도록잘저장해야함 - 각시스템에서생산되는데이터를원하는프로그램에서편리하게사용하기위한변환과정도필수적이며수집된데이터에대해미리표준화된양식으로변환하는작업필요 캐나다 Quandl 社는나스닥, Zillow, 월드뱅크, barchart 등의회사에서제공하는다양한형태의데이터를회사자체플랫폼을통해 25가지이상의표준화된파일형태로데이터를변환해 api 등의방식으로서비스제공 데이터가공 Factory 사업추진을위한구체적방안 - 부처및공공기관데이터를표준화된양식으로전환해축적하고, 누락된데이터등에대한보완등전처리작업수행 - 전처리및가공요청하는데이터셋에대한가공작업실시 - 현재오프라인데이터를온라인화하는국가DB 관련사업을데이터활용극대화를위한데이터가공사업으로전환 < 데이터가공프로세스예시 27) > 26) 프라카시난두리팍사타공동창업자겸 CEO 27) 보건의료빅데이터 ( 건강보험심사평가원 )
24 참고자료 [1] Federal Trade Commission(2015.5) Data Brokers : A Call for Transparency and Accountability [2] Committee on Commerce, Science, and Transportation(2013.12) A Review of the Data Broker Industry : Collection, Use, and Sale of Consumer Data for Marketing Purposes [3] Ashley Kuempel(2016) The Invisible Middleman: A Critique and Call for Reform of the Data Broker Industry [4] Federal Trade Commission(2012.3) Protecting consumer privacy in an era of rapid change [5] GAO (2006). Personal information: agency and reseller adherence to key privacy principles [6] 정대경 (2012.8) 국내외개인정보보호정책비교분석 : 개인정보보호법률과전담조직을중심으로 [7] 유지연 (2013) 미국데이터브로커 (data broker) 현황 [8] 정용찬 (2015) 빅데이터산업과데이터브로커 [9] 건강보험심사평가원 보건의료빅데이터 [10] 미래창조과학부 (2013) 온라인프라이버시에대한철학적배경과산업적접근 [11] 삼성경제연구소 (2015) 이것이빅데이터기업이다 [12] 조규범 (2006) 미국의프라이버시법제에관한연구 [13] 박정훈 (2013) 잊혀질권리와표현의자유, 그리고정보프라이버시 [14] Federal Trade Commission(1970) Fair Credit Reporting Act [15] 정지훈 (2016) 데이터기반사회 [16] 산업경쟁포럼세미나 (2016.6) 한국지능정보기술산업의국제경쟁력현황및제고방안 [17] OECD(2015) THE FEDERAL BIG DATA RESEARCH AND DEVELOPMENT STRATEGIC PLAN, Data-Driven Innovation Big Data for Growth and Well-Being IT & Future Strategy(7 호 ) 2016. 11
데이터브로커를통해본데이터활용촉진전략방향 25 IT & Future Strategy 보고서 제 1 호 (2016. 3. 31), 지능화시대, 새로운대한민국으로빅디자인하라 제 2 호 (2016. 4. 15), 지능화시대를위한하이브리드융합산업육성방안 제 3 호 (2016. 6. 30), 오피니언리더가전망하는지능정보사회미래와도전과제 제 4 호 (2016. 7. 30), 지능화시대의새로운생산 3 요소 : 데이터 AI 알고리즘 제 5 호 (2016. 7. 30), 한국의지능화준비도측정및분석 : OECD 국가간비교분석 제 6 호 (2016. 11. 7), 스마트시티발전전망과한국의경쟁력 제 7 호 (2016. 11. 30), 데이터브로커를통해본데이터활용촉진전략 1. 본보고서는방송통신발전기금으로수행한정보통신 방송연구지원사업의결과물이므로, 보고서의내용을발표할때는반드시미래창조과학부정보통신 방송연구지원사업의연구결과임을밝혀야합니다. 2. 본보고서내용의무단전재를금하며, 가공 인용할때는반드시출처를 한국정보화진흥원 (NIA) 이라고밝혀주시기바랍니다. 3. 본보고서의내용은한국정보화진흥원 (NIA) 의공식견해와다를수있습니다.