<C7C1B8AEB9CCBEF620B8AEC6F7C6AE313530342DBAF2B5A5C0CCC5CDBBEABEF7B0FA20B5A5C0CCC5CDBAEAB7CEC4BF2DC3D6C1BE2E687770>



Similar documents
< DC1A6C1D6C1BEC7D5BBE7C8B8BAB9C1F6B0FCBBE7BEF7BAB8B0EDBCADC7A5C1F62E696E6464>

< DC1A4BAB8C8AD20BBE7C8B8BFA1BCADC0C720C0CEB1C728C3D6C1BE292E687770>

2007-최종-10월 16일자.hwp

목 차 국회 1 월 중 제 개정 법령 대통령령 7 건 ( 제정 -, 개정 7, 폐지 -) 1. 댐건설 및 주변지역지원 등에 관한 법률 시행령 일부개정 1 2. 지방공무원 수당 등에 관한 규정 일부개정 1 3. 경력단절여성등의 경제활동 촉진법 시행령 일부개정 2 4. 대

종사연구자료-이야기방 hwp

인천광역시의회 의원 상해 등 보상금 지급에 관한 조례 일부개정조례안 의안 번호 179 제안연월일 : 제 안 자 :조례정비특별위원회위원장 제안이유 공무상재해인정기준 (총무처훈령 제153호)이 공무원연금법 시행규칙 (행정자치부령 제89호)으로 흡수 전면 개

<3130BAB9BDC428BCF6C1A4292E687770>

Data Industry White Paper

내지(교사용) 4-6부

7월16일자.hwp

USC HIPAA AUTHORIZATION FOR

화판

기사스크랩 (160504).hwp

산림병해충 방제규정 4. 신문 방송의 보도내용 등 제6 조( 조사지역) 제5 조에 따른 발생조사는 다음 각 호의 지역으로 구분하여 조사한다. 1. 특정지역 : 명승지 유적지 관광지 공원 유원지 및 고속국도 일반국도 철로변 등 경관보호구역 2. 주요지역 : 병해충별 선단

김기중 - 방송통신심의위원회 인터넷 내용심의의 위헌 여부.hwp

<C1B6BBE7BFACB1B D303428B1E8BEF0BEC B8F1C2F7292E687770>


<B5B6BCADC7C1B7CEB1D7B7A52DC0DBBEF7C1DF E687770>

Microsoft Word - 青野論文_李_.doc

입장


DBPIA-NURIMEDIA

0429bodo.hwp

伐)이라고 하였는데, 라자(羅字)는 나자(那字)로 쓰기도 하고 야자(耶字)로 쓰기도 한다. 또 서벌(徐伐)이라고도 한다. 세속에서 경자(京字)를 새겨 서벌(徐伐)이라고 한다. 이 때문에 또 사라(斯羅)라고 하기도 하고, 또 사로(斯盧)라고 하기도 한다. 재위 기간은 6

최우석.hwp

교사용지도서_쓰기.hwp

時 習 說 ) 5), 원호설( 元 昊 說 ) 6) 등이 있다. 7) 이 가운데 임제설에 동의하는바, 상세한 논의는 황패강의 논의로 미루나 그의 논의에 논거로서 빠져 있는 부분을 보강하여 임제설에 대한 변증( 辨 證 )을 덧붙이고자 한다. 우선, 다음의 인용문을 보도록

cls46-06(심우영).hwp

E1-정답및풀이(1~24)ok

<C1B6BCB1B4EBBCBCBDC3B1E2342DC3D6C1BE2E687770>

< BDC3BAB8C1A4B1D4C6C75BC8A3BFDC D2E687770>

untitled

<C0CEBCE2BABB2D33C2F7BCF6C1A420B1B9BFAAC3D1BCAD203130B1C72E687770>


민주장정-노동운동(분권).indd

과 위 가 오는 경우에는 앞말 받침을 대표음으로 바꾼 [다가페]와 [흐귀 에]가 올바른 발음이 [안자서], [할튼], [업쓰므로], [절믐] 풀이 자음으로 끝나는 말인 앉- 과 핥-, 없-, 젊- 에 각각 모음으로 시작하는 형식형태소인 -아서, -은, -으므로, -음

6±Ç¸ñÂ÷

<C3D6C1BE5FBBF5B1B9BEEEBBFDC8B0B0DCBFEFC8A C3D6C1BEBABB292E687770>

초등국어에서 관용표현 지도 방안 연구

177

제주어 교육자료(중등)-작업.hwp

¸é¸ñ¼Ò½ÄÁö 63È£_³»Áö ÃÖÁ¾

01Report_210-4.hwp

<C3D1BCB15FC0CCC8C45FBFECB8AE5FB1B3C0B0C0C75FB9E6C7E D352D32315FC5E4292E687770>



교육 과 학기 술부 고 시 제 호 초 중등교육법 제23조 제2항에 의거하여 초 중등학교 교육과정을 다음과 같이 고시합니다. 2011년 8월 9일 교육과학기술부장관 1. 초 중등학교 교육과정 총론은 별책 1 과 같습니다. 2. 초등학교 교육과정은 별책

시험지 출제 양식

우리나라의 전통문화에는 무엇이 있는지 알아봅시다. 우리나라의 전통문화를 체험합시다. 우리나라의 전통문화를 소중히 여기는 마음을 가집시다. 5. 우리 옷 한복의 특징 자료 3 참고 남자와 여자가 입는 한복의 종류 가 달랐다는 것을 알려 준다. 85쪽 문제 8, 9 자료

상품 전단지

::: 해당사항이 없을 경우 무 표시하시기 바랍니다. 검토항목 검 토 여 부 ( 표시) 시 민 : 유 ( ) 무 시 민 참 여 고 려 사 항 이 해 당 사 자 : 유 ( ) 무 전 문 가 : 유 ( ) 무 옴 브 즈 만 : 유 ( ) 무 법 령 규 정 : 교통 환경 재

2

DBPIA-NURIMEDIA

화이련(華以戀) hwp

ÆòÈ�´©¸® 94È£ ³»Áö_ÃÖÁ¾

歯1##01.PDF

<5BC1F8C7E0C1DF2D31B1C75D2DBCF6C1A4BABB2E687770>

120229(00)(1~3).indd

래를 북한에서 영화의 주제곡으로 사용했다든지, 남한의 반체제세력이 애창한다 든지 등등 여타의 이유를 들어 그 가요의 기념곡 지정을 반대한다는 것은 더 이상 용인될 수 없는 반민주적인 행동이 될 것이다. 동시에 그 노래가 두 가지 필요조 건을 충족시키지 못함에도 불구하고

정보화 산업의 발전단계 : 정보혁명의 진화 정보화 산업의 발전단계 1세기에 두 번 정도의 큰 기술혁명이 이루어져 경제성장의 원동력으로 작용 uit 시대는 정보혁명 중 인터넷 이후의 새로운 기술혁명인 컨버전스 기술이 핵심이 되는 시대 uit 시대는 정보화의 극대화와 타

FSB-6¿ù-³»Áö


> 1. 법 제34조제1항제3호에 따른 노인전문병원 2. 국민건강보험법 제40조제1항의 규정에 의한 요양기관(약국을 제외한다) 3. 삭제< > 4. 의료급여법 제2조제2호의 규정에 의한 의료급여기관 제9조 (건강진단) 영 제20조제1항의 규

<38BFF920BFF8B0ED2DC8F1BFB5BEF6B8B620C6EDC1FDBABB2E687770>

노인복지법 시행규칙

**09콘텐츠산업백서_1 2

2017 1

한울타리36호_완성본


4) 이 이 6) 위 (가) 나는 소백산맥을 바라보다 문득 신라의 삼국 통 일을 못마땅해하던 당신의 말이 생각났습니다. 하나가 되는 것은 더 커지는 것이라는 당신의 말을 생각하면, 대동강 이북의 땅을 당나라에 내주기로 하고 이룩한 통 일은 더 작아진 것이라는 점에서,

주택시장 동향 1) 주택 매매 동향 2) 주택 전세 동향 3) 규모별 아파트 가격지수 동향 4) 권역별 아파트 매매 전세시장 동향 토지시장 동향 1) 지가변동률 2) 토지거래 동향 강남권 재건축아파트 시장동향 15 준공업지역 부동산시장 동향

i4uNETWORKS_CompanyBrief_ key

시장 개방과 자율경쟁 원칙의 규제개혁 (Big Bang)을 했던 사례, 일본이 1998년에 증권업 등록제 등 경쟁 공정 글로벌화를 목 표로 삼아 금융개혁을 했던 사례를 든다. 이는 정부가 금융 빅뱅식 규제개혁을 염두 에 두고 있다는 것을 보여준다. 한편 주요 선진국들은

<C5F0B0E82D313132C8A328C0DBBEF7BFEB292E687770>

무제-1

요 약 문 1. 제목 : 개인정보 오남용 유출 2차 피해 최소화 방안 2. 연구의 배경 개인정보란 살아 있는 개인에 관한 정보로서 개인을 알아볼 수 있는 정보로 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다.


Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

Ⅰ. 머리말 각종 기록에 따르면 백제의 초기 도읍은 위례성( 慰 禮 城 )이다. 위례성에 관한 기록은 삼국사기, 삼국유사, 고려사, 세종실록, 동국여지승람 등 많은 책에 실려 있는데, 대부분 조선시대에 편 찬된 것이다. 가장 오래된 사서인 삼국사기 도 백제가 멸망한지

<BBE7C8B8C5EBC7D BAB8B0EDBCAD295FC3D6C1BE F E687770>

<C0FAC0DBB1C7B4DCC3BCBFACC7D5C8B85F BFACC2F7BAB8B0EDBCAD5FB8E9C1F62CB3BBC1F62E687770>

zb 2) 짜내어 목민관을 살찌운다. 그러니 백성이 과연 목민관을 위해 있는 것일까? 아니다. 그건 아니다. 목민관이 백성 을 위해 있는 것이다. 이정 - ( ᄀ ) - ( ᄂ ) - 국군 - 방백 - 황왕 (나) 옛날에야 백성이 있었을 뿐이지, 무슨 목민관이 있 었던

data_ hwp

<C1A634C2F720BAB8B0EDBCAD20C1BEC6ED20BDC3BBE720C5E4C5A920C7C1B7CEB1D7B7A5C0C720BEF0BEEE20BBE7BFEB20BDC7C5C220C1A1B0CB20C1A6C3E22E687770>

1-2-2하태수.hwp

주류-비주류 프레임으로 본 19대 대선구도 예측 좌클릭-우클릭 논쟁 넘어 새로운 대선방정식 필요 단일대상 프레임의 넘어 듀얼 프레임 필요 본 보고서는 <데일리한국>에 기고한 2017 대선, 좌클릭-우클릭 논쟁 넘어 새로운 듀얼 전략 필요 의 원본 보고서이다(2015년

<C6EDC1FD20B0F8C1F7C0AFB0FCB4DCC3BC20BBE7B1D420B0B3BCB120BFF6C5A9BCF32E687770>

이슈위클리(0315)

망되지만, 논란은 더욱 증폭될 것으로 전망된다. 일단 광주지역 민주화 운동 세력 은 5.18기념식을 국가기념일로 지정 받은 데 이어 이 노래까지 공식기념곡으로 만 들어 5.18을 장식하는 마지막 아우라로 활용한다는 계획이다. 걱정스러운 건 이런 움직임이 이른바 호남정서

IT & Future Strategy 보고서 는 21세기 한국사회의 주요 패러다임 변화를 분석하고 이를 토대로 미래 정보사회의 주요 이슈를 전망, IT를 통한 해결 방안을 모색하기 위해 한국정보화진흥원 (NIA) 에서 기획, 발간하는 보고서입니 다. NIA 의 승인 없

올바른 먹거리 유통과 건강한 식문화 창조를 통해 함께하는 행복한 내일을 꿈꾸는 서울특별시농수산식품공사입니다 CONTENTS 마음에 그린 마켓, 함께하는 행복한 내일 지속가능경영 전반 CEO 인사말 하이라이트 06 공사 소개 10 위험과 기회 12 비전 및

KISO저널 원고 작성 양식

PowerPoint 프레젠테이션

歯연보00-5.PDF

소규모 비즈니스를 위한 플레이북 여기서 다룰 내용은 다음과 같습니다. 1. YouTube 소개 2. YouTube에서 비즈니스를 위한 채널 만들기 3. 눈길을 끄는 동영상 만들기 4. 고객의 액션 유도하기 5. 비즈니스에 중요한 잠재고객에게 더 많이 도달하기

< B5BFBEC6BDC3BEC6BBE E687770>

<33C6E4C0CCC1F620C1A63139C8A320B8F1C2F72E687770>

#제일기획 4월호

< FC1A4BAB8B9FDC7D D325FC3D6C1BEBABB2E687770>

슬라이드 1

Transcription:

빅데이터 산업과 데이터 브로커 정 용 찬 정보통신정책연구원 ICT 통계분석센터장 *ycjung@kisdi.re.kr, 043-531-4160 *고려대학교 응용통계학 박사 * 전) DNI 컨설팅 이사(CRM 담당) * 전) 방송위원회 연구센터 연구위원 빅데이터 산업과 데이터 브로커 디지털 경제의 확산으로 형성된 빅데이터 환경에서 데이터는 부를 창출하는 새로운 자원으로 주목받고 있다. 미국의 경우 데이터 산업 발전 과정에서 소비자의 개인 정보를 수집해서 제3 자와 공유하거나 재판매하는 기업을 의미 하는 데이터 브로커(Data Broker) 가 등장하게 되었다. 미국 데이터 브로커 산업의 특징은 광범위한 데이터 원천으로부터 다양한 소비자 데이터를 수집, 유통하고 있지만 대부분의 경우 소비자가 이를 정확 하게 인지하지 못하고 있다는 점에 있다. 미국 공정거래위원회(FTC) 는 데이터 브로커산업의 투명성 부족 에 주목하고 의회에 소비자가 데이터 브로커의 존재와 활동을 인지하고, 이들이 보유하고 있는 개인 정보에 합리적으로 접근할 수 있도록 돕는 법률 제정을 권고했다. 우리나라는 미국처럼 데이터 브로커 산업이 활성화되지 않았지만 데이터 기반(data-driven) 패러다임 이 확산될수록 사회 전 분야에서 데이터의 수 집과 활용에 대한 요구는 급증할 것으로 전망된다. 정보 약자 인 소비자의 자기정보에 대한 권리 강화는 규제 강화 가 아닌 정보 유통의 투명성 제고 이고, 데이터 유통 활성화와 산업 발전도 소비자 신뢰에 기반 할 때 가능하므로 빅데이터 시대에 부합하는 개인정보 보호의 범위와 수준에 대한 사회적 합의를 위한 논의가 필요하다. 데이터 유통 활성화를 위해서는 데이터 보안, 암호화, 비식별화 등 개인 정보보호를 위한 기술 개발이 필수적이며, 일상이 곧 데이터 를 의미하는 데이터 기반 사회를 대비하기 위한 국가 차원의 데이터 역량 강화 전략 수립이 시급하다.

빅데이터 산업과 데이터 브로커 1. 머리말 사람들의 행동은 물론 생각까지도 데이터로 축적되는 빅데이터(Big Data) 시대에 효과적으로 대응하기 위해 주요국 정부는 공공 정보의 전면적인 개방과 데이터 활용을 통한 가치 창출을 국가 전략으로 삼고 새로운 혁신을 도모 - 영국 정부의 오픈데이터 정책 과 데이터 역량 강화 전략 은 데이터 활용을 통해 새로운 성장 동력을 찾기 위한 노력임(BIS 2014; HM Government 2013) - 미국 정부도 빅데이터: 기회 포착과 가치 보호(Big Data: Seizing Opportunities, Preserving Values) 보고서에서 삶의 질을 높이면서 동 시에 개인의 프라이버시를 보호하기 위한 빅데이터 정책을 천명 (White House 2014) 디지털 경제의 확산으로 형성된 빅데이터 환경에서 데이터는 부를 창출 하는 새로운 자원 으로 주목받고 있음 - 정부가 공개한 오픈데이터를 활용한 벤처 기업이 빠른 성장으로 큰 부가가치를 창출하는 기업으로 성공하는 사례도 나타남 - 1 억 천만 건이 넘는 미국 주택 데이터베이스를 기반으로 온라인 부동산 장터 서비스를 개설한 벤처기업(Zillow) 의 시가총액이 30억 달러에 달하며, 미국 정부의 작물재배 현황과 날씨 정보, 토양 데이터를 활용 하여 농부들에게 정보를 제공한 벤처기업(Climate Corp) 을 몬산토가 2013년 9억 3 천만 달러에 인수한 사례가 있음(The World Bank 2014, 11-12) 디지털경제는 인터넷 경제( Internet Economy), 신 경제(the New Economy), 웹 경제(Web Economy)로도 불리는데 전자상거래, 인터넷 쇼핑몰, 검색 서비스 등과 2

1. 머리말 같이 인터넷을 비롯한 정보통신기술(ICT) 을 기반으로 이루어지는 경제활동을 의미. 70개국을 대상으로 한 디지털경제 순위 조사에서 우리나라는 13위를 차지 (Economist Intelligence Unit 2010, 4). 민간 기업은 1990년대부터 데이터의 중요성을 인식하고, 고객 데이터를 축적, 분석하여 다양한 마케팅 활동을 추진하는 고객관계관리(CRM, Customer Relationship Management) 를 실행( 정용찬 2012, 6) - 미국의 경우 이 과정에서 데이터를 수집, 분석, 가공하는 서비스를 제공 하는 데이터 브로커가 등장하게 되었으며 빅데이터 환경에서 급성장 하고 있는 이들을 주목하기 시작함 - 미국 회계감사원(GAO) 은 상원의 요청에 따라 데이터 브로커의 성장 에 따른 소비자 프라이버시 보호법 개선 방향에 대한 보고서를 작성 (U. S. GAO 2013). 미 의회도 급성장하고 있는 데이터 브로커 산업 의 잠재적 위험과 혜택을 평가하고 적절한 소비자 보호 조치를 위한 정책입안자의 지속적인 관리감독의 중요성을 강조하는 보고서를 발표 (Majority Staff of Senate Committee 2013, 36) - 이러한 사회 분위기를 반영하여 미국 공정거래위원회는 9개 주요 데 이터 브로커에 대한 조사를 통해 산업 실태를 파악한 보고서를 발표 (FTC 2014) 본 리포트는 미국 데이터 산업 생태계의 핵심 역할을 담당하고 있는 데이터 브로커의 실태 파악을 통해 빅데이터 산업 활성화와 프라이버시 보호가 조화를 이루기 위한 정책 방향을 모색해 보고자 함 3

빅데이터 산업과 데이터 브로커 2. 데이터 브로커의 정의와 특징 가. 빅데이터 산업과 데이터 브로커 빅데이터 산업은 부가가치 창출을 위해 빅데이터의 생산, 유통, 활용, 관리 등과 관련된 서비스를 제공하는 산업을 의미( 정용찬 외 2014, 31) - 빅데이터 산업은 데이터를 매개로 하는 산업의 특성을 감안할 때 기반 산업, 지원산업, 활용산업으로 분류 < 1> 대분류 중분류 주요 기업 빅데이터 관련 장비 제조업 IBM, HP, EMC 등 기반산업 빅데이터 관련 소프트웨어 개발업오러클, SAS, SPSS 등 빅데이터설비 임대/ 운영대행업 구글, 아마존, MS 등 지원산업 활용산업 시스템구축 및 솔루션 제공업 컨설팅 및 사업서비스업 기타 지원업 데이터유통업 데이터가공업 기타 활용업 자료: 정용찬 외(2014) 의 31-32쪽에서 인용 IBM, 오러클, SAS 등 Axiom, Corelogic, Datalogix 등 디지털 경제에서 빅데이터(Big Data) 는 거대 산업이며, 데이터 브로커 (Data Broker) 는 빅데이터 생태계에서 중요한 역할을 담당(FTC 2014, i) - 정보 재판매업자(information resellers) 로도 불리는 데이터 브로커란 소비자의 개인 정보를 수집해서 그 정보를 제3자와 공유하거나 재판 매하는 기업을 의미(FTC 2014, i) - 빅데이터산업 분류의 관점에서 데이터 브로커는 데이터유통업과 데이터 가공업을 의미하는 활용산업에 해당 4

2. 데이터 브로커의 정의와 특징 미국의 경우 인터넷이나 이메일이 등장하기 전부터 마케팅을 목적으로 소비자 데이터를 수집하고 판매하는 비즈니스 영역이 존재 - 우편 발송을 통한 직접 판매(direct mail) 의 적중률을 높이기 위해 우편 번호(ZIP code) 의 지역 구분과 잡지 구독, 식품 소비 유형, 정치성향 등 개인 정보를 연결하려는 다양한 시도가 진행(Majority Staff of Senate Committee 2013, 1) 대표적인 사례로는 1974 년 Jonathan Robbin 이 개발한 PRIZM(Potential Rating Index for Zip Markets) 으로 3만 6 천개의 우편번호를 센서스 데이터, 소비자 조사 데이터와 결합하여 40 개의 그룹으로 분류(Weiss 1988, 3-5). 현재 PRISM 은 미국 인을 생활양식에 따라 62 개의 그룹으로, 사회경제적 요인별로 15 개의 그룹으로 분류(Weiss 2000, 11-13) - 이후 우편물을 통한 마케팅뿐 아니라 전화 마케팅 등의 목적을 위해 공공 정보, 사회 조사 결과 등을 활용한 소비자 정보의 축적이 진행 되었으며 인터넷의 등장과 전자 결제, 스마트폰의 확산으로 수집되는 소비자 정보의 양이 급속도로 확장 이러한 역사적 배경을 지닌 미국의 데이터 유통 시장의 존재는 그동안 일정 부분 베일에 가려져 있어 투명성에 대해 논란이 있었음(Singerjune 2012) - 미국 공정거래위원회(FTC) 는 대표적인 데이터 브로커인 데이터로직 스와 페이스북과의 개인정보 관련 협업과정에서 프라이버시 이슈를 위반했는지에 대해 조사할 것을 요구 받기도 함(Mills 2012) - 회계감사원(GAO) 은 현재의 프라이버시 관련 법안이 마케팅 목적으로 소비자 데이터를 수집, 이용, 판매하는 행위에 대해 제한적으로 접근 하고 있기 때문에, 민간 기업이 취급하고 있는 소비자 정보의 수집과 판매에 관한 포괄적인 프라이버시 법안의 필요성을 제기(U. S. GAO 2013, 4) 5

빅데이터 산업과 데이터 브로커 - 의회를 비롯해서 데이터 브로커 산업에 대한 투명성 요구가 확산되자 공정거래위원회(FTC) 는 데이터 브로커 기업을 대상으로 조사를 벌여 비즈니스 실체를 공개하는 등 투명성 강화에 노력을 기울임 나. 주요 데이터 브로커와 데이터 수집 데이터 브로커가 수집하는 소비자 데이터는 온라인과 오프라인 전 영역에 걸쳐 다양한 유형을 포함하고 있음 - 오프라인 상점은 물론 온라인 쇼핑몰에서의 구매 내역, 웹사이트의 등록 정보, 블로그, 홈페이지의 공개 정보, 주택 구매와 같은 공공정보에 이르기까지 소비자와 관련된 다양한 행동 정보가 데이터 브로커에 의해 수집되고 있음( 그림 1 ) 미국 공정거래위원회(FTC) 가 조사한 데이터 브로커는 빅데이터 분석을 통해 오바마 미 대통령의 당선을 도운 것으로 알려진 Axiom 을 비롯해 Corelogic, Datalogix, ebureau, ID Analytics, Intelius, PeekYou, Rapleaf, Recorded Future 의 9개 회사임 - FTC조사의 의하면 데이터 브로커는 미국은 물론 전 세계 소비자와 관련된 다양한 데이터를 수집, 분석, 가공하여 마케팅과 광고, 부정거래 탐지 등을 지원하기 위한 다양한 서비스를 제공 중(< 표 2>) 6

2. 데이터 브로커의 정의와 특징 1 자료: FTC(2014) 의 p. 2. 7

빅데이터 산업과 데이터 브로커 < 2> (FTC ) 회사명 특징 - 마케팅캠페인 부정사용 탐지를 위한 고객데이터 분석 서비스 제공 Acxiom, - 전 세계 7억 명의 소비자 정보가 담긴 데이터베이스 보유 - 산업계와 정부에 재무정보와 부동산정보에 기초한 분석서비스 제공 Corelogic - 약 8 억 건의 부동산 거래정보, 약 1억 건의 담보 데이터베이스 보유 - 거의 모든 미국 소비자의 마케팅 데이터를 제공 Datalogix - 2012년 페이스북은 페이스북 이용자의 소셜사이트 상품광고 조회와 오프 라인 상점의 구매 관련성 측정 위해 데이터로직스와 협력 발표 - 마케터와 재무관련 회사, 온라인유통업체에 수익성이 높은 잠재 고객과 ebureau 부정 거래 예측 서비스 제공 - 매달 평균 30억 건이 넘는 새로운 정보 추가 축적 - 특정인 확인 부정 거래 확인 서비스 제공 ID Analytics, - 7천억 건의 데이터와 14억 건의 소비자 거래 데이터 보유 - 신원 조회와 공문서 정보 제공 Intelius - 20억 건이 넘는 데이터베이스 보유 PeekYou - 소셜미디어사이트, 홈페이지, 블로그의 콘텐츠를 분석 작성자 확인 서비스 제공 Rapleaf Recorded Future - 이메일 주소와 함께 이메일 주소 소유자의 연령, 성, 우편번호, 소득, 결혼 여부, 자녀 여부와 취미, 구매 유형 등 정보 제공 - 소비자와 기업의 과거 이력 데이터 분석을 통해 미래 행동 예측 정보 제공 자료: FTC(2014) 의 pp. 8-9와 각 사별 홈페이지를 참고하여 작성 8

3. 데이터 취득과 가공 3. 데이터 취득과 가공 가. 데이터 취득 조사 대상 9개 기업 모두 소비자로부터 직접 데이터를 수집하지 않는 특징을 보임 - 주요 데이터 취득 원천은 (1) 정부 데이터, (2) 그 외 공개된 정보, (3) 민간 데이터로 구분 가능(FTC 2014, 11) 정부 데이터는 연방정부와 주정부, 지방정부로부터 수집 - 연방정부 데이터로는 센서스국(U.S. Census Bureau) 의 인구통계정보와 주소, 선거구 등 행정 정보, 사회보장국(Social Security Administration)의 사망자 명부 정보, 우편서비스(U.S. Postal Service) 의 주소 변경 정보, 연방법원의 파산 정보를 활용 - 주정부와 지방정부 데이터로는 전문직 면허 정보, 부동산, 유권자, 자동차 등록, 법원 정보 등이 대표적 - 민간 상업 정보로는 소매업과 카탈로그 회사의 거래 내역, 잡지사의 구독자 정보, 전자상거래, 뉴스, 여행 사이트, 금융회사의 거래 정보, 다른 데이터 브로커의 보유 정보 등이 해당 9

빅데이터 산업과 데이터 브로커 분야 < 3> 데이터 - 센서스국(U.S. Census Bureau) : 특정 도시나 구역의 인종, 연령, 교육수준, 가족 구성, 수입, 직업, 통근 시간, 도로, 주소, 행정 구역, 선거구, 학군 정보 연방정부 - 사회보장국(Social Security Administration) : 사망자 이름, 사회 보장번호, 사망일 - 우편서비스(U.S. Postal Service) 의 주소 변경 이력 정보 - 연방법원 : 파산 정보 정부 - 전문직 면허( 의사, 변호사, 조종사, 건축사) 정보와 사냥, 낚시 면허 정보 - 부동산 : 세무, 주택소유권과 담보, 소유자 정보, 부동산 세부 주정부 내역 정보( 욕실 수, 침실 수, 수영장 유무 등) 지방정부 - 유권자 등록정보 : 이름, 주소, 생일, 가입 정당 - 자동차등록정보와 운전 기록 - 법원 : 범죄 기록, 민사 소송, 출생, 결혼, 이혼, 사망 기록 - 전화번호부 보도자료 블로그와 소셜미디어사이트 링크드인과 공개정보,, ( 같은 공개형) 등 인터넷에 올린 개인정보 - 소매업, 카탈로그회사의 거래내역, 품목( 예를 들어 고가의 구두, 친환경식품 등), 구매일자, 결재 방법 데이터 - 잡지사의 구독자 데이터 상업정보 - 전자상거래, 뉴스, 여행 사이트의 고객 이름, 이메일, 우편번호 정보 - 금융서비스회사의 거래 데이터 - 다른 데이터 브로커가 보유한 데이터 자료:FTC(2014) 의 pp. 11-14의 내용 요약 대부분의 데이터 브로커는 정부, 공개정보, 상업정보로부터 데이터를 확보하고 있으며 데이터 브로커 회사 간의 데이터 유통도 활발함( 그림 2 ) - 다른 데이터 브로커와 데이터를 거래하지 않는 회사는 조사 대상 9개 사 중 1개사에 불과 데이터 수집 방법으로는 웹으로부터 크롤링(web crawling), 구매 등을 활용 인쇄정보 10

3. 데이터 취득과 가공 - 인쇄정보로는 전화번호부, 지방정부 기록 등이 해당 - 데이터 취득 과정에서 데이터 브로커가 필요한 정보만을 선별적으로 구매하지 못하는 과잉 취득 상황도 발생 웹 크롤링(web crawling) 은 봇(bots), 웜(worms), 웹 스파이더(web spider), 웹 로봇 (web robot) 등으로 불리는 웹 크롤러(web crawler) 가 자동화 방법으로 월드 와이드 웹을 탐색하여 필요 정보를 찾아내는 것을 의미( 위키피디아 ) - 수집된 데이터는 데이터 특성에 따라 실시간, 일간, 주간, 월간 등 기간 별로 현행화(update) 2 자료: FTC(2014) 의 p. 15. 여기서 G 는 정부, P 는 공공, C 는 상업 정보 원천을 의미. 1 9는 FTC가 조사한 9 개 데이터 브로커 회사를, 화살표는 데이터 브로커 간의 데이터 이전 경로를 의미. 11

빅데이터 산업과 데이터 브로커 나. 데이터 가공 수집된 데이터는 기존 데이터와 연결, 가공, 재분류 등 판매를 위한 상품 화의 과정을 거침(FTC 2014, 19) - 데이터 브로커는 고객에게 원데이터를 판매하기도 하지만 고객 특성을 분석하여 새로운 고객군(segment) 정보를 생성 판매함 고객군 정보를 생성하는 방법으로는 유사한 특성을 가진 고객군으로 분류하기 위해 데이터를 요소별로 결합하거나, 고객의 행동을 예측하기 위한 모형을 개발함(FTC 2014, 19-21) - 예를 들어 사커맘 (soccer mom) 고객군은 자녀가 있고 최근 2 년 이내에 스포츠 용품을 구매한 경험이 있는 21세에서 45세 사이의 여성을 의미 - 또한 최근 1 년 이내에 캠핑 장비를 구매한 경험이 있는 고객의 정보를 분석하여 공통 특징을 발견하여 캠핑 장비를 구매할 가능성이 있는 고객 을 발굴 - 이들이 개발한 고객군은 부유한 베이비부머(baby Boomer), 알러지로 고통 받는 사람, 친구가 250 명이 넘는 트위터 사용자 등과 함께 소수 인종, 고연령층, 저소득층도 분류 segment 는 마케팅 용어로 특성별로 분류된 집단을 의미하며 이렇게 분류하는 과정을 세분화 (segmentation) 라고 표현 고객데이터는 일반적으로 인구통계정보, 취미, 구매 습관 등 개인 정보 (individual consumer profile) 단위로 저장되나, 경우에 따라 은행 계좌 개설 등과 같은 특정 이벤트 단위로 저장하기도 함 12

4. 서비스 유형과 구매자 4. 서비스 유형과 구매자 가. 제공 서비스 데이터 브로커가 제공하는 상품은 (1) 마케팅, (2) 리스크 경감(risk mitigation), (3) 사람 찾기의 세 범주로 구분(FTC 2014, 23) - 9개 데이터 브로커의 총매출은 2012년 기준 4억2 천6 백만 달러( 한화로 약 4570 억원) 규모로 이 중에서 마케팅 분야가 약 1억9 천6 백만 달러에 달함(FTC 2014, 23) 3 9 (2012, : $) 마케팅 상품 마케팅 상품은 소비자에게 맞춤형 마케팅 메시지를 전달하는 과정에 도움을 주기 위한 목적으로 직접마케팅(direct marketing), 온라인 마케팅, 마케팅 분석으로 구분(FTC 2014, 23) 13

빅데이터 산업과 데이터 브로커 직접마케팅(direct marketing) 상품은 데이터 추가 제공(data append) 과 마케팅 명부(marketing list) 작성으로 구성(FTC 2014, 23) - 데이터 추가 제공이란 데이터 브로커가 고객의 의뢰를 받아 고객이 가지고 있는 명단에 필요한 항목을 추가로 제공하는 것을 의미 - 예를 들어 이름과 주소정보만 가지고 있는 고객 명부에 전화번호와 구매 습관 정보, 이메일정보 등을 추가하여 우편 발송을 통한 직접 판매 ( direct mail), 텔레마케팅, 이메일 마케팅 캠페인 등에 활용할 수 있도록 제공. 경우에 따라서 집전화나 휴대전화 이메일 주소 정보를 가지고 있을 경우 소유자의 이름과 주소 정보를 결합하여 제공하기도 함 - 데이터 브로커가 제공하는 정보로는 연령, 성, 직업과 같은 인구통계 정보뿐 아니라 키, 몸무게, 흡연 여부, 자녀 유무, 신용카드 사용, 부 동산 담보 유형 등 개인과 가족 정보는 물론 인종, 종교, 정치성향과 같은 민감한 정보도 포함되어 있음 - 마케팅 명부 작성 상품은 최소한 두 명 이상의 자녀가 있는 가정, 특 정 종류의 차를 소유하고 있는 여성, 당뇨병에 관심이 있는 사람 등과 같이 특정한 조건에 해당되는 소비자의 명부를 작성하는 것을 의미. 명부는 마케팅 목적에 따라 이름과 주소 (direct mail 용도), 이름과 전화 번호( 텔레마케팅 용도), 이메일 주소( 이메일 마케팅 용도) 정보를 제공 온라인 마케팅(online marketing) 지원 상품은 인터넷, 모바일 기기, 케 이블과 위성TV 를 통해 효과가 가장 높은 고객군을 선별, 마케팅이나 광고 활동을 지원하기 위한 데이터 상품을 의미. 온라인 마케팅 지원 상품은 등록 고객 타게팅 (registration targeting) 과 협업 타게팅(collaborative targeting) 으로 구분(FTC 2014, 26) - 등록 고객 타게팅은 특정 목적의 마케팅을 위해 인터넷 업체의 고객 명단을 데이터 브로커에게 보내면 이 중에서 가능성이 있는 고객을 14

4. 서비스 유형과 구매자 선별해주는 서비스 - 협업 타게팅은 인터넷에 기반한 두 사업체가 협업을 원하지만 각자의 고객 정보를 공유하기를 원치 않을 경우 데이터 브로커가 중간에서 두 사업체의 고객 정보를 결합, 분석하여 각 기업이 필요로 하는 정보를 제공 마케팅 분석(marketing analytics) - 마케팅 분석이란 고객 데이터 분석을 통해 행동을 예측하는 것을 목 적으로 한 서비스를 의미. 이를 통해 특정 상품이나 브랜드를 판매하 거나 홍보하기 위해서는 어떤 미디어 채널( 온라인, 신문, TV 등이 ) 적합 한지, 어떤 지역이 최적인지 조언을 하며, 광고 효과에 대한 분석 서비스를 제공하기도 함(FTC 2014, 31) 리스크 경감 리스크 경감 서비스는 고객으로부터 발생할 수 있는 위험(risk) 을 감소 시키기 위한 서비스로 신원 식별(identity verification) 과 사기 탐지 (fraud detection) 로 구분(FTC 2014, 32) 데이터 브로커의 신원 식별 서비스는 은행과 같은 금융기관이 고객이 거래하는 시점에서 자사 고객의 신원을 인증하는데 도움을 주기위해 거래 건별로 위험 점수를 산출, 제공하는 등의 방법으로 신원 확인을 지원 사기 탐지는 소비자가 회사에 제출한 이메일 주소 등의 정보가 정확한 지를 확인하는 것과 같은 민간 영역뿐 아니라 정부보조금 지원을 받기 위해 공공 기관에 제출한 소득 정보의 진위 여부도 판단하는 등 공공 부문에도 활용(FTC 2014, 33-34) 15

빅데이터 산업과 데이터 브로커 사람 찾기 사람 찾기 서비스는 기업이 보유하고 있는 고객에 대한 세부 정보를 제공하는 서비스로 주로 정부나 소셜미디어 사이트와 같이 공개된 정 보를 기초로 작성된 다양한 정보로 구성되는데 여기에는 이름, 주소, 전화번호, 이메일 주소와 같은 정보 이외에 결혼 기록, 생년월일, 범죄 전과, 이혼 경력, 주소 이력, 취미 / 관심사, 부동산 소유와 거래 내역, 친지, 고용 기록, 재산 소유 내역과 거래 정보 등이 포함(FTC 2014, 34) 나. 데이터 구매자 데이터 브로커의 서비스를 이용하는 구매자는 자동차, 에너지, 교육, 의료, 보험, 통신, 미디어, 금융 등 다양한 산업을 포괄 - 민간 영역뿐 아니라 지방정부와 주정부, 연방정부와 같은 공공 기관, 자선단체와 대학교와 같은 비영리조직도 데이터 구매자에 포함되어 있는 점이 특징(Majority Staff of Senate Committee 2013, 29) 16

4. 서비스 유형과 구매자 < 4> 구분 다이렉트 온라인 마케팅 마케팅 마케팅 분석 개인 식별 사기 탐지 사람 찾기 변호사/ 수사관 자동차산업 데이터 브로커 교육기관 에너지 정부 관광여가 개인고객 보험 대출기관/ 금융 마케팅/ 광고 미디어 비영리/ 정치캠페인 제약 부동산 소매 기술기업 통신 자료: FTC(2014) 의 pp. 39-40의 표 일부 17

빅데이터 산업과 데이터 브로커 5. 시사점데이터 : 생태계와 데이터 브로커 미국 데이터 브로커 산업의 특징을 요약하면 광범위한 데이터 원천으 로부터 다양한 소비자 데이터를 수집, 유통하고 있지만 대부분의 경우 소비자가 이를 정확하게 인지하지 못하고 있다는 점 - 데이터 브로커는 거의 모든 미국 소비자와 관련된 데이터를 수집하고 있으며 데이터 브로커 간에도 이를 유통시키는 등 데이터 거래관계가 복잡하여 소비자의 입장에서는 자신의 데이터가 어떤 경로를 통해 유통 되는지 파악하기 곤란한 상황 - 특히 다양한 소비자 정보를 연결하여 분석하는 과정에서 민감한 프라이 버시 문제를 야기할 가능성이 상존. 예를 들어 소비자의 행동 데이터 분석을 통해 다양한 고객군(segment) 으로 분류하는데 이 중에는 출산 예정, 당뇨병 관심과 같이 민감한 추론 정보도 존재 사기 방지, 개인 기호에 부합하는 상품 추천, 맞춤형 광고 제공 등 데이터 브로커의 활동으로부터 소비자가 얻는 이득도 동시에 존재함 - 분실된 신용카드를 제3자가 부정 사용할 경우 이상 거래임을 감지하 거나, 기존의 광고 시스템에서는 홍보하기 어려운 혁신적인 소기업의 제품을 필요로 하는 사람에게 광고로 전달하거나, 오랫동안 연락이 끊 겼던 지인 찾기 등은 소비자의 입장에서 유용한 서비스임 - 물론 이 과정에서 소비자가 피해를 입을 가능성도 존재함. 예를 들어 오토바이 매니아 나 당뇨병 관심 고객군으로 분류될 경우 맞춤형 광 고를 통해 필요한 제품 정보와 할인 기회를 얻을 수 있지만 보험사는 이러한 고객을 고위험군으로 분류할 가능성이 있음 - 특히 이러한 분석 정보는 수집된 다양한 데이터를 기초로 분석과정을 통해 얻은 추론 결과이므로 원천 데이터에 오류가 있거나 추론 결과가 18

5. 시사점 : 데이터 생태계와 데이터 브로커 틀릴 경우 해당 소비자가 불이익을 입을 수 있으며, 경우에 따라 불이 익을 당하는 소비자가 그 이유를 알지 못할 수 있음 미국 공정거래위원회는 데이터 브로커산업 조사 과정에서 투명성 부 족 에 주목하고 이를 강화하기 위해 의회에 소비자가 데이터 브로커의 존재와 활동을 인지하고, 이들이 보유하고 있는 개인 정보에 합리적으로 접근할 수 있도록 하는 법률을 제정할 것을 권고함 - 즉 데이터 브로커가 보유하고 있는 개인 정보에 대해 소비자가 접근 할 수 있도록 하고, 마케팅 목적으로 개인정보를 공유할 경우 소비자가 이를 거부할 수 있도록 제안 프라이버시를 기본 인권으로 인식하고 있는 유럽과 달리 미국은 사고 팔 수 있는 상품으로 간주하고 있으며 이러한 차이는 각 국가의 역사적 배경과 연관되어 있음(Craig & Ludloff 2011, 78-79) - 이러한 인식의 차이로 미국의 경우 프라이버시는 일종의 자산으로 프라 이버시의 침해에 대한 판단은 그로 인한 손실의 존재 여부에 달려 있음 - 최근 미국 공정거래위원회의 데이터 브로커 산업에 대한 투명성 강화 방침은 공정거래위원회가 데이터 브로커 산업에 대해 조사를 시작한 20년 전과 비교할 때 비약적으로 발전한 데이터 산업의 위상에 부합 하는 투명성과 소비자 통제권의 강화 필요성을 인식했기 때문임 우리나라의 경우 미국처럼 데이터 브로커 산업이 활성화되지 않았지만 데이터 기반(data-driven) 패러다임 이 확산될수록 사회 전 분야에서 데이터의 수집과 활용에 대한 요구는 급증할 것으로 전망 - 다양한 소비자 정보를 보유하고 있는 기업에 비해 정보 약자인 소비 자의 자기정보에 대한 권리 강화는 규제 강화 가 아닌 정보 유통의 투명성 제고 이고, 소비자 신뢰 확보를 기반으로 할 때 데이터 유통 활성화와 빅데이터 산업 발전이 가능( 정용찬 외 2014, 133) 19

빅데이터 산업과 데이터 브로커 - 방송통신위원회는 개인정보의 오 남용을 방지하면서, 빅데이터 산업의 활성화를 목적으로 빅데이터 개인정보보호 가이드라인 발표. 이를 계기로 빅데이터 시대에 부합하는 개인 정보의 유통과 활용, 개인정보 보호의 범위와 수준에 대한 사회적 합의를 위한 논의가 지속되어야 함 개인정보 보호의 범위는 사회의 역사적 배경과 제도에 따라 가변적임. 예를 들어 부패인식지수 조사에서 청렴도 최상위 국가군에 속하는 핀란드의 경우 개인 소득과 납세 정보는 누구나 확인 가능한 공개 정보임 데이터 유통 활성화를 위해서는 데이터 보안, 암호화, 비식별화 등 개인 정보보호를 위한 기술 개발이 중요함 - 미국 오바마 행정부는 프라이버시 기술 관련 연구개발을 위해 국립과학 재단, 국립보건원, 국토안보부, 국가안보국 등 관련 기관을 중심으로 매년 7천7 백만 달러의 예산을 집행(White House 2014, 55) 주요 사업으로는 익명화 기술, 프라이버시 보호 데이터 통합, 프라이버시를 위한 데이터 세분화, 보건데이터 익명화 보호, 클라우드 컴퓨팅 데이터 통합 데이터 마이닝을 위한 프라이버시 솔루션 등이 있음 - 우리 정부도 빅데이터 산업 발전 전략 에서 빅데이터 기술 핵심 7대 분야 중 하나로 제시한 익명화 처리 등 개인정보보호 기술 개발의 실행을 통해 프라이버시 보호와 관련된 원천 기술 확보가 시급( 관계 부처 합동 2013) 온라인 거래의 확산과 디지털 콘텐츠 이용의 확대, CCTV와 사물인터 넷의 증가로 우리 환경은 일상이 곧 데이터 를 의미하는 데이터 기반 사회로 진화하고 있으며 이를 효과적으로 대처하기 위한 국가 차원의 전략 수립이 필요 - 빅데이터 환경에서는 대용량 데이터의 처리 속도와 함께 다양한 데이 터의 조합을 통한 정확한 예측 능력이 곧 글로벌 경쟁력이며 이러한 원천 기술의 유무가 국가 경쟁력의 척도로 작용 20

5. 시사점 : 데이터 생태계와 데이터 브로커 - 데이터 기반 사회에서도 인적 자원의 중요성은 여전하며, 데이터 과학자 (Data Scientist)' 와 같은 전문가 양성과 함께 국민 개개인의 데이터 역량 강화를 위한 국가 전략이 필요 영국은 데이터 역량 강화 전략 (A strategy for UK data capability) 의 핵심을 초 중등 교육 과정 개혁과 빅데이터 활용 선도 역할을 수행할 공무원 교육 강화로 선정(HM Government 2013, 20-28) 21

빅데이터 산업과 데이터 브로커 참 고 문 헌 < 국내 문헌> 관계부처 합동 (2013), 창조경제 및 정부3.0 지원을 위한 빅데이터 산업 발전 전략. 정용찬 (2012). 빅데이터 혁명과 미디어 정책 이슈. KISDI Premiun Report 2012-02. 정보통신정책연구원. (2013) 빅데이터 커뮤니케이션북스. 정용찬 한은영 (2014). 빅데이터 산업촉진 전략 연구: 해외 주요국 정부 사 례를 중심으로. 정보통신정책연구원. < 국외 문헌> BIS (2014). "Open Data Strategy: 2014-2016." Craig, T and Ludloff, M. E. (2011). Privacy and Big Data. O Reilly. Economist Intelligence Unit (2010). Digital Economy ranking 2010: Beyond e-readiness. Federal Trade Commission (2014). "Data Brokers: A Call for Transparency and Accountability." HM Government (2013). "Seizing the data opportunity: A Strategy for UK data capability." Majority Staff of Senate Committee on Commerce, Science, & Transportation, Office of Oversight & Investigations (2013). "A Review of the Data Broker Industry: Collection, Use, and Sale of Consumer Data for Marketing Purposes." Mills, Elinor(2012). "Privacy experts to ask FTC to probe Facebook- Datalogix deal", (Sep. 24). http://www.cnet.com/news/privacyexperts-to-ask-ftc-to-probe-facebook-datalogix-deal/ 22

참고문헌 Singerjune, Natasha (2012). Mapping, and Sharing, the Consumer Genome. New York Times (June 16). http://www.nytimes.com/ 2012/06/17 /technology/acxiom-the-quiet-giant-of-consumer-databasemarketing.html United States Government Accountability Office (2013). "Information Resellers: Consumer Privacy Framework Needs to Reflect Changes in Technology and the Marketplace. Weiss, J. Michael (1988). The Clustering of America. Harper & Row Publishers. (2000). The Clusteed World. Little, Brown and Company. White House (2014). "Big Data: Seizing Opportunities, Preserving Values." The World Bank (2014). "Open Data for Economic Growth." 23