빅데이터 기반 융합 서비스 창출 주요 정책 및 시사점 1) 장병열 연구원 연구위원 jangpy@stepi.re.kr 김영돈 연구원 연구원 dony@stepi.re.kr Ⅰ. 서론 박근혜정부는 과학기술을 통한 창조산업 육성을 국정방향으로 설정하고 있다. 이러한 창조산업 육성을 위해 과거 기술 지식 확보가 목표인 분절형 R&D에서 신산업 창출을 위한 생태계 창조형 R&D로의 변화가 강조되고 있다. 과학기술과 아이디어 및 상상력을 융합한 신산업 창출을 통해 신 성장동력 발굴, 사회이슈해결, 실용기술 활용, 거대 전략기술 기반산업 육성 등의 과제 해결을 도모 하고 있으며, 특히 빅데이터를 활용한 공공 및 민간 서비스 확대와 이를 통한 서비스 산업 육성이 국정과제로 제시되었다. 빅데이터는 양(Volume), 속도(Velocity), 다양성(Variety), 복잡성(Complexity) 등의 특징을 가 지며(Mckinsey, 2011), 단순 데이터 크기와 함께 정형 및 비정형 데이터의 수집, 관리, 분석, 시각 화, 활용 등을 포함하는 개념이다. 최근 급속한 정보의 증가로 인해 빅데이터라고 칭할 수 있는 데 이터가 급속히 증가하고 있으며 이를 활용한 새로운 융합 서비스 창출도 가시화되고 있다. 빅데이터와 관련해, 미국은 12. 3월 백악관 국(OSTP)을 중심으로 범정부적인 빅데 이터 연구개발 주도권 연구개발 계획을 발표하는 등 빅데이터를 핵심 의제로 설정하고, 국방부, 국 토안보부, 에너지부, 보훈부, 보건인적자원부, 항공우주국(NASA), 국가과학재단(NSF), 국립인문학 기금(NEH) 등이 범정부적으로 참여하여 6개 정부 부처 및 관련기관을 통해 2억 달러를 투자할 계 획이다. 유럽 국가는 빅데이터를 활용한 비용 절감 및 세수 증대 등의 경제적 효과를 도모하고 있다. 유럽 연합(EU)은 빅데이터를 활용한 비용 절감, 부정 및 오류에 따른 손실 감소, 세수 증대에 따른 비용 효과를 1,500~3,000억 유로 규모로 추산하고 있다. 빅데이터 활용 맞춤형 고용으로 독일 연방 노 동기관은 3년간 백억 유로의 비용을 절감하였다. 특히, 구글 등 글로벌 선진기업들은 웹사이트 방문기록, 검색통계, 소셜미디어 기록 등에 대한 빅 1) 본 원고는 연구원에서 수행하고 있는 빅데이터 기반 융합 서비스 산업 창출 방안 과제 보고서의 일부를 요약 정리한 것임. 4
데이터 분석을 활용한 새로운 서비스를 개발하고 있으며 일본 주요 기업은 트위터에서의 반응을 모 니터링한 후 빠른 주기로 마케팅 방법을 변경하고 있다. 본고에서는 빅데이터의 개념 및 정의, 관련 주요 연구 및 관련 정책을 검토하고 빅데이터 기반 융 합 서비스 창출 사례 분석을 통해 시사점을 도출 하였다. 정 책 초 점 Ⅱ. 빅데이터의 개념 및 주요 연구 세계경제포럼(WEF)은 2012년 10대 신흥 기술 가운데 첫 번째로 빅데이터 기술을 선정하였다. 빅 데이터의 중요성은 국내 외적으로 강조되고 있지만 현재까지 빅데이터에 대한 개념에 대해서는 단 일하게 확립되어 있지 않다. 해외 주요 기관들은 빅데이터를 다음과 같이 정의하고 있다. 첫 번째 가트너(Gartner)는 더 나은 의사결정, 시사점 발견 및 프로세스 최적화를 위해 사용되는 새로운 형태의 정보처리가 필요한 대용량(high volume), 초고속(high velocity) 및 다양성(high variety)의 특성을 가진 정보 자산으로 정의한다. 두 번째 맥킨지(McKinsey)는 일반적인 데이터베 이스 소프트웨어 도구가 수집, 저장, 관리, 분석하기 어려운 대규모의 데이터로 정의한다. 마지막으 로 IDC는 데이터보다는 기술에 초점을 두고 초고속 수집, 발견, 분석이 가능하여 매우 다양한 종류 의 대규모 데이터로부터 경제적으로 가치를 추출할 수 있도록 고안된 차세대 기술 및 아키텍처로 정의하고 있다(배동민 외, 2013, pp. 39~40). <표 1> 해외 주요 기관의 빅데이터 정의 기 관 Gartner McKinsey IDC 빅데이터 정의 더 나은 의사결정, 시사점 발견 및 프로세스 최적화를 위해 사용되는 새로운 형태의 정보처리가 필요한 대용량, 초고속 및 다양성의 특성을 가진 정보 자산 일반적인 데이터베이스 소프트웨어 도구가 수집, 저장, 관리, 분석하기 어려운 대규모의 데이터 빅데이터 기술을 초고속 수집, 발견, 분석이 가능하여 매우 다양한 종류의 대규모 데이터로부터 경제적으로 가치 를 추출할 수 있도록 고안된 차세대 기술 및 아키텍처로 정의 자료: Gartner(2012) 2) ; McKinsey Global Institute(2011), p. 1; IDC(2011), p. 6. 해외 연구들에서 빅데이터에 대한 정의도 다양하게 이루어지고 있다(<표 2> 참조). Hunter(2013) 는 데이터 집합 그 자체만을 빅데이터로 정의하지만 Wigan & Clarke(2013)은 데이터를 추출하고 분석하는 기술까지 포함하여 정의한다. Boyd & Crawford(2012)는 대규모 데이터 및 관리기술에서 더 나아가 빅데이터를 학문적인 현상의 하나로 포괄하여 설명한다. 이러한 다양한 정의를 배경으로 2) http://en.wikipedia.org/wiki/big_data 재인용, 홈페이지 접속일자: 2013. 6. 14. 11:11. 제23권 제3호 5
Ovadia(2013)는 빅데이터란 용어는 학문적으로나 대중매체에서 많이 사용하고 있지만 아직까지 정 형화된 정의는 수립되지 않았으며 맥락에 따라 다르게 사용되고 있음을 지적하였다. <표 2> 해외 연구에서 빅데이터 정의 구 분 Boyd & Crawford (2012) Hunter (2013) Ovadia (2013) Wigan & Clarke (2013) 빅데이터 정의 대규모의 데이터에 대한 과학기술과 분석연구 및 신화적 믿음의 상호작용에 근거한 문화적이고 과학기술적이며 학 문적인 현상 매우 크고 복잡하여 데이터베이스 관리도구나 전형적인 데이터 처리 프로그램으로 쉽게 다루기 어려운 데이터들의 집합 학문적으로나 대중적으로 유행하는 용어가 되었지만 정형화된 정의가 없어 융통성이 있으나, 맥락에 따라 다른 의 미로 사용되어 혼란스러울 수 있다고 함 대규모의 세부적인 데이터 집합뿐만 아니라 다양한 정보원에서 많은 데이터 집합을 통합하는 것까지 포함하며, 나 아가 데이터를 관리하고 분석하는 기술까지 포함함 국내에서도 해외 및 주요 연구에 기반해 빅데이터에 대한 개념을 제시하고 있다(<표 3> 참조). 대 체로 정형 및 비정형 데이터를 포괄하는 데이터의 규모에 초점을 맞춘 좁은 의미의 빅데이터 정의와 데이터 처리방식과 관련 기술까지 포함하는 넓은 의미의 정의로 나누어 볼 수 있다. 김정숙(2012)과 이성훈 외(2013)는 좁은 의미의 빅데이터를 개념화하여 사용하며, 강만모 외(2012), 고준철 외 (2012), 김상락 외(2012), 배동민 외(2013)에서는 넓은 의미의 빅데이터로 개념화하여 사용하였다. <표 3> 국내 연구에서 빅데이터 정의 구 분 강만모 외 (2012) 고준철 외 (2012) 김상락 외 (2012) 김정숙 (2012) 배동민 외 (2013) 이성훈 외 (2013) 빅데이터 정의 일반적인 데이터베이스, 소프트웨어로는 관리하기 어려운 정도의 큰 규모로서, 현재 수십 테라바이트에서 향후 페타 바이트, 엑사바이트 정도 크기의 대용량 데이터를 의미. 최근 빅데이터는 대용량 데이터의 수집, 저장, 분석, 체계화 를 위한 도구, 플랫폼, 분석 기법 등을 포괄하는 용어로 변화하고 있으며, 대용량 데이터를 활용 분석하여 가치 있 는 정보를 추출하고 생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술 기존의 관리 및 분석체계로는 감당할 수 없을 정도의 거대한 데이터의 집합을 지칭하며, 대규모 데이터와 관계된 기술 및 도구(수집, 저장, 검색, 공유, 분석, 시각화 등)도 빅데이터의 범주에 포함 대용량의 데이터를 저장, 수집, 발굴, 분석, 비즈니스화하는 일련의 과정 현재 시스템으로 처리 가능한 범위를 넘어서는 데이터 기존 데이터 분석에 비해 100배 이상 많은 데이터를 로그 데이터, 구매 기록 등 정형 데이터뿐만 아니라 소셜미디어, 위치, 센서 등 비정형 데이터까지 분석대상에 포함하여 다양한 데이터들의 관계를 동시에 가능한 빨리 처리할 수 있 는 새로운 컴퓨팅 기술을 적용해 다양하고 신뢰할 만한 분석결과를 제시하여 가치를 창출하는 데이터 처리 방식 기존 데이터에 비해 너무 방대하여 기존의 방법이나 도구로 수집, 저장, 분석 등이 어려운 정형 및 비정형 데이터들 을 의미 6
Ⅲ. 빅데이터 기반 융합 서비스 산업 가치 및 시장 규모 1. 빅데이터 주요 서비스 산업 영역별 가치 글로벌 컨설팅 기업인 맥킨지는 데이터가 생산성을 높이고 기업과 공공부문의 경쟁력을 높이며, 소비자에게 혜택이 돌아갈 것임을 제시하고, 미국의 의료서비스, 유럽의 공공분야, 미국의 소매업, 제조업과 개인정보데이터를 분석하였다(McKinsey Global Institute, 2011). 본 보고서의 추정결과 에 따르면 미국 의료서비스는 빅데이터를 효율적으로 활용하여 데이터로부터 얻게 되는 잠재적인 가치가 매년 3천억 달러에 달할 것으로 나타났다. 이는 국가 의료서비스 지출의 8%에 해당하는 수 치이다. 또한 민간영역에서 빅데이터를 활용한 소매사업은 운영마진을 60% 향상시킬 수 있는 것으 로 나타났다. 그리고 유럽의 선진국들은 빅데이터를 통해 운영효율을 개선시킨 결과 1,490억 달러 를 줄일 수 있는 것으로 나타났다. 빅데이터에 기반한 주요 서비스 산업 영역별 창출가치는 [그림 1] 과 같다. 정 책 초 점 [그림 1] 빅데이터의 주요 서비스 산업 영역별 가치창출 자료: MGI(2011), p. 8. 제23권 제3호 7
2. 세계 빅데이터 시장 규모 IDC는 2010년 세계 시장 규모를 바탕으로 2011년부터 2015년까지 성장규모를 예측하고 있으며, 빅데이터 시장은 스토리지, 서버, 네트워킹, 서비스 시장으로 구분하여 추정하였다(IDC, 2012). 2011년 기준 빅데이터 기술 및 서비스 시장 규모는 약 48억 달러인데, 이 가운데 서비스는 41.5% 를 차지하며 소프트웨어는 29.7%, 서버는 14.0%, 스토리지는 11.8%, 네트워크는 3.1%를 차지한다. 향후 영역별 5년 동안의 평균 성장률은 39.4%로 예측하였으며, 이는 전체 정보통신 기술 시장의 7 배에 해당되는 성장률이다. 영역별로 보면 서버부문이 최저로 27.3%, 소프트웨어부문이 34.2%, 서 비스부문이 39.5%, 네트워킹부문이 42.4%로 나타났으며, 스토리지 부문이 최대인 61.4%로 다양하 게 성장률이 도출되었다. [그림 2] 세계 빅데이터 기술 및 서비스의 영역별 수입 규모 자료: IDC(2012), p. 3. <표 4> 영역별 세계 빅데이터 기술과 서비스 수입 규모(2010~2015) 2010 2011 2012 2013 2014 2015 (단위: $M) 2010~2015 연평균(%) 서버 495.0 665.0 802.8 1,031.6 1,270.2 1,657.2 27.3 스토리지 317.5 560.3 1,224.1 1,968.1 2,719.1 3,479.2 61.4 네트워킹 106.0 146.0 242.0 368.0 485.0 620.0 42.4 소프트웨어 1,062.3 1,415.4 1,851.0 2,476.8 3,367.9 4,625.9 34.2 서비스 1,236.3 1,979.0 2,721.8 3,883.3 5,098.5 6,537.8 39.5 합 계 3,217.1 4,765.7 6,841.7 9,727.8 12,940.7 16,920.0 39.4 자료: IDC(2012), p. 8. 8
3. 빅데이터의 미래사회 역할 미래사회에서 빅데이터가 가진 기회요인은 다양하다. 강만모 외(2012)는 미래사회가 가진 불확실 성, 리스크, 스마트, 융합이라는 4가지 키워드에 대해, 빅데이터가 통찰력, 대응력, 경쟁력, 창조력 을 제공하는 토대가 될 것으로 전망하였다. 예를 들어 미래사회가 가진 불확실성을 현실세계의 데이터를 기반으로 한 패턴분석과 미래전망에 활용하고 여러 가지 가능성에 대한 시나리오 시뮬레이션을 통해 다각적인 상황이 고려된 통찰력을 제시하여 다수의 시나리오의 상황 변화에 유연하게 대처할 수 있을 것으로 전망하였다. 정 책 초 점 <표 5> 미래사회와 빅데이터의 역할 미래사회의 특징 불확실성 리스크 스마트 융합 자료: 강만모 외(2012), p. 30. 통찰력 대응력 경쟁력 창조력 빅데이터의 역할 사회현상, 현실세계의 데이터를 기반으로 한 패턴분석과 미래전망 여러 가지 가능성에 대한 시나리오 시뮬레이션 다각적인 상황이 고려된 통찰력을 제시 다수의 시나리오의 상황 변화에 유연하게 대처 환경, 소셜, 모니터링 정보의 패턴분석을 통한 위험징후, 이상 신호 포착 이슈를 사전에 인지, 분석하고 빠른 의사결정과 실시간 대응 지원 기업과 국가 경영의 명성 제고 및 낭비요소 절감 대규모 데이터 분석을 통한 상황인지, 인공지능 서비스 등 가능 개인화, 지능화 서비스 제공 확대 소셜분석, 평가, 신용, 평판 분석을 통해 최적의 선택 지원 트렌드 변화 분석을 통한 제품 경쟁력 확보 타 분야와의 결합을 통한 새로운 가치창출 인과관계, 상관관계가 컨버전스 분야의 데이터 분석으로 안전성 확보, 시행착오 최소화 방대한 데이터 활용을 통한 새로운 융합시장 창출 Ⅳ. 빅데이터 기반 융합 서비스 관련 주요 정책 1. 구)국가정보화전략위원회 3) 대통령 직속의 구)국가정보화전략위원회는 2011년 11월 빅데이터를 활용한 스마트 정부 구현 (안) 을 마련하였다. 특히 12년 11월 교육과학기술부, 행정안전부, 지식경제부, 방송통신위원회, 국 가과학기술위원회와 협의하여 스마트 국가 구현을 위한 빅데이터 마스터플랜을 수립하였다. 6개 분 3) 국가정보화 기본법 개정에 따라 2013. 3. 23.에 폐지됨. 제23권 제3호 9
야에서 대상과제 16개를 제시하였고 유용성을 고려하여 3개 과제를 13년도에 우선 추진한 후 17년 도까지 단계적 활용계획을 수립하였다. 6개 분야는 사회안전, 국민복지, 국가경제, 국가 인프라, 산 업지원, 과학기술이며, 대상과제별로 관련 주관부처를 선정하였다. <표 6> 빅데이터 마스터플랜의 빅데이터 대상과제 분 야 빅데이터 대상과제 주관부처 사회안전 국민복지 국가경제 국가 인프라 산업지원 과학기술 범죄발생 장소 시간 예측을 통한 범죄발생 최소화[우선추진] 예측기반의 자연재해 조기 감지 대응[우선추진] 음란물 유통차단을 통한 건강한 인터넷문화 조성 민원 데이터 분석을 통한 정책의 환류 시스템 마련 복지 수요 공급 매칭을 통한 맞춤형 서비스 제공 일자리 현황 분석 예측으로 고용정책 수립 지원 과세 데이터 분석으로 탈세방지 및 국가 재정 확충 지원 다양한 경제관련 데이터 분석 기반의 경제정책 수립 지원 주민참여형 교통사고 감소체계 구축[우선추진] 실시간 네트워크시스템 재난 관리 대응체계 마련 자영업자 창업 실패 예방 지원 제조공정 실시간 장애 예측을 통한 생산효율 고도화 수급 전망에 기반한 농수산물 생산 관리 국가 기후 위험요소에 대한 선제적 대응 체계 구축 유전자 의료 데이터 분석을 통한 국민 건강 증진 위성영상 데이터 분석 활용을 통한 재난 대응 경찰청, 행안부, 법무부, 검찰청 방재청, 경찰청, 기상청, 행안부 방통위, 행안부, 경찰청, 여가부 권익위, 각부처, 지자체 복지부, 노동부, 지자체, 국세청 노동부, 중기청, 교과부 국세청, 기재부 기재부, 지경부 경찰청, 국토부, 지자체 방통위, 행안부 중기청, 노동부, 지경부, 지자체 지경부, 교과부 농림부, 기상청 기상청, 국토부, 산림청 교과부, 복지부, 지경부, 식약청 교과부, 기상청, 국토부 자료: 국가정보화전략위원회(2012), p. 26. 2. 방송통신위원회 방송통신위원회는 빅데이터 활용을 통해 기업과 국가의 경쟁력을 강화하고 사회 현안을 효과적으 로 해결하여 개인의 맞춤형 스마트 라이프 구현에 초점을 맞춘 빅데이터 서비스 활성화 방안 을 2012년 6월 발표하였다. 본 방안에서는 데이터가 폭증하는 상황에서 인터넷 및 방송통신 업계가 효 과적으로 대응하기 위해, 신규 서비스 발굴 확산을 위한 시범서비스 추진, 빅데이터 기술 및 플랫폼 경쟁력 강화 등 7가지 정책 방안을 제시하였다. 10
정책 방안 신규 서비스 발굴 확산을 위한 시범서비스 추진 빅데이터 기술 및 플랫폼 경쟁력 강화 <표 7> 방송통신위원회 빅데이터 서비스 활성화 방안 세부 내용 방송통신, 교육, 교통, 의료 등 서비스 수요가 제기되는 여러 분야에서 매 칭펀드 공모방식으로 핵심 분야를 발굴하여 시범서비스 실시 클라우드 기술, 분산컴퓨팅 기술, 지능화 기술 등 핵심 요소기술을 중점 개발 오픈소스를 활용하여 빅데이터 플랫폼을 개발하고 다양한 분야에 활용될 수 있도록 공개 정 책 초 점 전문인력 양성 빅데이터 지원센터 설치 운영 및 정보공유 체계 마련 빅데이터 산업실태 조사 개인정보보호 관련 법제도 개선 빅데이터 산업 진흥을 위한 법제도 개선 대학과의 연계시스템을 구축하여 이론과 실무를 고루 갖춘 고급인력 양성 전문 기업들과 제휴하여 관련 교육과정 설치 및 실무인력 양성 빅데이터 분석가 자격증제도 도입 추진 및 빅데이터 활용경진대회 개최 산학연 공동 활용 빅데이터 지원센터를 구축 개방형 정보공유 체계 마련 업체, 시장 규모, 사업 모델 등 활용현황과 빅데이터에 대한 인식 조사 정보 활용 단계별 익명성을 보장할 수 있는 장치 마련 빅데이터를 활용하는 기업의 개인정보 관리수준 검증을 위한 개인정보보호 관리체계 인증제 개선 빅데이터 관련 기술개발 및 표준화 등을 위한 법제도 개선 방안 도출 자료: 방송통신위원회(2012), pp. 8~10. 3. 미래창조과학부 미래창조과학부는 빅데이터 기반 서비스를 발굴 확산하여 공공 민간서비스의 경쟁력을 높이고 이를 통한 일자리 및 비즈니스 창출을 지원하기 위해 사업예산 총 14억 원의 빅데이터 활용 스마트 서비스 시범사업을 시행하여 현재 시범사업으로 6개 과제를 선정하였으며, 13년도 말 시범서비스 개시를 목표로 개발을 착수하였다. <표 8> 13년 빅데이터 시범사업 선정 과제 컨소시엄 서비스명 내 용 KT (서울특별시) 국민건강보험공단 (다음소프트) 에스지에이 (한국의약품안전관리원, 와이즈넛) 심야버스 노선 정책 지원 국민건강 주의 예보 서비스 의약품 안전성 조기경보 서비스 서울시의 교통데이터와 KT의 유동인구 데이터를 연계, 분석하 여 최적의 심야버스 노선 정책 수립 지원 국민건강보험공단의 건강보험 DB와 SNS 정보를 연계하여 홍 역, 조류독감, SAS 등 감염병 발생 예측 모델 개발하고 주의 예보 유해사례 DB, 진료기록, SNS 등을 분석하여, 유의 의약품을 추출하고, 병의원, 제약회사 및 유관기관 등에 위험도 예측 서 비스 제공 제23권 제3호 11
컨소시엄 서비스명 내 용 서울아산병원 (ETRI, 한국MS, 테크아이, 켐아이넷, 한국쌔쓰소프트웨어) 오픈메이트 (비씨카드, 한국감정원) 차세대융합기술연구원 (서울대 융합과학기술 대학원, 이스플러스) 자료: 미래창조과학부(2013), p. 2. 심실부정맥 예측 등 보건의료 서비스 소상공인 창업성공률 제고를 위한 점포이력분석 서비스 모바일을 통한 지능형 뉴스검색 서비스 포털(다음), 질병관리본부 데이터와 병원 자체 데이터를 활용 하여 독감 유행 예측, 심실부정맥 예측, 입원 병상 배정 최적 화 등 제공 카드거래, 부동산, 상가이력 정보 등의 연계 분석을 통해 창업 관련 과거/현황 분석 및 예측 정보를 제공하여 소상공인 창업 지원 대량의 기사 DB에 대해 중요도, 관계도 등 다각도의 고급분석 을 적용하여 지능형 뉴스 검색 서비스 제공 V. 빅데이터 기반 융합 서비스 창출 사례 1. 미국 로스앤젤레스 범죄예측 서비스 전 세계적으로 범죄예방과 치안 증진에 대해 일반대중의 수요는 증대되고 있지만, 경찰인력을 확보 하기 위한 예산은 한정되어 있으며 오히려 삭감되는 추세에 있다. 이러한 환경하에서 미국 로스앤젤레 스 경찰은 범죄 관련 업무를 효과적으로 수행하기 위해 범죄예측 서비스(PredPol)를 개발하였다. 미국 로스앤젤레스 범죄예측 서비스(PredPol)는 목표한 지역에 실시간으로 범죄예측을 제공하는 시스템으로 로스앤젤레스의 일선 경찰관들에 의해 활용되고 있다. 범죄예측 서비스(PredPol)의 목 표는 일선 경찰관들이 범죄를 예방할 기회가 가장 높은 시간과 지역에 갈 수 있도록 하는 것이다. 본 서비스는 개발과정에서 지진발생 이후 여진을 예측하는 모델을 활용한 기술을 이용하였다. 본 서비스는 수년간의 과거 범죄 데이터들을 분석하고 패턴을 파악함으로써 범죄발생 위험이 높은 장 소와 시간을 예측한다. 범죄예측 서비스는 일선 경찰관에게 그날의 위험지역(hot spots)을 알려주 고 다른 지역보다 주의를 기울일 것(매 두 시간마다 15분 이상 순찰 등)을 요청한다. 그리고 10개의 위험지역을 알려주고 그 지역을 순찰하는 동안 업무연락을 통해 순찰지역을 이탈하는 것을 방지한 다. 범죄예측 서비스의 예측 결과는 새로운 범죄가 발생하고 최신데이터가 프로그램에 반영될 때마 다 매일 새로 계산되어 갱신된다. 범죄예측도구는 작게는 약 150미터 150미터(500피트 500피트) 의 사각 박스 형태로 범죄발생을 예측하여 경찰관들의 범죄예방을 위한 직관을 보완해준다. 범죄예측 서비스는 범죄데이터에 기반한 단순한 지도와는 다르게 고급 수학과 컴퓨터 학습기술을 적용하였다. 따라서 기존의 노하우와 경험으로 만들어진 시스템에 비해 두 배의 예측정확성을 보여주 었다. 다음 [그림 3]은 6개월 동안의 확률실험을 통해 기존의 크라임 핫스포팅(Crime hotspotting)과 새로이 개발된 범죄예측 서비스의 예측정확성을 비교한 결과이다. 12
[그림 3] 범죄예측 서비스(PredPol vs. Crime Hotspotting)의 예측 정확성 확률실험결과 정 책 초 점 자료: Predictive Policing company의 홈페이지(http://www.predpol.com/results/). 2. 경찰청 지리적 프로파일링 서비스 프로파일링은 범죄현장에서 수집된 데이터들을 이용하여 범인의 행동 혹은 심리적 특성을 추론하 여 용의자의 확률이 높은 인구 통계적 특성, 단서를 도출하는 것이다(신상화, 2009, p. 129). 프로 파일링은 심리학적 프로파일링(psychological profiling), 범죄자 프로파일링(criminal profiling), 지리적 프로파일링(geographic profiling), 인종적 프로파일링(racial profiling)으로 구분할 수 있다 (Bartol & Bartol, 2005, p. 329; 임준태 외, 2009, p. 203 재인용). 과학적 수사기법으로 프로파일링은 2000년 2월 서울지방경찰청에 국내에 처음 도입되었으며, 유 영철, 강호순 등 연쇄 살인사건을 해결하면서 수사기법이 발전하여 왔다. 하지만 한국 실정에 맞는 지형공식이 없어 지리적 프로파일링은 범죄수사의 범위를 줄여 수사를 도울 수 있는 주요한 프로파 일링 기법임에도 2008년까지 활용되지 못하여 개발의 필요성이 제기되었다(고찬유, 2010). 경찰청(2013)은 지리적 프로파일링 시스템을 다양한 공간통계분석기법을 경찰의 범죄수사데이터 (KICS 등)에 적용, 범죄위험지역 예측을 통한 방범 전략 수립 및 연쇄 범죄자 거주지 예측을 통한 수사 활동 전개가 가능한 시스템 으로 정의한다. 경찰청은 2008년부터 6개월 동안 미국의 지리 프로파일링 시스템(CrimeStat)에 국내의 지역적 특성과 사건 데이터를 적용하여 지리적 프로파일링 서비스를 개발하였다. 개발된 지리적 프로파일 링 서비스는 XX시 OO 경찰서(2012)에 따르면 2012년 8월 1개월 동안 강력범죄 등 5대 범죄의 지리 적 프로파일링 시스템을 이용한 분석을 토대로 형사기동차량순찰 및 필요지점에 거점근무를 실시한 결과 동기간 동안 5대 범죄가 총 265건이 발생하여 전년 동기간 296건보다 10.5%(31건) 감소한 결 제23권 제3호 13
과가 나타났다. 또한 심야 취약지 형사활동 근무를 통해 형사범 6명을 검거하였다. 검거된 피의자는 심야 취객 상대 부축빼기 피의자 2명, 심야 자전거 절취 피의자 2명, 특수절도 피의자 2명이다. Ⅵ. 결론 및 시사점 본고에서는 빅데이터의 개념 및 주요 연구, 빅데이터 기반 융합 서비스 산업 가치 및 시장 규모, 빅데이터 기반 융합 서비스 산업 관련 주요 정책, 빅데이터 기반 융합 서비스 산업 창출 사례 등을 살펴보았다. 국가경제를 위해 과학기술에 기반한 창조산업 육성이 화두로 제시되는 상황에서 미래사회 환경변 화에 따라 사회안전, 국민복지, 삶의 질 등 여러 분야에서 새로운 융합 서비스의 개발이 요청되고 있다. 이러한 새로운 융합 서비스를 개발하기 위해서는 시장, 소비자, 환경 등 여러 측면에서 다양 한 데이터가 필요하다. 과거 데이터 자체가 희소성을 가지고 있었을 때와 비교해 보면 현재와 앞으로 새로운 서비스를 개발하기 위해서 활용할 수 있는 빅데이터는 더욱 광범위해질 것으로 전망된다. 더욱이 활용할 수 있는 데이터의 제한으로 불가능했거나 시장성을 확보하지 못했던 서비스가 가능해지고 시장성을 가 진 서비스 모델로 진화할 것이다. 향후 빅데이터에 기반한 융합 서비스 창출을 위해서는 다음과 같은 정책이 요구된다. 첫째 현재 는 하나의 빅데이터를 활용한 서비스 개발에 초점을 맞추고 있는 상황이다. 향후 하나의 빅데이터 를 넘어 다양한 빅데이터들을 연계 융합해 새로운 서비스 개발을 촉진할 수 있는 정책이 필요하다. 둘째 빅데이터를 활용해 공공 서비스의 품질(Quality) 제고 방안이 필요하다. 정부가 의무적으로 제공해야하는 공공 서비스에 있어 빅데이터를 활용해 국민의 수요(Needs)에 부응할(Meet) 수 있는 서비스의 개발 및 품질 제고가 요청된다. 셋째 빅데이터를 활용한 민간 서비스 개발의 활성화를 위해 공공의 빅데이터 플랫폼 및 인프라 제공이 필요하다. 공공부분이 제공하는 플랫폼 및 인프라 위에서 민간의 창의적인 서비스 개발이 가능할 것이다. 넷째 민간 빅데이터의 공개 촉진 방안이 요구된다. 현재 공공기관을 중심으로 다양한 데이터를 공개했거나 공개할 계획이지만 민간 부문의 데이터 공개는 미흡하다. 기업 등 대부분의 민간 데이 터는 자체 활용 용도로 한정될 뿐 외부 접근이 어려운 상황이다. 기업 자체의 필요에 의한 정보를 제외하고 공개할 수 있는 데이터의 유형과 패턴을 분석해 인센티브 제공 등을 통해 제한적으로 외 부 공개를 촉진할 수 있는 방안 제시가 필요하다. 향후 공공부분 빅데이터와 민간부분 빅데이터의 융합을 통해 새로운 서비스 창출이 촉진될 수 있을 것이다. 14
참고문헌 XX시 OO 경찰서(2012), 지리적 프로파일링 시스템 활용한 범죄다발지(hot-spot) 분석, 형사활동 결 과, 보도자료, 9월 4일. 강만모 외(2012), 빅 데이터의 분석과 활용, 정보과학회지, 제30권 제6호, pp. 25~32. 경찰청(2013), 경찰순찰! 범죄 위험지역 위주로 집중!! 효율성 강화, 보도자료, 2월 7일. 고준철 외(2012), 빅 데이터의 새로운 고객 가치와 비즈니스 창출을 위한 대응 전략, 대한안전경영 과학회지, 제14권 4호, pp. 229~238. 고찬유(2010), 범인 저곳에! 예측력 미 프로그램의 10배, 한국일보, 3월 3일. 국가정보화전략위원회(2011), 빅데이터를 활용한 스마트 정부 구현(안), 10월 26일. (2012), 스마트 국가 구현을 위한 빅데이터 마스터 플랜, 11월 28일. 김상락 외(2012), 빅 데이터가 여는 미래의 세상, 정보과학회지, 제30권 제6호, pp. 18~24. 김정숙(2012), 빅 데이터 활용과 관련기술 고찰, 한국콘텐츠학회지, 제10권 제1호, pp. 34~40. 미래창조과학부(2013), 빅데이터로 인터넷 신산업 본격 활성화 시동, 보도자료, 6월 14일. 방송통신위원회(2012), 방통위, 빅데이터 서비스 활성화 적극 나선다, 보도자료, 6월 21일. 배동민 외(2013), 빅 데이터 동향 및 정책 시사점, 방송통신정책, 제25권 제10호, pp. 37~74. 신상화(2009), 연쇄 강간범에 대한 지리적 프로파일링에 관한 연구, 경찰학논총, 제4권 제2호, pp. 127~160. 이성훈 외(2013), 빅데이터의 국내 외 활용 고찰 및 시사점, 디지털정책연구, 제11권 제2호, pp. 229~233. 임준태 외(2009), 지리적 프로파일링을 통한 연쇄강력범죄의 공간적 특성분석, 한국경찰연구, 제8권 4호, pp. 199~224. 정 책 초 점 Bartol, Curt R. & Bartol, Ann M.(2005), Criminal Behavior: A Psychological Approach, 7th Ed. Upper Saddle River. NJ: Pearson Prentice-Hall. Boyd, C. & Crawford, K.(2012), Critical Questions for Big Data, Information, Communication & Society, Vol. 15, No. 5, pp. 662~679. Gartner(2012), The Importance of Big Data : A Definition. Hunter, P.(2013), Journey to the center of Big Data, Engineering & Technology, Vol. 8, No. 3, pp. 56~59. IDC(2011), Extraction Value from Chaos. (2012), Worldwide Big Data Technology and Services 2012~2015 Forecast. McKinsey Global Institute(2011), Big data: The next frontier for innovation, competition, and productivity. 제23권 제3호 15
Ovadia, S.(2013), The Role of Big Data in the Social Science, Behavioral & Social Sciences Librarian, Vol. 32, No. 2, pp. 130~134. Wigan, M. R. & Clarke, R.(2013), Big Data s Big Unintended Consequences, Computer, Vol. 46, No. 6, pp. 46~53. 16