<312D35295FC1A4C3A5C3CAC1A12DBCDBC5C2B9CE2DC6EDC1FD2E687770>

Similar documents
<BFACB1B85F D333728BCDBC5C2B9CE295FC3D6C1BEC8AEC1A45FC0CEBCE2BFEB B8F1C2F7BCF6C1A42E687770>

PowerPoint Presentation

Microsoft Word - th1_Big Data 시대의 기술_ _조성우

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

보건 복지 Issue & Focus 보건복지부 3.0의 소통하는투명한보건복지 는빅데이터의이용활성화를위해공공데이터를적극개방함으로써활용가능한자료가복잡하고 (Complexity), 양이매우방대해짐 (Volume) 보건복지부 3.0의 일잘하는유능한보건복지 는빅데이터를활용한과학

빅데이터_DAY key


ICT À¶ÇÕÃÖÁ¾

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

ㅇ ㅇ


PowerPoint Template

hwp

Semantic Search and Data Interoperability for GeoWeb

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

SECTION TITLE A PURE PRIMER (AI), // 1

160322_ADOP 상품 소개서_1.0


<BFACB1B85F D303528BCDBC5C2B9CE295FC3D6C1BEC8AEC1A45FC0CEBCE2BFEB5F FBCF6C1A42E687770>

2007-최종-10월 16일자.hwp

<C6EDC1FDBFCFB7E15FBFACB1B85F D303528BCDBC5C2B9CE295F E687770>

장애인건강관리사업

CYNWPDGDMFAL.hwp

210 법학논고제 50 집 ( )

untitled

( 제 20-1 호 ) '15 ( 제 20-2 호 ) ''16 '15 년국제개발협력자체평가결과 ( 안 ) 16 년국제개발협력통합평가계획 ( 안 ) 자체평가결과반영계획이행점검결과 ( 제 20-3 호 ) 자체평가결과 국제개발협력평가소위원회

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론


<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

Untitled-1

C O N T E N T S 목 차 요약 / 3 Ⅰ. 브라질소비시장동향및특성 경제현황 2. 소비시장의특성 Ⅱ. 브라질소비시장히트상품분석 최근히트상품 년소비시장, 이런상품을주목하라! Ⅲ. 우리기업의 4P 진출전략

04 특집

제 1 호 지방자치단체녹색정보화추진동향 제 2 호 전자정부성과관리를위한평가동향 제 3 호 외국모바일전자정부추진동향 제 4 호 업무용 PC 가상화 제 5 호 증강현실구현기술현황 제 6 호 Web 기술의진화와공공서비스 제 7 호 ICT 를통한일자리창출방안 제 8 호 스마트

2009방송통신산업동향.hwp

슬라이드 1

4 차산업혁명과지식서비스 l 저자 l 한형상 / 한국산업기술평가관리원지식서비스 PD 김 현 / 한국전자통신연구원 IoT 연구본부장 SUMMARY 4차산업혁명의성격은초연결 초융합 초지능의세키워드로요약된다. 초연결은사람, 사물등객체간의상호연결성이확장됨을말하며이는곧실시간데이

월간 SW 산업동향 ( ~ ) Ⅰ. Summary 1 Ⅱ SW 5 2. SW 7 Ⅲ Ⅳ. SW SW Ⅴ : Big Data, 38

슬라이드 1

제목을 입력하십시오

<B3EDB4DC28B1E8BCAEC7F6292E687770>



2 Journal of Disaster Prevention

2ÀåÀÛ¾÷

Microsoft Word - IT Report

문서의 제목 나눔고딕B, 54pt

Data Industry White Paper

맘톡광고소개서

Jkafm093.hwp

Lecture Title

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

Hallym Communication Policy Research Center 15 빅데이터기술은대용량의데이터를다룰때, 여러과정을거치게되는데, 데이터수집및데이터전처리, 저장, 분석, 활용 ( 시각화 ) 까지의과정을 거치게되며각과정별로핵심기술이존재한다. 빅데이터기술은대용

1-1) 아직까지도우리나라는 resilience' 이라는용어가적응유연성 ( 권태철, 2002; 김미승, 2002; 박현선, 1998, 1999a, 1999b; 양국선, 2001; 유성경, 2000; 이선아, 2004; 윤미경, 2002; 조혜정, 2002; 장순정, 2

Microsoft PowerPoint - 6.pptx

Cloud Friendly System Architecture

2010 산업원천기술로드맵요약보고서 - 화학공정소재

슬라이드 1

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

경북자동차부품관련연구소의효율적 운영방안

해외유학생보험3단팜플렛1104

IT & Future Strategy 는 21 세기한국사회의주요패러다임변화를분석하고이를토대로미래정보사회의주요이슈를전망, IT 를통한해결방안을모색하기위해 NIA 에서기획 발간하는보고서입니다. NIA 의승인없이본보고서의무단전재나복제를금하며, 내용에대한문의나제안은아래연락처로

슬라이드 1


PowerPoint 프레젠테이션

UDI 이슈리포트제 18 호 고용없는성장과울산의대응방안 경제산업연구실김문연책임연구원 052) / < 목차 > 요약 1 Ⅰ. 연구배경및목적 2 Ⅱ. 한국경제의취업구조및취업계수 3 Ⅲ. 울산경제의고용계수 9

목차 Ⅰ. 기본현황 Ⅱ 년도성과평가및시사점 Ⅲ 년도비전및전략목표 Ⅳ. 전략목표별핵심과제 1. 군정성과확산을통한지역경쟁력강화 2. 지역교육환경개선및평생학습활성화 3. 건전재정및합리적예산운용 4. 청렴한공직문화및앞서가는법무행정구현 5. 참여소통을통한섬

Global FDI Briefing [FDI FOCUS] 아세안의외국인직접투자와경제구역 (UNCTAD) 2017 년 12 월 18 일 [ 제 139 호 ]

C O N T E N T S 1. FDI NEWS 2. GOVERNMENT POLICIES 3. ECONOMY & BUSINESS 4. FDI STATISTICS 5. FDI FOCUS

목 차 < 요약 > Ⅰ. 검토배경 1 Ⅱ. 반도체산업이경기지역경제에서차지하는위상 2 Ⅲ. 반도체산업이경기지역경제에미치는영향 7 Ⅳ. 최근반도체산업의여건변화 15 Ⅴ. 정책적시사점 26 < 참고 1> 반도체산업개관 30 < 참고 2> 반도체산업현황 31

Contents SEOUL NATIONAL UNIVERSITY FUTURE INTEGRATED-TECHNOLOGY PROGRAM FIP 13 FIP

SEOUL NATIONAL UNIVERSITY FUTURE INTEGRATED-TECHNOLOGY PROGRAM 13 : (IoT), 4.0,,,,,, CEO. 13 : ( ) ~ 11 1 ( ) : 310

<464B4949B8AEC6F7C6AE2DC0AFBAF1C4F5C5CDBDBABBEABEF7C8AD28C3D6C1BE5FBCD5BFACB1B8BFF8BCF6C1A4292E687770>

Microsoft PowerPoint - 3주차.pptx

신성장동력업종및품목분류 ( 안 )

2차 수사분석사례집_최종.hwp

C O N T E N T S 1. FDI NEWS 2. GOVERNMENT POLICIES 3. ECONOMY & BUSINESS 4. FDI STATISTICS 5. FDI FOCUS

소규모 비즈니스를 위한 플레이북 여기서 다룰 내용은 다음과 같습니다. 1. YouTube 소개 2. YouTube에서 비즈니스를 위한 채널 만들기 3. 눈길을 끄는 동영상 만들기 4. 고객의 액션 유도하기 5. 비즈니스에 중요한 잠재고객에게 더 많이 도달하기

ePapyrus PDF Document

목 차 Ⅰ. 조사개요 1 1. 조사배경및목적 1 2. 조사내용및방법 2 3. 조사기간 2 4. 조사자 2 5. 기대효과 2 Ⅱ. P2P 대출일반현황 3 1. P2P 대출의개념 3 2. P2P 대출의성장배경 7 3. P2P 대출의장점과위험 8 4. P2P 대출산업최근동향

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

슬라이드 1

C O N T E N T S 1. FDI NEWS 2. GOVERNMENT POLICIES 3. ECONOMY & BUSINESS 4. FDI STATISTICS 5. FDI FOCUS

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)


FOCUS Ⅰ. 서론 지금은바야흐로빅데이터 (BigData) 시대라해도과언이아니다 년전세계디지털정보생산량은약 1.8ZB( 제타바이트 ) 라고한다. 1.8ZB 는 2000 억개이상의고화질 (HD) 영화를 4700 만년동안시청할수있는정도의엄청난정보량을뜻한다. 이

< B1E8C7F6C1D65FC7CFB5D3B1E2B9DDBAF2B5A5C0CCC5CDB1E2B9FDB8A6C0CCBFEBC7D128BCF6C1A4292E687770>

김기남_ATDC2016_160620_[키노트].key

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

선진사례집(0529)

Art & Technology #5: 3D 프린팅 - Art World | 현대자동차


<BBEAC0E7BAB8C7E8C1A6B5B52E687770>

±³À°È°µ¿Áö

슬라이드 1

01 01NEAR

3월2일자.hwp

Transcription:

정책초점 우리나라보건복지빅데이터동향및활용방안 1) 송태민한국보건사회연구원연구위원 tmsong@kihasa.re.kr Ⅰ. 서론 최근스마트폰, 스마트 TV, RFID, 센서등의급속한보급과모바일인터넷과소셜미디어의확산으로데이터량이기하급수적으로증가하고데이터의생산, 유통, 소비체계에큰변화를주면서데이터가경제적자산이될수있는빅데이터시대를맞이하게되었다. 특히, 정보통신기술 (Information Communication Technology: ICT) 이다른산업들과융복합되면서방대한양의데이터들이생산되고있는가운데사회변화에따른삶의질에대한욕구및현안해결에빅데이터의활용은매우중요한과제로떠오르고있다 ( 이성훈 이동우, 2013). 빅데이터생산의주된원인은기존의레거시시스템의성공적구축과함께스마트기기의보급으로사용자의위치정보와온라인및모바일사용기록과 SNS 에서사용자의일상생활과의견이어딘가에모두저장됨에따라정보량이폭증하는것이다. 이러한정보량은 2012 년에연간 2.7 제타바이트 (2조 7천억 Giga bytes) 2) 를넘어서고, 페이스북가입자가 8억명을돌파하고, 카카오톡의하루전송메시지가 10억건, 모바일기기 1조대이상, M2M 센서 20억대이상보급, 1분에유튜브동영상이 60시간분량이상업로드됨에따라서빅데이터는폭발적으로증가할것으로예측하고있다 ( 함유근 채승병, 2012; 윤형중, 2012). 세계각국의정부와기업들은빅데이터가향후국가와기업의성패를가름할새로운경제적가치의원천이될것으로기대하고있으며, McKinsey, The Economist, Gartner 등은빅데이터를활용한시장변동예측과신사업발굴등경제적가치창출사례및효과를제시하고있다. The Economist(2010) 는빅데이터를제대로활용하면전세계가직면한환경, 에너지, 식량, 의료문제를상당부분해결할것으로전망하고있고, Gartner(2011) 는빅데이터가미래경쟁력을좌우하는 21 세기의원유이며, Mckinsey(2011) 는빅데이터의활용에따라기업 / 공공분야의경쟁력확보와생산성향상, 사업혁신 / 신규사업발굴의차이가생길것이라고보고있다. 또한, Mckinsey(2011) 는 1) 본원고는 송태민 (2012. 11), 보건복지빅데이터의효율적활용방안, 보건복지포럼, 한국보건사회연구원 의내용을수정 보완함. 2) 2012 년쏟아질데이터는 2.7 제타바이트이고매일쏟아지는데이터는평균 7.7 엑사바이트로이를저장하려면 1 테라바이트 PC 용 HDD 가하루에 750 만개가필요. 56 과학기술정책

빅데이터활용시미국의료분야에서연 3,000 억달러, 유럽공공분야에서연 2,500 억달러의경제적효과가있으며, 우리나라는약 10.7 조의정부지출을감소시킬것으로예측하고있다. 일본총무성 (2012) 은빅데이터의활용이촉진되면부가가치의창출이나사회적비용의절감에서총 16조원이상의경제적인효과가얻어질것으로예상하고있다. 한편인구고령화와만성질환유병률의증가로의료비문제와의료서비스의접근성및질에관한문제가논의되면서많은국가에서 IT와의료기술을접목한 u-health 도입을추진하여왔다. u-health 는의료비절감등의사회경제적비용감소효과와공공보건의료서비스와예방관리보건등의사회정책적효과를기대할수있는가장효과적인대안으로각광받고있다. u-health 의보급은의료분야에서많은변화를가져올것으로보고있다. 유무선통신기술과센싱기술의발전으로 u-health 기기나스마트TV 등을통하여의사의건강상담및진료가가능한의료서비스를이용할수있으며개인의건강정보를기록하는전자의무기록 (EHR) 을통해환자의건강상태를실시간으로관찰할수있게되었다. u-health 서비스는다양한생체정보를수집하기위해다양한스마트센서들의네트워크가필수적이다. 스마트센서들이수집한환자의의료정보나건강정보는다양한형태로분석 처리되어개인의료정보에저장되고병원의의사나간호사등에전송되어활용될수있다. 최근이러한 u-health 서비스를통해생산되는건강정보관련빅데이터의관리와활용에대한논의가활발히진행되고있다. 따라서본고에서는빅데이터의개념과보건복지분야의빅데이터적용사례에대해살펴봄으로써보건복지빅데이터의효율적관리와활용을위한방안을제시하고자한다. 정책초점 Ⅱ. 관련연구 1. 빅데이터개념빅데이터 (Big Data) 는 Wikipedia(2013. 5. 30.) 에서 기존데이터베이스관리도구로데이터를수집 저장 관리 분석의역량을넘어서는대량의정형또는비정형데이터세트및이러한데이터로부터가치를추출하고결과를분석하는기술 로정의하고있으며, 국가정보화전략위원회에서는 대용량데이터를활용, 분석하여가치있는정보를추출하고, 생성된지식을바탕으로능동적으로대응하거나변화를예측하기위한정보화기술 이라고정의하고있다 ( 국가정보화전략위원회, 2011). 삼성경제연구소는 빅데이터란수십에서수천데라바이트정도의거대한크기를갖고여러가지다양한비정형데이터를포함하고있으며, 생성, 유통, 소비가몇초에서몇시간단위로일어나기존의관리및분석체계로는감당할수없을정도의거대한데이터의집합으로대규모데이터와관계된인력, 조직, 기술및도구 ( 수집, 저장, 검색, 공유, 분석, 시각화등 ) 까지모두포함하는개념 으로정의하고있다 ( 함유근 채승병, 2012). 이와같은정의를살펴볼때빅데이터란엄청나게많은데이터로양적인 제 23 권제 3 호 57

정책초점 의미를벗어나데이터분석과활용을포괄하는개념으로사용되고있다. 인터넷이일상화된최근 10 년사이, 인류는디지털데이터가폭증하는데이터홍수 (Data Deluge)(IDC, 2011) 현상에직면하여 2011 년전세계데이터에서생성될디지털정보량이 1.8ZB( 제타바이트 ) 에달하는 제타바이트시대 3) 로진입 4) 함에따라빅데이터의용어가등장하기시작하였다 ( 정지선, 2011). 빅데이터의주요특성은일반적으로 3V(Volume, Variety, Velocity) 를기본으로 1V(Value) 나 1C(Complexity) 의특성을추가하여설명하고있다. 5) 빅데이터 4가지구성요소는 < 표 1> 과같다. 비즈니스분석솔루션기업인 SAS 는데이터의가치 (Value) 에중점을두어가치를창출하기위한비즈니스예측및최적화주제를선정하여빅데이터로부터어떤가치있는정보를얻을것인가에분석관점을가지고있다 ( 김근태, 2012). < 표 1> 빅데이터의 4 가지구성요소 구분규모 (Volume) 의증가다양성 (Variety) 의증가복잡성 (Complexity) 의증가속도 (Velocity) 의증가 주요내용 기술적인발전과 IT 의일상화가진행되면서해마다디지털정보량이기하급수적으로폭증하여제타바이트 (ZB) 시대로진입 로그기록, 소셜, 위치, 소비, 현실데이터등데이터의종류의증가와멀티미디어등비정형화된데이터유형의다양화 구조화되지않은데이터, 저장방식의차이, 중복성문제, 데이터의종류확대, 데이터관리및처리의복잡성이심화 사물정보 ( 센서, 모니터링 ), 스트리밍정보등실시간정보의증가로데이터의생성과이동 ( 유통 ) 속도가증가, 대규모데이터처리와정보의활용을위한데이터처리및분석속도가중요 자료 : 정지선 (2011), 新가치창출엔진, 빅데이터의새로운가능성과대응전략. 2. 빅데이터기술 정보통신기술주도권이인프라, 기술, SW 등에서데이터로이동됨에따라빅데이터의역할은분석과추론 ( 전망 ) 의방향으로진화되어가치창출의원천요소로작용하고있다 ([ 그림 1]). [ 그림 1] 데이터의진화단계 자료 : 정지선 (2011), 新가치창출엔진, 빅데이터의새로운가능성과대응전략. 3) 1ZB( 제타바이트 ) 는 1 조 GB( 기가바이트 ) 에해당하는양으로미의회도서관저장정보 (235 테라바이트 ; 11. 4 월현재 ) 의 4 백만배에해당. 4) IDC(2011), Digital Universe study. 5) 정지선 (2012), 성공적인빅데이터활용을위한 3 대요소 : 자원, 기술, 인력, IT & Future Strategy, 제 3 호. 58 과학기술정책

빅데이터기술은 생성 수집 저장 분석 표현 의처리전과정을거치면서요구되는개념으로분석기술과인프라는 < 표 2> 와같다. 빅데이터분석기술은통계, 데이터마이닝, 기계학습, 자연어처리, 패턴인식, 소셜네트워크분석, 비디오 오디오 이미지프로세싱등이해당된다. 빅데이터의활용, 분석, 처리등을포함하는인프라에는 BI(Business Intelligence), DW(Data Warehouse), 클라우드컴퓨팅, 분산데이터베이스 (NoSQL), 분산병렬처리, 하둡 (Hadoop) 6) 분산파일시스템 (HDFS), MapReduce 등이해당된다. 7)8) 그리고다양한데이터소스에서수집된빅데이터를처리 분석하여지식을추출하고이를기반으로지능화된서비스를제공하기위해서는빅데이터플랫폼이필요하다. 정책초점 [ 그림 2] 빅데이터플랫폼 자료 : 황승구외 (2013), 빅데이터플랫폼전략, 전자신문사, p. 81. 데이터수집에는 ETL(Extraction Transformation Loading) 과크롤링엔진 (Crawling Engine) 을사용한다. ETL 은다양한소스시스템으로부터필요한데이터를추출하여변환작업을거쳐저장하거나분석을담당하는시스템으로전송및적재하는모든과정을포함한다. 크롤링엔진은로봇이거미줄처럼얽혀있는인터넷링크를따라다니며방문한사이트의모든페이지의복사본을생성함으로문서를수집한다. 하둡분산파일시스템을이용하여수천대의노드들을연결하여수페타바이트급의저장용량을제공하고, 다이나모 (Dynamo) 분산데이터관리시스템은데이터를분할하여노드들을배치함으로써대용량의데이터를관리할수있다. 인메모리컴퓨팅은데이터베이스자체를메모리에올려서입출력을빠르게하여데이터의분석과저장, 제공을빠르게지원한다. 6) 하둡은대용량데이터처리분석을위한대규모분산컴퓨팅지원프레임워크로하둡분산파일시스템 (HDFS) 과분산처리를위한맵리듀스가핵심요소이며그외분산 DB 인 Hbase, 검색엔진 (Nutch), 쿼리언어 (Pig) 등을포함한다. 7) Peter Warden(2011), Big Data Glossary, O Reilly Media. 8) 장상현 (2012), 빅데이터와스마트교육, 한국정보과학회지, 제 30 권제 6 호 ( 통권제 277 호 ), pp. 59~64. 제 23 권제 3 호 59

정책초점 < 표 2> 빅데이터처리프로세스별기술영역 흐름영역개요 소스수집저장처리분석표현 내부데이터외부데이터크룰링 (crawling) ETL(Extraction, Transformation, Loading) NoSQL Databases Storage Servers Map & Reduce Processing NLP(Neuro Linguistic Programming) Machine Learning Serialization Visualization Acquisition Database. File Management System File, Multimedia Streaming 검색엔진의로봇을이용한데이터수집소스데이터의추출, 전송, 변환, 적재비정형데이터관리빅데이터관리초경량서버데이터의추출다중업무처리자연어처리기계학습을통해데이터의패턴발견데이터건의순서화데이터를도표나그래픽적으로표현데이터의획득및재해석 자료 : Pete Warden(2011), Big Data Glossary, O Reilly Media. 빅데이터분야에서는 소셜애널리틱스 (Social Analytics) 가페이스북, 트위터, SNS 등에서수집되는비정형데이터를신속하게분석을한다. 소셜미디어에서정보를뽑아내고분석하는방법은크게 3가지로나눌수있다. 첫째, 텍스트마이닝 (Text Mining) 은인간이언어로쓰인비정형텍스트에서자연어처리기술을이용하여유용한정보를추출하거나, 연계성을파악, 분류혹은군집화, 요약등빅데이터의숨겨진의미있는정보를발견하는것이다. 둘째, 오피니언마이닝 (Opinion Mining) 은소셜미디어의텍스트문장을대상으로자연어처리기술과감성분석기술을적용하여사용자의의견을분석하는것으로마케팅에서는버즈 (Buzz; 입소문 ) 분석이라고도한다. 셋째, 네트워크분석 (Network Analytics) 은네트워크연결구조와연결강도를분석하여어떤메시지가어떤경로를통해전파가되는지, 누구에게영향을미칠수있는지를파악하는것이다. 빅데이터의주요기술로는구글에서개발한비구조적데이터의획득, 조직화, 분석을하기위한기술인맵리듀스 (Map & Reduce) 가있다. 60 과학기술정책

[ 그림 3] Map & Reduce 사례 ( 감자, 1) ( 가지, 1) ( 안데스산맥, 1) ( 감자, 1) ( 원산지, 1) ( 감자, 1) ( 기후, 1) ( 감자, 1) ( 파종, 1) ( 감자, 1) ( 잡초, 1) 자료 : 함유근 채승병 (2012), 빅데이터경영을바꾸다, 삼성경제연구소, p. 81. ( 가지, 1) ( 감자, 5) ( 기후, 1) ( 안데스산맥, 1) ( 원산지, 1) ( 잡초, 1) ( 파종, 1) 정책초점 Ⅲ. 본론 1. 보건복지빅데이터활용사례및수요 9) 보건분야의빅데이터국외활용사례로미국국립보건원은다양한질병을연구하기위해유전자데이터를공유분석할수있는유전자데이터공유를통한질병치료체계를마련하여주요관리대상에해당하는질병에대한관리및예측을실시하고있다. 현재 1,700 명의유전자정보를아마존클라우드에저장하여누구나데이터를이용가능하게구축하였다 (www.1000genomes.org/). 미국국립보건원산하국립의학도서관에서는사용자가요구하는다양한약에대한정보를제공하고제조사와사용자간의쌍방향상호작용을통해약의정보를제공하는 Pillbox 프로젝트를통한의료개혁을추진하고있다. Pillbox 서비스 (pillbox.nlm.nih.gov/) 로미국국립보건원에접수되는알약의기능이나유효기간을문의하는민원수는 100 만건이상으로평균한건당확인하는소요비용 50 달러를감안하면연간 5,000 만달러의비용절감효과가있는것으로전망하고있다. 미국퇴역군인국 (U.S. Department of Veterans Affairs) 에서는퇴역군인의전자의료기록분석을통한맞춤형의료서비스를지원하는빅데이터분석을위해 2년간 25 개의 DW 를배치하여 2,200 만퇴역군인에게의료서비스를제공하고있다. 퇴역군인전자의무기록 (EHR) 을분석하여의사가개별환자를쉽게진료할수있도록지원하고있다. 싱가포르 PA(People s Association) 는 1,800 개이상의주민위원 9) 본절은일부내용은 한국정보화진흥원 (2012), 빅데이터로진화하는세상 (Big Data 글로벌선진사례 ) 에서보건 ( 건강한사회 ) 과복지 ( 안전한사회 ) 의사례를분석재정리함. 제 23 권제 3 호 61

정책초점 회센터 ( 커뮤니케이션센터 ) 에서진행되는다양한활동들을공유하기위해주민위원회센터네트워크기반의맞춤형복지사회를구현하였다. 싱가포르 PA 는빅데이터처리를위하여다양한인종, 나이, 문화, 소득, 연령에따른주민의데이터를수집 분석하여개인별맞춤형서비스를제공하고있다. 캐나다온타리오공과대병원은인큐베이터내미숙아에대한다양한데이터를분석하여병원균감염을예측할수있는시스템을개발하여미숙아모니터링을통한감염예방및예측, 감염징후등을조기에발견하고다른미숙아등에대한감염을예방하며퇴원후무선센서를이용하여병원밖에서도환자들을실시간으로체크를할수있는시스템을구축하였다. IBM 과미국건강보험회사인웰포인트 (Wellpoint) 는의사와다른의료진들이진단과환자치료에이용할수있는애플리케이션 ( 왓슨 ) 을개발하여제공하고있다. 왓슨은임상실험및우수치료사례등과거데이터를분석하여환자에게가장적절한치료방법을제공하고최신정보를과학적인방법으로제시하고있다. 구글 (Google) 은감기와관련된검색어분석을통하여독감예보서비스제공하고있다. 구글독감예보서비스 ( 구글플루트렌드 ; www.google.org/flutrends/) 는다양한사용자의검색어분석을통하여사용자에게다시유의미한데이터로가공하여정확한정보를실시간으로제공하고있다. 보건분야국내활용사례로질병관리본부에서운영하는한국인체자원은행네트워크 (kbn.cdc.go.kr/) 는 16개병원을통해 36 만명의인체자원확보하여질병지표발굴및질병조기진단을위해활용하고있다. 한국인체자원은행네트워크는생명연구자원의체계적수집과정보표준화, 정보공유를통하여질병의예방과진단, 맞춤치료, 신약- 신기술을위한미래바이오산업의신성장동력으로서기반을마련하고있다. 분당서울대병원은빅데이터도입을통해업무효율성및생산성향상을위한임상의사결정지원시스템을개발하였다. 임상의사결정지원시스템은환자개인의특이사항을입력하여임상적의사결정을지원하기위한서비스로시스템이도입된후, 부적절한용량의신독성약물처방률이 30.6% 로감소하는효과를가져왔다. 임상의사결정지원시스템은빅데이터를분석하여자연어검색을지원하고의약품의처방과조제시의약품안정성과관련된정보를실시간으로제공하여부적절한약물사용을사전에검사할수있도록확대하고있다. DNA Link (dnalink.com/) 에서는질병관리분석과개인의유전체염기서열분석으로맞춤형건강진단서비스를제공하는유전자분석시스템을제공하고있다. 연세대학교의료원에서는 u-health 를이용하여언제어디서나질병예방, 진단, 치료가가능한후 (H H) 헬스케어시스템을제공하고있다. 복지분야국외사례로는주로안전과관련한빅데이터활용이주를이루고있다. 싱가포르에서는국가위험관리시스템 (Risk Assessment Horizon Scanning) 을구축하여질병, 금융위기등모든국가적위험을수집및분석을하고있다. RAHS(hsc.gov.sg) 는 2004 년부터빅데이터를기반으로한위험관리계획을추진하여수집된정보는시뮬레이션, 시나리오기법을통해분석하여사전위험예측및대응방안을모색하고있다. FBI 는유전자색인시스템활용하여단시간범인을검거하는체계를구축하고있다. FBI 의유전자정보은행 CODIS(Combined, DNA Index System) 은미제사건용의자및실종자에대한 DNA 정보 1만 3,000 건을포함하여 12만명의범죄자 DNA 정보가 62 과학기술정책

저장되고매년 2,200 만명의 DNA 샘플을추가하여범죄수사에활용하며약 350 만개의 DNA 분석표가내장되어있다. 샌프란시스코경찰청은범죄발생지역및시각을예측하여범죄를미연에방지하기위한범죄예방시스템을구축하였다 (www.crimemapping.com). 범죄예방시스템은과거범죄를분석하여효율적으로경찰을배치하고과거범죄자및범죄유형을 SNS 를통해지속적으로관찰함으로써그와관련된조직및범죄에대한예방을하고있다. 복지분야국내활용현황으로는보건복지부가사회복지통합관리망 ( 행복e음 ) 을개발하여수요자중심의복지서비스구현하였다. 사회복지통합관리망은지자체공무원들의복지행정처리를지원하는정보시스템으로지자체에서집행하는 120 여가지의복지급여및서비스이력데이터를이용하여복지대상자선정과맞춤형서비스를제공하고있다. 근로복지공단은공공부문고객관계관리 (CRM) 를구축하여 찾아가는서비스 를통한맞춤형서비스를제공하고있다. 한국정보화진흥원빅데이터국가전략포럼분석팀에서는 2012 년 1월부터 10월 18일까지자살로언급된빅데이터자료를뉴스 ( 온라인에서게재되는 214 개웹사이트 ), 블로그 ( 네이트, 네이버, 이글루스, 다음, 티스토리, 야후 ), 카페 ( 네이버, 다음, 뽐뿌, 카드고릴라, SLR 클럽 ), SNS( 트위터, 미투데이 ), 게시판 ( 네이버지식인, 네이트지식, 다음신지식등 ) 등에서수집하여청소년이작성했다고추정되는 6만 9,886 건을분석하였다. 이를통해청소년들은자살과관련하여온라인상에많은 Buzz 를생성하고있으며 Buzz 의발생패턴에따라보다체계적으로대응할수있는자살예방체계를설계할수있다는가능성을보였다. 10) 한편, 2013 년현재, 보건의료분야빅데이터시범사업으로진행중인과제는다음과같다. 첫째, 국민건강주의예보시범서비스구축사업은국민건강공단의건강보험 DB 와 SNS 정보를융합하여홍역, 조류독감, SAS 등감염별발생예측모델링을개발하고, 이를상시모니터링하여위험징후시주의예보서비스를제공한다. 둘째, 빅데이터기반의약품안전성조기경보서비스는유해사례 DB, 치료기록, SNS 등을연계분석하여, 유의의약품을추출하고, 이들의위험도를예측하여병의원, 제약회사및유관기관등과정보공유를하는사업이다. 셋째, 보건의료빅데이터활용시범사업은포털과질병관리본부등과협의된데이터외병원자체데이터를활용하여독감유행예측, 심실부정맥예측, 입원병상배정최적화, 신종마약류인지및감시서비스를제공한다. 정책초점 2. 빅데이터분석사례 11) 우리나라는급격한사회 경제적변화속에자살률이 2004 년부터 OECD 국가중최고의수준이며, 특히청소년계층의자살문제가사회적이슈로대두되면서정부차원의대책이시급한실정이다. 그동안자살의연구는국가간자살률비교나패널데이터의분석을통한자살원인에대한연구가진행되어왔으나데이터수집의제한으로인하여개인과집단의다양한자살원인에대한분석은 10) 한국정보화진흥원 빅데이터국가전략포럼 (2012. 10. 29.), 대한민국사회현안과빅데이터전략, 제 3 차빅데이터국가전략포럼. 11) 본분석사례는한국보건사회연구원과 ( 주 )SK telecom 이공동으로연구한내용임을밝힘. 제 23 권제 3 호 63

정책초점 미흡한실정이다. 따라서빅데이터분석을통하여다양한자살의원인과자살에대한위험징후를예측할수있을것으로본다. 본연구는 2011 년 1월 1일 2013 년 3월 31 일까지인터넷뉴스, 블로그, 카페, 게시판, SNS( 트위터, 미투데이 ) 등의온라인채널에서발생한 청소년자살 관련온라인 Buzz( 본문, 댓글포함 ) 를분석대상으로하였다. 청소년자살, 유명인자살등자살과관련된사회적이슈발생시에자살과관련한커뮤니케이션이급증하는양상을보이고있으며특히연예인자살이슈발생시버즈량이급증하는것으로나타났다. [ 그림 4] 자살관련버즈량일별추이 청소년자살원인의 1위는 학업 / 성적 / 진학 으로관련된스트레스로인한청소년자살이우리사회의가장큰이슈가되는것으로나타났다. 주요자살원인 [ 그림 5] 주요자살원인 자살 청소년자살 열등감질병 / 장애 0.2% 0.6% 가정불화 1.1% 경쟁 3.0% 실직 / 취업란 3.9% 인터넷 / 게임중독 4.6% 폭력 5.1% 경제적빈곤 5.6% 기타학업 / 성적 / 기타성폭력 14.9% 진학 13.5% 1.8% 학업 / 성적 / 19.3% 진학 27.3% 왕따 6.7% N= 259,071 학교폭력 9.1% 성폭력 10.4% 우울 / 고독 / 불안 15.6% 가정불화 2.0% 경쟁 2.3% 인터넷 / 게임중독 4.7% 경제적빈곤 1.0% 질병 / 장애 1.2% 폭력 7.5% 열등감 0.4% 왕따 12.7% N= 151,183 우울 / 고독 / 불안 12.8% 학교폭력 12.8% 64 과학기술정책

청소년자살검색의예측모형은 < 표 3> 과같다. [ 모형 1] 은 2011 년일별청소년 (19 세이하 ) 자살률이청소년자살검색에미치는영향을예측하는것으로청소년자살자수가많을수록 ( 자살률이높을수록 ) 청소년의자살검색은증가하는것으로나타났다. [ 모형 2] 는일별청소년자살률과스트레스검색이자살검색에미치는영향을예측하는것으로자살자수가많을수록, 또스트레스검색이많을수록청소년의자살검색은증가하는것으로나타났다. [ 모형 3] 은일별청소년자살률, 스트레스검색, 음주검색이청소년자살검색에미치는영향을예측하는것으로자살자수, 스트레스검색, 음주검색이많을수록청소년의자살검색은증가하는것으로나타났다. [ 모형 4] 는일별청소년자살률, 스트레스검색, 음주검색, 미세먼지량이청소년자살검색에미치는영향을예측하는것으로자살자수가많을수록, 스트레스검색이많을수록, 음주검색이많을수록, 미세먼지량이적을수록청소년의자살검색은증가하는것으로나타났다. 청소년의자살검색을예측하는모형의그래프는 [ 그림 6] 과같다. 정책초점 < 표 3> 청소년의자살검색예측모형 독립변수 Model 1 Model 2 Model 3 Model 4 t t t t ( 상수 ) 1.957 68.86 **.648 6.48 **.624 6.22 **.939 5.75 ** 자살률.290 2.53 *.187 2.17 *.173 2.01 *.192 2.24 * 스트레스검색량 1.003 13.40 **.913 10.94 **.935 11.25 ** 음주검색량.178 2.34 *.176 2.34 * 미세먼지량 -.214-2.43 * 수정된 R 2.023.448.456.467 F 6.421 ** 95.430 ** 65.464 ** 51.629 ** ** p<0.01, * p<0.05 [ 그림 6] 청소년의자살검색예측모형 Model 3 제 23 권제 3 호 65

정책초점 Model 4 청소년버즈확산의위험도를측정하기위한데이터마이닝의의사결정나무분석결과사망이혼요인이가장큰확산위험요인으로나타났으며, 사망이혼요인의검색이높은집단은우울질병요인, 걱정얼굴요인, 폭력요인순으로위험의영향이높은것으로나타났다. 그리고사망이혼요인이낮은집단은폭력요인, ( 걱정얼굴요인, 수능성적요인 ), ( 고통열등감요인, 성폭행충격요인 ) 순으로위험의영향이높은것으로나타났다. [ 그림 7] 청소년자살검색확산예측모형 본연구를바탕으로우리나라의자살예방과관련한정책적함의는다음과같다. 12) 첫째, 본연구의결과는성인과청소년모두다양한원인들에의해스트레스를경험하면서자살 66 과학기술정책

을검색하게된다는것이다. 따라서청소년의스트레스를해소할수있는학교차원의다양한프로그램의마련과함께성인의경제활동으로인한스트레스를해소시킬수있는직장차원의프로그램이개발되어야할것이다. 둘째, 성인과청소년은온라인상에서자살과관련한담론을주고받고있으며이러한언급이실제적인자살과관련된심리적 행동적특성으로노출될수있기때문에자살예측모형에따른위험징후가예측되면실시간으로개입할수있는애플리케이션 ( 가칭 : 생명존중온라인게이트키퍼 (Gate Keeper)) 이개발되어야할것이다. 생명존중온라인게이트키퍼 는자살에대한위험징후가예측되면소셜담론의분석에서추측된위험요인을줄일수있는맞춤형프로그램을실시간으로제공할수있도록개발되어야할것이다. 셋째, 지역별소셜빅데이터와지역요인의연계를통한지역별자살예측모형을개발하여실시간으로자살을사전에방지할수있는시스템 ( 가칭 : 지역생명존중예보시스템 ) 을구축하여야할것이다. 지역생명존중예보시스템 은지역별생명존중관련기관에지역별자살예보를 1주또는월단위로제공하여지역별자살행동의원인에대해적극적대응을위한대국민홍보활동을지속적으로실시함으로써지역주민의생명존중인식을강화할수있을것이다. 넷째, SNS 에서주고받는자살관련소셜담론은개인이일상생활에서갖는우울한감정이나고민이기록되는 온라인심리적부검보고서 라할수있다. 핀란드가 오프라인심리적부검보고서 를바탕으로국가차원의자살예방대책을마련하여자살률을줄였다면, 우리나라는세계최고수준의 IT 기술과소셜빅데이터의활용과분석으로국가차원의자살예방대책의마련이가능할것으로본다. 정책초점 3. 빅데이터분석방법소셜빅데이터분석절차및방법은 [ 그림 8] 과같다. 첫째, 해당 Buzz( 자살 ) 분석모델링을통해수집대상과수집범위를설정한후, 대상채널 ( 뉴스, 블로그, 카페, 게시판, SNS 등 ) 에서크롤러 (Crawler) 등수집엔진 ( 로봇 ) 을이용하여수집한다. 이때자살관련키워드그룹 ( 원인, 유형, 대상, 성별, 장소, 지역, 방법등 ) 과자살토픽에대한불용어등을지정하여수집한다. 둘째, 수집된비정형데이터를분석한다. 비정형데이터는 Buzz 분석, 키워드분석, 감성분석, 계정분석등으로진행된다. [ 그림 8] 의청소년자살Buzz 수집사례와같이비정형데이터를연구자가분석하기는수집된상태로는어렵다. 따라서수집된비정형데이터는 Text Mining, Opinion Mining, Network Analysis 를통하여비정형데이터를분류하는절차가필요하다. 셋째, 비정형빅데이터를정형빅데이터로변환해야한다. 자살 Buzz 사례를살펴보면, 자살Buzz 각각의문서는 ID로 Code 화되어야하고, Buzz 내키워드나방법등도모두 Code 화되어야한다. 넷째, 사회현상과연계하여분석하기위하여정형화된빅데이터를오프라인통계 ( 조사 ) 자료와연계해야한다. 오프라인통계 ( 조사 ) 자료는대부분정부나공공기관에서유료또는무료로제공하고있기때문에연계대상자료와함께연 12) 본연구의결과와정책적함의는 송태민 (2013. 8), 소셜빅데이터분석을통한자살검색예측모형개발, 보건복지포럼, 통권제 202 호 의내용중에서발췌한것임을밝힌다. 제 23 권제 3 호 67

정책초점 계가능한 ID( 일별, 월별, 연별, 지역별 ) 를확인한후, 오프라인자료를수집하여연계 (Merge) 할수있다. 다섯째, 오프라인통계 ( 조사 ) 자료와연계된정형화된빅데이터의분석은요인간의인과관계나시간별변화궤적을분석할수있는구조방정식모형이나일별 ( 월별, 연별 ), 지역별사회현상과관련된요인과의관계를분석할수있는다층분석, 그리고수집된키워드의분류과정을통해새로운현상을발견할수있는데이터마이닝분석을실시할수있다. [ 그림 8] 소셜빅데이터분석절차및방법 ( 자살 Buzz 사례 ) Ⅳ. 결론 빅데이터는신가치창출의엔진으로보건복지서비스에새로운패러다임을제공할수있다. 국내의보건복지분야에서는기존레거시시스템의안정적인구축으로이미수많은빅데이터가저장 관리되고있다. 보건분야에서국민건강보험공단은 2002 년부터데이터웨어하우스를구축하여본부와지역본부에서운영중인급여관리시스템, 요양급여비지급시스템, 건강검진시스템, 의료보호시스템, 자격, 보험료급여및사후시스템에서생성되는데이터를저장 관리하고있다. 국민건강보험공단의데이터웨어하우스는보험료시뮬레이션, 보험료및보험급여비상승추계등의정보를제공하고있다. 건강보험심사평가원에서는 2000 년의약분업시행이후청구심사데이터가비약적으로증가하면서 2002 년부터데이터웨어하우스를구축하여기준정보, 요양기관정보, 지급정보에대한데이터를저장 관리하고있다. 건강보험심사평가원데이터웨어하우스는적시에정보를분석할수있도록각주제영역에대한통계분석, 시계열분석, 다차원분석, 추이분석등과같은다양한분석기법을적용하고있다. 또한데이터의활용목적별로심사분석데이터마트, 평가분석데이터마트, 통계분석데이터마트등을운영하고있다. 국립암센터에서는암통계 ( 발생률, 사망률, 생존률 ) 산출로암부담수준파악과암관리정책수립근거를마련하기위한추이분석등을위하여 2002 년부터암등록자 68 과학기술정책

료의데이터웨어하우스를구축하여운영하고있다. 복지분야에서는사회복지통합관리망에대부분의복지정보가통합 관리되고있다. 사회복지통합관리망에는사회복지통합관리망채널, 희망복지, 복지행정, 복지급여통합, 새올행정, 외부영역의 6 개영역의 44 개세부업무별로데이터가저장 관리되고있다. 그외식품의약품안전처에서는수입식품현황이나식품관련 DB 를운영하고있으며, 통계청과국책연구기관들은보건복지관련각종통계생산을위한패널데이터를구축하고있다. 상기에서술한바와같이공공부분에서는이미수많은정형화된빅데이터가저장 관리되고있을뿐만아니라각기관의홈페이지나 SNS 서비스를통해서도많은비정형데이터가관리되고있다. 한편, 개인건강기록 (Personal Health Record: PHR) 이의료서비스소비자에게다양한건강정보를제공하고그들의건강을스스로통제관리할수있는수단을제공함에따라공공과민간차원의 PHR 구축이지속적으로추진되고있다. PHR 은혈압과같은객관적인자료를수집할수있고이런자료는측정되어환자가수동으로입력하거나 u-health 기기를통해직접전송될수도있다. 즉, 24 시간원격건강관리모니터링을위해 u-health 기기를통하여전송된 PHR 정보는건강생활습관 ( 금연, 절주, 영양, 운동 ) 의확립과자가건강관리능력의함양으로국민건강수명을연장시키며삶의질을향상시키고만성질환에대한치료에서예방중심의건강관리를통한의료비절감의효과를기대할수있다 ( 송태민외, 2011). 앞에서살펴본바와같이보건복지영역과빅데이터의관계는매우밀접하다. 보건의료분야에서는생애주기별로맞춤형보건의료서비스를제공하기위해서는보건의료뿐만아니라사회현안이나미래중요이슈를중심으로빅데이터를활용한미래전망및정책의사결정모델을도출할필요가있으며, 이를위해서는사회공동자산인데이터의부가가치를높기위한 위험분석센터 의설립이필요하다. 위험분석센터에서질병관리및예측, 다양한사용자의질병에대한통계데이터를활용하여주요질병의분포및추세를예측함으로써국가차원의조기대응이가능할것으로본다 ( 고숙자 정영호, 2012). 정책초점 [ 그림 9] 위험분석센터설립을통한빅데이터활용방안 자료 : 고숙자 정영호 (2012. 11), 국민건강미래예측시스템구축방안, 보건복지포럼, 통권제 193 호, 한국보건사회연구원. 제 23 권제 3 호 69

정책초점 복지분야에서는 2010 년 2월부터보건복지부를포함한각부처의공공기관이수행하는복지사업과수혜자정보를통합관리하는사회복지통합관리망 ( 행복e음 ) 을가동하고있다. 복지사각지대를해소하고생애주기별로개인맞춤형복지서비스를제공하려면현재의사회복지통합망을전 ( 全 ) 정부부처의정보시스템과통합연동하는국가빅데이터인프라로확장하여야할것이다 ( 황승구외, 2013). [ 그림 10] 복지분야의빅테이터활용방안 자료 : 황승구외 (2013), 빅데이터플랫폼전략, 전자신문사, p. 201. 이러한보건복지분야빅데이터를효율적으로활용하기위해서는다음과같은전략이필요할것이다. 첫째, 보건복지빅데이터를통합적으로관리하기위한범부처차원의 ( 가칭 ) 보건복지빅데이터관리위원회의운영이필요하다. 현재보건복지빅데이터는보건복지부, 고용노동부, 지식경제부 ( 현산업통상자원부, 미래창조과학부 ), 식품의약품안전처, 통계청등많은정부부처와국민건강보험공단, 건강보험심사평가원, 국책연구기관등많은공공기관에서관리 운영되고있어각기관에서운영중인정보의연계와공유를위해서는범정부차원의조직이필요할것이다. 둘째, 비정형화된보건복지빅데이터를관리하고있는민간기관과의협조체제가마련되어야할것이다. 비정형화된보건복지빅데이터는민간기관의검색포털이나 SNS 를통해서생산 저장되고있어민간기관과의긴밀한협조체계 ( 가칭 : 보건복지빅데이터포럼 ) 가구축되어야할것이다. 셋째, 국가차원의오픈 API(Open Application Programming Interface) 의제공이필요하다. 보건복지빅데이터는대부분공공부문에서독점하고있다. 정보를수집 / 분석하고수집과동시에정보를실시간으로웹상에공개하는것도중요하지만보건복지빅데이터를효과적이고효율적으로활용하기위해서는정부차원의 API 공개를적극적으로검토할필요가있다. 2013 년 5월기준으로공유자원포털 (www.data.go.kr) 에서공개되어있는공공정보는 1,721 종으로이중보건의료 21종, 복지 29 종에불과하다. 국가정보화전략위원회의에서는폭증하는데이터가경제적자산이되는시대 70 과학기술정책

이기때문에정부가능동적으로빅데이터를활용하고국가지식플랫폼을만들기를제안하고있다. 13) 따라서보건복지빅데이터의공개는관련기관과빅데이터전문가의참여로정부와국민이필요로하는정보를분류하고공개대상정보는개인정보를철저하게보안하여국가지식플랫폼에저장할수있을것이다. 넷째, 보건복지빅데이터를분석처리할수있는관련기술의개발이필요하다. 스마트시대에는비관계형, 비정형데이터의저장과분석, 클라우드서비스의확산, 시멘틱검색서비스, 추론에기반한상황인식서비스등의기술이핵심이될것이다. 따라서관련부처와협력하여보건복지분야빅데이터를 수집 저장 분석 추론 할수있는기술개발은물론기술표준화가우선적으로추진되어야할것이다. 다섯째, 구조화되지않은대규모데이터속에서숨겨진정보를찾아내는데이터사이언티스트 (Data Scientist) 의양성이필요할것이다. 빅데이터시대에는데이터를관리하고분석할수있는인력이매우중요하다. 이미글로벌 IT 업체에서는데이터사이언티스트에대한인재확보와역량강화에많은노력을경주하고있다. 14) 따라서교육부와협력하여보건복지분야데이터사이언티스트를양성할수있는전략이마련되어야할것이다. 끝으로보건복지빅데이터의개인정보와기밀정보에대한보안정책이마련되어야할것이다. 보건복지빅데이터는개인에대한거의모든정보가저장되어있지만아직법 제도는미비한상황이며논의조차되지못하고있다. 빅데이터의활용도중요하지만과다한개인정보의유출은프라이버시침해는물론사이버인권침해나범죄에악용될수있다. 빅데이터로부터개인을보호하기위해가장중요한것은특정개인을식별하지못하도록하는익명화와정보접근및처리에대한통제이다. 그러나정보접근및처리에대한통제를강하게하면정보활용이활성화되지않기때문에보건복지빅데이터 활용과보호의균형 에대한효과적인정책이마련되어야할것이다. 정책초점 참고문헌 고숙자 정영호 (2012. 11), 국민건강미래예측시스템구축방안, 보건복지포럼, 통권제193호, 한국보건사회연구원. 국가정보화전략위원회 (2011. 11. 7.), 지식정보개방과협력으로스마트정부구현. 김근태 (2012), 빅데이터분석을위한기업의 Big Analytics 환경변화, 정보처리학회지, 제19 권제2 호, pp. 70~78. 송태민 이상영 이기호 박대순 진달래 류시원 장상현 (2011), u-health 현황과정책과제, 한국보건사회연구원. 13) 국가지식플랫폼은 1,068 종공공지식정보가운데 351 종을 2013 년까지민간에전면공개하고이를통해창출되는경제적부가가치는 10 조 7,000 억원에달할것으로예측하고있다. 14) 이베이는고객데이터를분석하고가공하는일을맡은직원만 5,000 명에이르고, EMC 는경제학, 통계학, 심리학등을전공한박사급인재들인데이터사이언티스트로구성된 애널리틱스 랩을운영하고있으며, 미국 IBM 은사내 200 명이상의수학자들이 분석학 을집중적으로연구하고있음. 미국에서는 2018 년까지 14 만 19 만명의전문가와 150 만명정도의데이터관리자와분석인력이부족할것으로예측하고있음 (McKinsey, 2011). 제 23 권제 3 호 71

정책초점 송태민 (2012. 11), 보건복지빅데이터의효율적활용방안, 보건복지포럼, 통권제193 호, 한국보건사회연구원. 송태민 (2013. 8), 소셜빅데이터분석을통한자살검색예측모형개발, 보건복지포럼, 통권제202 호, 한국보건사회연구원. 윤미영 권정은 (2012), 빅데이터로진화하는세상-빅데이터글로벌선진사례-, 한국정보화진흥원빅데이터전략연구센터. 윤형중 (2012), 이제는빅데이터시대, 비즈북스. 이성훈 이동우 (2013. 2), 빅데이터의국내 외활용고찰및시사점, 디지털정책연구, 제11권제2 호, pp. 229~233. 장상현 (2012), 빅데이터와스마트교육, 한국정보과학회지, 제30 권제6호, 통권제277 호, pp. 59~64. 전자통신기술연구소 (2012), 보건의료 Big Data R&D 사업기획연구계획서. 정지선 (2011), 新가치창출엔진, 빅데이터의새로운가능성과대응전략, IT & Future Strategy, 제18 호. 정지선 (2012), 성공적인빅데이터활용을위한 3대요소 : 자원, 기술, 인력, IT & Future Strategy, 제3호. 한국정보화진흥원 (2012. 10. 29.), 대한민국사회현안과빅데이터전략, 제3차빅데이터국가전략포럼. 함유근 채승병 (2012), 빅데이터경영을바꾸다, 삼성경제연구소. 황승구 최완 허성진 장명길 이미영 박종열 원희선 김달 (2013), 빅데이터플랫폼전략, 전자신문사. IDC(2011), Digital Universe study. McKinsey Global Institute(2011), Big Data: The Next Frontier for Innovation, for Innovation, Competition, and Productivity, McKinsey Inc. Peter Warden(2011), Big Data Glossary, O Reilly Media. 総務省 (2012), 平成 24 年度版年度版情報通信白書. 공유자원포털 (www.data.go.kr) 구글독감예보 (www.google.org/flutrends) 구글검색트렌드 (www.google.org/trends/) 샌프란시스코범죄예방 (www.crimemapping.com) 유전자정보제공 (www.1000genomes.org/) 일본총무성 (www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/) 한국인체자원은행 (kbn.cdc.go.kr/) DNA Link(dnalink.com/) 72 과학기술정책

The Economist(2010)(www.economist.com/node/15557443/) Gartner(2011)(www.gartner.com/newsroom/id/1731916/) Pillbox service(pillbox.nlm.nih.gov/) RAHS(hsc.gov.sg) 정책초점 제 23 권제 3 호 73