BRIC View 2017-T07 BRIC View 동향리포트 보건의료빅데이터관리시스템최신동향 장성재 한국원자력의학원 E-mail: sjsjj@kirams.re.kr 요약문 최근보건의료산업이치료중심에서예방및건강관리중심으로이행됨에따라서질병발생가능성을예측하고사전에예방할수있는관련기술에대한요구가증가하고있으며, 이와더불어개인맞춤형정밀의료서비스의중요성또한증가하고있는추세이다. 또한, 건강검진자료, 질병자료, EMR (Electronic Medical Records), 유전체분석데이터등정밀의료및의료영상을중심으로관련데이터의양이급격히증가하고있다. 특히인간유전체염기서열판독기술의비약적인발전으로인해생명공학의기술패러다임이새로운세대로이동하고있으며, 각개인의유전자특성정보를분석할수있게됨에따라헬스케어의패러다임이발병후치료에서발병전예측및맞춤형관리 / 치료의개념으로전환되고있다. 본동향리포트에서는보건의료빅데이터관련법규및정보관리시스템에대한글로벌트랜드를소개하고국내현황과의비교를통해관련연구자및산업계에최신지견을소개하고자한다. Key Words: 유전체, 정밀의학, 빅데이터, 개인정보, 기술패러다임변화 목차 1. 서론 2. 본론 2.1 보건의료빅데이터시장동향 2.2 보건의료개인정보관련법체계 2.3 보건의료빅데이터와인공지능의결합 2.4 개인유전체기반맞춤형의료서비스 2.5 개인정보비식별화조치 2.6 보건의료표준화현황 보건의료빅데이터관리시스템최신동향장성재 Page 1 / 17
3. 결론 4. 참고문헌 1. 서론 한국생명공학연구원은지난 2016년 12월 28일바이오헬스이슈를선도하는 10대미래유망기술을선정하여공개했다 ( 표 1). 이기술들에는대규모임상유전체정보관리기술및모바일인공지능진단기술등국내전문가들이선별한향후유망할것으로예측되는기술들이대거포함되어있다. 특히단순치료중심에서사전진단ㆍ예방및맞춤형치료로의보건의료패러다임의변화에부응하기위해서는폭발적으로증가하고있는보건의료데이터를비롯하여 2~8번에이르는이슈들을해결하기위한차세대시퀀싱기술이필수적이며, 이기술을통해생산된방대한데이터를분석하기위해서는이들보건의료빅데이터를통합하여관리할수있도록 대규모임상유전체정보관리기술 가선행되어야할과제중의하나이다 [1]. 대규모임상유전체정보관리기술 의요소기술로는첫째, 임상-유전체정보데이터웨어하우스를통한임상유전체정보의표준화및관련정보의데이터베이스 (DB) 화가필수적이며, 이를위해기존의임상정보와유전체정보의통합을위한프로토콜의개발및궁극적으로환자의임상정보와유전체정보를통합한 임상-유전체 DB 를구축하여야한다. 둘째, 바이오빅데이터기반의임상-유전체정보분석기술이필요한데, 대용량의암임상-유전체정보기반진단, 치료및예후바이오마커분석등을위한알고리즘및시스템개발이필수적이다. 또한, 구축된임상-유전체 DB의기본적인분석을할수있는인공지능기반의임상의사결정지원시스템 (Clinical Decision Support System, CDSS) 과같은 IT 기반의클라우드컴퓨팅분석파이프라인및서비스시스템의개발도요구된다. 글로벌보건의료분야데이터분석시장은 2014년 ~2019년연평균 25% 이상의성장률이예측되며미래경제성장을견인하는유방분야로주목받고있다. 2013년 McKinsey 보고서에따르면 지난수십년간의료기관의의무기록을디지털화하고, 제약회사가연구개발데이터를전자 DB로통합하며, 정부와공공기관들이저장된데이터를이용ㆍ검색ㆍ실행가능하도록투명성을확대함에따라서보건의료분야에서도정보공개가진행되고있으며이러한데이터의유동성확대는보건의료산업을변화시킬것 이라고전망했다 [2, 3]. 하지만, 세계빅데이터시장에서빠른속도로진행되고있는산업화와기술경쟁은보건의료빅데이터의공익적활용가치와산업적가치창출의균형을맞추기어렵게한다. 공적건강보험제도에기초한국내보건의료시스템에서보건의료빅데이터는국가서비스산업발전전략의일부로추진되고있으며, 보건의료시스템전반에서혁신을유도하고정보생산의주체인국민에게보건의료빅데이터의분석편익을돌려주는공익적활용의국가전략수립은지연되고있는실정이다 [4]. 보건의료빅데이터관리시스템최신동향장성재 Page 2 / 17
표 1. 2017 년바이오미래유망기술 ( 부제 : 바이오헬스이슈를선도하는 10 대미래유망기술 ) 이슈 10 대미래유망기술 1 보건의료빅데이터대규모임상유전체정보관리기술플랫폼구축 (Clinico-genomic big data management) 2 개인유전체기반단일세포유전체분석기술맞춤형치료제개발 (Single cell genomics) 3 재생의료융합화및생체내직접교차분화기술기술개발확대 (In vivo direct reprogramming) 4 유전체발현후성유전학적발생ㆍ분화조절기술지휘단백질발견 (Epigenetic regulation of development) 5 혁신적진단기술, 순환종양세포 DNA 탐지기술액체생체검사대두 (Circulating tumor DNA detector) 6 표적유전자를편집하는유전자편집을통한질병치료기술유전자가위기술의혁신 (Genome editing-based gene/cell therapy) 7 신종바이러스와역학정보분석기술슈퍼박테리아의전세계확산 (Infoepidemiology) 8 모바일기기로질병모바일인공지능진단기술예측ㆍ예방ㆍ진단및관리 (Mobile AI diagnosis) 9 애플ㆍ구글등웨어러블건강관리기술스마트헬스케어전쟁 (Wearable health device) 10 원격의료시범사업확산 연속식혈당측정기술 (Continuous glucose monitoring) [ 출처 : 한국생명공학연구원, 바이오헬스이슈를선도하는 10대미래유망기술보도자료, 2016] 표 2. 대규모임상유전체정보관리기술의니즈 주요이슈 기술적측면 경제적측면 사회적측면 2007년부터본격적으로도입된 NGS (Next Generation Sequencing) 기술을이용한유전체정보를얻는비용과시간의획기적인절감에따른대용량유전체빅데이터생산기술이급속히발전질병의정확한진단과개인에알맞은효과적치료와치료제의선택및질병을예측 / 예방함으로써건강한삶추구와의료비절감에기여고령화사회로급속히접어들고있으며, 그에따른질병치료에대한비용및치료기간의지속적증가에따라서유전체기반의개인맞춤의료에대한요구가증가 보건의료빅데이터관리시스템최신동향장성재 Page 3 / 17
2. 본론 2.1 보건의료빅데이터시장동향 보건의료빅데이터시장은해외의여러시장조사보고서에서공통적으로매우빠른성장을통해큰시장을형성할것으로예측하고있다. Technavio (www.technavio.com) 에서발표한시장조사보고서에서는 2015년부터 2019년까지연평균 42% 의고성장을보일것으로예측하고있다. 특히, 미국의경우 HITECH (Health Information Technology for Economic and Clinical Health) Act와 Affordable Care Act를위시한정부주도의빅테이터이니셔티브에기인한영향으로전세계시장의약 63% 를차지할정도로미국중심의시장이형성될것으로예측하고있다. 그외여러시장보고서들의내용에서도연평균 17.34~40.5% 의시장증가를예상하고있으며, 2018년에는 100~500억달러규모의시장으로예측하고있다. 그리고대표적인기업들로는 IBM, SAS, Oracle과같은전통적인 IT업체에서부터 Cerner, Allscripts와같은 EMR 업체들이언급되고있다. 산업통상자원부의보고서에따르면보건의료빅데이터시장은 2013년에 52억달러규모에달하고 2023년에는 629억달러에이를것으로예측하고있으며, 특히데이터해석-분석분야의성장률이연평균 37.55% 에달할것으로보고있다 [6]. 하지만, 시장규모는데이터저장-통합부분이기반인프라구축차원에서큰투자가필요해당분간가장큰규모를차지할것으로예측하였다. 특히, 국내시장의경우 2013년에 857억원규모였던것이 2023년에는세계시장성장률을웃돌아약 5,600억원의규모로확대될전망이라고한다. 표 3. 보건의료빅데이터해외시장규모 ( 단위 : 억달러 ) 구분 2013 2018 2023 연평균성장률 (%) 건강관리 525 1,147 1,824 9.38 서비스 예측의료 4.4 6.7 10.5 9.47 유전자 17 2.8 42 8.41 데이터저장 - 통합 27.3 146.4 346.2 21.27 DB 관리 데이터해석 - 분석 1.6 6.9 34.4 37.55 시각화 - 빅데이터 23 92.4 248 19.62 보건의료빅데이터관리시스템최신동향장성재 Page 4 / 17
표 4. 포스트게놈다부처유전체사업추진계획 ( 안 ) 추진경과 일정 내용 10.10~ 10.11 유전체연구공동기획추진을위한부처협의 10.11~ 11.02 국과위 BT 5 개중점분야투자전략수립추진 10.11~ 11.02 국과위유전체실무위원회구성및운영 11.02 국과위유전체정보ㆍ분석연구투자전략확정 11.05~ 11.11 다부처유전체사업공동기획 12.03.09 2012년상반기예비타당성조사대상선정 12.03~ 12.11 KISTEP 예비타당성조사실시 13.10 범부처협의체구성ㆍ운영계획수립 13.12 2014년 1차년도사업예산확정 14.02.20 2014년도부처공동사업설명회실시 14.03 포스트게놈다부처유전체사업추진계획 ( 안 ) 수립 [ 출처 : (2014~2021) 포스트게놈다부처유전체사업추진계획 ( 안 ), 2014] 우리나라는 2019년에 65세이상의노령인구가전체인구의 14.4%, 2026년에는 20.0% 에이르는초고령화사회로진입할것으로예측되는등, 세계에서보기드문고령화속도를보이고있어보건의료관련산업의성장잠재력이매우높으며, 이를해결하기위해정부에서도국가정책으로보건의료빅데이터에대한지원을위해노력을하고있다. 특히, 2014년부터포스트게놈다부처유전체시업추진계획을발표하고, 창조경제의핵심분야인유전체사업의연구역량확대및조기투자성과창출을위해부처별연계ㆍ협력을강화하려는노력을아끼지않고있다. 선진국을포함한대부분의국가에서의료정보빅데이터활용에서공통적인면은공익적목적으로빅데이터의활용을제한함으로써위험을감소시키는한편, 민감한개인정보보호와데이터보안을강화하는전략을통해국민의신뢰와참여를유도하고있다는것이다. 보건의료빅데이터관리시스템최신동향장성재 Page 5 / 17
그림 1. 통합건강관리시스템 (Integrated Healthcare) 모식도 [ 출처 : MaRS Market Intelligence 2014] 미국 미국은 65세이상노인에대한국가건강보험프로그램인메디케어 (Medicare; http://www.medicare.gov/) 와저소득층에대한주정부관장의료보호제도인메디케이드 (Medicaid; http://www.medicaid.gov/) 를제외하고는대부분을민간의료시장에의존하고있다는특성을가지고있다 [3]. 하지만, 미국의초기보건의료빅데이터사업은보건부의 NIH (National Health Institute) 와 AHRQ (Agency for Healthcare Research and Quality) 를통한비교효과성연구 (Comparative Effectiveness Research, CER) 사업으로시작되었고, 의학과의료제공에서혁신을유도하도록근거생산연구를확대를통한환자중심통합의료 (Patient-Centered Integrated Care) 기반을구축하는국가적인전략을추진하고있다. 미국은민간보험사들을중심으로다양한정보통합플랫폼이활성화되도록간접적인조정자의역할로서보건부산하에 ONC (Office of the National Coordinator) 를설치하여데이터상호운용성 (Interoperability) 을높이기위한정부제공과분류표준화등을담당하게하고있다. 또한, 의료질향상과비용절감을통한시스템효율화를목적으로공적시스템에서다양한정보활용사업 ( 환자중심의료연계실적을포함한의료질평가 ) 을추진하고있다. 보건의료빅데이터관리시스템최신동향장성재 Page 6 / 17
영국 영국은전국민에게무료로의료서비스를제공하는조세기반국가보건의료서비스 (National Health Service, NHS) 를운영하고있으며, 보건의료빅데이터활용에대해서는미국과동일하게환자중심통합의료기반을구축하는국가적인전략을추진하고있다 [5]. 특히, 영국보건부는 2013년에 Personalized Health and Care 2020을발표하여환자와시민의의료및복지정보에대한통제권을강화시키고분산된사회보장데이터들을수집, 저장, 연계, 분석하는독립조직인 HSCIC (Health and Social Care Information Center) 를설립한바있다. 또한, NHS에서더나은의료를제공하기위해의료정보의활용 (The Care Data program을통한의사간환자진료정보공유 ) 을목적으로국민의참여와선택을유도하고있다. 일본 일본은전세계적인빅데이터활용움직임에일단보조를적극적으로맞추고있다. 2015년 1월 의료빅데이터시대의개막 이라는보고서를의학전문출판사인의학서원 ( 醫學書院 ) 에서출간하였는데, 일본에서는연간약 900만건의데이터가축적되는진단군분류자료와진료보수명세서자료를중심으로연구자가구축한증례자료와생명공학 DB 등포괄적인의료정보빅데이터에대한정비작업을추진중이다. 이의일환으로진료보수명세서및특정건강검진결과에대한국가 DB 구축을시작으로각각독립적으로구축해온 DB를연계해개인건강상태의인과관계를규명하고개개인에대한의료서비스의개선은물론, 의료정책의수립에이르기까지통합시스템을활용하도록정부차원에서지원하고있다. 2.2 보건의료개인정보관련법체계 2.2.1 미국 일반사항 미국의경우의료정보의수집및사용에균일하게적용되는개인정보보호원칙은따로존재하지않으며기본적으로연방법차원의 HIPAA (Health Insurance Portability and Accountability Act) 의 Privacy rule에서주로규정하고있고, GINA (The Genetic Information Nondisclosure Act of 2008), 42 CFR Part 2를비롯하여기타각주별로법률체계에서관리하고있다 [7]. 관련법체계 미국은개인정보보호에관하여각산업별로규정하고있는데, 1966 HIPAA 의제정을통해 보건의료빅데이터관리시스템최신동향장성재 Page 7 / 17
의료영역에서개인정보보호를규율하게되었다. HIPAA 제정당시의주목적은건강보험의이동성과책임을규정하는법으로피고용자가퇴직이나이직을하는경우에도의료보험의보장성을유지하기위한것이었다. HIPAA Privacy rule은개인건강정보의이용및공개방법, 범위등에관한법규명령으로 2002년 8월 14일제정하여 2003년 4월 14일부터발효되었다. 또한, HIPAA Security rule은전자개인의료정보에한해규정하고있다. 일반적으로 HIPAA에서개인의료정보의이용과공개를위해서는아래와같은경우를제외하고는개인의서면동의가원칙이나진료및의료행위에필수적으로수반되는진료, 지불또는기관운영을위해필요한경우에는예외로한다고규정되어있다. < 서면동의없이이용및공개가가능한경우, HIPAA> -법에의해요구되는경우 -공중보건을위한활동 -중독, 방임또는가정폭력의신고 -보건감독활동 -사법절차, 행정절차 -법집행목적의활동 ( 범죄수사등 ) -사망자에관한정보를검사관, 의사등에게제공하는경우 -장기, 안구, 조직기증의목적 -연구목적으로기관심의위원회 (Institutional Review Board; IRB) 또는 Private Board의승인을받아 PHI (Protected Health Information) 이용및제공가능, 연구준비를위해필요한경우해당기관내부에서이용가능, 사망자에대한연구가목적인경우등의일정한유형의연구활동 -공중의건강안전에대한중대한위해 ( 危害 ) 를방지하기위한경우 -군사, 교정활동등특별한정부의기능을위한경우 -산업재해보상청구를위한경우 HIPAA Privacy rule( 연방프라이버시보호법 ) 은행정기관이보유하는개인에관한정보를대상으로개인정보에대한정의를하고있기때문에식별가능성에대한사항보다는식별된개인에관한정보를개인정보로인정한다. 반면, 미국아동의온라인프라이버시보호법과그시행령은개인을식별할수있는정보라는점을전제하면서개인정보의범위에포함되는정보를열거하고있다. 이는 EU나영국등에서개인정보에대한개념을추상적으로접근한것에비하여상당히구체적인방법으로접근하고있다는것을알수있다. 다만, 아동에대한보호규정이기때문에다른법률규정에비하여좀더유연하게이루어지고있는것으로도볼수있다. 캐나다의연방프라이버시보호법과개인정보보호및전자문서법에서도 식별가능한 또는 신원을확인할수있는 이라는용어를사용하면서개인정보의핵심으로써식별성을필요로한다는점을명시하고있다. 이러한기준은우리의개인정보보호법상개인정보의식별성에관한사항과비교할때, 우리의경우는좀더상세한기준이필요하다는점을시사하고있다고볼수있다. 보건의료빅데이터관리시스템최신동향장성재 Page 8 / 17
또한, GINA는일반적으로보험관련의사결정을내릴때수혜장의유전정보를제공하는것을금지하고있으며, 일반적으로고용주가유전정보를바탕으로한차별과고용결정에유전정보를사용하는것을금지하고있다. 42 CFR Part 2는연방정부가약물남용예방프로그램, 메디케어 (Medicare) 에참여하는제공자, 미국마약단속관리번호를가지고있는자에게적용되며, 제공자는정보공개를위하여환자의사망원인, 아동학대보고, 특정연구를위한국가위임요구에따른정보공개를예외로하고반드시환자의동의를얻어야한다. 또한, 최근하원을통과한 21st Century Cure Act (2015년 7월 ) 는생물의학연구에대한현재의규제에대한개혁과매년 FDA 및 NIH에추가적인세출을제공하는법률안으로써보건부장관에게 Patient Experience Data를활용하여 Risk-Benefit Analysis를도입하여 FDA 규제프레임워크를개선에활용하고있다. 특히, 최근미국내빅데이터연관산업의발전에따라서데이터거래산업도성장하고있는추세로미연방통상위원회 (Federal Trade Commission, FTC) 는제품의디자인단계별개인정보보호체계를마련할것을촉구하고있다. 2.2.2 유럽연합 EU 의개인정보보호법 EU의경우그동안개인정보보호에관한기본법적역할을했던 1995년개인정보보호지침 (Directive) 을폐지하고새로운법률인개인정보보호규정 (Regulation) 을제정하는거의마지막단계에와있다. 개인정보의범위와관련한두법률은기본적으로접근방식은동일하지만 2014년개인정보보호규정에서좀더상세한접근을하고있다. 구체적으로보면원칙적으로식별된또는식별가능한자연인과관련된여하한정보는모두개인정보에해당한다. 여기에서식별가능한자연인은직접적또는간접적으로식별될수있는사람이다. 그런데특별히본규정에서는식별성과관련해서이름, 식별번호, 위치정보, 온라인식별자또는그사람의하나또는이이상의요소로서특정한신체적, 생리적, 유전적, 정신적, 경제적, 문화적, 사회적정체성에의하여식별할수있는것이라고규정한다. 이와마찬가지로영국의경우에는그내용에있어표현방식의차이가있을뿐, 거의유사한내용을담고있으며독일의연방개인정보보호법도마찬가지이다. 식별성과관련해서 EU 개인정보보호지침 ( 제26조 ) 및개인정보보호규정 ( 제23조 ) 은모두식별성의해석에있어합리적으로판단해야한다는점을강조한다. 영국의일반사항 영국의의료서비스제공자는환자정보와관련하여보통법 (Common Law) 상의비밀유지의무를가지고있기때문에환자정보를제3자와공유하기위해서는해당환자의동의를받아야하는것이원칙이다. 보건의료정보에대한접근과이용에관해서는보통법상의비밀유지의무외에도 Data Protection Act 1998, Health and Social care Act 2012, Care Act 2014에의해규정하고있다. 보건의료빅데이터관리시스템최신동향장성재 Page 9 / 17
영국의관련법체계 보통법상의비밀유지의무에의하면환자관련정보는원칙적으로제3자에게공개될수없으나, 환자가자신의정보가어떻게사용될지에대해알고자발적으로정보공개에동의를한경우 ( 환자의사에따라서동의의내용및범위변경가능 ), 정보공개를통해환자개인, 타인, 혹은공공의이익을위해필요할경우, 정보를공개해야할법률상의의무가있을경우에는개인정보의공개가가능하다고명시하고있다. Data Protection Act 1998은 1995년에제정된 EU의개인정보보호지침을국내법으로수용한법률로개인정보의처리에관한일반적인규율을제공하고, 개인정보처리자가준수하여야할 8가지원칙을규정하고있다 [8]. 또한, 생존하는개인을식별할수있는정보의처리에만적용되며, 비식별처리된정보는대상에서제외한다. 특이한사항으로연구목적에대해서는보유기간에제한이없이예외를인정하며, 환자의동의를얻은바없어도기존의무기록등환자의식별가능정보를이용하여역학적연구를하는것이가능하도록정하고있다. Health and Social Care Act 2012는영국의국립보건서비스 (NHS) 를개혁하기위해제정되었으며, 보건의료데이터의연계및활용을위한독립된권한을가진별도기구로써 HSCIC( 현재 NHS Digital) 의설립근거제공하고있다. HSCIC는영국내일반의 (General Practitioner) 로부터환자의진료기록등의정보를제공받아저장, 분석, 가공하며이를제3자및일반에제공및공개하는역할을담당한다. 다만, 이들정보의제공및공개는반드시국민의건강수준향상, 질병예방, 보건의료체계의혁신을위한범위내여야만한다. Care Act 2014는 Health and Social Care Act 2012 제정이후, 개인정보보호가부족하다는비판에따라서 HSCIC가제3자에게보유정보를제공하는목적을 의료ㆍ복지서비스의증진, 혹은국민건강증진 으로제한하였으며, 연구, 신약개발또는치료방법개발이외의상업적인보험회사들이환자의개인정보를열람하는것이불가능하게하였다. 또한, 기타관계법령으로 Human Right Act 1998, Health Service (Control pf Patient Information) Regulations 2002, National Health Service Act 2006, Health Protection (Notification) Regulations 2010 등이있다. 2.2.3 일본 일반사항 일본에서는개인정보보호에관한법률로서 행정기관이보유하는개인정보의보호에관한법률, 독립행정법인등이보유하는개인정보의보호에관한법률, 정보공개 개인정보보호심사회설치법 및 행정기관이보유하는개인정보의보호에관한법률등의시행에따른관계법률의정비등에관한법률 이 2003년 5월 30일에공포되어, 2005년 4월 1일부터시행되고있으며, 동시에실시된 개인정보의보호에관한법률 ( 이하 개인정보보호법 ) 과마찬가지로 IT 사회에서개인정보의이용확대에대응하기위하여제정되었다. 다만, 공적부문중지방공공단체가보유하는개인정보에관하여는각지방공공단체가제정하는조례에의해규율된다. 일본의경우현재각부처에서분야별로개인정보보호가이드라인을규정하였지만, 법률개정으로 보건의료빅데이터관리시스템최신동향장성재 Page 10 / 17
인해총리실직속으로해당업무가이관될예정이다. 특히, 의료분야는별도로관리번호 CRP 를 도입하여게놈등연구활성화를위해특별법도입을논의중에있다. 관련법체계 개인정보보호법이 2005년제정된이후개인의권익보호및공익및공공성의관점에서정보공개의양립의견이개진됨에따라 2015년 9월 3일개정안이중의원본회의에서가결되었으며, 2016년 1월 1일부터시행되었다 [9]. 또한, 그동안분야별로각부처에서관할하던업무를총리실산하에개인정보보호회를두어개인정보보호에대한업무를총괄하도록하였다. 개정안에는 행정절차에있어특정개인을식별하는번호의이용등에관한법률 (2013년) 에따라서한국의주민등록번호와같은체계가도입됨과빅데이터분석의발전에따라서개인정보에 개인식별부호 를추가하였고, 의료정보 ( 병력 ) 는 필수배려개인정보 로관리하도록규정하며구체적인내용은정령으로정하도록하였다. 후생노동성은의료서비스의품질향상및의학연구발전을추진하기위한정보연계를위해기반이필요할것으로판단하여개인의권리이익의추가도모를의료분야의개별법을추진하였다 [10]. 최근법개정이진행되었으나게놈연구등의확대를위해서현행개인정보보호법체계에서의개인식별부호, 필수배려개인정보등에대한문제점은계속해서제기되고있는실정이다. < 의료분야주요검토내용 > -환자등의권리와의료등의서비스제공측의의무 -환자등의자기정보통제권한의확보 -의료등의서비스제공측의면책 -정보검색및활용 -법의평가적용범위와이행의확보 2.3 개인정보비식별화조치 개인정보비식별화 (de-identification) 는데이터값삭제, 가명처리, 총계처리, 범주화, 데이터마스킹등을통해개인정보의일부또는전부를삭제하거나대체함으로써다른정보와결합하여도특정개인을식별할수없도록하는조치이다 [11]. 데이터의활용과정에서개인정보노출및개인프라이버시의침해우려를최소화하기위한방책으로활용되며, 최근빅데이터로대표되는 ICT 분야의환경변화와그에따른개인정보보호의논란속에서주목받고있다. 국제표준기구에서도개인정보비식별화표준제정에적극나서는등공공과산업영역에서데이터활용을통해막대한부가가치창출을지원하는동시에개인정보보호의법률원칙과시민의프라이버시권리를지킬수있는제도적장치의마련에대한필요성이커지고있다. 보건의료빅데이터관리시스템최신동향장성재 Page 11 / 17
2.3.1 해외의비식별화법제및가이드라인현황 미국 앞서언급했듯이미국에서는개인정보보호법제가개별분야나사안에따라서적용되기때문에비식별화관련규제나지침역시분야별로다뤄진다. 미국에서개인정보비식별화원칙은온라인개인정보취급과관련한정보주체의권리를확립하기위해 2012년오바마행정부가제안한 소비자프라이버시권리장전 (Consumer Privacy Bill of Rights, CPBR) 의개정을통해명확하게정의될전망이다 [12]. 비식별화관련지침으로는미연방거래위원회 (FTC) 가 2012년 3월발표한 개인정보의비식별화가이드라인 이있으며, 이는특정한소비자, 컴퓨터및기타개인을식별할수있는장치들과연관될수있는것은어떤정보라도보호의대상이되어야한다고규정하고있다. FTC가제시하는비식별화관련 3가지요구사항은다음과같다. 첫째, 개인, 컴퓨터및디바이스에대한정보를추론 ( 식별 ) 할수있는데이터의삭제, 수정, 노이즈추가, 통계적으로샘플링, 총계처리등의적절한방법을자율적으로판단하여반드시비식별조치를취한다. 둘째, 데이터를공개할경우해당데이터를비식별화하여이용한다는것과향후비식별화상태를유지하여야한다는것, 그리고재식별하지않을것을개인정보주체에게공개적으로약속한다. 셋째, 데이터를제3자에게제공할때에는해당데이터를제공받은어떠한이용자도재식별하지않도록계약조건으로반드시요구해야한다. FTC 에서는업계가위의 3가지조건을이행한경우에만특정데이터가식별가능하지않도록처리된것으로판단한다. 유럽연합 EU는 2015년 12월에합의된일반정보보호규정 (General Data Protection Regulation, GDPR) 을통해 가명화 를통한개인정보비식별화조치를조건으로데이터를수집및이용할수있도록했다 [10]. 이때 가명화 는 특정개인에게연결되지않을것 을최우선의조건으로하며, 재식별화가가능한만큼개인정보로취급되지만기술적, 관리적방법을통해특정목적을위해활용할수있도록허용한다. 특히, 암호화를통해데이터를인식불가능하게한경우에는데이터유출시정보주체에게통지하는의무를면제받도록하고있다. 과학, 역사, 통계목표의이용을위해서는 2083조를통해가명화한후정보를이용하도록허용하고있다. 또한, GDPR 제20조에서는프로파일링에대한거부권을두고있어개인적특성에대한평가와개인에관한분석또는예측을위한기준의적용을받지않도록권리를보장하고있는데이는온라인상에서개인정보보호를더욱강화하는근거가된다. 구체적인비식별화지침은회원국별가이드라인을통해제시하고있는데, 영국에서는정보보호기관인 ICO (Information Commissioner s Office) 가 2012년개인정보식별화행동강령 (Anonymization: managing data protection risk code of practice, 2012) 을발표했다. ICO 강령은법적강제력이없고비식별화해야하는개인정보의범위역시개인식별가능성이 보건의료빅데이터관리시스템최신동향장성재 Page 12 / 17
최소화되는수준으로관련업계가자율적으로판단하여처리하도록하고있다는특징을보인다. 일본 일본은 2015년비식별화데이터를 익명가공정보 로정의하고, 이를처리및이용할수있도록한개인정보보호법을개정했다 [10, 11]. 이는빅데이터를기반으로한다양한신규비즈니스기회를창출하고경제재생계획과연결시켜이를실현하기위해기존의빅데이터관련규칙을강화한것이특징이다. 일본의개인정보보호법의경우익명화의개념을적극적으로도입해재식별화가불가능하도록개인을특정할수있는요인들을희석한데이터에대해서는정보주체의동의를받거나, 제3자에게제공시제약을두지않고있다. 2.4 보건의료빅데이터와인공지능과결합 2.4.1 미국 미국은인공지능 R&D 정책을범정부차원에서추진하고있으며, 인공지능을활용한정밀의료추진을통해의료의질적수준제고에집중하고있다 [13]. 특히, 2013년 Brain Initiative 를통해백악관은범정부차원에서인간의뇌를중심으로체계적인인공지능기술개발을통해원천기술확보및실제인공지능을활용하기위한상용화연구의적극적추진을발표하여향후 10년간 30억달러규모의투자가이뤄질예정이며, 2015년에는연구교서에서 2016년 2.2억달러 ( 약 2,600억원 ) 투자를골자로하는 정밀의료추진계획 (Precision Medicine Initiative, PMI) 을발표한바있다. 빅데이터활용바이오헬스기술의발전단계별국가전략을수립하여 American Recovery and Reinvestment Act of 2009 의 HITECH Act에 IT와헬스케어의융합을지원하는것을포함시켰으며, 국립보건원은 Pillbox (National Library of Medicine) 를통해주요질병의분포, 연도별현황등세부분석을시행하는등유전체구조및생물학연구, 질병생리학연구등바이오헬스연구에빅데이터를활용함으로써향후인공지능헬스케어연구와의시너지창출을기대하고있다. 2.4.2 유럽연합 EU는 2013년부터 2023년까지 10년동안 1.8조원을투자하여 HBP (Human Brain Project) 라는인간두뇌의인진형태를기반으로한지식처리용인공지능기술을개발예정으로 6개 ICT (Information and Communications Technology) 중에서 의료정보플랫폼 기술을포함하여유전체분석을기반으로정밀의료제공을추진중에있다 [13]. 또한, 영국은암, 감염질환치료를목적으로 2014년부터 2017년까지 10만명유전체분석프로젝트에약 5천억원 (3억파운드 ) 을투자하는정밀의료연구개발및실용화를위한연구개발에투자를강화중이다. 보건의료빅데이터관리시스템최신동향장성재 Page 13 / 17
2.4.3 일본 일본의료연구개발기구 (Japan Agency for Medical Research and Development, AMED) 는 2015년유전체정보를활용해환자의특성에따른최적의맞춤형치료서비스를제공하는게놈의료의실용화를목표로정부에약 93억엔 ( 한화 950억원 ) 을요구하였으며, 일본총무성은 2045년에는인공지능이인간의능력을뛰어넘을것이라는유엔보고서를기반으로 2015년 2월정보통신, 뇌과학분야전문가 12명이참여하는인공지능의연구개발강화방안을모색하기위한 가칭 2045 연구회 ( 인공지능화가가속화되는 ICT 미래상에대한연구회 ) 를발족한바있다. 또한, 일본재부흥전략의일환으로로봇혁명의실현을위해 3대핵심전략 (1 로봇창출력 의근본적강화를통한세계로봇혁신거점화, 2 세계최고의로봇활용사회를목표로 로봇활용및보급, 3빅데이터, IT 융합, 네트워크, 인공지능을구사하는로봇으로세계를주도하는 로봇혁명전개ㆍ발전 ) 을선정하여 2020년까지 5년간 1,000억엔을투자하기로하였다 [13]. 2.5 개인유전체기반맞춤형의료서비스 개인맞춤의료 (Personalized medicine) 이란유전정보인 DNA 분석기술의발전, 유전정보와질병의발병사이의관계에대한생물학및의학지식이축적됨에따라서개인의고유한유전적특징을바탕으로질병의예방, 발견, 진단, 치료, 건강관리등에활용하고자하는의학적노력속에서탄생한개념이다 [14]. 기존의평균적인환자에게맞춰진방법 (One-Size-Fits-All) 인반면맞춤의료는의료적처치를각환자의개인별특성에맞추는것을의미하며예방과치료에집중하는것이외에도부작용과비용의감소에크게기여할것으로기대된다. 특히, 개인유전체분석기반맞춤의료서비스를단순화하면개인 DNA 시퀀싱부터유전체정보를의료에적용하는모든과정을포함한다. < 맞춤형의료서비스의적용분야 > -위험평가(Risk Assessment): 유전적소인등을토대로질병발병의위험도를예측 -예방(Prevention): 질병발병위험도등을토대로질병예방을위한생활방식등제안 -발견(Detection): 유전체분석등을토대로분자수준에서질병의조기발견 -진단(Diagnosis): 유전자이상 / 변이등의분석결과를토대로질병에대한정확한진단 -치료(Treatment): 유전적특징에따른진단및약물감수성파악으로효과적치료 -관리(Management): 질병치료에대한반응및질병의예후를모니터링 2.6 의료정보표준화동향 국제표준화기구 (Organization of International Standardization, ISO) 는전자건강기록 (Electronic Health Records, EHR) 을 환자의건강과관련된정보를컴퓨터가이해할수있는형식으로저장한 보건의료빅데이터관리시스템최신동향장성재 Page 14 / 17
것 이라고정의하고, EHR에대하여의료기관수준의의무기록, 공유가능한의무기록, 소비자의무기록, 연구와질병등록등과관련된다양한종류로공공의무기록의관점에서가이드라인을제시하고있다 [15, 16]. 의료정보분야의국제표준을제정하는 ISO/TC 215 (Health Information) 에서는현재까지 148개의표준이제정되었고, 120여개의신규표준이진행중에있다. 스마트헬스데이터는 WG1( 아키텍쳐, 프레임워크및모델 ), WG2( 시스템및기기상호운용성 ), WG3( 시멘틱컨텐츠 ), WG4( 보안및정보보호 ) 등대부분의워킹그룹과관련이있다. ISO 표준안이외에 IHTSDO (International Health Terminology Standards Development Organization) 의 SNOMED-CT (Systematized Nomenclature of Medicine Clinical terminology) 와 Regenstrief Institute의 LOINC (Laboratory Observation Identifiers Names and Codes) 도의료정보관련용어표준화를위한중요한국제표준들이며, 의료데이터의전달및통합을위한 HL7 (Health Level 7) 의 CDA (Clinical Document Architecture) 표준을비롯하여임상의사결정지원시스템에대한다양한표준들이개발되었다. 특히, 임상시험데이터표준과관련해서는 CDISC (Clinical Data Interchange Standards Consortium) 이별도로존재하여다양한국제표준안을개발하면서미국식약청에서실제로활발하게사용하고있는중이다. CDISC에서는 open data 표준으로 CDASH (clinical data Acquisition Standards Harmonization), LAB (Laboratory Data Model), SDTM (Study Data Tabulation Model), SEND (Standard for Exchange of Nonclinical Data), Controlled Terminology 등다양한표준안을제정하였다 [17]. 3. 결론 최근대부분의미래학자들은빅데이터와사물인터넷 (IoT) 을응용한신규산업을누가주도하느냐에따라세계경제주도권이달라질것이라고한다. 빅데이터 라는거대한광산에서 유용한정보 라는귀금속을캐내는것은매우매력적이지만그곳에는무수히많은 개인정보 들이포함되어있다. 우리현행법의경우과거개인정보보호의가치를인격적가치로만이해하던시대의법이론을그대로답습하고있어 동의만능주의 에빠져있다. 과학기술 이아닌 제도 때문에우리나라가주도권경쟁에서뒤쳐진다는것은매우불행한일이다. 지금은보다선재적으로제도개선을위한노력이필요한시점이다. 민감한개인정보처리에관해서는우리나라를포함하여국외의규정이모두처리금지원칙을세우고있다. 반면예외에있어서는 EU와영국, 독일의개인정보보호법은매우상세한열거식의규정을운영하고있다. 특히, 개인정보중에서민감정보인지의여부가불분명한경우가존재하기때문에그에대한좀더상세한기준을제시한다는측면에서우리의현행규정에시사하는점이있다고보여진다. 이외에 EU의개인정보보호규정과영국및독일의개인정보보호법에서는자동화된개인의의사결정에관한제한을규정하고있는데이는빅데이터에서의개인정보처리와관련하여참고할수있는규정으로보여진다. 의료정보의관리효율화및활용을높이기위해서는의료정보의표준화가필수적이다. 하지만국내의경우의료정보관련표준화작업은외국에비해서활발하지않으며, 국내의료기관들은자체적으로의료정보시스템을구축을진행해왔기때문에국제표준에대한인식및 보건의료빅데이터관리시스템최신동향장성재 Page 15 / 17
요구도가매우낮다는문제점도앞으로개선해야할당면과제이다. 보건의료빅데이터를보다효율적으로활용하기위해서는 LOD (Linked Open Data) 기반글로벌보건의료빅데이터연계플랫폼이구축되어야한다는지적이있다 [3, 18]. 각기다른기관간정보연계및공유가가장중요하며, 개인정보보호법등각종규제와관행으로인해공개활용이어렵기때문에웹상의정보를공유 / 연계 / 재이용해가치를창출할수있는 LOD 기반이중요하다는뜻이다. 또한, 앞으로보건의료데이터관련기술을개발할때에는기존의개발된표준안들을반드시참고로하여기술개발이이루어져야하며, 필요에따라서는기존표준안을개선하는것이중요하다. 보건의료빅데이터관리는의료및건강정보를대상으로최신의 ICT 기술을활용하여보건의료의질을향상시키고새로운산업을활성화하고자하는분야이다. 즉, 이를위해서전통적인의료분야의연구성과는물론유전체분야, 그리고딥러닝으로대표되는기계학습의연구성과를융합하기위해서다양한분야의연구자들이협력하도록유도하는것이필요하며, 미국, 영국과같이정부의주도하에정부민간기업, 연구소의지속적이고체계적인협업이반드시필요하다. 4. 참고문헌 [1] 한국생명공학연구원보도자료 바이오헬스이슈를선도하는 10대미래유망기술발표, 2016.12. [2] McKinsey&Company, The big data revolution in health care, 2013.01. [3] 강희정, 보건의료빅데이터의정책현황및과제, 보건복지포럼, 2016.08. [4] 이인재, 국내외보건의료빅데이터현황및과제, 정보통신기술진흥센터, 2014.07. [5] 영국보건의료서비스홈페이지 http://content.digital.nhs.uk/ [6] 산업통상자원부, 개인맞춤형건강관리시스템기획보고서, 2014.02 [7] Foley and Lardner "Tapping Into the Big Value of Health Care Big Data Top Legal and Regulatory Considerations on the Path to Monetization", 2015. [8] 최계영, 의료분야에서의개인정보보호 개인정보와빅데이터, 2015.11. [9] Kubota, 사적인정보의이용및활용과개인정보보호법의개정, 내각위원회조사실, 2015.01. [10] 후생노동성, 제1차게놈정보를이용한의료등의실용화추진태스크포스 회의록, 2015.11. [11] 한국인터넷진흥원, 개인정보보호핫이슈심층분석보고서, 2016.05. [12] Gartner, Forecast Analysis: Internet of Things, Endpoints and Associated service, 2014. [13] 보건산업통계시스템, 보건산업브리프, vol. 208, 2015.12. [14] 과학기술정책연구원, 개인유전체기반맞춤의료현황과발전과제, STEPI INSIGHT, 제179호, 2015.12. [15] 국가표준코디네이터, 스마트헬스데이터동향및시사점, 2016.04. [16] 미래창조과학부, 보도자료, 빅데이터, 산업과생활을바꾼다, 2016.03. [17] 국제임상데이터표준화컨소시움홈페이지 http://cdisc.org/ [18] 한국정보화진흥원, 알기쉬운 Linked Open Data, 2015.04. 보건의료빅데이터관리시스템최신동향장성재 Page 16 / 17
The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center. 장성재 (2017). 보건의료빅데이터관리시스템최신동향. BRIC View 2017-T07 Available from http://www.ibric.org/myboard/read.php?board=report&id=2698 (Mar 21, 2017) Email: member@ibric.org 본콘텐츠는의후원으로작성되었습니다. 보건의료빅데이터관리시스템최신동향장성재 Page 17 / 17