Healthcare 에서빅데이터의활용 정성원데이터솔루션마케팅총괄이사 Sungwon Jung Marketing Director, Data Solution Inc 초록 최근디지털세상이열리면서, 헬스케어분야에도데이터가폭발적으로증가하고있다. 이와같은헬스케어빅데이터를잘활용하면보건의료분야에투여되는막대한비용을절감할수있을것으로전망된다. 특히헬스케어빅데이터와머신러닝이결합된다양한스마트의료기기의출현과스마트폰과웨어러블디바이스의보급확대에따른최적의모바일헬스환경이조성되면서, 환자개인별로특화된질병진단및치료서비스는물론이고만성질환관리서비스및질병예방서비스등으로의료서비스의혁신을이룰수있다. 주제어 : 빅데이터, 머신러닝, 딥러닝, 스마트의료기기, 모바일헬스 서론 헬스케어데이터가폭발적으로증가하고있다. IBM에의하면세계 16,000개병원이환자데이터를수집하고있다고하며, 80% 의헬스케어데이터는텍스트나이미지, 영상과같은비구조화데이터라고한다. 전세계 490만명의환자가원격모니터링디바이스를사용하고있으며, 원격모니터링디바이스를사용하는환자가최근 5년년평균 18% 의증가율을보이고있다고한다. 개별환자모니터링장비는평균초당 1,000개의수치를측정하고있으며, 이는환자 1인당하루에 86,400개수치가생성되는것을뜻한다. 이렇게생성된헬스케어빅데이터의크기는미국국회도서관에의하면약 370 TB에달한다고한다. 세계적인비즈니스컨설팅전문업체인 McKinsey 는 2013년연구보고서를통해미국보건의료부문이빅데이터활용의용이성이높고경제에서차지하는비중이커서빅데이터기대효과가큰것으로전망하였으며, 빅데이터를통해서미국보건의료부문에서만년간최대 $190 billion의비용절감을실현시킬수있다고내다봤다. 18 대한간학회
정성원 Healthcare 에서빅데이터의활용 그림 1. Bigdata in healthcare, IBM 그림 2. 전세계에축적된데이터의크기, McKinsey Global Institute, 2013 www.kasl.org 19
제 5 회임상연구방법론워크숍 그림 3. 미국보건의료부문에서빅데이터활용효과, McKinsey, 2013 헬스케어빅데이터활용분야 헬스케어빅데이터는다양한분야에활용될가치를가지고있다. 대표적인활용분야는다음과같다. 현장현시의료의사결정최적화 (Better point-of-care decisions) 보건의료기관의고객유지 (Engage consumers in their healthcare) 재입원율감소 (Reducing Readmissions) 예측모델을사용하여고위험환자와저위험환자를사전에식별하고심각한환자에대해알람을울림으로써재입원율을획기적으로개선함 국민건강관리 (Population health management) 보건의료기관운영향상 (Operational improvements) 질병치료연구발전 (Clinical research advancement) 정보기술비용감소 (Lower Information Technology costs) 20 대한간학회
정성원 Healthcare 에서빅데이터의활용 실질적으로환자 / 국민, 의료기관및기업을대상으로다양한빅데이터활용서비스가제공된해외사례가 있으며, 국내에서도다양한분야에헬스빅데이터를활용하고자하는시도가이어지고있다. 표 1. 빅데이터활용서비스해외사례 수요군빅데이터활용서비스해외사례 환자 / 국민 의료기관 기업 개인의유전체분석을통해미래발병가능성이높은질환을예측하고적합한병원의료진을추천해주는서비스 초고속유전체분석서비스및관련분야의새로운학술정보와치료법등을의료진에게통합제공하는서비스 초고속유전체분석서비스및의료진이관심있는데이터를추출, 시각화, 맵핑하여클라우드기반으로제공하는서비스 대규모비정형의료데이터 ( 녹음, 동영상, 사진등 ) 를병원, 의료진등이원하는정형데이터형태로가공해주는서비스 각의료기관들로부터임상, 병원경영및재무성과등방대한자료를수집및가공하여병원, 의료진들이원하는데이터를제공해주는서비스 제약 의료기기기업, 의료기관등이보유한임상데이터를결합하여연구자들에게데이터 pool 로제공해주는서비스 동일질병을앓고있는환자간에축적되는데이터를기반으로임상또는의약품, 의료기기의수요예측정보를생성하여제공해주는서비스 개인, 기업, 단체등다양한집단으로부터의약품, 의료기기기업등이원하는데이터를수집하여익명화, 표준화등의과정을거쳐제공하는서비스 Genome Health Solutions Myriad Genetics Genome Health Solutions DNAnexus Appisty Inc. Health Fidelity Explorys Inc. NextBio Patientslikeme Qualcomm Life 머신러닝 / 딥러닝의개념 머신러닝 (Machine Learning) 이란인공지능 (AI) 의한분야로데이터로부터배울수있는시스템을개발하고연구하는것으로예측분석 (Predictive Analytics) 을지원한다. Arthur Samuel은 머신러닝은컴퓨터에게배울수있는능력, 즉코드로정의하지않은동작을실행하는능력에대한연구분야. 라고정의하였으며, Tom Mitchell은 머신러닝이란어떠한태스크 (T) 에대한꾸준한경험 (E) 을통하여그태스크 (T) 에대한성능 (P) 를높이는컴퓨터프로그램 ( 알고리즘 ) 을연구하는것이다. 라고정의하였다. 머신러닝은상당히전문적인용어였으나 2016년 3월인공지능알파고가프로바둑기사이세돌 9단과대국하여 4승 1패로승리하게됨으로써요즈음초등학생도머신러닝이란단어를언급하고있다고한다. 알파고는딥마인드라는회사에서만든인공지능시스템인데, 2010년영국의데미스허사비스가설립하였고 2014년에 4억달러 ( 한화 4,800억원 ) 로구글에인수되었다. 알파고는실제적으로딥러닝알고리즘을통해수많은기보를학습하였으며, 많은바둑프로그램과프로기사들과대국을통해서그기량을높여나갈수있었다. 딥러닝 (Deep Learning) 이란여러비선형변환기법의조합을통해높은수준의추상화를시도하는머신러닝알고리즘의집합으로정의되며, 큰틀에서사람의사 www.kasl.org 21
제 5 회임상연구방법론워크숍 고방식을컴퓨터에게가르치는머신러닝의한분야라고이야기할수있다. 즉, 딥러닝은심층적 (Deep) 머신러닝 (Machine Learning) 이라할수있다. 딥러닝알고리즘에는심층신경망 (Deep Neural Network, DNN), 합성곱신경망 (Convolutional Neural Network, CNN), 순환신경망 (Recurrent Neural Network, RNN), 제한볼츠만머신 (Restricted Boltzmann Machine, RBM), 심층신뢰신경망 (Deep Belief Network, DBN), 심층 Q-네트워크 (Deep Q-Networks) 등의알고리즘들이있으며이미지 / 영상인식, 음성인식, 자연어처리등에서인상적인성과를내고있다. 빅데이터와머신러닝이몰고오는의료분야의혁신 빅데이터와머신러닝기술이결합된스마트의료기기는보다효과적이고개인화된솔루션을제공함으로서질병예방, 진단및치료등의의료분야의혁신을가져올것으로전망된다. General Electric Company는 2015년외부행사에서 GE가앞으로더욱의료분야에집중할뜻을밝히면서 보이지않은것을보이게 (Make the Invisible, Visible) 란모토와같이 GE가의료분야혁신에앞장설것이라고전망하였다. 이를접한청중들은 SF영화프로메테우스에서나온미래의의료디바이스 Medpod 개발을 GE가목표로하고있음을알게되었다. 미국 인리틱 은각종의학영상자료를토대로환자의암세포를식별하고 5년이내완치율, 사망률등을알려준다. 인리틱의스마트의료기기가방사선전문의보다더정확하게악성폐종양을찾아낼수있다는게인리틱의주장이다. 또한미국 23andMe 는의사의도움없이 99달러비용으로개인유전자분석을통해질병가능성등 250여개의의료정보를제공하는서비스를출시했다. 시카고아동병원 (CMH: Children's Memorial Hospital in Chicago) 은뇌종양연구소책임자인 Eric Bremer 박사의주도로뇌종양 gene-expression 데이터베이스및진단시스템을구축하여아동뇌종양진단및치료방법에관하여가장성공적인병원으로평가받고있다. 시카고아동병원의뇌종양진단시스템은뇌종양표본 1개당 7,000~30,000개의측정치를축적하고머신러닝기술을접목하여뇌종양을분류하고, 뇌종양관련의학논문에텍스트마이닝기술을접목하여뇌종양과유전자관계패턴을도출하여, 243개인공신경망예측모델로구성된뇌종양진단시스템이다. UNC 헬스케어 (University of North Carolina Health Care) 는비영리통합의료기관으로매년 37,000명이상의환자를수용하는최첨단시설로고품질의의료서비스를제공한다. UNC 헬스케어는데이터분석을통한통찰력확보를위해 IBM의텍스트분석서비스를도입하여서정형데이터및비정형데이터를모두분석하여환자들의입원원인을사전에파악하여환자재입원비용을줄이는데활용하였다. 환자의영상과텍스트데이터에서비정상 (Abnormal) 정보를추출해내는일은의료진의많은시간과노력을필요로하는데, UNC헬스케어는유방촬영술 (mammography screenings) 과자궁경부세전검사 (Pap Smear) 에있어콘텐츠분석 (Content Analytics) 과자연어처리 (Natural Language Processing) 를활용한비정형의료데이터분석을수행하고기계판독과자동처리알고리즘을통해비정상부문을자동추출하여의료진 22 대한간학회
정성원 Healthcare 에서빅데이터의활용 의시간과노력을획기적으로절감하였다. UNC 헬스케어의빅데이터를활용한여성암진단시스템은유방 암과자궁경부암부문에서암진단건수를 10% 이상증가시켰으며, 결장암 (colon cancer) 과같은타암의 진단에확대적용하고있다. 그림 4. 미국 UNC 헬스케어의여성암진단시스템성과 2015년 8월 19일글로벌반도체칩셋제조사인인텔 (Intel) 은암환자의유전자및임상데이터공유가가능한클라우드플랫폼을발표하였다. 이플랫폼명칭은 CCC(Collaborative Cancer Cloud) 로인텔과미국오레곤의과대학산하나이트암연구소 (Knight Cancer Institute) 가공동개발중이다. 인텔은유전자배열분석에서발생하는대규모의데이터자원을 CCC 를통해수집 / 공유하여맞춤형치료를구현할수있을것으로예상하고있으며, 나이트암연구소소장브라이언드러커역시미래의학의핵심과제는모든질병의유전자배열을분석하는것이라고하였다. www.kasl.org 23
제 5 회임상연구방법론워크숍 그림 5. 인간이평생만들어내는데이터의종류와크기, IBM 2014 IBM은 2014년 IBM Health and Social Programs Summit 에서우리인간이만들어내는데이터는의료데이터, 유전체데이터, 그외에외부적인활동데이터등의세가지종류로분류하고인간이한평생동안에만들어내는이들세종류데이터의크기를살펴보면의료데이터가 0.4TB, 유전체데이터가 6TB인데반해서그외외부적인활동데이터는무려 1100TB에이르는데이들세종류의데이터가우리인체의건강에미치는영향도는각각 10%, 30%, 그리고 60% 로차이가난다는사실을발표하였다. IBM은이어 1500만페이지분량의의료논문과 200여개의의학서적과 300여개의의료저널을온토로지기반으로학습하여여기에머신러닝을결합하여암정복을향한도전을시작하였다고밝혔다. IBM은 2016년 2월에건강정보데이터업체트루벤헬스애널리틱스를 26억달러 ( 한화약 2조원 ) 에인수한것을비롯하여지난 1년간헬스케어분야에 4번의인수를단행하였으며총 40억달러의돈을쏟아부었다. 현재 IBM 왓슨헬스분야의직원은 5,000여명에이르고 3억명분의환자정보를보유하게되었다. 그림 6. IBM Watson 의암정복에도전시작 24 대한간학회
정성원 Healthcare 에서빅데이터의활용 IBM은 2014년 11월미국샌디에고의개인유전정보분석기업인 Pathway Genomics 에투자하기도했는데, 이는개인의유전정보라는궁극적인개인화된데이터까지기존의헬스 / 의료데이터와통합하겠다는야심찬계획입니다. Pathway Genomics 는웨어러블디바이스등에서얻은개인의헬스케어데이터와개인의유전정보를통합하려는 파노라마 (Panorama) 라는서비스를개발하고있습니다. Pathway Genomics가이데이터들을통합하기위해사용하는것이 IBM Watson의인지컴퓨팅이다. 그림 7. IBM Watson 과 Pathway Genomics 의 Panorama 서비스 스마트폰과웨어러블디바이스의보급과함께태생한모바일헬스 스마트폰및다양한센서등의발전에따라이제는개인의다양한건강 / 의료데이터가측정되기시작했다. 단순히걸음수, 활동량, 체지방률등뿐만아니라체온, 혈압, 혈당, 심박수, 심전도, 산소포화도등의중요한의료데이터도다양한모바일디바이스와스마트폰으로실시간으로연속적으로측정할수있게된것입니다. 2014년 6월 2일애플은아이폰의새로운운영체제 ios8을발표하면서디지털헬스케어플랫폼 HealthKit과어플리케이션 Health를발표하였다. 헬스케어관련개발자를위한플랫폼인 HealthKit 및일반사용자들을위한대쉬보드어플리케이션인 Health를통해외부의 3 rd party 개발사들의각종헬스케어웨어러블디바이스및스마트의료기기들이하나의플랫폼에서통합적으로관리될수있게되었다. 애플은디지털핼스케어플래폼인 Health를통해서웨어러블디바이스및휴대용의료기기와기존병원의의료시스템까지통합하고자 Mayo Clinic과협력을하고있다. Mayo Clinic은 1889년에설립된병원으로 www.kasl.org 25
제 5 회임상연구방법론워크숍 매년 1.2백만명의환자들이방문하는대형병원으로디지털헬스케어분야의혁신을발빠르게받아들이고있으며, 아이폰기반의의료어플리케이션 Better와파트너십을통해환자에게원격의료서비스를제공하고있다. 애플은미국전역에 1억명이상의환자에게서비스되고있는미국최대 EMR 회사인 Epic과제휴하고있는데, 스탠퍼드병원, 존스홉킨스의대, 클리블렌드클리닉등총 22개유명병원들이 Epic의 EMR을채택하고있다. Epic은 MyChart 라는스마트폰기반의 EMR/PHR 앱을출시한바있다는데, 이 MyChart 어플리케이션을통해환자들은자신의진료정보를볼수있고, 의사들과연락할수있으며병원예약관리등다양한기능을활용할수있다. 웨어러블디바이스를활용한모바일헬스의영역은달리기와걷기등과같은운동량추적은물론이고음식식단조절기능, 체중감량어드바이스, 신체상태에따른운동지도, 기초체온관리, 수면패텬분석및조언, 혈압관리를통한스트레스조절, 복약남용및부작용방지에이르기까지매우다양하다. 또한이와같은개인건강정보는의료기관의의료정보시스템과결합되면자연스럽게디지털헬스케어영역으로확장될수있다. 그림 8. 웨어러블디바이스적용분야, 웨어러블디바이스산업백서, 2014 AT&T와 WellDoc이개발한당뇨병환자건강관리어플리케이션 DiabetesManager는최초로미국 FDA의의료기기허가를받은모바일헬스관련서비스이다. WellDoc은단순히당뇨병환자의건강상태를수집하여피드백하는것에그치지않고행동분석 (Behavioral Analysis) 을기반으로환자의상태를종합적으로평가및분류하여의료전문가의건강관리에대한체계적인피드백을환자에게즉시 (just-in-time) 제공하는시스템을구축하였다. 또한, 당뇨뿐만아니라약물순응도 (drug adherence) 부터심혈관질환및정신질환까지복잡하고다양한만성질환을관리하는 mhealth 솔루션으로확장되고있다. 2012년 PwC Health Research Institute의연구에따르면이와같이당뇨환자를위한모바일헬스솔루션이 26 대한간학회
정성원 Healthcare 에서빅데이터의활용 그림 9. 모바일헬스빅데이터플랫폼 그림 10. 당뇨병환자건강관리모바일헬스어플리케이션 DiabetesManager www.kasl.org 27
제 5 회임상연구방법론워크숍 충분히활성화될경우환자당연간최대 10,000달러까지절약할수있다는결과가제시된다. 이는미국 2015년기준당뇨병환자수 33만명, 전당뇨 (prediabetes) 환자수 88만명전체에적용된다면약 121억달러의절감효과를거둘수있다고한다. 국내에서도보건복지부에서고혈압만성질환집중관리모델을개발하고이를모바일헬스로연결시키고자하는노력을하고있다. 그림 11. 보건복지부만성질환집중관리모델개요 그림 12. 보건복지부만성질환집중관리모델개발전략 28 대한간학회
정성원 Healthcare 에서빅데이터의활용 만성질환의지속적 체계적 효율적인집중관리를위한투약순응도및조절율예측을위해만성질환중 고혈압을대상으로하여투약순응도관리모델과조절율관리모델로구분, 세부적으로대상자유형별특성 을파악하여사전에관리하기위한예측모델을각각개발하였다. 그림 13. 보건복지부만성질환집중관리모델개발범위 결론 Healthcare 분야에서빅데이터와머신러닝의활용은이제더이상선택이아닌필수로자리잡고있다. 선진국에서는이미이점을간과하지않고집중투자를하고있으며 GE, IBM, Apple, Intel 등의글로벌 IT기업들도앞을다투어이분야에대한연구개발및실무적용에열을올리고있다. 대국민의의료복지수준을획기적으로개선하고문화컨텐츠한류에서시작한브랜드코리아를의료분야로확장시키기위해서라도헬스케어빅데이터와머신러닝에많은관심과연구및투자가이루어져야한다고생각한다. 참고문헌 1. IBM, Bigdata in healthcare, 2014 2. IBM, Health and Social Programs Summit 2014 3. McKinsey, Game changers: Five opportunities for US growth and renewal, 2013 4. General Electric Company Make the Invisible, Visible Report, 2015 5. IBM 빅데이터적용성과, 2011 6. 웨어러블디바이스산업백서, 2014 7. 보건복지부 2010년국민의료비및국민보건계정 8. 보건복지부, 만성질환집중관리통합시스템의개요 www.kasl.org 29