주간기술동향 2016. 8. 24. 의료분야골든타임 (CVR) 을위한딥러닝의가치 신재용한국보훈복지의료공단기술사 의료기관에서의환자안전은생명과직결된중요한문제이다. 병원내다양한검사에서환자의생명과직결되는위험한결과가나타나는경우에는골든타임 ( 생명과관련된조치를취할수있는시간 ) 과관련하여 CVR(Critical Value Report, 이상결과보고 ) 를통해주치의에게즉각적인보고와조치를하도록되어있다. PACS(Picture Archiving and Communication System, 의료영상저장전달시스템 ) 의도입에따라의료영상은이미 10년이상축적되어있다. 이러한빅데이터를딥러닝 (Deep learning) 기법을적용하여의료분야골든타임을위한적용기법을알아보고주요시사점을도출하였다. I. 서론 최근딥러닝은인공지능머신러닝의한분야로써각광받고있다. 예를들어, 컴퓨터로개와고양이를구분하는걸구현하고자할때, 기존프로그래밍에의한방법으로는개와고양이의특징을하나하나코딩에의해서입력하고, 구분하도록프로그래밍해야했고, 입력하지못한예외사항에는대처할수가없었다. 머신러닝에의한방법은개와고양이에대한많은데이터를컴퓨터에입력하면비슷한특징을분류하여개와고양이를스스로판단하도록학습시키는방식으로데이터가많을수록학습시간이길어질수록스스로정확도가높아질수있는방법이다. 인공지능의머신러닝은오래전부터나온개념이었으나, 여러가지문제점들로인해서연구실에서만존재했을뿐현실까지도달하지못했다. 최근들어딥러닝기법과함께다시금각광받게된데에는몇가지이유가있다. 첫째, 인공신경망의한계극복이다. 높은분류정확도에비해서속도가느린문제가있었다. 또한, 과적합 (overfitting) 의문제는데이터셋의한계로인해해결이불가능하게여겨졌으나빅데이터기반의컴퓨팅환경의발전에따라이러한한계가극복되고있다. 둘째, 하드웨어사양의발전이다. 기존에머신러닝을위한처리를위해서는고성 * 본내용은신재용기술사 ( 053-630-7082, jentshin@empal.com) 에게문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 IITP 의공식적인입장이아님을밝힙니다. 2 www.iitp.kr
기획시리즈 -ICT 융합 : 서비스 능의컴퓨팅자원이필요했으며, 이러한컴퓨터시스템을갖추기에는일반적인기업이나조직에서는한계가있었다. 최근하드웨어의발전으로 CPU( 중앙처리장치 ), GPU( 그래픽처리장치 ) 의성능이비약적으로향상되었고, 이에따른영상이미지처리등이원활해짐에따라딥러닝이더욱현실화되었다. 셋째는바로빅데이터이다. 딥러닝을위한훈련데이터가많으면많을수록머신러닝은효과적인능력을발휘할수있다. 지금까지는이러한데이터가충분히제공되지못했으나, 빅데이터환경에서는딥러닝을위한충분한훈련데이터가주어진다. 빅데이터역시기존의방식으로는분석에한계가있으나, 딥러닝을통해효과적인분석이가능해졌다. 딥러닝과빅데이터는바로찰떡궁합이라할수있다. 의료분야에서는환자생명과직결된골든타임을위해서각종검사결과에서이상결과 (Critical Value) 가나오면즉시주치의및환자에게알리고조치하도록하는프로세스가되어있다. 본고에서는바로빅데이터기반의딥러닝을활용하여의료분야골든타임 (Critical Value Report: CVR) 을위한방법을검토해보고주요시사점을도출해보고자한다. II. 의료분야 CVR 의필요성 의료기관은환자의질병현상과원인을알기위해서다양한검사를실시한다. 주치의가처방을입력하고, 검사자가검사를시행한다. 혈액검사, 소변검사와같은진단검사가있고, 엑스레이, MRI, CT 와같은영상검사가있다. 영상의학의경우에는보다정확한판독을위해서판독전문의가판독하여판독소견을입력한다. 판독전문의가판독하면 30% 의판독료를받도록되어있다. 처방의입력에서검사결과가확정되는판독결과입력까지의소요시간을 TAT(Turn Around Time) 이라고말하며, TAT 는가능한짧을수록좋겠지만, 여러가지인력적인문제및중요도에따라서 TAT 데드라인을정해둔다. MRI 는 10 일, CT 는 5 일이내와같은기간을정해둔다. 그래서 MRI, CT 를촬영하고나면 1~2 주이후에검사결과를확인하러오라고하는것이다. 단순한엑스레이촬영과달리 MRI, CT 의료영상장치의검사결과는주치의조차정확하게알기가힘들기때문이다. 그래서판독전문의가의료영상전문모니터로확인하고판독소견을입력한다. TAT 가 5 일이라면 5 일이내에판독하면프로세스상에는전혀문제가없으나, 최종판독이전에검사자나인턴, 레지던트등의수련의가 1 차판독을하는과정에서검사결과가환자의생명에영향을미칠수있는뇌출혈등의심각한결과값이발견되거나, 원래의추정진단과는완전히다 정보통신기술진흥센터 3
주간기술동향 2016. 8. 24. 르거나훨씬더중하다고판단되는경우에는정해진 TAT 와상관없이즉시판독전문의나주치의에게환자의상태를알리고조치하도록되어있다. 환자안전과관련한골든타임을위한전달체계이다. 이러한전달체계를이상검사결과보고 (Critical Value Report: CVR) 라하며의료기관인증평가의주요평가항목으로되어있다 [1]. 의료기관은환자의생명을다루는곳이다보니환자안전에대해많은노력을기울인다. 전직원이공유할수있는환자안전관리지침이있으며, 관련내용은약품관리, 환자관리, 검사결과관리등으로다양하다 [2]. 검사결과관리의중요한프로세스중하나로, 환자에게검사를시행하고이상검사결과가나타 나는경우에는발견즉시주치의등에게연락을 < 자료 > 의료기관인증제가이드라인 - 종합병원, 2015. [ 그림 1] 의료기관인증이상검사결과 (CVR) 규정 취하도록하고, 해당레포트를보관하며환자안전관리에필요한조치를하도록되어있다. 진단검사, 영상검사모두이상검사결과보고서를관리하도록되어있으며, 보고방법은유선보고, 구두보고등다양한방법을활용하며전자의무기록 (Electronic Medical Record) 을활용하는경우에는자동으로메시지전송기능이나휴대폰단문전송을활용하기도한다. [ 그림 2] 이상결과보고 (CVR) 프로세스 4 www.iitp.kr
기획시리즈 -ICT 융합 : 서비스 이상결과보고대상은의료기관내검사부서별관련규정으로정한다. 진단검사의경우에는대부분수치화된내용이어서정해진임계치값을가지고전자의무기록에서직접처리하기가용이하다. 이상결과발생시전자의무기록내에서메시지전송및휴대폰단문전송까지바로처리가가능하다. 하지만, 영상검사의경우에는의료영상을직접보면서검사결과를판단할수밖에없어서전자의무기록에서직접처리하기가불가하며, 이상결과보고의책임소재조차불명확하다. 방사선촬영기사가가장먼저의료영상을접하는사람이긴하지만, 판독의권한은없으므로명확한책임을가지고이상결과보고를하기에는무리가있다. 하지만, 환자안전의관점에서이상결과로추정되는경우에는책임소재에앞서빠른보고를하도록되어있다. III. 빅데이터기반딥러닝기법 아이들을키우다보면 저런건가르쳐주지도않았는데, 도대체어디서배운걸까? 라는생각이드는경우가많다. 아이들이하는언어, 행동은가르쳐준것만하는게아니라스스로학습하며새로운언어, 새로운행동을하게된다. 이게바로인간의지능이학습하는방식이다. 이러한인간의지능이학습하는방식을컴퓨터에적용한것이바로인공지능이다. 인공지능이인간의지능처럼학습하도록하는방법을기계학습, 머신러닝이라고한다. 머신러닝에는수백가지알고리즘이있는데크게분류하자면지도학습 (supervised learning) 과비지도학습 (unsupervised learning) 으로나뉜다. 지도학습에서많이사용하는알고리즘은서포트벡터머신 (support vector machine), 은닉마르코프모델 (Hidden Markov model), 회귀분석 (Regression), 나이브베이즈분류 (Naive Bayes Classification), 신경망 (Neural network) 등이있다. 비지도학습에서많이사용하는알고리즘은클러스터링 (Clustering), 비정상탐지 (Anomaly detection), 차원축소 (Dimension reduction) 등이 있다. < 자료 > 인공지능 (AI) 완생이되다, 디지에코, 2016. [ 그림 3] 인공지능, 머신러닝, 딥러닝의관계 정보통신기술진흥센터 5
주간기술동향 2016. 8. 24. 인공신경망의심화신경망 (Deep Neural Network) 을활용한머신러닝을딥러닝이라고한다. 딥러닝은인공신경망의한계를극복하기위해제안된머신러닝방법으로인공신경망의역사는 A LOGICAL CALCULUS OF THE IDEAS IMMANENT IN NERVOUS ACTIVITY(1943) 에서부터시작되었으나연구실에서의과제로만존재할뿐현실에까지활용되지는못했다 [14]. 머신러닝을위해서는훈련데이터 (Traning Data) 로학습할수있도록구성하고수많은시행착오등을통해학습하도록해야하는데, 학습하는시간이오래걸릴뿐아니라, 학습을위한데이터도부족했기때문이었다. 컴퓨팅환경이발전함에따라 CPU 의성능과 GPU 의성능이향상됨에따라학습하는시간이현실적으로가능하게되었다. 또한, 디지털처리데이터의급증으로빅데이터환경이됨에따라서머신러닝을하기위한훈련데이터가충분하게된것이다. 훈련데이터와훈련시간이짧아짐에따라훈련방향만명확하게정해지면다양한분야에활용이가능하다. 학습시스템이란환경 (Environment) 과의상호작용으로부터획득한경험적인데이터를바탕으로모델을자동으로구성하여스스로성능 (Perormance) 을향상시키는시스템이다. 이러한학습을기계가하도록하면머신러닝이라한다. 이정의에서중요한요소는바로데이터이다. 머신러닝의컨셉은오래되었으나최근에다시각광받는이유는바로이데이터와관련이있다. 유비쿼터스, 스마트, 사물인터넷 (IoT) 과같은정보화를거치며수많은데이터가모이게된것을빅데이터라부르며, 빅데이터를근간으로하여머신러닝이꽃피울수있게되었다. 2016 년 3 월에인공지능역사상한획을그은사건이일어났다. 구글의인공지능알파고가인간의직관의영역으로여겼던바둑에서이세돌 9 단을 4:1 불계승으로이겼다. 구글은 2014 년딥마인드라는인공지능회사를 4,300 억원에인수하여 2016 년 11 억원의상금을걸고알파고와이세돌간의대결을하도록만들었고, 4:1 불계승으로이기는 1 주일사이에구글주가는 11 조원상승했다 [13]. 구글은지속적으로인공지능의영역에서머신러닝과딥러닝분야에투자를하고있으며가장가깝게느낄수있는서비스는바로구글포토이다 [18]. 구글포토는사진을무료로업로드할수있는클라우드서비스이다. 하지만, 단순히사진을올려놓는서비스가아니라사진의내용들을머신러닝을기반으로분석하고자동으로분류한다. 사진파일에있는메타정보를기반으로위치와시간을기본으로하여분류하고, 사진의얼굴만을따로분석하여분류한다. 기존에도얼굴을인식하거나분류하는서비스가많이있어왔 6 www.iitp.kr
기획시리즈 -ICT 융합 : 서비스 지만, 구글포토의얼굴분류기술은놀라울정도이다. 단체사진, 측면사진등에서도얼굴별로자동분류하여사람별로묶어서보여주고는이름만알려달라는식이다. 어쩌면나도몰랐을단체사진에서아는사람을찾아줄지도모를일이다. 구글포토에서빅데이터의중요성을또다시느끼는부분은사진파일수가많은우리가족들의사진은거의완벽하게분류를하는반면, 사진의파일수가적은지인들의경우에는잘못분류하는경우가많았다. 데이터가많아지면많아질수록더욱정교해지는것이현실적으로느껴지는서비스이다. 사진을장소로분류하거나, 사람으로모아서보여주는서비스는다소보편적인서비스이다. 이보다놀라운것은사물 (Things) 이라는형태로분류하여보여준다. 콘서트, 하늘, 건물, 식품, 경기장, 자전거, 놀이터, 하이킹, 꽃등다양한사물을분류하여보여준다. 또한, 어시스트라는항목을통해특정일자에찍은수많은사진들중에서괜찮은사진을선별하여앨범을만들어주기도하고, 동영상을만들어주기도한다. 사람도사진을찍은이후에괜찮은사진을선택하게된다. 이러한선택은매우직관적인부분으로이루어지는데, 구글포토는이러한괜찮은사진의선택이라는부분에있어서꽤나만족스러우며놀랍다. 구글이딥러닝기술을알파고바둑을통해서증명하고, 구글포토를통해서구현하고있다. 장소사람사물 [ 그림 4] 구글포토장소, 사람, 사물 정보통신기술진흥센터 7
주간기술동향 2016. 8. 24. 현재의기술수준으로도충분히의료영상을분석하는데부족함이없다고생각된다. 다만, 기술 적인접근만으로는한계가있다. 데이터도충분하고기술적으로도가능한딥러닝을어떻게하 면현실적으로적용이가능할수있을지살펴보고자한다. IV. 의료분야딥러닝기반 CVR 적용 의료분야의영상판독에는 CAD(Computer Aided Diagnosis, 컴퓨터보조판독 ) 이라는분야가있다 [4]. 유방촬영기에많이적용되어있으며, 일테면프로그래밍에의한방식으로유방암진단의이상신호 (abnormal signal) 에대해서판단하고알림을주는방식이다. 유방촬영기의영상은사실단순하게지방조직만있는경우여서난이도측면에서쉬운분야라고할수있다. 그러나머리나가슴쪽은내부신체기관도많고복잡함에따라 CAD 로는도저히이상신호를찾을수있는범위를넘어서는것이다. 딥러닝을적용하여빅데이터기반의의료영상에서이상신호를찾아낼수있다. 성별, 연령대에따른영상간비교, 다른다양한의료영상과의비교, 본인의정상상태일때의영상과의비교등다양한비교분석을통해서이상신호여부를찾아낼수있다. VUNO 라는우리나라기업에서딥러닝기반의의료영상분석에대해서시도하고있으며, 폐관련질환에대해서보조판독을지원한다 [5],[20]. 의료기관에는 CVR 프로세스가있다. 의료기관내의다양한검사장비 ( 영상의학과, 진단검사 [ 그림 5] PACS MRI 판독영상 8 www.iitp.kr
기획시리즈 -ICT 융합 : 서비스 의학과, 병리검사의학과등 ) 에서나온검사결과중에서환자의생명과관련이있는위중한검사결과 (Critical Value) 가발견되면곧바로의사에게전달하는의료체계이다. CVR 보고는의료기관인증평가인증기준으로되어있어서의료기관인증을받은의료기관이라면모두규정되어있는내용이다. 진단검사, 병리검사의경우에는결과값이수치로나오기때문에 CVR 적용이용이하다. 임계치값만결정하면해당수치결과에따라서전자의무기록시스템내에서주치의에게바로알림쪽지를보내고, 응급사항에서는휴대폰단문전송을보내기도한다. 하지만, CT, MRI 등의영상검사의경우에는검사결과가이미지로나타나고이미지를보고판단하는건숙련된영상의학과전문의의전문지식이필요한영역이다. 의료영상은 PACS(Picture Archive & Communication System, 의료영상저장전달시스템 ) 에의해서전송되고관리된다. PACS 이전에는필름으로촬영하고인화하여진료실의뷰박스를통해서의료영상을보았다. PACS 를도입한병원은의료영상촬영과동시에진료실에서컴퓨터모니터를통해의료영상을본다. 최근필름카메라의사용빈도가현저하게떨어진것과마찬가지이다. 모니터로의료영상을볼때문제점은컴퓨터모니터의성능이다. 모니터에보여지는해상도, 명암비, 휘도등의요소로인해영상이제대로보여지지않을수있다. 그래서의료영상판독을전문으로하는판독전문의는의료영상전송표준인 DICOM(Digital Imaging and Communications in Medicine)[17] 을지원하는 5Mega Pixel 의모니터 4 대를한꺼번에본다. 1 대모니터가격이 1,000 만원정도의고가모니터이다. 이러한판독모니터에서보다정확하게영상을분석하고그에따른판독소견문을입력하면주치의는이를기반으로하여진료에활용한다. 단순엑스레이촬영이아닌 CT, MRI 등의고가영상일수록더욱복잡한의료영상이기때문이다. 의료영 [ 그림 6] DICOM 지원판독용모니터 정보통신기술진흥센터 9
주간기술동향 2016. 8. 24. 상판독을하는영상의학과전문의에게만고가의 DICOM 지원모니터가지원될뿐, 일반주치의의진료컴퓨터에는우리가집에서사용하는일반모니터를사용할뿐이다. 의료기관내 DICOM 을지원하는모니터의보급률도낮고, 또한의료영상이미지에서이상신호를찾는것은굉장한숙련도가필요한작업이다. 단순한픽셀만으로알수있는것이아니라, 전체이미지를보고해당픽셀의이상여부를판단해야하는일이며, 픽셀분석을통해서육안으로는찾아내기힘든작은크기의특이정보를찾아내제공할수도있고, 딥러닝기반의패턴분석을통해서 Critical Value 에대해서보다정확하고빠르게제공할수있다. 디지털사진을촬영한곳으로분류하는것은어렵지않다. 사진파일에 EXIF 표준을통해서 GPS 값이저장되어있기때문이다. 사진파일의 EXIF 와는비교도되지않을정도로많은정보가 DICOM 에는저장되어있다. DICOM 헤더정보에는의료장비의정보및환자의키, 나이, 몸무게등의정보뿐아니라, 각영상이미지에대한신체부위정보까지상세한자료가있다. 이러한정보를기반으로딥러닝기반의이미징분석을통한다면좀더다양한분석이될수있다. 또한, 의료영상분석에서가장중요한일은정상의영상과비교해보는일이다. 성별, 연령대, 키, 몸무게가유사할수록좋은비교군이될수있다. 더욱이본인의정상일때의료영상과비교한다면가장좋은비교군이된다. 얼마전스마트의료세미나에서영상의학과전문의가 EXIF Header Info DICOM Header Info [ 그림 7] EXIF, DICOM Header Info 10 www.iitp.kr
기획시리즈 -ICT 융합 : 서비스 알려준내용이있다. 건강할때의 CT, MRI 영상을꼭간직하고있으라고말이다. 나중에건강상문제가있을때본인의건강할때의영상과비교하면문제부위를가장잘찾을수있다. 판독전문의가의료영상판독을할때는여러가지제약사항들로현재의의료영상만으로판독을할수밖에없다. 하지만딥러닝기반의컴퓨팅환경에서는유사환자군, 또는예전영상과함께비교하여이상징후에대해서알려줄수있다. 병원응급실에는순서가없다. 만약유명한식당에서줄을서있는데, 배가너무고프다고해서순서를무시하고먼저식사를할수는없다. 하지만, 병원에서는가능하다. 응급의료법에따라서중증도분류에의해먼저온순서가아니라위급한순서로진료를보도록되어있다. 의료영상판독에있어서도비슷하다. 하루 100 명의 MRI 영상을판독한다고했을때문제가없는사람이 80% 라고하고 20% 만이이상결과가있다고한다면, 문제가있을만한검사를먼저판독한다면어떨까? 이를테면 MRI 의영상의중증도에따라서판독을할수있다면영상의학과판독전문의에있어서도매우도움이되는서비스가될수있다. 좀더나아가이상결과가있는검사중에서매우위험한 1% 에대해서는미리경고알림을줄수있다면병원에서의환자안전과관련한매우중요한서비스가될수있다. 이러한방식의접근이라면딥러닝기반의의료영상분석을통해서의료기관의환자안전을비롯하여의료진에게도현실적으로도움이되는서비스이다. V. 결론및시사점 의료분야의혁명과같은기술은많이개발되었으나실상에활용되고있는경우는미비하다. 여러가지이유가있으나기술적인문제보다는법적, 환경적인문제가더욱큰이유이다. 의료분야에서딥러닝기반의의료영상을분석하는일은앞서살펴본바와같이기술적으로충분히가능한분야이며 10 년이상축적된 DICOM 표준기반의의료영상은빅데이터로불리기에부족함이없다. 하지만, 이세돌과의바둑대결에서알파고가이긴이후에나왔던신문기사들마냥딥러닝이의사를대체할수있으리라는식의접근은전혀도움이되지않는다 [8]-[10]. 본고에서는의사에게도움이되고, 환자에게실질적으로도움이되는방식으로의의료분야딥러닝기술의적용을제언한다. 첫번째, 정렬 (Sort) 이다. 딥러닝기반의의료영상분석에따른위험도 (Critical Score) 가높은 정보통신기술진흥센터 11
주간기술동향 2016. 8. 24. 순서에서낮은순서로내림차순 (Descending) 정렬해서보여주는것이다. 위험도가다소주관적일수있다하더라도방대한데이터관점에서보면의미있는정보가되어줄것이며, 이는의료영상을판독하는판독전문의에게는꼭필요하면서도직접적인도움을주는서비스가된다. 두번째, 알림 (Alert) 이다. 위험도가임계치를넘어서는이상결과를보이는상황발견시에는환자의생명과직결되는골든타임과연관이있는경우이다. 이런경우는전자의무기록시스템과의료영상저장전달시스템의 CVR 응급프로세스를통해주치의와환자에게바로알려줄수있는시스템을갖춘다면환자안전에적의대응하는우수한의료기관이된다. 세번째, 판독아님 (No Diagnosis) 이다. 딥러닝기반의의료영상분석이판독을대체가능하다는형태로접근하면곤란하다. 다양한법적문제가드러날뿐아니라, 그정확성에대해서도굉장히문제가될수있다. 최근자율주행차의교통사고는자율주행차의안정성에큰의심을하게되는결과를나았다. 사람도교통사고가나기는하지만, 자율주행차에더욱엄격한잣대를대는이유는컴퓨터는동일한조건일때언제나동일한교통사고결과를낼수도있다는문제때문일것이다. 결론은딥러닝기반의의료영상분석을통해서중증도에따라정렬하고그중에심각한문제를일으킬수있는이상결과에대해서는알림해주는서비스라면의료기관에서바로필요로하는서비스가될수있다. 딥러닝기반의인공지능의발전이헐리우드영화에서흔히보아오던디스토피아의거부감과해당기술이특정한사람의영역을대체한다고우려할것이아니라, 그기술이사람에게어떻게도움을줄수있을지를살펴보고적용하여기술을통해사람의생활이더욱풍요로워지기를기대한다. [ 참고문헌 ] [1] 의료기관인증제가이드라인-종합병원, 2015. [2] 정연이, 의료기관의환자안전관리사례, 한국의료 QA 학회지, 2009. [3] 박진희외, 병원의사결정지원시스템의서비스품질이경영성과에미치는영향, 한국경영정보학회, 2014. [4] 이병채외, 디지털유방영상의 CAD 알고리즘구현, 대한영상의학회, 2014. [5] 이예하, Deep Learning for Medical Data Analysis, VUNO, 2015. [6] 고성진외, 초음파영상에서갑상선결절의컴퓨터자동진단을위한알고리즘응용, 대한영상의학회, 2013. 12 www.iitp.kr
기획시리즈 -ICT 융합 : 서비스 [7] AlphaGo 의인공지능알고리즘분석, SPRi, 2016 [8] 진화하는인공지능, 또한번의산업혁명, LGERI, 2015 [9] 인공지능 (AI) 완생이되다, 디지에코, 2016 [10] 알파고허사비스가그린 AI 의미래 의료 로봇 스마트폰적용, 연합신문, 2016. 3. 11. [11] 알파고개발자 긴여정의첫걸음 의료 AI 곧나온다, 머니투데이. 2016. 3. 8. [12] 알파고의승리 인공지능이의사역할도대체할까?, 청년의사, 2016. 3. [13] 이세돌, 대국료 17 만달러 구글은? 이세돌덕에 10 조원얻었다, 이투데이, 2016. 3. 15. [14] A LOGICAL CALCULUS OF THE IDEAS IMMANENT IN NERVOUS ACTIVITY, WARREN MCCULLOCH WALTER PITTS 1943. [15] Deep Learning Tutorial, LISA lab, 2015. [16] Enlitic picks up $2M to help diagnose diseases with deep learning, Venture Beat, 2014. [17] http://dicom.nema.org/ [18] http://photos.google.com [19] http://www.enlitic.com [20] http://www.vuno.co 정보통신기술진흥센터 13