기획시리즈 주간기술동향 2016. 3. 9. 인공지능과심층학습의연구동향 기용걸 도로교통공단교통과학연구원부수석연구원 kiyongkul@koroad.or.kr 1. 서론 2. 심층학습의발전과정 3. 심층망의문제점 4. 심층망을위한학습기법 5. 심층학습의응용 6. 결론및시사점 1. 서론마이너리티리포트와같은공상과학영화에서미래에는자동차가스스로운전하고사람들은그냥편안히앉아있는모습을종종보게된다. 이렇게영화에서나가능할것같던일들이첨단기술의발전과더불어점점현실화되는것을보면, 사람들의능력에새삼감탄하게된다. 2010 년구글이미래형자동차로자율주행차를발표한이래로자율주행차에대한관심이크게높아졌으며, 멀지않은미래에영화에서나보던자율주행차를직접운행하게될것이예상된다. 자율주행차가도시부에서안전하게운행되기위해서는 300 만가지이상의상황을실시간으로판단하고필요한조치를취해야하는것으로알려져있으며, 이를위해서는인공지능기술이필수적으로도입되어야할것이다. 이와같이인공지능기술은미래산업에없어서는안될핵심분야로국내외에서활발히연구ㆍ개발되고있다. 인공지능 (Artificial Intelligence) 은영국의수학자 앨런튜링 이고안한생각하는기계 튜링머신 으로부터시작된컴퓨터공학의한분야로, 인공지능이라는용어는리스프 (Lisp) 언어의창시자인존맥카시 (John McCarthy) 가처음고안해냈다. 인공지능은컴퓨터로하여금인간과같이사고하게만든체계로인간고유의사고, 학습, 자연어처리, 지 * 본내용과관련된사항은도로교통공단교통과학연구원기용걸부수석연구원 ( 033-749-5404) 에게문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 IITP 의공식적인입장이아님을밝힙니다. 10 www.iitp.kr
기획시리즈 인공지능 ( 그림 1) 인공지능으로운영될구글의자율주행차각능력등의지식활동을하는컴퓨터시스템이나프로그램을뜻한다. 인공지능의개념과알고리즘등의토대는 1956 년다트머스대학에서열린학회에서구체적인논의가시작된이후 1970 년, 1980 년대두번의붐을이루었지만난관에부딪히며정체기를맞았다. 그러던인공지능이최근인간의뇌구조를모방한인지학습기술인심층학습 (Deep Learning), 비약적으로향상된컴퓨팅파워, 데이터분석기술에힘입어세번째전성기를맞고있다. 이를주도한인물이구글의제프리힌튼 (Geoffery Hinton) 캐나다토론토대학교교수, 앤드류응 (Andrew Ng) 스탠포드대학교교수, 얀레쿤 (Yann LeCun) 페이스북인공지능연구소소장, 요슈아벤지오 (Yoshua Bengio) 캐나다몬트리올대학교교수등이다. 이들에의해구글, 애플, IBM, 바이두, 페이스북등의 IT 기업들사이에인공지능경쟁이한창진행되고있다. 이에뒤질세라우리나라의네이버도음성검색엔진에심층학습을적용하는등인공지능연구와도입에적극나서고있다. 다음카카오도심층학습기술을보유한케이큐브를인수했다 [1]. 해외기업중 IBM 은슈퍼컴 왓슨 으로오랜기간인공지능기술개발에투자한반면, 구글은최근에스마트온도조절기업체 네스트 (Nest, 32 억달러 ) 와영국스타트업기업인 딥마인드 (Deep Mind, 6 억달러 ) 를인수하였고, 바이두도 3 억달러를투자하여미국에인공지능연구소를설립하였다. 또한, 애플은모바일스트리밍서비스업체인 스웰 (Swell) 및지능형개인비서앱개발업체인 큐 (Cue) 를인수하는등인공지능분야사업확대를위해노력하고있다. 반면, 국내는네이버와다음카카오를중심으로인공지능연구 정보통신기술진흥센터 11
주간기술동향 2016. 3. 9. 및서비스가출시되었으나해외에비하면규모나수준이미약한편이다. 네이버는 2012 년부터 네이버랩스 를별도로운영하고있고, 다음카카오도인공지능에대한투자를강화하였으며, 엔씨소프트는 AI 랩 을운영하여인공지능기반의게임개발에집중하고있다. 삼성은 2015 년초세계최초가정용로봇개발벤처회사인 지보 (JIBO) 에 200 억원가량을투자하는등해외유망기업에투자를통해인공지능분야를준비중이다. 시장조사기관인 IDC 는전세계인공지능시장을 2017 년 1,650 억달러규모로전망했으며, 컨설팅기업맥킨지 (McKensey) 는 2025 년인공지능을통한지식노동의자동화효과를연간 5 조 2,000 억달러로내다봤다 [1]. 이러한흐름에따라본고에서는최근 ICT 분야의핵심으로발전하고있는인공지능분야중, 요즘많이사용되고있으며활발히연구되고있는심층학습분야의연구동향을간략히소개한다. 먼저심층학습의발전과정및심층망의문제점을알아보았고, 이러한문제점을극복하기위한심층학습기법중일반적으로많이사용되는몇가지에대해설명하며, 마지막으로심층학습의응용사례를영상처리분야를중심으로소개한다. 2. 심층학습의발전과정인공신경망은 1980 년대다층신경망 (Multi-layer Perceptron) 의학습방법인오류역전파 (Back Propagation) 알고리즘이개발되어복잡한분류문제들을높은성능으로성공적으로수행할수있음이밝혀지며주목을받았다. 하지만모델의크기가커질수록학습속도가느려지고학습결과가국소최적해 (Local Optima) 에빠지는단점이있어활용범위가제한되어왔다 [2]. 한편, SVM(Support Vector Machines) 이나로지스틱회귀분석과같이입력데이터가최종분류값으로변환되는과정이짧은얕은구조 (Shallow Architecture) 와달리, 인공신경망의은닉층수가두개이상인심층학습모델들은여러층의비선형변환과정을거치는심층구조 (Deep Architecture) 를가짐으로써동일한수의연결가중치값으로보다복잡하고표현력높은모델을구축할수있다. 반면, 심층학습모델은다층구조로인해기존의역전파알고리즘으로효율적인학습이불가능하고네트워크를학습하기위한계산량이많은한계로인해역사가오래되었음에도불구하고활용범위가제한적이었다. 하지만 2000 년대중반제안된제한적볼츠만머신 (Restricted Boltzmann Machine) 12 www.iitp.kr
기획시리즈 인공지능 을활용한사전학습 (Pre-training) 을통한초기해탐색방법, 확률적앙상블기법인드롭아웃 (Dropout) 과같은과적합방지방법등의방법론적진보와더불어 GPGPU(General- Purpose Computing on Graphics Processing Units) 를이용한컴퓨팅성능의비약적향상으로인해기존의한계점들이극복됨으로써음성인식, 얼굴인식, 물체인식, 자연어처리등다양한분야에서기존방법론들의성능을뛰어넘는획기적인결과들이발표되고있다 [3]. 3. 심층망의문제점역전파알고리즘은 ( 그림 2) 와같이입력층의각유닛에입력데이터를제시하면이신호는각유닛에서은닉층에전달되고최종적으로출력층으로나오게된다. 신경망의학습은이러한출력값과목표값을비교하여그차이를감소시키는방향으로결합계수를조절하는것이다. 역전파알고리즘은목표출력값과인공신경망의출력값사이의오차들의제곱합을최소로하기위해최급하강법 (gradient-descent method) 을사용하고있으며전방향계산과역방향계산의두단계로이루어진다. 전방향계산은주어진입력값에대해인공신경망의출력값을계산하는과정이며, 역방향계산은전방향계산에의해얻어진출력값과목표출력값의차이, 즉오류를출력으로부터입력층으로역전파시켜가며연결가중치를저장하는과정이다. 순방향 입력층 (i) 은닉층 (j) 출력층 (k) W W 역방향입력값 (O) 출력값 (O) 목표값 (t) ( 그림 2) 역전파알고리즘의학습과정 정보통신기술진흥센터 13
주간기술동향 2016. 3. 9. X 1 Y 1 X 2 Y 2 Backward information vanishing < 자료 > 최희열, 민윤홍, 딥러닝소개및주요이슈, 정보처리학회지, 2015 년 1 월호, pp.7-21. ( 그림 3) 사라지는경사현상신경망의계층을많이쌓은심층망이패턴인식등의성능향상에도움이된다는것을알고있으면서도최근까지심층망이활발히연구되지않은이유는학습이어렵다는것이다. 즉, 신경망을학습하는데사용되는역전파알고리즘이심층망에서는에러의역전파에어려움을겪는것이다. 이러한역전파의어려움은사라지는경사 (vanishing gradient) 라는현상때문이며, 이는 ( 그림 3) 과같이에러정보가출력유닛에서입력유닛방향으로전달되면서점점사라지는것을말한다. 에러정보가낮은계층까지잘전해지지않으면서낮은계층의연결강도는학습정도가미미한수준에머무르면서초기의랜덤값에서크게벗어나지못하게된다. 인공신경망이연결강도를조정하여다양한함수를표현할수있지만사라지는경사현상으로인해상대적으로낮은층은초기의연결강도값을그대로갖게되므로결국학습과정에서상위몇개층의연결강도만을조정하게된다. 이는상대적으로적은깊이를갖는모델을사용한것과같기때문에성능정확도를향상시키는데실패할수밖에없다. 하지만, 2006 년 G. Hinton 교수가사전학습을제시함으로써심층망의학습가능성을보여줬고, 이후다양한방법들이제안되고있다 [4]. 4. 심층망을위한학습기법 심층망의학습을가능하게하는방법들중에일반적으로사용되는대표적인방법들은 사전학습 (Pre-training), Dropout, 조기멈춤 (Early stopping) 등이있다. 14 www.iitp.kr
기획시리즈 인공지능 가. 사전학습사전학습은심층망에역전파알고리즘을적용하기전에각계층별로사전학습을진행하는것이다. 즉, 역전파알고리즘을임의의값에서시작하는것이아니라, 사전학습을통해심층망의연결을학습에도움이되는중간값으로미리변형해놓는것을의미한다. ( 그림 4) 와같이입력값이주어지면, 첫번째계층을먼저학습하고, 그출력값을두번째계층의입력으로사용하여두번째계층을학습한다. 이러한과정을모든계층에순서대로진행한다. 즉, 전체신경망을층별로분해해서학습하는것이다. 이후역전파알고리즘으로전체신경망을학습하는데이를미세조정 (fine-tuning) 이라고한다. 이름그대로미세조정을통해서연결강도가조금조정된다. 이런사전학습은초기값을최적해근처로옮겨놓는다는점에서최적화 (optimization) 문제를위한좋은초기해를찾는방법으로해석될수있다. 뿐만아니라, 무감독학습이 p(x) 로표현되는데이터의분포를학습하고, 감독학습에기반한미세조정은 p(y x) 로표현되는분류성능을최대화하며, 베이즈룰 (Bayes rule) 에따라좋은 p(x) 는 p(y x), 즉분류문제에대한좋은사전지식이된다. 사전학습의또다른장점은무감독학습이기때문에레이블없는빅데이터를학습에사 layer-wise unsupervised learning back propagation supervised learning Y 1 Y 2 X 1 X 2 X 1 X 2 < 자료 > 최희열, 민윤홍, 딥러닝소개및주요이슈, 정보처리학회지, 2015 년 1 월호, pp.7-21. ( 그림 4) 심층망학습을위한사전학습 정보통신기술진흥센터 15
주간기술동향 2016. 3. 9. 용할수있다는점이다. 감독학습을위해필요한레이블이많지않은데이터들도있고, 또 레이블을만드는데드는비용이매우큰경우무감독학습이유용하다 [4]. 나. Dropout Dropout 은 ( 그림 5) 와같이학습하는중에유닛들의절반을임의로끄고진행하는것이다. 매학습회수마다임의의선택을새로하며, 학습이끝난후새로운데이터에대해서는절반의유닛를끄는대신모든유닛들의출력값을절반으로나눈다. 이러한방법은기계학습의 bagging 방법과비슷한효과를만드는데안정성과정확성을향상시킨다 [5]. 그리고중요한것은 Dropout 은상호적응 (coadaptation) 문제를해소한다. 두개의유닛이한번비슷한연결강도를가지게되면, 그두유닛은비슷한방식으로업데이트되면서마치하나의유닛처럼작동하고, 이것은컴퓨팅파워와메모리의낭비를초래한다. Dropout 이임의로유닛들을끌때이러한두개의유닛이나눠지게되면상호적응문제를회피할수있게된다 [4]. X 1 Y 1 X 2 Y 2 h (1) h (2) h (3) < 자료 > 최희열, 민윤홍, 딥러닝소개및주요이슈, 정보처리학회지, 2015 년 1 월호, pp.7-21. ( 그림 5) Dropout 예 다. 조기멈춤심층망과같은패턴인식을위한모델을학습할때는보통두가지목표를동시에달성하기를원한다. 하나는비용함수를최소화하는모델을찾는것이고, 다른하나는찾은모델이학습에사용되지않은데이터에대해서도인식을잘하기를원하는것으로과적합 (overfitting) 을피하는것이다. 과적합문제는근본적으로학습데이터에대해비용함수를최소화하기때문에발생한다. 즉, 모델이지나치게학습데이터에만적합하게만들어져서 16 www.iitp.kr
기획시리즈 인공지능 학습에서보지못한데이터에대해서는큰에러를주는경우이다. 이를해결하기위해서주로쓰는방법은조기멈춤이다. 이방법은학습데이터중일부를검증데이터로따로떼어놓고, 남은데이터로만학습을진행한다. 학습중검증데이터로성능을검증해서에러가떨어지다가올라가기시작하면학습을멈춘다. 이방법은매우간단해보이지만잘작동한다. 그외에도 maxout 이나선형정류기 (Linear Rectifier) 등의모델관련기법들과 GPU(Graphic Processing Unit) 와여러대의서버들에기반한병렬연산 (parallel computing) 기법들이최근많이사용되거나연구되고있다 [4]. 5. 심층학습의응용심층학습을적용한음성인식의오류율이 20% 이상개선되기시작한것을계기로심층학습이다양한분야로확산되기시작했으며, 2012 년데이터사이언스콘테스트웹사이트인 Kaggle 에게재된 Merck Molecular Activity Challenge 1) 에서 Hinton 이이끄는팀이 1 위를차지해서 22,000 달러의상금을획득함으로써언론과대중의관심을받게되었다. 또한, 심층학습의권위자앤드류응교수는 1 만 6,000 개의프로세서와 10 억개이상의인공신경망 (Neural Network) 과심층신경망 (Deep Neural Networks) 을이용하여유튜브상의 1,000 만개비디오중고양이가있는영상을찾아냈다. 최근에는심층학습의응용분야가자율주행차, 자연어처리및델타모달데이터학습등으로확산되고있다. 우리나라정부도 세계최고인공지능기술선도 라는비전을달성하기위해미래창조과학부가소프트웨어분야의국가혁신기술개발형 R&D 과제인 엑소브레인 을 2013 년부터 10 년동안 1,000 억원을투입하여진행하고있으며, 2016 년부터는심층학습을구현하는소프트웨어와하드웨어를개발할계획이다. 심층학습기술은영상처리분야에많이이용되며, 그중 CNN(Convolutional Neural Networks) 알고리즘은 ( 그림 6) 과같이영상의각영역에대해복수의필터를적용하여특징지도 (Feature Map) 를만들어내는콘볼루션층 (Convolution Layer) 과특징지도를공간적으로통합함으로써크기를줄여위치나회전의변화에불변하는특징을추출할수있도록하는통합층 (Pooling Layer) 을번갈아반복하는구조로구성되어있다 [3],[6]. 1) 데이터로부터신약을개발하는방법을찾는것을목적으로한다. 정보통신기술진흥센터 17
주간기술동향 2016. 3. 9. Input layer (S1) 4 feature maps (C1) 4 feature maps (S2) 6 feature maps (C2) 6 feature maps Convolution layer sub-sampling layer convolution layer sub-sampling layer fully convolution MLP < 자료 > 정규환, 김현준, 이예하, 딥러닝을이용한일반영상에서의문자인식, 정보처리학회지, 2015 년 1 월호, pp.42-54. ( 그림 6) CNN 의구조이를통해점, 선, 면등낮은수준의특징에서부터복잡하고의미있는높은수준의특징까지다양한수준의특징을추출해내고, 이를최종단계분류모델의입력값으로사용함으로써기존모델에비해높은분류성능을나타내며다양한영상분석문제에적용되고있다 [7],[8]. CNN 기법의교통분야적용사례로는 ( 그림 7) 에예시된것과같이자율주행차의카메라센서를이용한차량및보행자인식, 도로상의교통안전표지및노면표시인식기술등이있다. < 자료 > NVIDIA 의 Drive PX ( 그림 7) NVIDIA 의자율주행차영상인식기술 18 www.iitp.kr
기획시리즈 인공지능 6. 결론및시사점인공지능이란인간의인지능력, 학습능력, 이해능력, 추론능력등을실현하는기술을의미한다. 최근 ICT 분야의기술력이날이갈수록높아지면서이러한인공지능기술은글로벌산업의중심에서다양한형태로나타나고있다. 이에인공지능이적용된유망산업분야의동향을살펴보고, 최근인공지능분야에서많이사용되고있는심층학습기술의연구동향에대해살펴보았다. 처음개발된이래로신경망학습알고리즘들이꾸준히개선되고있을뿐만아니라뇌신경과학적발견들과빅데이터처리에대한노하우가쌓여가고, GPU 의발전을포함한컴퓨팅파워가증가함으로써심층학습의발전도더욱가속화될것으로전망된다. 이러한시점에심층학습의배경을살펴보고, 주요이슈들을점검하는것은인공지능에관심이있는사람들에게매우유용할것이다. 최근미국도로교통안전국 (National Highway Traffic Safety Administration: NHTSA) 이자율주행인공지능을운전자로간주해달라는구글측의요청을받아들이며, 구글의자율주행차인공지능시스템을 운전자 로인정할수있다. 고말했다는걸보면, 인공지능기술이우리주변에서흔히발견될날이멀지않은것같다. < 참고문헌 > [1] 도안구, 인공지능의혁신딥러닝, 클라우드와빅데이터플랫폼덕, 한국철도학회철도저널, 18 권 6 호, 2012. 12, pp.6-9. [2] D. E. Rumelhart and J. L. McClelland, Parallel distributed processing: explorations in the microstructure of cognition, Cambridge: MIT Press, 1986. [3] 정규환, 김현준, 이예하, 딥러닝을이용한일반영상에서의문자인식, 정보처리학회지, 2015 년 1 월호, pp.42-54. [4] 최희열, 민윤홍, 딥러닝소개및주요이슈, 정보처리학회지, 2015 년 1 월호, pp.7-21. [5] P. Baldi, P. J. Sadowski, Understanding dropout, Advances in Neural Information Processing Systems(NIPS), 2013, pp.2814-2822. [6] 김지원, 표현아, 하정우, 이찬규, 김정희, 다양한딥러닝알고리즘과활용, 정보과학회지, 2015 년 8 월호, pp.25-31. [7] C. Szegedy, W. Liu., Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke and A. Rabinovich, Going deeper with convolutions, arxiv:1409.4842, 2014. [8] 김지섭, 남장군, 장병탁, 딥러닝기반비디오분석기술, 정보과학회지, 2015 년 9 월호, pp.21-31. 정보통신기술진흥센터 19