시장분석통계Ⅰ. 서론부록인공신경망의시초라할수있는퍼셉트론 (perceptron) 은 1957 년 Frank Rosenblatt 가발명했고딥러닝의 학습알고리즘인오차역전파법 (back-propagation) 은 1986년 LeCun에의해발명됐다. 이미딥러닝의핵심이론은 198

Similar documents
딥러닝 첫걸음

Introduction to Deep learning

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

1-1-basic-43p

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

<313620B1E8BFB5BFF52E687770>

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

제4차 산업혁명과 인공지능 차 례 제4차 산업혁명과 인공지능 2 제46회 다보스포럼이 2016년 1월 21일~24일 4차 산업혁명의 이해 라는 주제로 개최 되었습니다. 4차 산업혁명은 인공지능에 의해 자동화와 연결성이 극대화되는 단계 로서 오늘날 우리 곁에 모습을 드러

Ch 8 딥강화학습

본보고서는 과학기술정보통신부정보통신진흥기금 을지원받아제작한것으로과학기술정보통신부의공식의견과다를수있습니다. 본보고서의내용은연구진의개인견해이며, 본보고서와관련한의문사항또는수정 보완할필요가있는경우에는아래연락처로연락해주시기바랍니다. 소프트웨어정책연구소기술 공학연구실추형석선임연

= ``...(2011), , (.)''

Ch 1 머신러닝 개요.pptx

신경망 (Neural Networks) < 인공지능입문 > 강의 허민오 Biointelligence Laboratory School of Computer Science and Engineering Seoul National University

AIGo 개발 줂갗 보곀.hwp

Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology Vol.7, No.11, November (2017), pp

Sequences with Low Correlation

빅데이터_DAY key

<4D F736F F F696E74202D203034BECBB0EDB8AEC1F228BECBC6C4B0ED20BECBB0EDB8AEC1F220C0CCBEDFB1E2292E >

PowerPoint Presentation

PowerPoint 프레젠테이션

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석 지도교수장병탁 이논문을공학학사학위논문으로제출함 년 12 월 21 일 서울대학교공과대학컴퓨터공학부한동식 2016 년 2 월

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

PowerPoint Template

PowerPoint Presentation

OCW_C언어 기초


때문이다. 물론가장큰이유는, 다음절에서살펴보겠지만최근들어딥러닝구조를학습하는데필요한여러가지테크닉들이개발되었기때문이다 [6,7]. 딥러닝이산업현장에서선호되는데는몇가지이유가있다. 일단은어려운문제를잘해결한다는것이다. 예를들어서, 물체인식과음성인식등전통적인패턴인식의문제에서딥러닝

모바일동향

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 29(7),

슬라이드 0

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

adfasdfasfdasfasfadf

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

약관

(b) 미분기 (c) 적분기 그림 6.1. 연산증폭기연산응용회로

보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마

PowerPoint 프레젠테이션

[NO_11] 의과대학 소식지_OK(P)

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

2013 년도연구용역보고서 중소기업정책자금지원의경기대응효과분석 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한남대학교경제학과교수황진영

01 AI Definition 02 Deep Learning Theory - Linear Regression - Cost Function - Gradient Descendent - Logistic Regression - Activation Function - Conce

PowerPoint Presentation

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오.

2 : (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, (JBE

핵 심 교 양 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 교양학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (

조사보고서 구조화금융관점에서본금융위기 분석및시사점

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

특집 2 부 3 신경회로망 신경회로망에대한연구는뇌신경생리학으로부터유래되어패턴인식이나연산기억장치, 최적화, 로봇제어, 문자인식, 음성인식, 신호처리등의분야로확대됐을뿐아니라경제, 경영분야의의사결정시스템에도응용되기에이르렀다. 최근에는데이터마이닝의주요기법으로손꼽히고있다. 신현

실험 5

04 Çмú_±â¼ú±â»ç

02본문

PowerPoint 프레젠테이션

(b) 연산증폭기슬루율측정회로 (c) 연산증폭기공통모드제거비측정회로 그림 1.1. 연산증폭기성능파라미터측정회로

PowerPoint 프레젠테이션

Microsoft PowerPoint - Java7.pptx

슬라이드 1

딥러닝튜토리얼 Deep Learning Tutorial - 신경망과딥러닝의이해 Understanding Neural Network & Deep Learning

Chap 6: Graphs

Microsoft PowerPoint - ai-2 탐색과 최적화-I

의료영상분석에있어딥러닝의응용사례에대해살펴본다. 2 장에서는딥러닝의개요와관련주요기술들에대해역사와원리를소개한다. 3장에서는최근의료영상분석에딥러닝이응용된사례에대해정리한다. 4장에서는추후의료영상분석에있어딥러닝의응용가능성에대해언급함으로써결론을맺는다. 딥러닝의개요 1. 인공신경망

PowerPoint 프레젠테이션

(001~006)개념RPM3-2(부속)

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB0FBB3EBC1D8>

중간고사

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB1E2BFEBB0C9>

슬라이드 1

슬라이드 1

PowerPoint 프레젠테이션

SOSCON-MXNET_1014

Microsoft Word - Lab.4

<BFACBDC0B9AEC1A6C7AEC0CC5F F E687770>

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

exp

PowerPoint 프레젠테이션

슬라이드 1

3. 다음은카르노맵의표이다. 논리식을간략화한것은? < 나 > 4. 다음카르노맵을간략화시킨결과는? < >

<C0FCB9AEB1E2BCFA20BFDCB1B9C0CEB7C220B3EBB5BFBDC3C0E520BAD0BCAE2E687770>

학점배분구조표(표 1-20)

목차 윈도우드라이버 1. 매뉴얼안내 운영체제 (OS) 환경 윈도우드라이버준비 윈도우드라이버설치 Windows XP/Server 2003 에서설치 Serial 또는 Parallel 포트의경우.

기획특집 4 I 머신러닝알고리즘을이용한부동산가치산정에관한소고 Ⅱ. 인공지능의정의와주요분야 1956년여름개최된다트머스학술회의 (Dartmouth Conference) 를통해인공지능이라는용어가널리알려지고, 인공지능이새로운연구분야로서확립되게된다. 인공지능이라는용어를처음고안한

에듀데이터_자료집_완성본.hwp

= " (2014), `` ,'' .." " (2011), `` ,'' (.)"

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음

PowerPoint 프레젠테이션

소성해석

......

Microsoft Word - PLC제어응용-2차시.doc

<B3EDB4DC28B1E8BCAEC7F6292E687770>

슬라이드 1

학습목표 함수프로시저, 서브프로시저의의미를안다. 매개변수전달방식을학습한다. 함수를이용한프로그래밍한다. 2

A Hierarchical Approach to Interactive Motion Editing for Human-like Figures

Microsoft PowerPoint - chap06-1Array.ppt

Reinforcement Learning & AlphaGo

Transcription:

SURVEY AND RESEARCH 02 딥러닝의현재와미래 Ⅰ. 서론 Ⅱ. 딥러닝을이용한채권회수율예측 Ⅲ. 알파고, 알파고제로, 알파제로 Ⅳ. 결론 김동현 * 한국주택금융공사정보전산부팀장 2017년말에딥마인드에서개발한알파제로는딥러닝을이용한강화학습을통해바둑의기본규칙만을입력받고스스로바둑을둬가며학습하여불과 3일만에수천년간쌓아올린인간의바둑지식을터득했고인간이미처생각하지못한새로운전략도발견했다. 2017년주택금융공사학습조직베타고에서수행한프로젝트에서딥러닝을이용한심층신경망은과거의채권회수율을학습하여미래채권회수율을높은정확도로예측했고금융의다양한분야에서딥러닝이적용될수있음을보여줬다. 아직까지는게임등일부분야에국한되기는하지만 AI는많은분야에서인간의능력을뛰어넘었으며 AI 기술과하드웨어성능의기하급수적인발전이지속된다면머지않은미래에 AI가모든분야에서인간의능력을뛰어넘는날이올수도있다. 특히알파제로가보여줬듯이게임의규칙만입력받고바둑뿐만아니라체스, 장기까지이기는법을스스로학습하는강화학습알고리즘은레이커즈와일 (Ray Kurzweil) 이말한특이점을앞당기는데이용될수있을것으로보인다. * 한국주택금융공사정보전산부보증전산팀팀장 (dhkim95@hf.go.kr) 본고의내용은필자의개인의견으로한국주택금융공사의공식적인견해와다를수있습니다. 본조사결과는 통계법 제 3 조제 1 호및 동법시행령 제 2 조제 5 호에해당하는수량적정보로서, 통계법적용대상이아님을알려드립니다. 22 주택금융리서치

시장분석통계Ⅰ. 서론부록인공신경망의시초라할수있는퍼셉트론 (perceptron) 은 1957 년 Frank Rosenblatt 가발명했고딥러닝의 학습알고리즘인오차역전파법 (back-propagation) 은 1986년 LeCun에의해발명됐다. 이미딥러닝의핵심이론은 1980년대에나왔지만학습가능한데이터양의제한, 하드웨어성능의한계로인해 2000년대중반까지가시적인성과가나타나지않았다. 매년기하급수적으로빨라지는하드웨어의성능과데이터양의폭발적인증가에힘입어 2000년대중반에는과거보다훨씬더많은학습데이터가생기고훨씬더크고복잡한인공신경망을구축할수있게되었으며이는최근 AI 기술성공의기반이되었다. 딥러닝의발전에는아래의몇가지기술적인진보가있었다. 퍼셉트론은 XOR 같은비선형함수학습이불가능했으나퍼셉트론에은닉층을추가하면서 비선형특징추출이가능하게됨. 활성함수로 sigmoid 를사용하면오차역전파법으로미분값계산시여러층을거치면서값이계속 줄어드는 (vanishing gradient) 문제가있으나, ReLU 를활성함수로사용하면서이문제를해결함. 제한된학습데이터를이용해인공신경망을학습시키면과적합 (overfitting) 이발생할수있는데, 전체뉴런중일부에대해서만학습하는방식 (dropout) 을사용하여과적합을방지함. 최근 AI 발전의원동력은다음과같다. 2000 년대후반에비약적으로발전한컴퓨터비전 (computer vision) 관련기술 2010 년대초반부터생겨난빅데이터 구글, 아마존등 IT 기업이보여준딥러닝기술의성공적인적용 구글, 페이스북, 아마존같은최상위권기업은이미 2000 년대중반부터 AI 연구에천문학적인돈과노력을쏟 아붓고있으며 AI 최신기술을자사제품에경쟁적으로적용하고있다. 최상위권 IT 기업보다는 10년정도뒤쳐졌지만 2010년대중반부터는포춘 500 기업도경쟁력확보를위해빅데이터와 AI 기술에투자를아끼지않고있다. 이제는 AI 기술은선택의문제가아니라기업의사활이걸린문제이다. 조사 연구HOUSING FINANCE RESEARCH 23

아래는 AI 기술의구체적인성공사례이다. 헬스케어 ( 질병진단 ) 인터넷상거래및소매분야에서의매출분석 통신 / 금융분야에서비정상적거래인식 음성인식및자동번역 딥마인드의알파고, 구글의자율주행자동차의성공으로 AI에대한대중의기대가폭발했지만 1990년대후반의 IT 붐에서겪었듯이단기간에너무커진 AI에대한기대는실망을안겨줄수도있다. 본고에서는최신 AI 기술인딥러닝의원리를딥러닝을이용한채권회수율예측프로젝트, 알파고, 알파고제로, 알파제로등의사례를통해분석해보고향후기술발전방향에대해논의해보고자한다. Ⅱ. 딥러닝을이용한채권회수율예측 채권회수율을예측하기위해서는일반적으로회귀분석방법이많이쓰인다. 회귀분석방법중하나인선형회귀분석은회수율에영향을미치는값과회수율이선형 (linear) 적인상관관계를갖는다고가정한다. 예를들어, 채무자의나이, 채권원금잔액등 (,,...) 이채권회수율 ( ) 과선형적으로어떻게연관되어있는지찾는다. 즉, 선형회귀분석은다음의식을가장근접하게만족하는,,,... 를찾는다. 선형회귀분석은간단하고빠르게결과를도출할수있으며모델을이해하기쉽다는장점이있으나모델링대상이선형적인경우에만적용가능하며두개이상의입력값의상호작용을고려하지못한다는단점이있다. MLP의경우 ReLU 등의비선형활성함수와여러층의노드들을이용하여입력값과출력값의비선형적인관계를모델링할수있다. 특히, 두개이상의입력값이상호작용하는경우 MLP는이러한부분까지감안하여모델링이가능하다. 2017년주택금융공사학습조직베타고에서는딥러닝알고리즘중하나인 MLP를이용해주택금융신용보증구상채권의회수율을예측하는프로젝트를수행하였다. 2013년, 2014년 2년간의채권원금회수율데이터를이용해심층신경망 (deep neural network) 의한종류인 MLP(multilayer perceptron) 를학습시켜 2015 년, 2016년 2년간의실제회수율과 MLP가예측한예상회수율을비교하였으며, 회수율평균절대오차 (mean 24 주택금융리서치

시장분석통계균적으로 6.5% 정도의오차로회수율을예측했다는점은매우고무적이다. 먼저딥러닝과 MLP에대해살펴보고 MLP를이용해구상채권회수율을어떻게학습하고예측했는지알아보자. 1. 심층신경망과 MLP 의개요 심층신경망의특징은다음과같다. 기존의인공신경망보다많은뉴런 ( 노드 ) 을사용 기존의인공신경망보다뉴런이더복잡하게연결됨 폭발적으로성장한컴퓨터의연산능력을이용한학습 자동화된특징추출 (feature extraction) [ 그림 1] MLP (multilayer perceptron) 출처 : http://jaykaychoi.tistory.com/148 딥러닝에서쓰이는인공신경망중가장간단한형태는 [ 그림 1] 과같은 MLP(multilayer perceptron) 이다. 입력층 (input layer) 에여러개의입력값이입력되면여러층의은닉층 (hidden layer) 을통해계산이수행되어최종적으로출력층 (output layer) 을통해결과값이출력된다. 각층의노드들은이전층의모든노드, 다음층의모든노드와연결되어있다. 입력값의예는다음과같다. absolute error) 는 6.5% 를나타냈다. 미래회수율의정확한예측의어려움을감안할때딥러닝을이용하여평조사 연구부록HOUSING FINANCE RESEARCH 25

[ 표 1] MLP 의입력및출력값의예 입력값 출력값 알파고 상대방과플레이어의바둑판위의바둑돌의위치 승률을최대화하는다음수 채권회수율예측 채권의종류, 채무자의나이, 채권보전조치여부등 향후 2년간예상되는채권회수율 자율주행 자동차의센서에입력되는영상정보등 목적지에안전하게도달하기위한최선의행동 자료 : UNECE(2015), 김혜승외 (2017), 박은철외 (2017) 은닉층에있는노드들은아래와같이입력값을계산하여출력한다. 채권회수율모형을예로들면는벡터값으로서입력층에서는채권의종류, 채무자의나이등채권의특징을나타내는정보를나타내며, 두번째층부터는이전층의노드에서출력된값을나타낸다. 와는초기에는랜덤한값으로설정되고학습을통해출력값의정확도를높이는방향으로수정된다. 는활성함수 (activation function) 로서일반적으로와같은 ReLU 함수가쓰인다. 이수식은뇌의뉴런의작용중아래성질을모방한것이다. 뉴런에입력되는대부분의입력신호는무시되며뉴런은반응을보이지않는다. 일부입력신호에대해뉴런은입력신호의세기와비례해서출력신호를발생시킨다. 출력층의노드는은닉층의노드와는다르게아래와같이계산을수행한다. 출력노드는일반적으로특정행동을선택하는확률을의미하며출력노드의값의합은 1 이된다. 출력노드 의 softmax 함수는대뇌피질 (cortex) 의뉴런에서작용하는측면억제 (lateral inhibition) 의작용을모방한것으로서여러개의출력값중값이가장큰값하나가선택되는승자독식의형태를나타낸다. 26 주택금융리서치

시장분석통계여기서는, 등 MLP 의파라미터값을의미하며학습을통해 MLP 의출력값이실제출력값 ( ) 과비슷해 지도록수정된다. 학습에따른 MLP 의파라미터수정방법으로는아래와같이비용함수인를에대해미분하여를최소 화하는를찾는방법인 SGD(stochastic gradient descent) 가많이쓰인다. 비용함수최소화하기를반복적으로학습하면서를에대해미분하여최소값을찾는다. [ 그림 2] SGD(stochastic gradient descent) J(w) Initial weight 출처 : http://www.quora.com/what-is-stochastic-gradient-descent Graient Global cost minimum J min (w) 함수는아래와같이정의되며 MLP의예측이정확해질수록비용함수의값이작아지게된다. 조사 연구부록비용 HOUSING FINANCE RESEARCH 27

2. MLP 를이용한채권회수율예측 구상채권의채권회수율을 MLP 에게학습시키기위해아래와같이회수율에영향을미칠것으로예상되는 19 개항목을입력값으로선택했다. [ 표 2] 회수율예측에쓰인입력값 구분 출력값 실험 1 실험 2 실험 3 과거회수율 *, 구상권잔액, 보증채무이행일로부터경과개월, 보증일로부터보증채무이행일까지경과개월, 전세보증상품여부, 중도금보증상품여부, 건축 구입 개량자금보증상품여부, 신용회복여부, 개인회생여부, 파산면책여부, 분할상환약정여부, 채권보전조치여부 채무관계자수, 연대보증인수, 채무자의나이, 구상채권발생금액 시효완성여부, 상각여부, 상속인수 * 회수율 = 기초일이전구상채권회수금액 / 구상채권발생금액 2013년초기준주택금융신용보증개인보증구상채권 17만여개의속성값과 2년간의실제회수율데이터를 MLP 학습에사용했다. 모든입력값은대체적으로 0에서 1까지의값을나타내도록변환 (normalize) 하였으며전세보증상품여부등여부를나타내는항목은 0 또는 1 값을가지도록 (one-hot encoding) 하였다. MLP 를구축하기위해 Skymind 에서개발한 Java 기반딥러닝오픈소스라이브러리 DL4J 1) 를사용했다. 채권회수율프로젝트프로그램소스코드는아래에서확인할수있다. http://github.com/dhkim9549/mlpdrp [ 표 3] 채권회수율예측을위한 MLP에서사용된 hyper-parameters Parameters 값 설명 mini-batch size 16 한번의가중치조절시사용되는학습데이터의수 learning rate 0.0025 SGD에서사용되는학습속도 number of hidden layers 3 은닉층 (hidden layer) 의수 number of input nodes 12 ~ 19 입력항목의개수 1) http://deeplearning4j.org 28 주택금융리서치

시장분석통계7.4% 7.2% 7.0% 12 6.8% 16 19 6.6% 6.4% 6.2% 25 50 75 100 125 150 175 200 225 학습된 MLP를이용해 2015년초기준구상채권의 2년간의실제회수율과 MLP가예측한회수율의평균절대오차를비교한결과아래와같은결과를얻을수있었다. 학습횟수가많을수록, 학습에사용된입력항목이많을수록예측회수율과실제회수율의차이가줄어듦 MLP의목적은특정입력값에대한결과값의민감도를찾는것이아니라모든입력값을종합적으로고려하여최선의결과값을찾는것이므로각각의입력항목에대한채권회수율민감도는분석하지않았다. 또한, 과거의공사정책등인위적인개입이채권회수율에적지않은중요도로작용했을수있으나 MLP 학습에서이부분은고려하지않았다. 19개의항목을입력받은 MLP의예측회수율이가장높은채권 3개와가장낮은채권 3개는 [ 표 4] 와 [ 표 5] 와같다. 분할상환약정을했고과거회수율이 90% 이상이고채권원금잔액이얼마남지않은경우 MLP는채권의회수율을높게예측했고, 파산면책여부가여이고과거회수율이 0% 인구입자금보증을낮게예측했다. 이는상식에도부합하는결과이다. [ 그림 3] 학습횟수에따른평균절대오차조사 연구부록HOUSING FINANCE RESEARCH 29

[ 표 4] MLP가예측한회수율상위 3개채권의특성채권1 채권2 채권3 보증구분 전세자금보증 전세자금보증 전세자금보증 분할상환약정여부 Y Y Y 채권원금잔액 310,646원 145,370원 519,041원 과거회수율 90.6% 95.8% 91.3% 채권보전조치여부 N N Y 실제회수율 100% 100% 100% MLP 예측회수율 96.70% 96.67% 96.61% [ 표 5] MLP가예측한회수율하위 3개채권의특성채권1 채권2 채권3 보증구분 구입자금보증 구입자금보증 구입자금보증 파산면책여부 Y Y Y 분할상환약정여부 N N N 채권원금잔액 3,707,563원 2,921,190원 8,756,179원 과거회수율 0% 0% 0% 채권보전조치여부 N N N 실제회수율 0% 0% 0% MLP 예측회수율 0.00004% 0.00012% 0.00019% MLP의예상회수율은채권매각시채권의적정가격을산정할때유용하게사용될수있다. 예를들어특정조건을충족하는특수채권을매각한다고하자. 앞에서학습된 MLP를이용해예상회수율을산출해서실제회수율과비교한결과 [ 표 6] 과같이가중평균회수율의차이가 0.38% 로나타났으며, 이는향후주신보특수채권을매각할때의미있는참고자료로 MLP의예상회수율이사용될수있음을보여준다. [ 표 6] 매각대상채권의실제회수율과 MLP 예측회수율비교, 매각대상채권조건 : 2015 년초기준특수채권, 구상채권발생후 5 년이상경과, 채권보전조치없음, 파산면책여부부, 회생여부부, 신용회복여부부 ( 채권수 : 52,322) MLP 예측실제차이 기준일이후 2 년간회수율 ( 단순평균 ) 기준일이후 2 년간회수율 ( 회수원금가중평균 ) 4.62% 3.83% 0.79% 2.22% 1.84% 0.38% 30 주택금융리서치

시장분석통계사용된입력항목수가 19개로제한되었으며외부변수는고려되지않은점이있다. 내부정보뿐만아니라경제성장률, 실업률등각종경제지표, 채무자의신용정보등외부정보도함께학습하고, 학습대상채권수를수십만건에서수백만건으로늘릴수있다면 MLP의예측정확도는더욱높아질것으로보인다. 주택금융공사업무중조기상환율, 원리금회수속도, 대손율예측, 개인신용평가모형구축, 부도율예측등다양한분야에서도딥러닝을이용한예측방법이적용될수있을것으로기대된다. Ⅲ. 알파고, 알파고제로, 알파제로 경우의수가우주의원자수보다많아컴퓨터가인간을이기려면수십년후에나가능할것이라고여겨진바둑에서 2016년에딥마인드의알파고는이세돌을 4 대 1로이겼고 2017년에기능이향상된알파고마스터는온라인대국에서세계최고수준의프로바둑기사들을상대로 60 대 0으로이겼다. 이후더욱향상된학습알고리즘과하드웨어를갖춘알파제로는인간의기보에대한학습없이게임의규칙만입력받은후스스로학습해불과 3일만에알파고, 알파고마스터를이겼으며바둑뿐만아니라체스와 Shogi ( 일본식장기 ) 를불과하루동안스스로학습해인간의능력을뛰어넘었다. 1. 알파고 (AlphaGo) 알파고에서사용된심층신경망 (deep neural network) 은 MLP와유사하지만층간연결방식이다른 CNN(convolutional neural network) 이다. MLP의경우각층의노드들은이전층과다음층의모든노드들과연결되어있지만 CNN의노드들은이전층과이후층의가까이있는일부노드와만연결되어있다. 이는생물학적인뉴런이근처의뉴런들과만연결되어있다는점을모방한것이며주로영상인식분야에서뛰어난성능을보인다. MLP를이용한채권회수율예측프로젝트의한계점으로는학습대상채권이수십만건으로한정되고학습에조사 연구부록HOUSING FINANCE RESEARCH 31

[ 그림 4] CNN(convolutional neural network) 의구조 출처 : http://en.wikipedia.org/wiki/convolutional_neural_network 알파고의학습방법을요약하면다음과같다. 1. 학습 : 바둑판의상태 : 다음행동프로기사들의 3천만건의기보를이용해지도학습정책망 2) 을학습시킨다. 학습이종료된정책망은프로기사들의다음수를 57% 의정확도로예측한다. 2. 학습강화학습을통해위에서학습된의성능을향상시킨다. 여기서강화학습은사람의개입없이알파고스스로바둑을둬승률을개선시키는방향으로 network 노드들의파라미터값을변경시키는것을의미한다. 강화학습으로학습된 network를강화학습정책망 3) 이라고한다. 알파고는하루에 120만판정도의바둑을두어를학습했다. 알파고스스로바둑을둘때는를이용해수많은경우의수중승률이높은수천개로경우의수를좁혀서 MCTS 4) 방식으로최적의수를찾는다. 3. 학습바둑판의상태가주어졌을때승률을예측하는가치망 (value network) 를학습한다. 학습대상은앞단계의강화학습과정에서생성된알파고의기보를대상으로한다. 알파고는 1주일간약 12억개의수에대해를학습했다. 2) SL (supervised learning) policy network 3) RL (reinforcement learning) policy network 4) 몬테카를로트리탐색 (Monte Carlo tree search, MCTS). 결정을위한체험적탐색알고리즘. 탐색영역이방대하거나경로가복잡한경우난수를이용한탐색을통해최적의경로를확률적으로계산한다. 32 주택금융리서치

시장분석통계의비어있는칸의수 (number of liberties), 축을탈출하는수 (ladder escape) 등 12가지종류의값이이용되었다. 학습알고리즘으로는 SGD가사용되었다. 알파고는정책망을이용해탐색대상의경우의수를승률이높은수천가지정도로줄이고, 가치망을이용한 MCTS 방식으로최적의수를찾아내어바둑에서인간의능력을뛰어넘을수있었다. 2. 알파고제로 (AlphaGo Zero) 알파고제로는알파고와는다르게인간의기보를이용한학습을하지않았다. 이전버전의알파고는효율적인학습을위해전문가의정보에해당하는인간의기보를이용해사전지도학습을실시했으나, 인간전문가의정보자체가불안정하고완벽하지않기때문에알파고제로는기보학습을배제하고처음부터자기스스로바둑을두어스스로학습하는강화학습을했다. 알파고제로가알파고와다른점은아래와같다. 1 지도학습을거치지않고강화학습만했다. 2 심층신경망의입력값 (feature) 값으로단순히자신과상대방의돌의위치 ( 최근 8회의 history 포함 ) 만을선택했다. ( 기존버전의알파고에서는축을탈출하는수등인간이직접설계한입력값이선택됨 ) 3 정책망과가치망을구분하지않고하나의심층신경망을사용했다. 심층신경망은다음수식과같이바둑판의상태를입력받아각각의수가선택될확률, 현재플레이어의이길확률을출력한다. 하나의심층신경망을사용하면두개의망을사용할때보다더욱안정적으로학습이가능하다. 알파고제로는알파고와유사하게를이용해경우의수를수천가지로줄이고 MCTS 방식을이용해최적의수를찾는다. 알파고제로는 3일동안약 5백만판의바둑을두어학습을했고놀랍게도학습시작 36시간만에이세돌을이긴알파고 ( 알파고 Lee) 의능력을뛰어넘었으며, 72시간후에이뤄진평가에서는알파고 Lee를 100 대 0으로이겼다. 알파고제로는 AI가바둑과같은복잡한분야에서인간의지도학습없이순수하게스스로학습하여인간의능력을뛰어넘을수있음을보여준다. neural network에입력되는입력값 (feature) 은자신과상대방의바둑돌의위치뿐아니라주위조사 연구부록공통적으로 HOUSING FINANCE RESEARCH 33

3. 알파제로 (AlphaZero) 알파제로는알파고제로와거의동일한학습알고리즘을이용하여바둑뿐만아니라체스와쇼기 (Shogi, 일본 식장기 ) 에서도불과몇시간의강화학습을거친후인간의능력을뛰어넘는기량을보여줬다. 인간이사전에습득한지식을프로그램으로구현하는것이그동안의체스나장기같은게임의일반적인 AI 구 현방식이었으나알파제로의경우인간의사전지식을완전히배제하고심층신경망을이용한강화학습만을했다. 체스에서 4 시간동안스스로 120 만게임을해학습한후 Stockfish 5) 의기량을뛰어넘었고, 쇼기에서는 2 시 간동안 440 만게임을해학습후 Elmo 6) 의기량을뛰어넘었다. 바둑의경우알파제로는 8 시간동안 660 만게 임을두어학습후알파고 Lee 의기량을뛰어넘었고, 3 일간학습후알파고제로의기량을뛰어넘었다. 알파제로는알파고제로와마찬가지로최적의수를찾아내기위해 사용했다. 를이용한 MCTS 방법을 알파제로는인간의지식을배제하고게임의규칙만입력받은후심층신경망을이용하는강화학습이바둑뿐만 아니라여러가지다른게임에도적용될수있음을보여준다. 5) 2016 년 Top Chess Engine Championship 세계대회우승한인공지능체스엔진 6) Shogi Association 세계대회우승한인공지능 34 주택금융리서치

조사 연구시장분석통계Ⅳ. 결론 강화학습을통해불과몇시간만에인간의기량을뛰어넘는바둑등의게임능력습득에서볼수있듯이딥러닝알고리즘은다양한분야에서인간이해결하기어려운문제를해결하는데이용될수있다. 특히딥러닝을이용한강화학습은수천년동안축적된인간의바둑의지혜를불과몇시간만에뛰어넘을수있었다는점에서놀랍다. 물론현실에서인간이접하는문제들은바둑이나체스같은게임과는달리룰자체가명확하게정의되어있지않고시뮬레이션하기도쉽지않아알파제로처럼강화학습을통해문제를해결하기가어렵다. 자율주행을예로들면교통법규자체는명확하게정의된다고하더라도날씨, 도로환경, 보행자의행동등은바둑의규칙처럼간단히정의되지않고, 현실에서수많은사고를유발하며시행착오를겪으면서자율주행을학습할수도없다. 강화학습을통해학습된완벽해보이는인공신경망이특정입력값에대한최적의입력값을찾아낼수는있지만그인과관계는설명이불가능하다. 알파고는승률이가장높은다음수가어떤수인지알려주지만왜그런지는설명하지못하며, MLP가특정고객의부도율을예측할수있지만왜그런부도율이나오는지는알려주지않는다. 그렇지만현실에서일어나는일들은물리학의법칙에따른다는점을볼때알파제로가바둑의규칙을입력받아바둑을이기는법을스스로학습한것처럼물리학의법칙을입력받아가상의공간에서강화학습을하여현실세계의문제를해결할수있을지도모른다. 현실세계를물리학법칙으로시뮬레이션하며학습하는것은물론바둑판에서바둑을시뮬레이션하는것과는차원이다른문제이지만매년발전하는컴퓨터의성능과 AI 기술의발전을볼때멀지않은미래에이러한꿈이실현될지도모른다. 부록< 참고문헌 > Silver, D. et al "Mastering the game of Go with deep neural networks and tree search", Nature, 529, 2016, 484~489 Silver, D. et al "Mastering the game of Go without human knowledge", Nature, 550, 2017, 354~359 Silver, D. et al "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm", arxiv:1712.01815 [cs.ai] Goodfellow, I., Bengio, Y. & Courville A. Deep Learning, MIT Press, 2016 Kurzweil, R, The Singularity is Near: When Humans Transcend Biology, Penguin Books, 2006 미래혁신기술연구회 (BetaGo), Deep Learning 을활용한공사적용가능사례연구, 한국주택금융공사학습조직결과보고서, 2017 정영민, 변재권, 최낙일, 대출회수율의결정요인에관한연구 : 신용보증대출을중심으로, 금융연구, 25, 2011 HOUSING FINANCE RESEARCH 35