< 내용요약 > 인공지능 (Artificial Intelligence) 기술은혁신적알고리즘 (algorithm) 의개발을통해인간과유사한방식으로학습하는진정한의미의인공지능으로발전 인공지능알고리즘의발전은이미지인식, 음성인식및통 번역등다양한영역에서비약적인성능향상을견인하고, 스

Similar documents
Ch 1 머신러닝 개요.pptx

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

정보기술응용학회 발표

PowerPoint 프레젠테이션

_KrlGF발표자료_AI

김기남_ATDC2016_160620_[키노트].key

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

PowerPoint 프레젠테이션

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

슬라이드 1

딥러닝 첫걸음

Data Industry White Paper

슬라이드 1

제1강 인공지능 개념과 역사

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

DIY 챗봇 - LangCon

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology


보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마

Reinforcement Learning & AlphaGo

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

(, sta*s*cal disclosure control) - (Risk) and (U*lity) (Synthe*c Data) 4. 5.

1-1-basic-43p

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

HTML5* Web Development to the next level HTML5 ~= HTML + CSS + JS API

2017 1

PowerPoint 프레젠테이션

빅데이터_DAY key

Introduction to Deep learning

조사보고서 구조화금융관점에서본금융위기 분석및시사점

PowerPoint 프레젠테이션

Ch 8 딥강화학습

170918_hjk_datayanolja_v1.0.1.

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 29(7),

2 PX-8000과 RM-8000/LM-8000등의 관련 제품은 시스템의 간편한 설치와 쉬운 운영에 대한 고급 기술을 제공합니다. 또한 뛰어난 확장성으로 사용자가 요구하는 시스템을 손쉽게 구현할 수 있습니다. 메인컨트롤러인 PX-8000의 BGM입력소스를 8개의 로컬지

PowerPoint Presentation

PowerPoint 프레젠테이션

슬라이드 1

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

제 출 문 국방부 장관 귀하 본 보고서를 국방부 군인연금과에서 당연구원에 의뢰한 군인연금기금 체 계적 관리방안 연구용역의 최종보고서로 제출합니다 (주)한국채권연구원 대표이사 오 규 철

15_3oracle

example code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for

[한반도]한국의 ICT 현주소(송부)

2 : (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, (JBE

OUTLINE 행사개요 행사명 Inside Bitcoins Conference & Expo 2015 장소 KINTEX 제 2전시장 3층 (회의실 301~304호) 행사시기 2015년 12월 9일(수) - 11일(금)ㅣ9일은

ETL_project_best_practice1.ppt

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

레이아웃 1

에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 1~18 가격비대칭성검정모형민감도분석 1

006_026_특집_정일권.indd

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

목차 AI Boom Chatbot Deep Learning Company.AI s Approach AI Chatbot In Financial service 2

R을 이용한 텍스트 감정분석

SuaKITBrochure_v2.2_KO

2013 <D55C><ACBD><C5F0><BC31><C11C>(<CD5C><C885>).pdf

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

44-4대지.07이영희532~

다중 곡면 검출 및 추적을 이용한 증강현실 책

Data Scientist Shortage

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

SchoolNet튜토리얼.PDF

기타자료.PDF

기획 1 서울공대생에게 물었다 글 재료공학부 1, 이윤구 재료공학부 1, 김유리 전기정보공학부 1, 전세환 편집 재료공학부 3, 오수봉 이번 서울공대생에게 물었다! 코너는 특별히 설문조사 형식으로 진행해 보려고 해 요. 설문조사에는 서울대학교 공대 재학생 121명, 비

001지식백서_4도

KAST International Symposium on Convergence Education of Science and Technology Seoul Sep , 2007

gcp

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB0FBB3EBC1D8>

03¼ºÅ°æ_2

시안

164

Pattern Recognition

PowerPoint 프레젠테이션

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형

歯목차45호.PDF

09권오설_ok.hwp

경영과학(1) 본문

Disclaimer IPO Presentation,. Presentation...,,,,, E.,,., Presentation,., Representative...

강의지침서 작성 양식

Microsoft PowerPoint - 3.공영DBM_최동욱_본부장-중소기업의_실용주의_CRM

[Summary] 딥러닝이란인간뇌의학습처리과정을모방한머신러닝방법의한종류로, 사람의사고방식을컴퓨터에게가르치는것을의미 1980년대등장한인공신경망 (ANN, artificial neural networks) 에기반하여설계된개념으로, IT기술의발전과함께단점으로여겨지던과적합문제

시장분석통계Ⅰ. 서론부록인공신경망의시초라할수있는퍼셉트론 (perceptron) 은 1957 년 Frank Rosenblatt 가발명했고딥러닝의 학습알고리즘인오차역전파법 (back-propagation) 은 1986년 LeCun에의해발명됐다. 이미딥러닝의핵심이론은 198

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

B-05 Hierarchical Bayesian Model을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축

사회통계포럼

Tech Trends 클라우드 버스팅의 현주소와 과제 아직 완벽한 클라우드 버스팅을 위해 가야 할 길이 멀지만, 하이브리드 클라우드는 충분한 이점을 가져다 준다. Robert L. Scheier Networkworld 매끄러운 클라우드 버스팅(Cloud Bursting


제 출 문 문화체육관광부장관 귀하 본 보고서를 문화예술분야 통계 생산 및 관리 방안 연구결과 최종 보고서로 제출합니다. 2010년 10월 숙명여자대학교 산학협력단 본 보고서는 문화체육관광부의 공식적인 견해와 다를 수 있습니다

SECTION TITLE A PURE PRIMER (AI), // 1

< B3E220BDBAB8B6C6AE20BDC3B4EBC0C72033B4EB20BAAFC8AD20B5BFC0CE5F E687770>

......(N)

歯CRM개괄_허순영.PDF

45호_N스크린 추진과정과 주체별 서비스 전략 분석.hwp

제4차 산업혁명과 인공지능 차 례 제4차 산업혁명과 인공지능 2 제46회 다보스포럼이 2016년 1월 21일~24일 4차 산업혁명의 이해 라는 주제로 개최 되었습니다. 4차 산업혁명은 인공지능에 의해 자동화와 연결성이 극대화되는 단계 로서 오늘날 우리 곁에 모습을 드러

Transcription:

2018. 5. 28 : 인공지능알고리즘의발전방향과금융산업적용 인공지능알고리즘의발전과성과 인공지능알고리즘의한계와진화방향 알고리즘활용시고려사항

< 내용요약 > 인공지능 (Artificial Intelligence) 기술은혁신적알고리즘 (algorithm) 의개발을통해인간과유사한방식으로학습하는진정한의미의인공지능으로발전 인공지능알고리즘의발전은이미지인식, 음성인식및통 번역등다양한영역에서비약적인성능향상을견인하고, 스마트스피커등인공지능서비스상용화확대 딥러닝등최신알고리즘의기업활용을어렵게만드는한계점이존재, 이의해결책을모색 [ 정답이있는대량데이터필요 ] 데이터없이도반복적인경험을통해정량화된보상을극대화하는방법을스스로터득하는 강화학습 및실제와매우유사한데이터를직접생성하는 GAN 등제시 [ 도출결과의설명력부족 ] 딥러닝등을통해도출된결과값을설명력높은모델과결합하는방식 (Surrogate 모형 ) 및변수를조정해결과값의변화를파악하는민감도분석방식 (LIME) 등제시 [ 기존학습모델의재사용어려움 ] 특정영역에서학습된모델을다른유사영역으로이전하는 전이학습 및해당영역에맞춤화된인공지능시스템을자동으로설계해주는 메타학습 등연구 인공지능알고리즘은뚜렷한한계점에도불구하고이에대한솔루션을매우빠른속도로찾아내고있다는점에서, 새로운기술에대한지속적학습및실제적용이요구 인공지능 (Artificial Intelligence) 알고리즘의발전과성과 인공지능기술은활용가능한데이터와컴퓨팅파워의증대와함께혁신적알고리즘 (algorithm) 의개발을통해인간과유사한방식으로학습하는진정한의미의인공지능으로발전 2000년대까지전문가시스템 (expert system) 등의인공지능기술은인간이만들어놓은지식을기계에게주입하는방식 (rule-based) 으로구현되어왔으나, 다양한상황에대응가능한지식개발의어려움등으로인해제한적으로활용 다층의신경망 (Deep Neural Network) 을학습하는방법 (Back-propagation 1 ) 의개발과함께 CNN(Convolutional Neural Network) 2, RNN(Recurrent NN) 3 등 딥러닝 (Deep learning) 알고리즘들이등장, 대용량데이터와컴퓨팅파워를통해실제로구현되기시작 인간의지식 이아닌 생각하는방식 인알고리즘을제공함으로써, 기계가데이터를통해스스로자신만의룰을학습하는인공지능시대로진입 중국 Baidu의음성인식기술 ( Deep Speech ) 은문법이아닌 DNN/CNN/RNN 등알고리즘에기반해성능향상 1 예측값과실제값의오차 (error) 를줄이기위해출력 (output) 층에서입력 (input) 층의역방향으로움직이며가중치를수정하는방법 2 Object recognition with gradient-based learning (Yann LeCun et al., Proceedings of the IEEE 1998) 3 Long short-term memory (Sepp Hochreiter & Juergen Schmidhuber, Neural Computation 1997) 1

[ 표 1] 주요딥러닝 (Deep learning) 알고리즘구조및개요 알고리즘구조개요 DNN CNN RNN 인간의신경망시스템을모방, 다층의레이어 (layer) 와다수의인공뉴런 (neuron) 을결합해복잡한형태의모형화가능 Back-propagation( 역전파 ) 방법을통해다층의신경망학습 이미지의특징 (feature) 을추출하는필터역할을하는 컨볼루셔널레이어 (Convolutional layer) 를적용, 효율적이미지처리 고차원의이미지인식 (image recognition) 및분류에주로활용 입력값 (input) 의순서 (sequence) 를고려하여학습하는모델 현재의입력값에과거의정보 (state) 를결합하여목표값예측 데이터의순서가중요한시계열분석및언어처리등에활용 [ 그림 1] 기술수준별인공지능알고리즘 [ 그림 2] Baidu Deep Speech 시스템구조 Advanced Transfer learning Deep learning neural networks(e.g., feed forward neural networks/cnns/rnns/gans) Reinforcement learning Dimensionality reduction (e.g., PCA/tSNE) Instance based(e.g., KNN) Ensemble learning(e.g., random forest/gradient boosting) Decision tree learning CNN RNN DNN Monte Carlo methods Linear classifiers(e.g., Linear discriminant/svm) Clustering(e.g., k-means/ tree based/db scan) Statistical inference(e.g., Bayesian inference/anova) Markov process Regression Analysis(e.g., (e.g., Markov chain) linear/logistic/lasso) Descriptive statistics (e.g. confidence interval) Naïve Bayes classifier Traditional 자료 : McKinsey Global Institute analysis 자료 : Baidu(2016. 2) 인공지능알고리즘의발전은이미지인식, 음성인식및통 번역등다양한영역에서비약적인성능향상을견인 딥러닝알고리즘활용이후이미지인식의정확도를경쟁하는 ImageNet Challenge 4 에서인공지능의정확도가인간의인식률 (94.9%) 을추월하기시작 - 인간전문가가만든언어모델 (Ontology) 에기반한음성인식기술은 80% 수준의정확도를달성하는데 10년이상소요되는등정체기를겪었으나, 딥러닝알고리즘이도입되면서다수언어의인식성능이동시다발적으로급격히개선 4 1000 가지종류의사물로구성된 120 만장의이미지를학습, 개별이미지속사물의종류를맞추는 (object localization) 경쟁 2

기술성능의획기적발전과함께음성을통해디바이스와상호작용이가능한스마트스피커 (smart speaker) 등인공지능서비스의상용화가빠르게확대 - Amazon 의인공지능기술 Alexa 를탑재한스마트스피커 Amazon Echo 출시이후 2년만에미국성인 4,730만명이스마트스피커를이용중인것으로조사되는등, Amazon Google Apple 등거대 IT기업들이경쟁하는시장으로성장 - 딥러닝알고리즘의우수성이검증됨에따라주변환경을빠르게인식, 주행방식을판단해야하는자율주행차 (self-driving car) 의현실화가능성증대 [ 그림 3] 이미지인식의성능개선추이 [ 그림 4] 세부활동별스마트스피커이용빈도 ( 정확도, %) 100 95 90 85 80 75 70 0 2010 딥러닝활용인간의정확도최고성능 AI 시스템 '11 '12 '13 '14 '15 '16 '17 질문 (Ask a question) 음악스트리밍서비스날씨확인타이머 (Timer) 설정라디오청취알람 (Alarm) 설정뉴스청취게임및일반상식요리레시피확인애플리케이션사용교통상황확인전화인터넷방송청취가전제품컨트롤일정확인문자 (Messaging) 상품구매 매일사용 월별사용 사용경험있음 자료 : ImageNet Challenge 결과자료 : Voicebot.ai(2018. 3) 인공지능기술이全산업에큰영향을미치는 보편적기술 (General-Purpose Technology) 로인식되면서, IT뿐만아니라소매업 (retail) 미디어 금융등다양한산업에서기술적용사례증가 2017년 3분기상장기업실적발표 (earnings call) 시 인공지능 이 791회나언급 5 되는등, 업종에관계없이인공지능기술에대한관심이커지는모습 - McKinsey 6 는향후 20년간인공지능기술이마케팅 영업 (1.4조달러 ), 공급사슬 (supply chain) 관리 (1.3조달러 ), 리스크관리 (0.5조달러 ), 고객서비스운영 (0.2조달러 ), 재무 IT(0.2 조달러 ) 등경영전반에서높은부가가치를창출할것으로예상 - Foxconn Nvidia 등의정밀부품제조기업들은딥러닝알고리즘을적용한컴퓨터비전 (computer vision) 기술을활용, 제조프로세스상의결함을자동으로파악하고있으며, 영국소매업체 Ocado는하루 1만개이메일의고객감정을분석, 고객서비스고도화 5 On earnings calls, big data is out. Execs have AI on the brain (CBInsights, 2017. 11) 6 Notes from the AI frontier insights from hundreds of use cases (McKinsey Global Institute, 2018. 4) 3

금융산업은현재기술도입수준및향후투자수요의측면에서 IT 통신, 자동차 부품산업등과함께인공지능기술의영향력이높은산업으로평가 - 글로벌 86개은행들은인공지능기술이향후 3년간매출 3.4% 증가, 비용 3.9% 감소효과를가져올수있을것으로기대 (UBS Evidence Lab) - 헤지펀드 (hedge fund) 시장의전반적약세에도불구하고인공지능알고리즘을통해투자전략을자동화하는퀀트펀드 (Quant fund) 는자금이순유입되는흐름지속 미정부의암호해독가로일하던 James Simons는헤지펀드 Renaissance Technologies 7 를설립, 신호처리와음성인식에사용되는인공지능기술을투자전략에적극활용 [ 그림 5] 업종별인공지능침투율및향후투자 [ 그림 6] 헤지펀드자금유출입 (net flow) 추이 Future AI Demand ( 향후 3 년간 AI 투자규모변화 ) 100 80 60 40 20 0-20 -40-60 -80 퀀트펀드 (Quant Funds) 비퀀트펀드 (Non-Quant Funds) ( 단위 : 십억달러 ) 2013 2014 2015 2016 2017 Current AI Adoption (AI 기술도입회사비율 ) -100 자료 : McKinsey(2017. 6, 10 개국경영진조사 ) 자료 : HRF(2017 년은 9 월까지의데이터 ) 인공지능알고리즘의한계와진화방향 정답이있는대량의학습데이터필요 (Obtaining labeled & massive training data sets) 다층의레이어와다수의뉴런으로구성된인공신경망 (artificial neural network) 를학습하는딥러닝알고리즘등을활용하기위해서는정답 ( 결과값 ) 이존재하는대량의학습데이터가필요 - 딥러닝알고리즘은우수한수준 (relatively good) 의분류 (classification) 성능을내기위해서는수천개의데이터가필요하며, 사람과비슷한수준의성능을내려면수백만개의데이터요구 8 - 대부분의알고리즘이입력값과결과값이모두이용되어야하는 지도학습 (Supervisedlearning) 방법론이기때문에, 정답이존재하는데이터 (labeled data) 의확보가중요 7 연평균 30% 이상의수익률을 15 년이상지속한 Medallion Fund 등운용. 현재 500 억달러의 AUM 으로세계 4 위헤지펀드 8 Deep Learning (Ian Goodfellow, Yoshua Bengio and Aaron Courville, 2016) 4

[ 강화학습 (Reinforcement learning)] 인공지능시스템이여러번의시행착오 (trial and error) 를하는과정에서설계자가원하는특정행동 (action) 을할때보상 (reward, 예 : 높은점수 ) 을제공, 누적보상이최대화되는방법 (optimal policy) 을학습하는알고리즘 - 지도학습 알고리즘이요구하는 ( 행동 x, 결과 y) 형태의데이터가주어지지않더라도, 반복적인경험을통해자신이처한상황과행동가능한옵션들을인지, 정량화된보상을극대화하는방식을스스로터득 9 인간의지식을학습하지않고도바둑을마스터한 AlphaGo Zero 9 상세내용 2 - DeepMind 는인간이만들어낸기보 ( 데이터 ) 를배우지않고도 강화학습 을통해단기간에바둑최고수의실력을습득한 AlphaGo Zero 발표. 기본규칙만을알려준후다수의실전경험을통해바둑을익힌지 40일만에 2016년이세돌을이긴 AlphaGo Lee 의실력을넘어섬 (100전 100승 ). 기보를통해학습한알고리즘의성능을뛰어넘은것은 고정관념등인간의오류가포함된데이터 가학습에서배제되었기때문이라는분석존재 [ 표 2] 데이터규모별의료이미지분류정확도 [ 그림 7] 강화학습기반 벽돌깨기게임 학습데이터양 10 20 100 200 뇌 (Brain) 3.39 45.71 72.82 98.44 목 (Brain) 30.63 79.97 99.74 99.33 어깨 (Shoulder) 21.39 69.64 95.53 92.94 가슴 (Chest) 34.45 62.53 95.25 99.61 배 (Abdomen) 3.23 35.40 91.01 95.18 누적보상 ( 점수 ) 현재의행동이목적달성을위해얼마나좋은지를정량화 매순간최선의행동을스스로선택 골반 (Pelvis) 1.15 15.99 83.70 88.45 평균 17.37 51.54 89.68 95.67 자료 : Goldman Sachs (0( 부정확 )~100( 정확 )) 자료 : V. Minih(Nature, 2015) - JPMorgan 은단기보상 ( 호가스프레드 ) 및최종보상 ( 거래체결여부 / 거래소요시간 / 시장충격비용 10 ) 을최소화 ( 보상을 비용 으로정의 ) 하도록최적의주식거래전략을학습하는강화학습기반의트레이딩알고리즘 LOXM 개발 11 특히대량의주식매도가필요한경우시장에미치는충격 (market impact) 을최소화함으로써투자자의거래비용을낮추는데벤치마크대비탁월한성과 9 Mastering the game of Go without human knowledge (David Silver et al., Nature 2017. 10) 10 대량의주문을일시적으로실행할때단기적거래가격변화 ( 일시적충격 ) 또는새로운균형가격도달 ( 영구적충격 ) 로인한비용 11 Active Learning in Trading Algorithms (JPMorgan) 및 JPMorgan develops robot to execute trades (FT, 2017/7/31) 5

[ 그림 8] JPMorgan 의강화학습기반트레이딩시스템 LOXM 개요및성능 [ 강화학습 (Deep Reinforcement Learning) 기반트레이딩시스템 ] [ 트레이딩시스템별거래비용비교 ] 거래비용최소화 1.4 강화학습기반시스템 (loxm) 단기보상 1.2 일반트레이딩시스템 (ref) Order ( 삼성전자, V, T) Current State (v, t) - 호가스프레드 (Bid-Ask Spread) 최종보상 - 거래체결여부 (Completion) Next State (v', t') 1 0.8 0.6 0.4 삼성전자 주식을 T시간이전에 V주만큼매수 - 거래소요시간 (Order duration) - 시장충격비용 (Market impact) 0.2 0 0.01 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 거래량비중 (Percentage of Volume) 자료 : Active Learning in Trading Algorithms(JPMorgan, 2016) 및 KB 경영연구소 [GAN(Generative Adversarial Network)] 실제와비슷한데이터를생성하는모델 (Generator) 과이를통해생성된데이터와실제데이터를구별하는모델 (Discriminator) 을경쟁시켜, 두모델의학습성능을동시에개선할수있는알고리즘 12 - 실제와매우유사한데이터를직접생성할수있기때문에, 정답이존재하는데이터의양이부족한환경에서도학습가능 이상거래 (fraud) 에대한데이터가부족한상황에서 GAN을통해실제이상거래와유사한사례를다수생성, FDS( 이상금융거래탐지시스템 ) 의고도화가능 13 - Qraft Technologies 는 GAN 알고리즘을통해실제시장내최적포트폴리오의특성을최대한반영한새로운포트폴리오를구성하는 Q-GAN 솔루션개발 [ 그림 9] GAN 알고리즘개요 [ 그림 10] Qraft의 Q-GAN 포트폴리오 [ 목표 1 ] 생성자 Generator 최대한진짜같은모조품을만든다 생성데이터 [ 목표 2 ] 구별자 Discriminator 전체투자상품 및포트폴리오 구성요소 최적포트폴리오 Input Data G 생성자 평가용시장데이터 D 구별자 PF 평가기준 Correct? 실제데이터 진짜인지가짜인지구분해낸다 Noise Fine Tuning 자료 : Tech M 및 KB 경영연구소자료 : Qraft Techologies(2017. 9) 12 Generative Adversarial Networks (I. Goodfellow et al., 2014) 13 Generative Adversarial Networks and Cybersecurity Part1/2 (SecurityIntelligence, IBM 2018. 3) 6

해석력 설명력문제 (The explainability problem) 딥러닝등복잡한구조의인공지능알고리즘들은도출된결과의근거나영향변수등을확인하기어려운 블랙박스 (Black box) 14 의속성을가지므로기업활용시큰제약요인 - 알고리즘의복잡성이커질수록예측의정확도는향상되나, 변수간의다양한상호작용 (interaction effect) 을파악하기어렵기때문에해석력 (interpretability) 은하락 - 의료 금융산업등서비스의공정성및신뢰성이매우중요한산업의경우에는알고리즘의사용변수, 결과의도출근거등에대한설명을제공할책임요구 올해 5월유럽에서시행된 GDPR( 일반개인정보보호법 ) 15 은알고리즘에의한자동화된처리 (automated decision making & profiling) 에대해설명요구, 이의제기등의권리부여 - 인공지능의사회적영향력이강화됨에따라미국 DARPA( 방위고등연구계획국 ) 는 2017년부터인공지능알고리즘의해석가능성을높이기위한 XAI(eXplainable AI) 프로젝트 에약 800억원의예산을투입 [ 그림 11] 해석력 vs. 정확도기준알고리즘비교 [ 그림 12] DARPA 의 XAI 개념 회귀분석 (Linear Regression) 의사결정나무 (Decision Tree) 데이터 [ AS-IS ] 기존모델 동작결과 해석력 (Interpretability) K-인접이웃 (K-Nearest Neighbors) 랜덤포레스트 (Random Forest) 서포트벡터머신 (Support Vector Machine) 인공신경망 (Neural Nets) 예측정확도 (Accuracy) 학습데이터 데이터 [ TO-BE ] 설명가능모델 이이미지는 95% 의확률로고양이 동작결과 털 / 수염이존재하고모양가져 95% 확률로고양이 자료 : Ansaro Blog 자료 : DARPA 및금융보안원재인용 [ 해석력강화모델 ] 1딥러닝을통해도출된결과값을설명력높은모델 ( 회귀분석등 ) 과결합하는방식 (Surrogate models), 2변수간상호작용을제한하는방식 (GAM), 3변수를조정해결과값의변화를파악하는민감도분석방식 (LIME) 등다양한알고리즘연구 - 1 딥러닝등정확성이높은모델을통해도출된결과값을회귀분석 의사결정나무등해석력높은모델 ( 대리모형 (surrogate models)) 의종속변수로활용, 딥러닝알고리즘이도출한결과에대한근거및타당성확인 16 14 Deep Learning: A Critical Appraisal (Gary Marcus, 2018. 1) 15 General Data Protection Regulation: 자연인에대한개인정보를보호하고개인정보의자유로운이동및활용을보장 16 Ideas on interpreting machine learning (Patrick Hall et al, O REILLY conference 2017. 3) 7

- 2 개별변수별로복잡한구조의알고리즘을적용한후이를더하기형태로종합 (GAM, Generalized Additive Models) 함으로써, 변수간상호작용효과를배제해설명력제고 17-3 특정변수에약간의변화 (perturbation) 를주었을때결과값이어떻게변하는지확인함으로써알고리즘이도출한결과값에큰영향을미친요인을파악 특정모델에국한되지않고유연하게활용가능 (Local-Interpretable-Model-agnostic Explanations) [ 그림 13] 대리모형 (Surrogate models) 개요 [ 그림 14] LIME 알고리즘적용사례 1 정확도높은모형으로학습 2 해석력높은모형과결합 [ 데이터 ] [ 정확도높은모형 ] 부실 DTI 담보 채널 0 0.18 주담대 7 1 0.42 보증서 10 0 0.11 주담대 10 0 0.21 주담대 1 [ 데이터 ] [ 해석력높은모형 ] 예측치 DTI 담보 채널 0.47 0.18 주담대 7 0.82 0.42 보증서 10 의사결정나무 0.18 0.11 주담대 10 or 0.12 0.21 주담대 1 회귀분석 원본이미지 P( 개구리 ) = 0.54 그림요소변형 확률 0.85 0.00001 0.52 회색으로가려진부분은해당이미지가입력값에서삭제된것 얼굴과눈부분이있을때개구리로분류할확률이증가 (85%) 하고 없을때거의 0 으로감소, 얼굴과눈 이개구리분류의핵심요인 자료 : Patrick Hall et al.(o REILLY, 2017) 자료 : Marco Tulio Ribeiro et al.(o REILLY, 2016) - 금융회사들은예측정확도향상을통한수익성제고와높은설명력에기반한신뢰성 제고가동시에요구되는신용평가모형 (Credit Scoring System) 개선시, 해석력높은인공 지능알고리즘에많은관심 신용평가기업 FICO 의 Reasons Reporter ( 자료 : FICO Blog) 상세내용 2 - 미국다수은행이활용하는신용평가점수를제공하는 FICO는인공신경망기반의신용평가및이상카드거래탐지시스템 (Falcon Fraud Manager) 을개발하고, 평가결과의설명력을높이기위해 LIME 알고리즘을적용한 Reasons Reporter 개발. 신용평가및이상카드거래탐지시어떤요인이큰영향을미쳤는지파악가능. 해석력높은인공지능알고리즘개발을촉진하기위해, 미국방성등과함께올해 5월 xml Challenge 개최 학습모형의일반화 (Generalizability of learning) 특정영역의데이터에최적화되도록학습한인공지능모형은속성이유사한다른영역에적 용 (generalization) 하기어렵기때문에, 항상새로운모형을개발해야하는비효율성발생 17 Intelligible models for classification and regression (Yin Lou et al, ACM 2012) 8

- 인간은특정분야에서습득한지식을다양한영역에쉽게활용할수있는반면, 딥러닝등인공지능알고리즘은주어진데이터에자주과적합 (Overfitting) 되기때문에다른영역에서의재사용제한적 18 - 인공지능구현시기존에학습된지능을활용한다면학습과정에서요구되는데이터와컴퓨팅비용을획기적으로절약할수있기때문에, 지능의이식 (transferring intelligence) 이가능한 범용인공지능 (General AI) 의필요성증대 바둑을정복한 DeepMind 의 AlphaGo Zero는장기 (2시간학습 ), 체스 (4시간학습 ) 에서도기존에가장우수한실력을보인소프트웨어의실력능가 19 [ 범용인공지능모델 ] 1특정영역에서학습된모델을다른유사영역으로이전하는 전이학습 (Transfer learning), 2해당영역에맞는인공지능시스템설계를자동화하는 메타학습 (Meta-learning) 등연구가속화 - 1 전이학습 : 영역간유사성 (Similarity), 관련성 (Relationality) 등을추출, 데이터확보가용이해충분히학습된기존영역 (source domain) 의지식을새로운영역 (target domain) 으로이전하고, 해당영역의특성에맞게재학습 (Re-training) Volkswagen 은차선유지 서행등자율주행을위한범용지능을우선구축하고, 주행우선순위 표지판등국가별차이만을재학습하는방식활용 - 2 메타학습 : 다양한영역의데이터에맞춤화된인공지능을자동으로구현해주는인공지능알고리즘개발 Google 은데이터만있으면자동으로딥러닝모델을디자인해주는 AutoML 서비스를자사의클라우드플랫폼 (GCP) 과함께제공 [ 그림 15] 전이학습 (Transfer Learning) 개념 [ 그림 16] Google 의 Cloud AutoML [ 기존머신러닝방법론 ] 학습영역 (Training items) [ 전이학습 (Transfer Learning) ] 학습영역 (Training items) 데이터업로드및정답라벨링 (labeling) 모델구축및학습 모델평가및업데이트 학습시스템 학습시스템 학습시스템 지식 학습시스템 자료 : Sinno Jialin Pan(2012. 5) 자료 : Google 18 Deep Learning: A Critical Appraisal (Gary Marcus, 2018. 1) 19 Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (DeepMind, 2017. 12) 9

- 금융회사들은데이터가풍부한업권및국가등에서구축된학습모형을데이터가부족한 영역으로전이 ( 예 : 은행의콜센터데이터분석을통한챗봇시스템 저축은행챗봇 ) 하는방법에초점 알고리즘활용시고려사항 인공지능알고리즘은자연어처리 (natural language processing), 이미지인식등장기간정체되었던분야에서비약적성능향상을견인하였으나, 기업활용시여전히많은한계점이존재 정답이있는대량의학습데이터필요, 도출결과의설명력부족, 기존학습모델의재사용어려움등은기업들이딥러닝등최신알고리즘의활용을주저하게만드는핵심요인 Google, Facebook 등거대 IT기업들이인공지능을선도하는이유도데이터및기술확보에막대한자금을투여할수있는자본력과규제로부터자유로운환경의영향이크게작용 강화학습 GAN 등이러한한계점을해결하기위한인공지능알고리즘도완벽한솔루션은아님 강화학습이실제로효과를발휘하기위해서는학습환경이실제환경의복잡한요인들을잘반영 (representation of the real world) 해야하며, GAN 등을통해생성된가상의이미지를통해학습할경우실제데이터를통해학습한인공지능보다성능이저하되기도함 20 하지만인공지능기술은자신의한계를스스로극복하며매우빠른속도로발전하고있다는 점에서새로운알고리즘에대한지속적학습및적용이요구 2016년발표된인공지능관련논문은 1만8천건으로 1996년이후 9배이상증가 ( 일반논문은 2배수준 ) 했으며, NIPS/CVPR/ICML 등관련컨퍼런스참석자수도급증하는추세 21 1998년이후 Google(39.0억달러 ) Amazon(8.7 억달러 ) 등 15개의대형 IT기업들은총 86 억달러를투자해 103개의인공지능스타트업을인수하는등기업들도적극적투자 22 RBC(Bank of Canada) 는 2016 년부터캐나다내 3 개의인공지능연구소 ( Borealis AI ) 를설립, 우수인재영입을통한전문적연구및실무적용가능성모색 23 < 선임연구위원김예구 (yeigoo.kim@kbfg.com) 02)2073-5764> 20 Driving in the Matrix: Can virtual worlds replace human-generated annotations for real world tasks (ICRA, 2017) 21 Artificial Intelligence Index: 2017 Annual Report (MIT & Stanford, 2017. 11) 22 The 10 tech companies that have invested the most money in AI (TechRepublic, 2018. 1) 23 Non-tech 기업과글로벌금융회사의 AI 도입사례 (KB 경영연구소, 2018. 4) 10