인공지능에대한금융업의기대와현실 2017. 4. 경영연구팀박강희연구위원 ( 02-729-6178, can17can17@ibk.co.kr)
목차 Ⅰ. 검토배경 Ⅱ. 인공지능 Ⅲ. 사례 ( 로보어드바이저, 챗봇 & 음성비서, 신용평가, 이상탐지거래시스템 ) Ⅳ. 결어 본자료는 IBK 경제연구소가정보제공을목적으로작성한연구자료이며, 어떤경우에도법적책임소재증빙자료로사용될수없습니다. 2
Ⅰ. 검토배경 : 혁신적인공지능 (AI) 의등장 딥러닝의등장 : 사람만이할수있던영역에인공지능이적용되기시작 - 알파고의등장은컴퓨터가사람의직관을흉내내는일까지도가능할수있음을보여준사건 - 구글은이메일에간단한답변을자동으로응답하는 Smart reply 시스템을영어와중국어버전으로개발하여상용화 - 네덜란드의 Rechtwijzer( 레크트바이저 ) 서비스는머신러닝을이용해이혼과같은개인간법률분쟁을조정하는솔루션을제공 - 소니는최근 AI 가작곡한비틀즈스타일과재즈스타일의팝송두곡을발표 최근금융업에도인공지능의활용이관심받기시작!! 3
Ⅱ. 인공지능 인공지능이란? - 인공지능은 56 년존매카시가다트머스대학의컨퍼런스에서 사람의지능을모사하는컴퓨터시스템 으로사용하면서확산 - 수리계산능력도지능의한측면이라는점에서넓은의미에서는전자계산기도인공지능의범주에포함가능 ( 스탠포드, 2016) 최근의이슈되는인공지능은머신러닝 ( 기계학습 ) 기반 - ( 과거인공지능 ) 설계자가모든과정을일일이프로그램하여, 인공지능은설계자가의도한대로행동하는수준에머무름 - ( 머신러닝기반 ) 설계자는주제에맞는관련데이터만프로그램을설계하고결과는기계가최적값을도출하므로, 설계자조차결과를예측하기는어려움 4
Ⅱ. 인공지능 : 머신러닝 ( 기계학습 ) 머신러닝이란 데이터으로부터학습하는기계 를의미 다양한데이터를주입 ( 학습 ) 시켜자동으로모델 ( 프로그램, 패턴 / 규칙, 지식 ) 을생성하는알고리즘 전통적통계기법인회귀분석을비롯해인공신경망, SVM(support vector machine), 딥러닝등을포괄하는개념 5
Ⅱ. 인공지능 : 머신러닝과정 기계에데이터를학습시키기위해먼저기초데이터 (Raw Data) 를학습데이터, 검증데이터, 테스트데이터로나눔 학습데이터를기반으로데이터의규칙을생성하고, 검증데이터로결과를모의테스트하여, 유의미한결과가나올시테스트데이터로실전테스트를하는과정을따름 기계가학습하는과정을수능을치는수험생과비교하면, 학습은수능을대비하여공부하는과정, 검증은모의고사, 테스트는실제수능시험을보는과정으로비교할수있음 < 머신러닝과정예시 > 비교머신러닝과정예시 : 수능시험 Train Validation 데이터를기반으로규칙을 학습하는과정 모의테스트과정 수능을대비하여공부하는과정 공부한것을바탕으로 모의고사를보는것 Test 실전결과실제수능을보는것 6
Ⅱ. 인공지능 : 오해와한계 ( 현재 ) 언론에서인공지능은인간을뛰어넘는만능으로소개되고있으나, 실제로는데이터의관계에바탕을둔하나의수리모형에불과 ( 오해 ) 알파고이후언론에서는인공지능을 스스로생각하는시스템 으로마치언어를통해지식을습득하고스스로상황에맞는필요한질문을하고답을찾을수있는기계로소개하고있음 - 이는, 기계가스스로 학습 할수있다는오해를유발, 실제로는사람이특정주제에맞는데이터를알고리즘에 학습 시켜줘야하는과정이필요 ( 한계 ) 머신러닝을통한인공지능은매우제한적인범위의특정주제에대해사람의질문에적합한답을찾는시스템에불과 - 만약, 사용하는데이터나적용범위, 질문의형태가바뀌면시스템을처음부터다시구축해야되는문제발생 ( 적용현황 ) 은행에서신용도를판정하는데사용하는로지스틱회귀모형이나이상거래탐지시스템에적용된알고리즘들도일종의낮은단계의머신러닝임 7
Ⅱ. 인공지능 : 금융업도입이슈와현황 따라서, 현재단계에서개발된인공지능수준으로는모든일을다해결해주는식의낙관적인예상또는인간의일자리를위협하는식의비관적인예상은다소이른감이있음 - 그러나, 금융분석시스템켄쇼 (Kensho) 와같이부분적으로인간의일자리를잠식하는인공지능이나타나고는있음 다음장에서, 금융업에이슈되는분야별인공지능도입이슈와현단계에서의한계점을사례별로제시 - 로보어드바이저, 챗봇, 신용평가모델, 이상탐지모형 8
Ⅲ. 사례 1 : 로보어드바이저 - 현황 로보어드바이저 ( 로봇 + 투자전문가 ) 란로봇이고객의성향이나정보를바탕으로자동화된알고리즘과빅데이터를활용하여투자자에게최적의자산을관리해주는인공지능을뜻함 - 로보어드바이저에대한사람들의통념또는바라는생각은스스로경제상황을판단하고이에따른투자를수행하여마이더스의손과같은전지전능한투자로봇을생각하고있음 슈퍼로봇수준을원함 9
Ⅲ. 사례 1 : 로보어드바이저 - 문제점 로보어드바이저 ( 로봇 + 투자전문가 ) 는다양한경제지표의미래를예측할수있는예측모델과종목포트폴리오를효율적으로구성하는방법및트레이딩전략이유기적으로결합되야최적의궁극적인모형이만들어짐 現기술수준 - 그러나, 예측모형을만드는것은매우고난이도의작업이고현재개발된모델의정확도도매우낮아서, 現로보어드바이저는포트폴리오와시스템트레이딩을합친수준임 Prediction Model 연구단계 : 정확도 60% 대난이도 : 최상 Portfolio Selection Model 실전적용단계 : 증권사, 자산운용사난이도 : 중 현, 로보어드바이저수준 Trading Model 이미적용중 : 시스템트레이딩난이도 : 하 10
Ⅲ. 사례 1 : 로보어드바이저 - 전망 국내시장의로보어드바이저의전망은밝지않음 ( 기술력한계 ) 1 경험부족으로예측모형개발이단시간에어렵고 2 관련기업들내에서개발할만한인력도매우부족 ( 적자시현 ) 해외에서활동중인기업들은수수료에대한장점을홍보하며매출은증가하고있으나, 순이익은마이너스 * 미국의경우자산관리규모가 160 억달러를초과해야수익이나는구조이나가장선도업체인베터먼트 ( 08 년설립, 자산규모 50 억달러 ) 의경우도규모가이에미치지못하며, 운용비용 (3,000 만달러 ) 에비해수수료수익 (800 만달러 ) 은매우적음 ( 향후과제 ) 딥러닝이개발되며이미지인식수준이획기적으로향상된사례처럼, 지표예측에서혁신적인머신러닝방법론개발이선행되어야성공가능성이높아짐 11
Ⅲ. 사례 2 : 챗봇 and 음성비서 - 현황 챗봇, 음성비서란사람과의문자대화나음성등을인식하여상황에맞는답이나각종연관정보를제공하는인공지능기반커뮤니케이션소프트웨어 - 사용자들은영화아이언맨의 자비스나 Her 의 사만다 와같은 SF 영화수준의챗봇, 음성비서를기대하고있으나현실은매우상이 12
Ⅲ. 사례 2 : 챗봇 and 음성비서 - 문제점 1 - 실제 N 사의챗봇을이용해보면메뉴얼이되어있는대답만하고그이외의고객이원하는질문은일괄대답으로처리 ( 당행서비스도비슷한경우가많음 ) - 음성비서고객센터역시원하는질문과전혀다른답을주는경우가많음 음성을텍스트로바꿔주는기술은어느정도수준에올라와있으나언어를이해시키는기술수준은한참뒤떨어져있음! 13
Ⅲ. 사례 2 : 챗봇 and 음성비서 - 문제점 2 현존하는챗봇, 음성비서의동작방식이규칙기반 ( 매뉴얼기반 ) 으로개발된제품이대부분이기때문 - 머신러닝방식은기술적으로매우높은수준이며현재구글어시스턴스 ( 영어 ), 아마존알렉사 ( 영어 ), 삼성빅스비 ( 한국어, 영어 ) 정도만구현된상황 현재도입되는대부분방식 규칙기반 (Rule-base) 특정질문과해당하는답을정해놓음 답답함 동작방식 머신러닝기반 (Machine Learning) 다양한데이터에대한학습을기반으로상황에맞는답을유추 대화진행가능 14
Ⅲ. 사례 2 : 챗봇 and 음성비서 - 전망 사람과비슷한응대수준의서비스가가능한챗봇, 음성비서개발은상당한시간이필요함 - 한국어에대한기초연구와데이터규모가쌓여야, 머신러닝을제대로도입할수있고, 그이후비약적인발전을할것 - 현재는번역조차아직영어나일어등에비해낮은수준으로구동되어인공지능이가장최후에점령하는분야중하나라고봄 * 구글은영 - 한번역을위해한국어를전공한외국인을다수영입하여한글에대한언어구조를사전에연구했고, 머신러닝에한국어 - 터키어 - 일본어를동시에학습시키는방법도개발함 이런이유로같은딥러닝기술이적용되었어도타사보다더뛰어난번역품질을선보이고있음 - 또한, 텍스트와음성에대한보안기술도같이발전해야더안전한서비스를받을수있음 * 음성또는텍스트정보를해킹하여계좌정보, 거래내역등의개인정보를탈취하는문제 * 독일정부는아기들이사용할수있는음성비서시스템사용을금지 15
Ⅲ. 사례 3 : 신용평가 - 현황 1 신용평가는무디스에서이용중인로지스틱회귀분석방식을기반으로사용중이고이는일종의머신러닝방식이나, - 다양한변수를고려할수없는구조이므로최근빅데이터활용등의흐름을수용하기는어려운단점이있음 따라서딥러닝이나 SVM 등의머신러닝알고리즘들이대안으로떠오르고있음 - 단, 머신러닝은블랙박스화로인하여판별의원인을알수없는단점이상존 16
Ⅲ. 사례 3 : 신용평가 - 현황 2 선진국들은머신러닝을활용하여신용평가모형을도입중이고국내에도머신러닝을활용한초기모형개발시도중 - ( 미국 ) 제스트파이낸스 ( 구글 CIO 더글라스메릴설립 ) 는신용평가판별시머신러닝에활용하는변수만 1 만개이상 (Fico 변수 + 카드이용 +SNS+ 인터넷이용정보등 ) 활용 - 크레디테크 ( 독 ), 렌도 ( 홍 ), 소프트뱅크 + 미즈호은행 ( 일 ) 등도비슷한방법으로빅데이터를활용하여머신러닝기반신용평가개발중 - ( 국내 ) 신한은행이머신러닝을도입하여 중금리소매고객신용평가모형개발 프로젝트에착수 - ( 당행 ) IBK 경제연구소에서도머신러닝을이용하여장기카드대출가망고객모형 ( 15) 과악성한계기업색출모형 ( 17) 을자체개발 17
Ⅲ. 사례 3 : 신용평가 - 원인 해외선진국에서신용평가에머신러닝도입이슈가나온이유는 - 저소득층은제도권 (1 금융권 ) 의대출서비스를받기가어렵기때문에 - 저소득층의금융수요를수용하기위해, 핀테크기업들은개인활동정보를활용하고머신러닝기반신용평가방법론을개발하여 - 금융거래내역이없이도 1 금융권의신용평가와비슷한수준의평가능력을확보하면서, 전세계적으로사례가알려지고있음 선진국들은머신러닝활용에대한축적된지식과경험뿐만아니라개인정보활용에대한규제 ( 옵트아웃방식 ) 도적어발전속도가빠름 * 옵트인 : 개인정보를활용에각개인에게모두동의받는방식 ( 한국 ) * 옵트아웃 : 개인이정보활용에거부의사표명시만활용불가 ( 미국 ) 18
Ⅲ. 사례 3 : 신용평가 - 전망 ( 미래 ) 정보활용에대한규제가완화되면신용평가분야는머신러닝이가장핵심적으로활용될분야임 - ( 한계 ) 신용평가능력은금융기관 ( 특히은행 ) 의핵심역량중하나이나, 리스크안정이핵심인은행이금융권내에서는가장보수적인만큼다양한테스트없이빠르게현업에활용되기는어렵다고봄 - 하지만더우수한머신러닝기법을보유한은행일수록수익이상승할것이기때문에, 머신러닝활용에성공한은행일수록외부에홍보하지는않을확률이높음 - 즉, 은행들은내부적으로머신러닝개발시도가이루어질것으로보이나성공사례가외부에알려지기까지는많은시간이걸릴것 19
Ⅲ. 사례 4 : 이상탐지거래시스템 (FDS) - 현황 사용자가평소이용하지않는패턴의금융거래를탐지하여피싱등의위험을방지하는시스템 - 현재도입되는시스템들은일정한패턴을입력하고이에벗어난부분을감지함예 ) 출국기록없는국내이용자가해외에서카드승인이되면이상거래로탐지됨 - 주로신용카드사에서중점적으로사용했으나, 최근은행, 증권사도구축하고있음 < 이상탐지거래시스템구성도 > 20
Ⅲ. 사례 4 : 이상탐지거래시스템 (FDS) - 전망 머신러닝을이용하여스스로정상과사기패턴들을학습하고, 고도화된사기패턴을찾는방법이연구중 - 최근해외직구등소비패턴이변화하면서, 변화하는패턴에적응하는이상탐지거래시스템이소개되기시작 - 이상탐지거래시스템개발업체빌가드 (BillGuard, 미 ) 社는시간의흐름에따라고객의바뀌는소비패턴을학습하여신용카드사용내역과은행계좌이체등을실시간감시 Yeolwoo An and Hyunjung Shin, Novelty Detection Adaptive to Concept Drift, BIDM 2009 21
Ⅳ. 결어 - 금융업內인공지능의기대감에비해현재의기술수준 ( 분야별머신러닝연구상황 ), 관련기반상황 ( 빅데이터 ), 규제환경 ( 정책 ) 등에서온도차는있음 기술난이도규제환경도입환경現도입속도 로보어드바이저최상하상상 챗봇최상하최상최상 신용평가모델상중하중 이상탐지시스템상하상중 * 난이도상대치 ( 최상일수록어려움또는규제가많음 ) - 따라서, 현수준에서는인공지능도입에따른지나친낙관적인결과를기대하는것은금물 - 하지만, 인공지능의발전속도는절대적인시간에정비례하지않고, 보험이나리서치등활용분야도점차더욱다양해질것이므로금융기관에서는내부적인투자및개발을통한대비는필수 22
Reference 1. 박대수, 인공지능 (AI) 시대의 ICT 융합산업전망, 2017 ICT 산업전망컨퍼런스 2. 정민 (2016). 2016 년다보스포럼주요내용과시사점. 16-2 호. 현대경제연구원 3. 강맹수, Fast Follower 의몰락, IBK 경제연구소 4. 인공지능기반의 챗봇 서비스등장과발전방향, NIA 한국정보화진흥원 5. Daniela Rohrbach-Schmidt, Anja Hall(2013). Data and Methodological Reports, No.1/2013. Federal Institute for Vocatonal Education and Training. 6. Frey, C. B. & Osborne, M. A. (2013). The Future of Employment : How Susceptible are Jobs to Computerization? 7. Michael C., James M., & Mehdi M.(2016). Where machines could repalce humans - and where they can't(yet). McKinsey Quarterly (July 2016). 8. Kenneth Kennedy, Credit Scoring Using Machine Learning, Ph. D thesis. 9. Shu-Hao Y.(2014). Corporate Default Prediction via Deep Learning, The 34 th International Symposium on Forecasting(ISF 2014) 10. Wei C., Liang H., Longbing C.(2015). Deep Modeling complex Couplings within Financial Markets, Proceedings of the 29 th AAAI Conference on Artificial Intelligence 11. Xiao D., Yue Z., Ting L., Junwen D.(2014). Using Structured Events to Predict Stock Price Movement: An Empirical Investigation, Proceedings of the 2014 conference on Empirical Methods in Natural Language Processing(EMLP), pp.1415-1425, Oct 25-29 12. Yeolwoo An and Hyunjung Shin, Novelty Detection Adaptive to Concept Drift, BIDM 2009 23