보안연구부 -2016-016 머신러닝 (Machine 개요및활용동향 - 금융권인공지능 (AI) 을위한머신러닝과딥러닝 - ( 보안연구부보안기술팀 / 2016.3.24.) 개요 이세돌 9단과인공지능 (AI, Artificial Intelligence) 알파고 (AlphaGo) 의대국 ( 16 년 3월 9~15일총 5국 ) 의영향으로 4차산업혁명단계 1) 진입을인식함과더불어금융권에서도인공지능기술이주목받게됨에따라, 본보고서에서는빅데이터 (Big Data) 의분석기술및인공지능의한분야로 학습 ( 에관한부분을구체화한기술인머신러닝의개념과기술적특징을소개하고금융권머신러닝활용사례에대해조사 분석함 머신러닝 (Machine Learning, 기계학습 ) ( 개념 ) 인간이갖고있는고유의지능적기능인학습능력 2) 을기계를통해구현하는방법으로, 환경과의상호작용에기반한데이터로부터스스로성능을향상시키는 ( 기계가학습할수있는 ) 알고리즘및기술을개발하는분야 < 머신러닝의개념 > 1) 세계경제포럼 (WEF) 에서 제 4 차산업혁명 ( 인더스트리 4.0) 을 3 차산업혁명을기반으로한디지털과바이오산업, 물리학등의경계를융합하는기술혁명으로설명하고있으며, 로봇, 인공지능 (AI), 사물인터넷 (IoT) 등을통한기술융합이핵심 1 차산업혁명 ( 증기기관 ) 은기계화과정에서물과증기의힘을사용, 2 차산업혁명 ( 대량생산 ) 은전기에너지를이용해대량생산체제를만듦, 3 차산업혁명 ( 컴퓨터와 IT) 에서는컴퓨터및전기기술과정보기술을이용하여자동화된생산체계를만듦 2) 앨런튜닝 (A.M. Tunning) 은저널 Mind 에발표한 (1950) Computing Machinery and Intelligence 에서기계가지능적이라는조건 ( 컴퓨터로부터의반응을인간과구별할수없다면컴퓨터는생각할수있는것 ) 을언급함 - 1 -
( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (Reinforcement 내용 학습시출력결과값을미리알려주는 교사 (supervised) 가존재하는형태주로인식, 분류, 진단, 예측등의문제해결에적합비지도학습에비해성능이좋으나좋은결과를위해시간, 비용증가예 ) 회귀분석 (Regression Analysis, 데이터의함수관계예측 ), 의사결정나무 (Decision Tree, 데이터속성에따라나무형태의의사결정학습모델을만들고, 반복을통해최종결정을도출 ) 등 학습시출력값에대한정보없이 ( 교사없이 ) 학습이이루어지는형태군집화, 밀도추정, 차원축소, 특징추출등이필요한문제에적합지도학습에비해성능은좋지않으나, 학습데이터구축용이, 비용절감예 ) 군집화 (Clustering, 비슷한관측치끼리군집 ), 차원축소 (Dimensionality Reduction, 데이터간의연관규칙을찾음 ) 등 상태 (State) 에서어떤행동 (Action) 을취하는것이최적인지를학습행동을취할때마다외부환경에서보상 (Reward) 이주어지며, 보상을최대화하는방향으로학습이진행예 ) 컴퓨터체스, 복잡한로봇의제어등 - ( 강화학습 ) 최근인공지능분야에서강화학습에대한관심이커졌으며, 강화학습의접근방법으로는 1가치함수를직접활용하는방법 (value function-based methods), 2상태의존적이며제어전략에대한탐색을활용하는방법 (policy search methods), 3가치함수와제어전략탐색을위하여분리된모듈을사용하되학습과정에서이들을종합적으로활용하는액터-크리틱방법 (actor-critic methods) 의세가지방향으로발전함 < 환경과상호작용을통한강화학습 > 자료 : MIT Press, Reinforcement Learning : An Introduction 3) O. Chapelle et al., Semi-supervised learning, MIT Press Cambridge 에서는 Supervised Learning, Unsupervised Learning, Semi-Supervised Learning 으로구분 - 2 -
딥러닝 (Deep ( 개요 ) 인공신경망 (ANN, Artificial Neural Networks) 4) 에기반하고 1 입력층 (Input layer), 2 출력층 (Output layer), 복수개의 3 은닉층 (Hidden layer) 의계층구조 (Layer Structure) 를가지는심층신경망 (DNN, Deep Neural Networks) 을학습의주요방식으로사용하는머신러닝의한분야 < 딥러닝심층신경망구조 > ( 분류 ) 1 심층신경망 (DNN, Deep Neural Networks), 2 컨볼루션신경망 (CNN, Convolutional Neural Network), 3 리커런트신경망 (RNN, Recurrent Neural Network) 등다양한종류의심층신경망알고리즘과구조가존재하지만대부분대표적인몇가지구조들에서파생 - ( 컨볼루션신경망 ) 최소한의전처리 (pre-process) 를사용하도록설계된다층퍼셉트론 (MLP, Multi-Layer Perceptrons) 5) 의한종류이며, 1convolution-pooling layer( 입력된이미지로부터계층적구조의 feature 추출 ) 와 2fully connected layer ( 추출된 feature 를입력받아타겟클래스로분류 ) 의두부분으로구성 < 컨볼루션신경망 (CNN) 의일반구조 > 자료 : Y. LeCun 외 3 명, Gradient-based learning applied to document recognition,proceedings of the IEEE 4) 인간의신경망구조를모방하며, 인공신경망은 x1 부터 x n 까지입력값에각각 w1 부터 w n 까지의가중치를곱하고그모든합이변형함수를통해임계치가초과되면출력값이발생 5) 뉴런들을여러개결합하여네트워크형태를갖춘신경망을제안한것이 Rosenblatt 의퍼셉트론 (perceptrons) 이며, 비선형결정경계를만들기위해은닉층을가지는신경망을다층퍼셉트론 (multilayer perceptron) 이라고함 - 3 -
( 특징 ) 1 특징추출을위한전처리단계 6) 를전체학습프로세스에포함 *, 2 영상데이터와같이차원수가크고복잡한데이터의경우전처리과정에서손실될수도있는정보를자동추출, 3 높은수준의추상화작업 (Abstraction)* 에효율적이며시뮬레이션크기를늘릴수록대량의데이터를흡수하는능력이좋아지는특징, 4 빅데이터발달, GPU 등정보처리능력의향상과함께딥러닝은인공지능발전에기여할것으로예상 * 기존의특징추출과패턴분류의두단계를분리하여문제를해결하던방식을하나의단계로통합 ** 다량의데이터나복잡한자료들속에서핵심적인내용또는기능을요약하는작업 < 딥러닝구조 > - 글로벌 IT 기업 ( 구글, 페이스북, 트위터, MS, 바이두등 ) 에서딥러닝알고리즘의초고용량학습알고리즘특징을통해성능발휘 < 구글의딥러닝활용예 > < 페이스북의딥페이스 > 자료 : 구글 1만 6000개의컴퓨터프로세서로 10억개이상뉴럴네트워크를이용한딥러닝을적용유튜브안에있는 1000만개의이미지중에서스스로고양이를알아내는연구수행 자료 : 페이스북딥러닝을적용한딥페이스기술 (Closing the Gap to Human-Level Performance in Face Verification 논문에서발표 ) 에서인간과유사한 97.35% 정확도로사람얼굴을인식할수있는기술을선보임 6) 전처리 (Pre-Processing) 단계 : 주어진데이터를정제하여인식기가다루기쉬운형태로최적화또는정규화 (normalization) 등을통해서변환하는과정특징추출 (Feature Extraction) : 전 ( 前 ) 처리를통하여정제된데이터의특성을분석하여각패턴을표현하는가장핵심적인정보를특징으로찾는과정 - 4 -
금융권머신러닝활용사례 7) 선도금융회사와핀테크기업에서기존단순통계기반의데이터분석이아닌머신러닝알고리즘적용등을통해영업및마케팅, 투자관리및트레이딩, 사기및부정방지, 신용평가및심사등다양한분야에서활용 - 최근국내금융사들은펀드매니저, 자산관리사역할, 소비자의패턴분석등의활용을위해로보어드바이저 (Robo-advisor) 8) 서비스제공및투자 9) 구분 영업및마케팅 투자관리및트레이딩 사기및부정방지 신용평가및심사 내용및활용사례 타겟마케팅, 고객유지를위한고객이탈가능성예측등에활용아마존의상품추천, 미국퍼스트테네시 (First Tennessee) 은행의데이터분석을통한마케팅활용보험사에서는이탈가능고객, 보험갱신율등의예측모델수립에활용 고객맞춤형투자자문과자산관리서비스 ( 싱가포르개발은행 (DBS)), 투자자문서비스의품질개선 ( 호주뉴질랜드은행 (ANZ)) 등에활용증권권역에서는트레이딩 (Trading) 시스템에서예측정확도와수익률향상도모에머신러닝알고리즘활용 이상거래탐지시스템 (FDS, Fraud Detection System) 에서거래의위험도와특정거래의발생가능성을예측을위해머신러닝알고리즘 * 적용 * 의사결정나무 (Decision Tree), 랜덤포레스트 (Random Forest), 자가조직도 (Self- Organization Map), 연관규칙 (Association Rule) 등페이팔 (PayPal) 은이상거래판별하는인공지능에딥러닝적용 대출신청자의사회경제적인특성, 신용정보와지급이력과같은세부정보를바탕으로신용도, 특정대출에대한채무불이행가능성예측핀테크기업인제스트파이낸스 (Zest Finance) 는빅데이터와머신러닝을활용하여신용평가에접목 시사점 ( 금융데이터와머신러닝, 인공지능과조화로운활용 ) 1 타산업에비해데이터보유량이많아잠재적활용가치가높은금융권의특성과 2 딥러닝의경우비지도학습이가능함으로써인공지능의상용화시기를앞당길수있다는점을고려하여, 활용시적극적인분석및전략수립필요 ( 지속적인신기술흐름에대한이해및활용방안모색 ) 데이터분석을넘어머신러닝은이미대형 IT 기업과선도금융회사들의적극적인투자및신규서비스출시되는환경에서선행적으로신기술의흐름에대한이해와활용방안을모색필요 7) 금융보안원, 전자금융과금융보안 (2015.7) 중 Research 편 머신러닝을활용한스마트서비스와금융 내용을정리 8) 로봇 과 어드바이저 ( 조언자 ) 의합성어로, 컴퓨터알고리즘을활용하고빅데이터분석을기반으로한온라인상의자산관리서비스를의미 9) 조선비즈, 투자, 인공지능에맡겨라! 금융권 ' 로보어드바이저 ' 경쟁, 2016.3.15-5 -