4 차산업혁명과자본시장 - 인공지능과블록체인 - 2018. 12. 연구위원 선임연구위원 권민경 조성훈
序言 컴퓨터, 인터넷, 모바일로이어지면서눈부시게발전하고있는정보통 신기술(ICT) 은이미인간사회의구석구석까지파고들었으며, 사회가작 동하는모습을근본적으로변화시키고있습니다. 이러한거대한변화를 혹자는 디지털化 (digitalization) 라고도하고, 일각에서는과거에유사하 게근본적인변화를가져온산업혁명이또다시일어나고있다는의미에서 4 차산업혁명 이라고부르기도합니다. 4 차산업혁명의물결은자본시장을비롯한금융산업에도 핀테크 (fintech) 라는이름으로큰영향을미치고있습니다. 과거에는다룰수없 었던다양한형태의거대한데이터를관리하고분석하는빅데이터기술을 이용하여금융회사는금융소비자자신보다더정확하게고객의성향을파 악하고그에맞는상품이나서비스를설계하여제공하려는노력을펼치고 있습니다. 인공지능은투자자의자산관리서비스, 금융회사의업무효율화 등에서이미폭넓게활용되고있으며, 블록체인이금융서비스의인프라 를근본적으로바꾸어놓을것이라는기대속에서다수의금융시장플레 이어들이시장도입을위한노력을기울이고있습니다. 국내의금융산업, 그중에서도금융투자회사를비롯한자본시장플레이 어들역시 4차산업혁명이초래하는변화의흐름에뒤쳐지지않기위하여 다각도로노력을기울이고있습니다. 그리고 4 차산업혁명이무엇인지, 핵심기술에는어떤것들이있는지, 향후사회에어떠한영향을미칠것 인지에대하여포괄적관점에서서술한다수의서적들이발간되고있습니 다. 그러나보다구체적으로자본시장이라는영역에한정하여 4차산업혁 명의핵심기술을설명하고, 도입ㆍ활용을위해어떠한노력이나타나고 있으며, 금융소비자, 금융회사, 그리고정책당국에주는시사점은무엇인 지를다룬자료는그리많지않은것이현실입니다. 이러한문제의식에서출발하여본보고서는 4차산업혁명을이끄는다 양한기술중에서도특히자본시장에서활용시도가활발하게이루어지고 - i -
있는 2개의기술 - 인공지능과블록체인 - 에집중하여, 기술의개요를 설명하고, 현재진행되고있는자본시장에서의도입논의와사례를정리 하며, 이를토대로자본시장업계및정책당국에대한시사점을제시하고 자하는목적으로작성되었습니다. 본보고서가우리나라자본시장에서 인공지능과블록체인의도입및활용에있어서도움이될수있기를기대 합니다. 이보고서를작성한본연구원의권민경연구위원과조성훈선임연구 위원에게감사의뜻을표합니다. 보고서세미나와심사과정에서귀중한 조언을제공한이성복연구위원에게도감사의말씀을드립니다. 또한자 료수집과정리를위해수고한공경신선임연구원과여밀림연구원, 원고 교정과편집에수고한신지원연구조원께도감사드립니다. 마지막으로본 보고서의내용은연구진개인의의견이며, 본연구원의공식의견이아님 을밝힙니다. 2018년 12월자본시장연구원원장박영석 - ii -
목 차 Executive Summary ⅸ Abstract xv Ⅰ. 서론 3 Ⅱ. 인공지능의활용 9 1. 인공지능개요 9 2. 자본시장에서의인공지능기술의활용 37 3. 소결및시사점 46 Ⅲ. 블록체인의활용 51 1. 블록체인개요: 개념및특성 52 2. 블록체인의문제점및대응 58 3. 자본시장에서의블록체인기술의활용 71 4. 소결및시사점 77 Ⅳ. 결론 81 참고문헌 85 - iii -
표목차 < 표 Ⅲ -1> Forbes Fintech 50 중블록체인스타트업 72 - iv -
그림목차 < 그림 Ⅱ -1> 퍼셉트론의구조 15 < 그림 Ⅱ -2> 퍼셉트론을통한 AND/OR 문제구현예시 16 < 그림 Ⅱ -3> 다층퍼셉트론의구조 17 < 그림 Ⅱ -4> 다층퍼셉트론을통한 XOR 문제구현예시 18 < 그림 Ⅱ -5> 역전파예시: 인공신경망모형 21 < 그림 Ⅱ-6> 역전파예시: 가중치 에대한오차정보의전파 23 < 그림 Ⅱ-7> 역전파예시: 가중치 에대한오차정보의전파 24 < 그림 Ⅱ -8> 군집모형예시 27 < 그림 Ⅱ -9> 강화학습의개념도 28 < 그림 Ⅱ -10> 활성함수예시 31 < 그림 Ⅱ -11> 이미지인식서비스예시 33 < 그림 Ⅱ -12> 콘볼루션신경망모형예시 34 < 그림 Ⅱ -13> 순환신경망모형의개념 36 < 그림 Ⅲ -1> 블록체인과비트코인관심도추이 (Google Trends) 51 < 그림 Ⅲ -2> 비트코인가격추이 (2013.10.1~2018.9.30) 66 - v -
약어표 5G AI API AR ASX BDI BIS CCTV CHESS CIO CPU CSD DAO DTCC FATF FPGA GPU ICO ICT IoT 5th Generation Artificial Intelligence Application Programming Interface Augmented Reality Australian Securities Exchange Belief, Desire, Intention Bank of International Settlement Closed Circuit Television Clearing House Electronic Subregister System Chief Information Officer Central Processing Unit Central Securities Depository Decentralized Autonomous Organization Depository Trust & Clearing Corporation Financial Action Task Force Field Programmable Gate Array Graphics Processing Unit Initial Coin Offering Information & Communication Technology Internet of Things - vi -
IPO IRS MNIST MRC NPU P2P SI SNS TPU TWH VR WEF Initial Public Offering Internal Revenue Service Modified National Institute of Standards and Technology Machine Reading Comprehension Neural Processing Unit Peer to Peer System Integration Social Network Service Tensor Processing Unit TeraWatt-Hour Virtual Reality World Economic Forum - vii -
Executive Summary 4 차산업혁명 은디지털트랜스포메이션 (digital transforma- tion) 에의한산업, 일하는방식, 나아가사회ㆍ정치적변화까지아 우르는개념으로자본시장을비롯한금융산업에도큰변화를가져 올것으로예상된다. 기업의자금조달방식, 개인과가계의저축및 투자행태, 그리고이들을연결해주는금융기관의비즈니스와가치 사슬에 4차산업혁명은이미다양한모습으로영향을미치고있으 며, 향후금융이작동하는모습을근본적으로변화시킬가능성이있 다. 따라서금융회사의입장에서는이러한대( 大 ) 변화에효과적으로 대응하여변화의흐름에뒤쳐져도태되지않도록해야할뿐아니 라, 변화속에서새로운사업기회를찾아내야한다. 이를위해서는 4 차산업혁명을통하여금융에어떠한변화가일어나고있으며, 어 떤도입ㆍ활용노력이나타나고있는지파악하는것이필요하다. 본 고는이러한노력의일환으로, 4차산업혁명을이끄는다양한핵심 기술중자본시장에서활용가능성이가장높다고생각되는인공지 능과블록체인의두가지기술에집중하여개념과작동원리, 도입ㆍ 활용사례를정리해서소개한다. 인공지능의개념은오래전부터존재하였고그용어도이미 John McCarthy 교수의제안으로 1955 년부터사용되어왔다. 그러 나인공지능열풍이라불릴만큼압도적인관심을받게된것은비 교적최근의일이다. 2006 년인공신경망에서딥러닝기법의도입, 2012 년이미지넷경연대회에서딥콘볼루션신경망의출현, 그리고 결정적으로 2016 년구글딥마인드의 알파고 사건은인공지능기 술이해당전문가집단을넘어일반대중에게뚜렷하게인식되는 계기가되었다. 현재인공지능열풍을주도하고있는모형은단연인공신경망이 다. 인공신경망은그이름이의미하듯생물신경망으로부터아이디어 - ix -
를차용하여만들어졌으며, 뉴런의집적을통해아무리복잡한함수 라도모형화할수있다는강점을가지고있다. 다만현실적으로데 이터를학습함에있어경사감소소멸 (vanishing gradient) 이나과적 합(overfitting) 과같은기술적문제가나타날수있고학습할데이 터의양이나연산속도등에있어아직까지활용에제약이따르는 상황이다. 인공지능, 특히머신러닝의종류로는인공신경망외에도 결정트리모형, 서포트벡터머신등의지도학습모형이있으며, 그밖 에도주성분분석, 군집과같은비지도학습모형, 시행착오를통해 최적의행동전략을찾는강화학습방식의모형이있다. 최근들어인공지능기술이뛰어난성과를보이며대중의주목을 받게된배경은다음과같다. 첫째, 학습에활용할수있는양질의 데이터가크게늘어났으며, 둘째, 인공지능모형의알고리즘이획기 적으로개선되었고, 셋째, 데이터의연산및저장에쓰이는하드웨어 가발전하였으며, 마지막으로인공지능관련오픈소스프레임워크가 널리보급되고개발자간지식을공유할수있는온라인커뮤니티가 활성화되었다. 현재인공지능은이미지인식과자연어처리, 이상탐 지등의기초기술분야에서매우활발하게사용되고있으며, 이를 기반으로하여자율주행자동차, 가상비서등복합적이고파급력이큰 서비스도잇따라개발되는추세이다. 다른산업과마찬가지로인공지능은자본시장에서도활용도가매 우높다. 특히자산운용, 신용평가, 챗봇을통한업무효율화, 이상탐 지분야에서인공지능기술을적용하려는시도가활발히이루어지고 있다. 이미유수의글로벌금융회사들이금융서비스의효율증대또 는조직운영에드는비용감소를위해인공지능기술을속속도입하 고있으며, 상대적으로규모가작은전문핀테크업체들은인공지능 기술을활용하여기존에없던혁신적인금융서비스를개발하고자노 력을기울이고있다. 한편, 기술적우위를보유한글로벌 ICT업체들 - x -
은그들이보유한고객데이터와인공지능기술을결합하여종합적인 금융서비스를제공하려는움직임을보이고있다. 아직까지인공지능기술은우리가공상과학영화에서보는것처 럼인간을대신해모든것을처리할수있는만능해결책이아니다. 그렇지만지금까지그래왔듯앞으로도데이터의증가, 알고리즘및 하드웨어의꾸준한개선등에힘입어자본시장등모든산업에서 그활용도를넓혀나갈전망이다. 인공지능기술을활용함에있어 결국가장중요한핵심은양질의데이터확보에있다. 업계에서는 사전에가치있는데이터를발굴하고, 활용가능한형태로축적하 며, 각채널별로수집한데이터를전사적관점에서체계적으로관리 하려는노력이필요할것이다. 다음으로블록체인은 디지털화된공개분산원장 (public distributed ledger) 에의하여기록의무결성과신뢰성을확보하는컴퓨터네트워 크기술 로정의할수있으며, 2008 년비트코인 (Bitcoin) 을구동하는 기반기술로세상에등장한이후많은관심의대상이되었다. 그러나 초기의흥분(hype) 이진정되는가운데한계와문제점들이드러나게 되었고, 본격적인도입ㆍ활용도애초가졌던기대보다는느리게진행 되는모습을보이고있다. 동시에한계와문제점을해결하기위한노 력역시꾸준하게이루어지면서상당한변화와발전도이룩하였다. 블록체인은모든참여자들이 P2P 로연결되는네트워크구조, 합 의알고리즘, 고도로암호화된블록생성과연결이라는작동원리에 따라탈집중화, 보안성ㆍ안정성, 그리고경제성과효율성이라는특 성을갖는다. 그러나작업증명이라는합의알고리즘을사용하는개 방형(public) 블록체인은거래처리속도가느리다는점, 전력ㆍ컴퓨 터연산능력등자원을과도하게소비한다는점이지적되어왔으며, 블록체인의최대강점이라고할수있는보안성ㆍ안전성에대한의 문도제기되고있다. - xi -
이러한문제제기에대응하여이루어진블록체인의개선노력으 로는첫째로거래처리속도를높이고자원소비를줄이기위한대안 적합의알고리즘들이등장또는제안되었다는것이며, 그중에서가 장대표적인것이 지분증명 (proof of stake) 이다. 거래처리속도를 높이기위한다른시도로는블록의크기확대, 블록에기록되는거래 정보의구조수정등이있다. 또한사업상활용가능성을높이기위 한차원에서, 폐쇄적인사적(private) 혹은컨소시엄블록체인을구성 하여사전적인신뢰를확보하고합의알고리즘을없애거나단순화함 으로써거래처리속도를높이고자하는흐름도나타나고있다. 한편블록체인상에서발행ㆍ유통되는가상통화가법화 (fiat currency) 를대체하는지불수단으로자리잡았다고보기는어려우 며, 이는가상통화자체가격의변동성이매우큰데기인한다. 그리 고가상통화를발행하여블록체인을기반으로한사업이나프로젝 트추진에필요한자금을조달하는 ICO(Initial Coin Offering) 가크 게증가하였다. 그러나투자은행과같이자금을조달하려는가상통 화발행주체와투자자사이에서정보의집적ㆍ생산기능을수행하 는중개기관이없는 P2P 구조에서 ICO는심각한정보비대칭의문 제를안고있다. 또한발행된가상통화의유통시장은가격발견과관 련된시장미시구조의취약성, 차익거래의제약, 시세조종등불공정 거래, 거래의취소ㆍ정정기능부재등의문제를안고있다. 현재블록체인을기반으로사업을영위하고있는주요스타트업 들은주로가상통화거래ㆍ중개, 송금, 솔루션개발등을영위하고 있으며, 본격적으로자본시장관련서비스를주력사업으로하고있 는곳은없다. 주요자본시장인프라기관들은자본시장후선업무에 서의블록체인활용가능성을높게평가하고도입을위한노력을 기울이고있다. 그외자본시장에서블록체인의도입이시도되고있 는영역은기업지배구조분야이다. 특히주주총회에서의의결권행사 - xii -
를위한전자투표플랫폼을블록체인으로구성하려는시도들이다 수사업자들에의하여진행되고있다. 지금까지의흐름을통해볼때향후자본시장에서활용될블록 체인은대부분컨소시엄블록체인을포함한사적블록체인이될것 으로예상된다. 그리고블록체인은시스템또는플랫폼의구조와관 련된기반기술로서투자자에게직접제공되는리테일상품에활용 되기는어려우며, 후선또는인프라부분을중심으로먼저도입될 것이다. ICO는스타트업자금조달경로로상당한잠재력을가지고 있지만제대로자리잡기위해서는효과적인규제마련과함께정보 전달경로로서전문투자자의역할이중요할것으로보인다. 그리고 가상통화유통시장의제반문제점을해결하는것역시선행되어야 할과제이다. 이와같이인공지능과블록체인을비롯한 4차산업혁명의핵심 기술들은향후자본시장관련금융서비스의모습을크게바꿀수 있는잠재력을가진다. 4차산업혁명에대응하여금융회사는자사 의비즈니스모형및가치사슬중새로운기술에적합한분야를일 찌감치발굴하여해당부문에선제적으로투자하는것이필요하며, 이는향후금융회사의경쟁력을좌우할중요한변수가될것이다. 또한정책당국은신기술도입과정에있어기존제도와규제가걸 림돌로작용하지않도록이를지속적으로정비할필요가있다. 또한 금융시스템의안정성저해및소비자피해우려가적은분야에서부 터먼저진입장벽을낮추고플레이어간경쟁을유도하여이와같 은기술중심의변화를장려해야할것이다. - xiii -
Abstract 4 th Industrial Revolution and Capital Markets - Artificial Intelligence and Blockchain - This report focuses on artificial intelligence and blockchain among the key technologies leading the fourth industrial revolution. This report explains the concepts of artificial intelligence and blockchain, explores the ongoing attempts to introduce and utilize them in the capital markets, and provides implications for capital market players. Artificial intelligence emerges as one of the key technologies as machine learning, especially the artificial neural network, shows excellent prediction performance. It is actively used in basic technology fields such as image recognition, natural language processing, and anomaly detection, and in complex high-level services such as an autonomous driving car and a virtual assistant. Artificial intelligence is highly utilized in the capital markets as well. In particular, efforts are being actively made to apply artificial intelligence in the field of asset management, credit evaluation, chatbot, and anomaly detection. Global financial companies are introducing artificial intelligence to increase the efficiency of financial services and reduce their operating costs. Fin-tech companies use artificial intelligence to create innovative financial services. - xv -
Global ICT companies with technological advantages are also moving to provide comprehensive financial services by combining their customer data with artificial intelligence technology. On the other hand, as the initial hype subsided, it became known that blockchain, especially public blockchain, was too slow to deal with massive transactions in capital markets and consumed excessive resources (electricity and computing power), and at the same time, various efforts were made to address these problems. At this point, it cannot be said that virtual currencies (or cryptocurrencies) have become a means of payment to replace fiat currency. In addition, an initial coin offering (ICO) has suggested a new possible channel of corporate finance, but it faces the task of solving the serious information asymmetry problem. The microstructure of the virtual currency secondary market should also be improved. Most of the blockchains to be used in the capital markets are expected to be private ones. It will also be difficult to use in retail products, and will be introduced mainly in back-office functions and infrastructure components. The key technologies of the fourth industrial revolution, including artificial intelligence and blockchain, have the potential to significantly change the structure of financial services in the future. In response to the fourth industrial revolution, market players need to identify which area of - xvi -
their business models and value chains the new technologies are well suited for, and to invest in those areas in advance. - xvii -
Ⅰ. 서론
Ⅰ. 서론 2016 년세계경제포럼 (World Economic Forum: WEF) 의 Klaus Schwab 회장에의하여처음사용된 4 차산업혁명 은이제매우익숙한용어가되 었다. 4 차산업혁명의본질이무엇이고, 인간의삶과사회에어떤변화를 몰고올것인지, 경제와산업의모습은어떻게바뀔것인지등에대하여그 동안수많은논의가이루어지고, 다수의서적과논문들이출간되어왔다. 자본시장을비롯한금융산업에도 4 차산업혁명은큰반향을일으켰다. 기업의자금조달방식, 개인과가계의저축및투자행태, 그리고이사이 를연결해주는금융회사및인프라기관들의비즈니스와가치사슬에 4차 산업혁명은이미다양한모습으로도입ㆍ활용되고있으며, 앞으로도혁명 의진전에따라금융산업에파괴적(disruptive) 인변화를초래하여금융이 작동하는모습을근본적으로변화시킬가능성이있다. 따라서금융회사의입장에서는이러한대( 大 ) 변화에효과적으로대응 하여변화의흐름에서뒤쳐져도태되지않도록할뿐아니라, 변화속에 서새로운사업기회를찾아내야할것이다. 그리고이를위해서는 4차 산업혁명이정확하게무엇을의미하는지를이해하고, 자본시장을비롯한 금융산업에어떠한변화가일어나고있으며, 어떤도입ㆍ활용노력이나 타나고있는지를파악하는것이필요하다. 본보고서는이러한노력의일 환으로작성되었다. 전술한바와같이 4 차산업혁명 이라는용어는 2016년세계경제포럼 의 Schwab 회장이처음사용하였으며, 이것이구체적으로무엇을의미하 는지에대해서는논자에따라약간의차이는있으나, 대체로 디지털트랜 스포메이션(digital transformation) 에의한전산업의변화뿐아니라일 하는방식의변화, 사회ㆍ정치적변화까지를아우르는포괄적개념 이라고 할수있다. 1) 그리고디지털트랜스포메이션은농업, 제조업, 서비스업등 1) 4차산업혁명의개념및핵심기술에관해서는다음자료들을참고하여정리하였다. 김대호(2016), 이대기(2017), 리프킨(2012), 클라우스슈밥(2016), KT경제경
4 4차산업혁명과자본시장 전산업에정보통신기술 (Information & Communication Technology: ICT) 이결합하여기존의아날로그방식이디지털방식으로전환되는것을의 미한다. 2) 혁명 이라는단어는 급진적이고근본적인변화 라는의미를내포하고 있으며, 따라서이와같은변화를 4 차산업혁명 이라고부르는데에는이 변화가그만큼급진적이고근본적인변화를인간사회에가져오고있다고 보기때문이다. 이는이전까지의세번의산업혁명이무엇이었는지를살 펴보면조금더분명해진다. 일반적으로 1차산업혁명은 1760~1840 년기간에영국의주도하에 방적기, 증기기관의발명과철도의건설을중심으로기계에의한생산, 공 장시스템의도입등일련의획기적인거시적발명이이루어짐으로써농 업사회를산업사회로전환시킨사건을가리킨다. 그리고 2차산업혁명은 1870~1914 년(1 차세계대전발발전) 기간에미국의주도하에전기, 전 화, 내연기관, 자동차, 그리고생산조립라인에의한대량생산등의혁신적 기술로특징지어지며, 생산성의향상뿐아니라생활수준의획기적개선 을가져온사건을지칭한다. 3차산업혁명은대체로 1960년대이후 2000 년대초반까지의기간에무형의정보생산ㆍ처리ㆍ유통의효율화를가져 온 ICT 혁명을의미하며, 반도체기술의급속한발전을기반으로컴퓨터 와인터넷이혁명을이끈중심에자리하고있다. 현재진행중인 4차산업혁명의핵심기술로는먼저기반이되는요소 기술로인공지능(Artificial Intelligence: AI), 빅데이터, 블록체인, 사물인 터넷(Internet of Things: IoT), 5 세대(5th Generation: 5G) 네트워크, 생 명공학기술, 재료공학기술( 예: 그래핀, 나노), 양자컴퓨팅등을꼽을수 있다. 그리고이러한요소기술을기반으로한, 상위레이어(layer) 에해 당된다고볼수있는기술로서무인운송( 자율주행자동차 ), 드론, 적층가공 영연구소 (2017) 2) 유사한개념으로독일정부가추진한 Industry 4.0 이있다. 이는제조업과 ICT의융합을통한제조업혁신이핵심이며, 4차산업혁명은 Industry 4.0을포괄하는보다넓은상위의개념으로볼수있다.
Ⅰ. 서론 5 (additive manufacturing) 3), 로봇, 스마트에너지( 그리드), 스마트보안, 스마트팩토리, 가상현실(Virtual Reality: VR), 증강현실(Augmented Reality: AR) 등이있다. 본보고서는이러한 4 차산업혁명의핵심기술들을모두다루는대신, 핵심기술들중에서자본시장과의관련성과활용가능성이상대적으로높다 고생각되는인공지능과블록체인의두가지기술에집중하고있다. 인공 지능은이미자산운용이나신용평가, 시장감시등의분야에서본격적으로 활용되고있으며, 블록체인은자본시장후선업무를중심으로활발한도입 시도가진행되고있다. 본보고서에서는인공지능과블록체인에대하여 각각의개념과작동원리를설명한다음, 자본시장에서의도입ㆍ활용현 황을정리하여소개한다. 그리고이를토대로자본시장및금융투자업의 가치사슬및비즈니스에미치는영향을가늠해보고, 향후전망에대한 시사점을도출하고자한다. 본보고서는자본시장에서의활용가능성이라는맥락에서인공지능과 블록체인을설명하는것이목적인만큼기술적측면에대해서는상세하게 다루지않고기본적작동원리를소개하는수준에서서술한다. 또한블록 체인의경우, 이미조성훈(2016) 에서개념과작동원리에대한기술적내 용이정리된바있는만큼, 본보고서에서는이부분에대해서는조성훈 (2016) 의주요내용을간략하게압축하는것으로갈음하고, 대신최근수 년동안에블록체인의문제점으로제기된내용들과이에대한대응을정 리하여소개한다. 본보고서는다음과같이구성된다. 제Ⅱ장에서는인공지능, 제Ⅲ장에 서는블록체인에대하여각각개념과작동원리, 도입ㆍ활용현황을소개하 고향후전망및시사점을제시한다. 그리고 Ⅳ장에서는앞의내용들을종 합하여 4차산업혁명을맞는자본시장및금융투자업에대한보다넓은 시각에서의시사점을제시한다. 3) 적층가공은 3D 프린팅 이라는이름으로보다널리알려져있다.
Ⅱ. 인공지능의활용 1. 2. 3. 인공지능개요 자본시장에서의인공지능기술의활용 소결및시사점
Ⅱ. 인공지능의활용 은 4 차산업혁명의핵심기술로단연인공지능을꼽을수있다. 인공지능 2006년딥러닝의소개이후전산업에걸쳐빠른속도로도입되고있 으며, 특히인공지능기술을적용한구글딥마인드의 알파고 는 2016년 3월이세돌과의바둑대결을통해비단인공지능뿐아니라 4차산업혁 명이라는화두를전세계에던진바있다. 인공지능기술은이미지인식, 자연어처리분야에서이미놀라운성과를거두었으며, 향후자율주행자 동차, 가상비서등에적용되어인간삶의방식을획기적으로바꿀것으로 기대된다. 본장에서는 4차산업혁명의핵심기술로서인공지능을중점적으로살 펴보고자한다. 먼저 1 절에서는인공지능의개념, 구조및원리, 최근의 발전요인, 전반적인활용현황등을알아보고 2절에서는자본시장에서의 활용현황을파악한다. 마지막으로 3절에서는소결및시사점을제시하고 자한다. 1. 인공지능개요 인공지능 이라는용어는 1955년에다트머스대 John McCarthy 교수 가처음사용하였다. 그는 Marvin Minsky, Nathaniel Rochester, Claude Shannon 등과함께인공지능을주제로한컨퍼런스를기획하였 으며, 동컨퍼런스제안서에서최초로인공지능이라는용어를사용하였다. 이들이주최한 1956 년다트머스컨퍼런스(Dartmouth conference) 는인 공지능분야를확립한학술회의로유명하며한달에걸쳐진행되었다.
10 4차산업혁명과자본시장 이후인공지능에대한논의가구체화되면서이를명확하게정의하기위 한시도가이루어졌다. 그중대표적인것이 Russel & Norvig(1994) 이다. 이책에서저자는인공지능에대해 인간처럼생각하는시스템, 인간처럼 행동하는시스템, 이성적으로생각하는시스템, 이성적으로행동하는시 스템 등네가지정의를제시하였다. 현재는이중에서 인간처럼행동하 는시스템 으로정의하는것이일반적이며그이유는현실적인측면에있 다. 첫째, 시스템이어떻게 생각 하는지는파악하기어렵지만어떻게 행 동 하는지는관찰이용이하기때문이다. 둘째, 이성적 이라는개념은인간 의관점을뛰어넘기때문에사람에따라의견이다소엇갈릴수있지만 인간과비슷한지 여부는상대적으로쉽게합의에이를수있기때문이다. 이와관련하여 Turing(1950) 은인공지능여부를판단하기위해다음 과같은테스트방식을고안하였다. 4) 심사원이모니터를통해사람및컴 퓨터와각각문자를주고받은후, 어떤상대가컴퓨터인지구별해보는것 이다. 만약심사원이사람과컴퓨터를각각올바르게구별하지못한다면 해당컴퓨터가인공지능을가지고있는것으로판단한다. 이를튜링테스 트라부르며현재까지도활용되고있다. 인공지능은그수준에따라약인공지능(weak AI) 과강인공지능 (strong AI) 으로구분할수있다(Searle, 1980). 약인공지능은특정과제 를수행하기위해고안된인공지능이며, 현재상용화된대부분의인공지능 이이에해당한다고볼수있다. 반면, 강인공지능은보다다양하고일반 적인문제해결에활용할수있는인공지능으로인공일반지능 (artificial general intelligence) 이라불리기도한다. 기술적인난이도가훨씬높기 때문에가까운미래에상용화될것으로는보이지않으나만약개발된다면 그파급효과는매우크게나타날것으로예상된다. 강인공지능은미래 과학기술의상징으로여겨지는동시에한편으로인류지배가능성과같은 공포심을불러오기도한다. 4) 이때는 인공지능 이라는용어가등장하기이전이었으므로 인공지능 이라는용어를직접사용하지는않았다. 대신 기계가생각할수있는가(Can machines think)? 라는질문에대한테스트방식으로이를고안하였다.
Ⅱ. 인공지능의활용 11 한편, 인공지능과유사하게인공의식(artificial consciousness) 이라는 개념도존재한다. 일반적으로컴퓨터와같은인공물에의식이부여되었을 때인공의식을가진다고정의한다. 어떤이들은인공의식을일종의강인 공지능으로보기도하지만, 한편으로는인공적으로의식이부여된개체가 반드시높은수준의지능을가질필요는없다는점에서통상강인공지능 과구별되는개념으로본다. 인공의식은강인공지능과마찬가지로구현 에있어기술적인난이도가무척높기때문에가까운미래에나타나기는 어려울것으로예상된다. 현재모든산업에걸쳐각광을받으며활발하게도입되고있는시스템 은모두약인공지능이다. 공상과학소설이나영화에서심심찮게강인공지 능이나인공의식을소재로다루고있지만아직까지이러한개념은우리의 상상속에서만존재할뿐이다. 이에따라이하본문에서는약인공지능에 한정하여그구조와원리를소개하고자하며편의상이를별도의수식없 이 인공지능 이라는용어로지칭하도록하겠다. 가. 구조및원리 인공지능을구현하는방법은매우다양하다. 예를들어, 단순히많은 규칙을시스템에입력하는것만으로도인공지능을구현할수있다. 실제 로이러한방법은전문가시스템(expert system) 이라는이름으로오래 전부터활용되어왔다. 인간이축적한특정분야의지식체계를 A면 B 다 와같은조건부규칙의데이터베이스로전환하여시스템에주입하는방식 이다. 예를들면 콧물, 코막힘, 기침의증상이있는경우감기에걸린것 이다 와같은식이다. 이렇게조건부규칙의집적을통해구축한시스템은 사용자의조건에맞는정확한해답을제시한다는장점을갖지만, 사용자 가활용할수있는조건의수가한정되어있는경우에만이용할수있다. 규칙을일일이다입력할수없을정도로환경이복잡하고경우의수가 많은경우전문가시스템의효용은급격히떨어지고만다.
12 4차산업혁명과자본시장 최근각광받고있는머신러닝(machine learning) 은기존전문가시스 템의이러한한계를극복하였다. 조건부규칙만으로명확히규정할수없 는복잡한환경또는연속적인(continuous) 환경에서도비교적정확한해 답을제시할수있게된것이다. 머신러닝은특히다양한변수가복합적 으로영향을미치는문제를해결하는데있어높은정확도를나타낸다. 현실 에서는단순한조건부규칙으로해결할수있는문제보다여러변수가동시 에영향을미치는복잡한형태의문제가압도적으로많기때문에, 머신러닝 이인공지능의적용범위를크게확장시키는역할을하였다고볼수있다. 물론인공지능을구현하는방식으로전문가시스템과머신러닝만있는 것은아니다. 예를들면퍼지이론 (fuzzy theory), 유전알고리즘 (genetic algorithm), BDI(Belief, Desire, Intention) 아키텍처 (BDI architecture) 등 으로도구현이가능하다. 그러나이하본고에서는다른방식은다루지않고 오로지머신러닝만을집중적으로다루고자한다. 현재 4차산업혁명을주 도하는인공지능기술은대개머신러닝방식으로구현되고있기때문이다. 머신러닝 이란용어는 1959년 IBM 연구원 Arthur Samuel이처음사 용하였다. 여기서머신(machine) 은프로그래밍이가능한컴퓨터를의미한 다. 머신러닝을문자그대로풀어쓰면 프로그래밍가능한컴퓨터가학습 을하는것 이다. 그럼무엇을학습하는것일까? 그리고학습의목적은무 엇일까? 과거전문가시스템에서는사람이데이터를분석하여규칙을만 들고시스템은주어진문제에해당규칙을수동적으로적용하는역할만 수행하였다. 한번시스템에입력된규칙은누군가가별도수정하지않는 한변화없이유지되었다. 반면, 머신러닝에서는사람이아닌시스템이데 이터를분석( 학습) 하고이를통해스스로규칙을만들어문제에적용한다. 또한이미설정된규칙을계속해서그대로따르는것이아니라, 시스템이 새로운데이터를받아들이면서그규칙을더욱정교하게스스로업데이트 하는방식을취한다. 즉, 머신러닝은시스템이스스로 데이터 를학습하 고이를통해문제해결을위한 규칙을업데이트 하는것을의미한다. 머신러닝은어떻게이루어질까? 즉, 시스템이어떻게데이터를학습할 수있을까? 이와관련하여오래전부터다양한방법이제시되었다. 경제
Ⅱ. 인공지능의활용 13 학에서많이활용하는회귀분석도머신러닝모형의한종류이며, 1990년 대활발하게사용되었던서포트벡터머신 (support vector machine), 분류 및의사결정목적으로종종쓰이곤하는결정트리알고리즘 (decision tree algorithm) 등도머신러닝의모형으로활용된다. 그밖에도논리학이 나그래프를활용하여학습하는모형도있다. 여러가지머신러닝방법중본고에서집중하여살펴볼모형은바로인 공신경망모형이다. 인공신경망은구글딥마인드가알파고에적용하여이 미유명해진바있으며, 그밖에도이미지인식, 자연어처리등최근혁 신적인기술발전에중추적인역할을수행하며전반적인인공지능기술발 전을주도하고있다. 지금부터인공신경망이어떠한구조를가지고있는지 살펴보고어떻게데이터를학습하는지그원리를알아보도록하겠다. 1) 인공신경망5) 인공신경망모형은그용어가말해주듯생물의신경망구조에서아이 디어를차용하였다. 인공신경망모형을설명하기전에먼저생물신경망의 구조부터살펴보자. 인간의몸에는뉴런이라는신경세포가존재한다. 각각 의뉴런은이전단계의뉴런으로부터신호를전달받고, 전달받은신호의 총량이특정임계값을넘을경우다음뉴런으로신호를내보낸다. 개별 뉴런의기능은일견단순해보이지만, 인간의뇌에는평균 850억개에달 하는뉴런이서로연결되어있으며이로인해우리는고도의복잡한사고 를할수있게된다. 생물신경망에서뉴런이신호를주고받을때시냅스라는부위가이들을 잇는통로역할을한다. 신호전달을위해서는일정량의에너지소모가필 요한데특정뉴런간신호가반복되어전달되는경우해당뉴런을잇는 시냅스의연결부위가강화되어비교적낮은에너지로도신호를전달할수 있게된다. 따라서우리의몸은새로운자극을받으면이를처리하기위 5) 이장은김의중제롱쿠지라히코우즈쿠에를참고하여작성 (2016), (2018), (2017) 하였다.
14 4차산업혁명과자본시장 해많은에너지를소모해야하지만, 해당자극이반복될경우에는처음처 럼많은에너지를소모하지않고도원활하게처리할수있게된다. 이것 이생물신경망에서의학습과정이다. 인공신경망은이러한생물신경망구조를모방하여설계되었다. 인공신 경망내에는뉴런이라는정보처리의기본단위가존재하며이들을여러개 집적함으로써복잡한연산을수행할수있도록하였다. 또한생물신경망에 서의시냅스와마찬가지로인공신경망내에도뉴런간정보전달통로가존 재하는데여기에가중치(weight) 를부여할수있다. 가중치는고정된값이 아니며주어진데이터에따라얼마든지조정될수있다. 인공신경망모형 에서특정부분의가중치가높다는것은해당뉴런간전달되는정보가결 괏값에미치는영향이크다는것을의미한다. 따라서어떠한문제가주어 졌을때그문제에있어서특히중요하다고판단되는뉴런간연결부위에 높은가중치를부여함으로써해당문제를구현할수있다. 기존데이터를 활용하여어떠한부분의가중치를높이는것이문제해결에도움이될지 유추하는과정을인공신경망에서의학습이라부른다. 학습이올바르게이 루어지면향후유사한문제가주어졌을때에도해당인공신경망모형이이 를해결하는데있어우수한성능을발휘할것으로기대할수있다. 가) 인공신경망의구조 인공신경망의개념은 McCulloch & Pitts(1943) 가처음제시하였으며 Rosenblatt(1957) 의퍼셉트론(perceptron) 모형을통해최초로인공신경 망이구현되었다. 퍼셉트론은 < 그림 Ⅱ-1> 과같은구조로이루어져있다. 하나의뉴런은여러개의입력값(input) 을받아연산을수행하고하나의 출력값(output) 을만들어낸다. 보다구체적으로설명하면, 뉴런은각입력 값에해당가중치를곱한다음모두합산하는방식으로복수의입력값을 하나의값으로변환하며 6), 이값을임계값과비교하여임계값보다크면 1, 그렇지않으면 0 의출력값을제시한다. 7) 6) 해당함수를순입력함수(net input function) 라부른다.
Ⅱ. 인공지능의활용 15 입력값 < 그림 -1> 퍼셉트론의구조 Ⅱ 8) 가중치 순입력함수 활성함수 Σ 출력값 퍼셉트론구현의간단한예로 AND 문제와 OR 문제를들어보자. 일단 입력값, 는각각 0 또는 1 의값을갖는다고가정하자. AND 문제는 과 가모두 1일때만 이되고, 그렇지않은경우 인문제이 다. OR 문제는 과 가둘중하나라도 1이면 이되고, 그렇지않 은경우 인문제이다. AND 문제와 OR 문제를각각해결하는퍼셉트 론모형은 < 그림 Ⅱ-2> 와같이구현할수있다. 7) 순입력함수를거쳐산출된값을출력값으로변환하는함수를활성함수 (activation function) 라부른다. 퍼셉트론에서활성함수는통상계단함수(step function) 또는부호함수(sign function) 형태를가진다. 8) 실제인공신경망모형에는입력값뿐아니라편향값이추가로존재하지만본 (bias) 고에서제시하는모든인공신경망그림에서는편의상이를생략하였다.
16 4차산업혁명과자본시장 < 그림 Ⅱ-2> 퍼셉트론을통한 AND/OR 문제구현예시 AND 문제 0.6 0.6 0 0 0 0 1 0 1 0 0 1 1 1 OR 문제 0.6 0.6 0 0 0 0 1 1 1 0 1 1 1 1
Ⅱ. 인공지능의활용 17 이와같이단일뉴런으로 AND 문제또는 OR 문제를해결할수는있 지만복잡한연산을수행하기에는무리가있다. 그래서등장한것이여러 층의퍼셉트론을집적한다층퍼셉트론(multi-layered perceptron) 이다. 다층퍼셉트론은 < 그림 Ⅱ-3> 과같이입력층과은닉층, 출력층으로구성 되어있다. 각층에소속된뉴런은이전층의뉴런으로부터정보를받고 이를가공하여다음층의뉴런으로정보를전달하는역할을수행한다. < 그림 Ⅱ-3> 다층퍼셉트론의구조 입력값 입력층 은닉층 출력층 출력값 간단한다층퍼셉트론의예로는 XOR 문제를구현한 < 그림 Ⅱ-4> 를들 수있다. 우선입력값, 가각각 0 또는 1 의값을가진다고가정하자. XOR 문제는 과 중하나만 1일때 이되고, 그렇지않은경우 인문제이다. 얼핏보면 OR 문제와비슷하지만 XOR 문제에서는 과 가둘다 1이면 이된다는차이가있다. XOR 문제는다층퍼셉트론 을통해구현할수있지만단층퍼셉트론으로는결코구현할수없다.
18 4차산업혁명과자본시장 < 그림 Ⅱ-4> 다층퍼셉트론을통한 XOR 문제구현예시 -0.6 0.6 1-0.6 1 0.6 0 0 0 0 0 0 1 0 1 1 1 0 1 0 1 1 1 0 0 0 XOR 문제를구현한 < 그림 Ⅱ-4> 는은닉층이하나밖에없지만일반 적으로인공신경망을모형화할때은닉층이두개이상포함되어있는구 조를활용하는경우가많다. 이렇게복수의은닉층을가지는인공신경망 을심층신경망(deep neutral network) 이라부른다. 심층신경망을활용하 는이유는동일한기능을가진뉴런의불필요한중복을방지하여모형의 효율을높이기위함이다. 예를들어손글씨를인식하는인공신경망을생 각해보자. 은닉층이여러개인심층신경망을활용하면초기단계은닉층 에서는가장기본적인획을인식하고, 이를바탕으로중간단계은닉층에 서는글자를인식하고, 후기단계은닉층에서는단어또는문장을인식하 는식으로계층구조를활용할수있다. 즉, 비교적간단한인식은이전 단계은닉층에맡기고이를바탕으로다음단계에서보다복잡한형태를 인식을하는방식이다. 이렇게하면동일한기능을가진뉴런의중복을 막아비교적적은수의뉴런으로도복잡한문제구현이가능하다. 반면, 은닉층이하나뿐인인공신경망의경우계층화가불가능하기때문에모든 단어또는문장에대해매번획단위에서부터하나하나인식을해야한
Ⅱ. 인공지능의활용 19 다. 이에따라많은수의뉴런을필요로하게되고뉴런수의증가는이 후학습효율을떨어뜨리는원인이된다. 심층신경망구조는이후학습과정에서초기단계은닉층의학습값을 다른문제에재사용할수있다는장점도지닌다. 예를들어사진에서동 물을인식하는모형을학습한다음식물을인식하는새로운모형을학습해 야한다면, 동물인식모형에서초기단계은닉층의학습값을식물인식모 형에서재사용하는것이가능하다. 점과선등기초적인성분을인식하는 초기단계은닉층의기능은두모형에서모두동일하기때문이다. 이렇게 학습값을재사용하면새로운문제학습에드는시간과비용을크게단축할 수있다. 앞서 XOR 문제예시를통해단층퍼셉트론에서는구현할수없었던 문제를다층퍼셉트론에서구현할수있음을확인하였다. XOR은비교적 간단한문제이지만실제로다층퍼셉트론은이보다훨씬복잡한문제를 구현할수있다. Cybenko(1989) 는뉴런수를충분히늘릴수만있다면 은닉층이하나뿐인다층퍼셉트론만으로어떠한복잡한함수라도근사할 수있다는사실을밝혔다. 즉, 생물신경망에서뉴런의집적으로인간이고 도의복잡한사고를할수있는것처럼인공신경망에서도뉴런을통해복 잡한문제를구현할수있게된것이다. 향후인공신경망모형은일종의초지능역할을수행할가능성도있다. 과거전문가시스템은인간의지식체계를수동적으로활용하는정도에머 물렀으며, 경제학에서쓰이는주요예측모형들또한근본적으로기존이 론또는연구자의가설에기반하여설계되었다. 이와같은모형에서는기 존지식체계또는연구자의사전믿음이정확하지않은경우높은예측력 을보일수없다. 예를들어실제현상의작동원리가 인데 연구자가 형태로모형을설계하였을경우제대로된 예측이될수없다. 반면, 인공신경망에서는다양한변수들간폭넓은연 관관계에대해포착이가능하다. 인간이예상하기어려운복잡한함수관 계에있더라도이를파악하고올바른예측값을나타낼수있는것이다.
20 4차산업혁명과자본시장 실제구글딥마인드의알파고는이러한가능성을우리에게직접보여주었다. 알파고는프로기사와의바둑대전에서전문가들이전혀생각하지못한수를종종두었고결과적으로이를통해우세를점하였던것이다. 9) 지금까지인공신경망의구조에대해살펴보았다. 주어진문제에적합한구조설계를마치고나면다음에할작업은인공신경망모형에데이터를학습시키는것이다. 다음절에서는인공신경망을학습시키는방법에대해알아보도록하겠다. 나) 인공신경망의학습 일반적으로우리는주어진문제의구조및원리를분석하고이에맞는 모형을구현함으로써그다음부터는동일한유형의문제를모형에대입하 여쉽고빠르게풀수있다. 마찬가지로인공신경망에서도적절한구조를 설계하고뉴런간가중치를조정함으로써해당문제에맞는모형을구현 할수있다. 여기서각문제에대해적절한가중치를찾는작업이인공신 경망에서의학습이다. 학습을완료하여인공신경망모형을구현하면그 다음부터는동일한유형의문제를해당모형에대입하여빠르게예측값을 찾을수있다. 인공신경망을학습시키는방법으로는 Rumelhart et al.(1986) 이제안 한역전파(backpropagation) 가주로쓰인다. 10) < 그림 Ⅱ-5> 의인공신경 망모형을예로들어보자. 이모형에는두개의뉴런, 가은닉층에 존재하고마찬가지로두개의뉴런, 가출력층에존재한다. 주어진 9) 다만실제로초지능을구현하는단계에이르기에는아직갈길이멀다. 인공신경망은구조적으로어떠한함수라도근사할수있지만, 각문제에적합한함수를찾아내기위해서는학습과정이필요하며이에필요한데이터의양과연산및저장장치의성능에아직까지한계가있기때문이다. 10) 김의중(2016) 에따르면역전파방식을처음선보인것은 Bryson & Ho(1969) 이며이를인공신경망에처음적용한것은 Werbos(1974, 1981) 다. 이후 Parker(1985) 와 LeCun(1985) 이이를재발견하였으며 Rumelhart et al.(1986) 에의해본격적으로학계에알려졌다.
Ⅱ. 인공지능의활용 21 학습데이터의입력값은, 이며결괏값은, 라하 자. 각뉴런에입력되는값을, 각뉴런에서출력되는값을 으로 표현하도록하겠다. 예를들어뉴런 의입력값과출력값은각각, 이다. 입력층의각뉴런은입력값을그대로출력하며, 은닉층과출 력층에서각뉴런의출력값은활성화함수 에의해변형된다. 표현하면다음과같다. 수식으로 if if < 그림 Ⅱ-5> 역전파예시: 인공신경망모형 입력값입력층은닉층출력층출력값 오차함수 은모형의정확도를나타낸다. 좀더구체적으로는결괏값, 와출력층에서의출력값, 의차이를나타내며다음과같이정의한다.
22 4차산업혁명과자본시장 인공신경망학습의목표는오차함수 을최소화하는뉴런간가중치,,..., 을찾는것이다. 역전파는다음의세가지단계로이루어진다. 첫번째단계에서는학 습시킬가중치,,..., 에적절한방법으로초깃값을대입한다. 그리고이를바탕으로모든뉴런에대해입력값 과출력값 을계 산한다. 예를들면, 와같 은식이다. 두번째단계에서는각각의가중치가오차 에얼마나기여했는지살 펴본다. 즉, 가중치 에대해 을계산하여각각의가 중치가오차함수 에얼마나기여했는지구한다. 이때체인룰(chain rule) 을활용하여출력층에서부터역방향으로모든편미분값을계산한 다. 11) 예를들어가중치 의기여도 는다음과같다. 12) 이전단계에서계산한,, 을여기에대입하면 을구 할수있다. 11) 역전파 라고불리는이유가여기에있다. 12) 각항목의계산은다음과같다.,,
Ⅱ. 인공지능의활용 23 < 그림 Ⅱ-6> 역전파예시: 가중치 에대한오차정보의전파 입력값 입력층 은닉층 출력층 가중치 의기여도 을계산하는것은이보다조금더복잡하다. < 그림 Ⅱ-7> 에서보듯이오차의전파경로가더욱다양하기때문이다. 결 과는다음과같다. 13) 마찬가지로이전단계에서구한,,, 을여기에대 13) 주석12 와중복되는부분을제외한각항목의계산은다음과같다.,,,,,
24 4차산업혁명과자본시장 입하면 을구할수있다. 이런식으로모든가중치 에대하여 을 계산한다. < 그림 Ⅱ-7> 역전파예시: 가중치 에대한오차정보의전파 경로 1 입력값 입력층 은닉층 출력층
Ⅱ. 인공지능의활용 25 < 그림 Ⅱ-7> 역전파예시: 가중치 에대한오차정보의전파 ( 계속) 경로 2 입력값 입력층 은닉층 출력층 세번째단계에서는기존가중치 을새로운가중치 로다음과같이조정한다. 새로운가중치는외생적으로부여한학습률 와이전단계에서구한오차에대한기여도 에비례하여기존가중치를조정한값이다. 적절한학습률 하에서새로운가중치는기존가중치에비해오차함수 을작게만들어인공신경망모형의정확도를높인다. 이상의세단계를거치면새로운가중치,,..., 를구할수있으며이때오차함수 은이전보다작아진다. 이제는,,..., 의초깃값대신새로운가중치,,..., 를가지고첫번째단계부터위의작업을반복한다. 이렇게계속해서가중치를조정해가는작업을반복하다가오차함수 이사전에목표로한범위내에도달하면작업을종료한다. 마지막으로조정된뉴런간가중치가모형의학습값이된다.
26 4차산업혁명과자본시장 이와같이주어진데이터를학습하여그결과로적절한가중치가정해 진인공신경망모형은그다음부터동일한유형의문제를쉽고빠르게예 측하는인공지능시스템기능을수행하게된다. 2) 학습방식 머신러닝은학습방식에따라지도학습(supervised learning) 과비지도 학습(unsupervised learning), 강화학습(reinforcement learning) 으로구 분할수있다. 학습데이터가 (x, y) 와같이입력값( 샘플) 과결괏값( 레이 블) 의세트로구성되어있는경우에는지도학습방식으로학습할수있으 며그렇지않은경우비지도학습을수행한다. 앞서소개한인공신경망에 서의역전파학습은학습데이터가입력값과결괏값의 세트로이루어져 있으므로지도학습방식이라고볼수있다. 14) 그밖에사회과학분야에서 많이쓰이는회귀분석역시지도학습방식을따르는대표적인사례이며, 서포트벡터머신, 결정트리알고리즘등도지도학습방식을따른다. 반면비지도학습은결괏값( 레이블) 이없는데이터를다룬다. 예를들면 주성분분석(principal component analysis) 은비지도학습방식을따르는 대표적인사례다. 주성분분석은데이터가공통적으로가장많이포함하고 있는요인을순서대로추출하는통계적기법이며, 결괏값( 레이블) 없이입 력값만가지고도분석이가능하다. 그밖에도데이터에포함된샘플중 성격이서로유사한샘플들을각각하나의집단으로구분해주는군집 (clustering) 도비지도학습을따른다. < 그림 Ⅱ-8> 에나타나듯군집의방 법중에는거리기반으로집단을구분하는방식과밀도기반으로집단을 구분하는방식등이존재하며, 사용자가문제의특성에맞게원하는모형 을선택할수있다. < 그림 Ⅱ-8> 군집모형예시 14) 제한된볼츠만머신과같은일부인공신경망구 (restricted Boltzmann machine) 조는비지도학습방식을따르기도한다.
Ⅱ. 인공지능의활용 27 < 거리기반분류> < 밀도기반분류> 1 1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 0.2 0.4 0.6 0.8 1 0 0 0.2 0.4 0.6 0.8 1 다. 비지도학습은종종지도학습을위한보조적인도구로도사용되곤한 본격적인지도학습을수행하기이전에학습할데이터를정제하거나 학습에적합한특성을찾는데활용하는것이다. 예를들면비지도학습을 통해학습데이터에포함된이상치를탐지(anomaly detection) 하여제거 할수있다. 또한차원축소(dimensionality reduction) 를통해데이터에 포함된여러특성중에서중요도가높은특성을골라내고그렇지않은특 성을제외할수있다. 이러한작업을통해지도학습에드는소요시간을 단축하고결과의정확도를향상시키는것이가능하다. 때로는지도학습과비지도학습이혼합된형태인준지도학습이쓰이기 도한다. 구글, 애플, 페이스북등이제공하는사진속인물인식서비스 가대표적이다. 사용자가몇개의사진을골라사진속인물정보를입력 하면( 지도학습), 시스템이정보를입력받지않은다른사진에서도동일한 인물이라판단되는부분을포착( 비지도학습) 하여인물정보를제공하는 식이다. 이렇게하면사용자가모든사진에대해일일이인물정보를입 력하지않아도사진속인물정보를손쉽게확인할수있다. 마지막으로강화학습방식이있다. 강화학습에서는시스템이직접환 경을관찰하고이에맞게행동하여그에대한보상을받는다. 그리고이 러한일련의과정을무수히반복한다. 처음에는시스템이그다지효율적이 지않은행동을취할가능성이높지만, 이러한과정을계속해서반복하다
28 4차산업혁명과자본시장 보면결국에는가장큰보상을받을수있는최적의행동전략을찾아낼수있다. 시행착오를통해학습한다는측면에서인간의학습과정과비슷한점이있다. < 그림 Ⅱ-9> 강화학습의개념도 1 상태 환경 2 액션 3 보상 시스템 문제의특성에따라강화학습을수행할때행동에대한보상이즉각적 으로나타나는경우가있고그렇지않은경우도있다. 전자의경우에도 강화학습은잘작동하지만대개이러한경우는문제자체가쉽기때문에 굳이강화학습을수행할필요가없다. 강화학습이진정한강점을발휘할 때는보상이즉각주어지지않고지연되어나타나는경우다. 구글딥마인 드의알파고가온라인으로수많은상대와바둑을두고이를통해최적의 전략을찾아낸것이대표적인예다. 15) 통상바둑은어떤한수로인해얻 는득실이즉각적으로나타나지않고이후많은수를주고받은다음에야 비로소나타난다. 인간은미리내다볼수있는수의제약이존재하고시 행착오를통해배울수있는부분도물리적으로또는정신적으로상당부 분제한되어있기때문에이러한문제를해결하는데난항을겪을수있 다. 반면, 시스템은이러한제약에서비교적자유롭기때문에계속해서강 화학습을반복수행할수있는환경만조성된다면최적의해결책을찾아 15) 알파고는자기자신과도많이대전하였다고한다.
Ⅱ. 인공지능의활용 29 낼가능성이높다. 사실강화학습을적용할수있는문제는아직까지그리많지않다. 시 스템이무수히많은시행착오를겪을수있도록환경을구축하는것이쉽 지않기때문이다. 바둑이나체스와같은보드게임, 전자오락, 온라인게 임등이비교적이러한환경구축에용이하기때문에강화학습이가장먼 저적용되었으나현실의일반적인문제에적용하기는아직까지쉽지않 다. 그러나시스템을매우높은수준까지학습시킬수있다는측면에서 강화학습은머신러닝의강력한수단으로인정받고있으며, 연구자들은이 를현실적인문제에적용하는방법을찾고자많은노력을기울이고있다. 나. 발전요인 최근머신러닝의활용도가크게증가하게된배경으로는크게네가지 요인을꼽을수있다. 첫째, 데이터의양이획기적으로증가하였다. 머신 러닝에서는인간이시스템에지식체계를수동적으로입력하는방식이아 니라시스템이직접데이터를학습하고규칙을만들어나가는방식을채택 한다. 따라서얼마나많은양질의데이터가존재하는가가머신러닝의정 확도향상에중요한역할을한다. 그중에서도인공신경망은특히네트워 크의자유도가매우높아다른머신러닝모형에비해더욱많은양의데 이터를필요로한다. 근래에들어모든산업에걸쳐정보의디지털화가진행됨으로써머신 러닝에사용할수있는양질의데이터가크게늘어났다. 작고저렴한센 서의보급, 사물인터넷의발전등으로인해활용가능한데이터가비약적 으로증가하였으며, 과거와는달리음성, 이미지, 동영상등의비정형데 이터또는 SNS(Social Network Service) 에서발생하는실시간데이터도 추가적으로활용할수있게되었다. 공공데이터개방과오픈API(Application Programming Interface) 확대추세, 웹크롤링기술발전등도활용가능 한데이터의양적확대에크게기여하였다. 단순히데이터의양만늘어난
30 4차산업혁명과자본시장 것이아니라질적인면에서도개선이있었다. 온라인플랫폼을통해만들 어진정형화된데이터가늘어나고, 머신투머신(machine-to-machine) 관 계가점차확대되면서데이터의활용속도도크게증가한것이다. 둘째, 알고리즘의개선이다. 인공신경망은 1980년대소개된역전파방 식이이미주요한학습수단으로공고히자리매김하였음에도불구하고 2000 년대이전까지서포트벡터머신등다른모형에밀려빛을보지못하 였다. 인공신경망학습에너무오랜시간이걸렸으며모형을통해예측한 결과의정확도가그리높지않았기때문이다. 인공신경망학습에있어그 동안특히문제가되었던부분은경사감소소멸 (vanishing gradient) 과과 적합(overfitting) 문제이다. 경사감소소멸은역전파과정에서편미분값이 0에가까워지면서더이 상이전뉴런으로오차가전파되지않는현상을의미한다. 앞의 < 그림 Ⅱ -7> 을예로들면 이 0에가까워지면오차가최종목적지인 까 지전파되지않고이로인해 의변화가오차함수 에영향을주지못 한다. 이와같이어떠한뉴런에서경사감소소멸문제가발생하면그보다 이전뉴런의가중치에대한학습이더이상불가능해진다. 과적합은모형이데이터에지나치게민감하게반응하여올바른학습이 이루어지지않는현상을의미한다. 주로학습대상이되는매개변수의수 가많을때이러한문제가발생하며그결과모형의예측력이떨어지게 된다. 일반적으로인공신경망은학습시킬가중치의수가매우많기때문 에과적합문제가발생하기쉽다. Hinton et al.(2006) 은이러한문제의상당부분을해소함으로써인공 신경망이비로소빛을발하는데지대한공헌을하였다. 그는우선경사감 소소멸문제를해결하기위해새로운활성함수를제안하였다. 기존에주 로사용하였던시그모이드(sigmoid) 함수대신 ReLU 함수를사용한것이 다. < 그림 Ⅱ-10> 에서보듯시그모이드함수는일정수준이상의입력값 이주어질때미분값이 0에가까워지지만 ReLU 함수는미분값이계속해
Ⅱ. 인공지능의활용 31 서 1 로고정되어있다. 16) 또한사전학습과베이즈룰(Bayes' rule) 등을 통해가능성높은초깃값을설정하는등경사감소소멸문제를해결하기 위한추가장치도마련하였다. 그리고과적합문제를완화하기위해드롭 아웃(dropout) 알고리즘을적용하였다. 드롭아웃은특정확률 p를기준으 로임의의뉴런을제거하고축소된규모로학습을시킨후, 원래대로뉴 런을복원하고학습된가중치에 p 를곱하는방식이다. 드롭아웃과정을 반복하면특정가중치가데이터에지나치게민감하게반응하는현상을방 지할수있다. < 그림 Ⅱ-10> 활성함수예시 < 시그모이드함수> <ReLU 함수> 1 10 0.5 5 0-10 -5 0 5 10 0-10 -5 0 5 10 이와같이인공신경망학습에획기적인개선을일으킨 Hinton et al.(2006) 을통상딥러닝의시작이라부른다. 그이후에도알고리즘을개 선하고자하는노력은지속되었으며구체적인예로초기화방식의개선, 배치정규화, 미리훈련된심층신경망의일부분재사용, 병렬컴퓨팅이용 등을꼽을수있다. 머신러닝의발전에기여한세번째요인은하드웨어의발전이다. 대규모 데이터를학습해야하는인공신경망의특성상데이터의저장및연산에드 는높은비용은과거인공신경망의활용을저해하는요인으로작용하였다. 16) 입력값이 0보다작은경우에는 ReLU 함수의미분값도 0을나타내지만이는모형의정확도에큰영향을미치지않는다. 입력값이작다는사실자체가해당뉴런이결괏값에별다른영향을미치지않는다는것을의미하기때문이다.
32 4차산업혁명과자본시장 그러나하드웨어의꾸준한발전으로현재대용량저장장치를구입하는데드 는비용은획기적으로낮아졌으며, 컴퓨터의연산속도또한과거와비교할 수없을정도로빨라졌다. 최근에는머신러닝학습에특화된하드웨어를개발하려는시도도활발 히이루어지고있다. 일례로우리가일상적으로사용하는 CPU(Central Processing Unit) 는복잡한연산을수행할수있지만머신러닝학습에주 로수반되는간단하고반복적인연산수행에있어서는처리속도가느리다 는단점을지닌다. 반면, GPU(Graphics Processing Unit) 는 CPU에비해 간단한연산의처리속도가훨씬빠르기때문에머신러닝의학습속도를보 다높일수있다. 그러나 GPU 역시발열이심하고전력소비가높다는단 점이있어최근에는머신러닝에특화된전용칩에대한수요가늘어나고 있다. 현재활용중인전용칩의대표적인예로는 NPU(Neural Processing Unit), TPU(Tensor Processing Unit), FPGA(Field-Programmable Gate Array) 를들수있다. 마지막으로머신러닝관련오픈소스프레임워크의보급과개발자커 뮤니티의확대또한머신러닝의활용도를높이는데크게기여하고있다. 오픈소스프레임워크는머신러닝모형을개발하는데있어많이쓰는기 능을한데모아라이브러리형태로만든것이며, 몬트리올대학의 Theano, 뉴욕대 Torch, 버클리대 Café, 구글브레인의 TensorFlow 가대 표적이다. 오픈소스프레임워크는머신러닝모형을개발하는데드는비 용과시간을크게절약시켜준다. GitHub나 Stack Overflow 등개발자들 이서로지식을공유하고의견을교환하는온라인커뮤니티가과거에비해 크게활성화되었다는점도머신러닝기술이전산업으로빠르게전파되는 데있어큰역할을하고있다.
Ⅱ. 인공지능의활용 33 다. 활용현황 현재모든산업에걸쳐가장활용도가높은머신러닝기술을꼽자면 이미지인식, 자연어처리, 이상탐지를들수있다. 이미지인식기술은 휴대폰에서찍은여러사진중동일한인물의사진을한데모아주거나, SNS 에올린사진에서친한친구의얼굴을자동으로찾아이름을태그해 주는등의서비스를통해우리일상에서이미익숙한기술이다. 이는또 한사진에서고양이나강아지와같은동물을구별해주거나, 사용자가온 라인쇼핑몰에서신발을검색하면그와비슷한디자인을가진신발을추 천해주는데에도사용된다. 마이크로소프트는별도의웹사이트를통해사 진속의상황을설명해주는인공지능체험서비스를개설한바있다. 사용 자가사진을업로드하면 울타리옆에코끼리가서있습니다 와같이사진 을설명하는문장을표시해주는식이다. 사진속사람의표정을인식하여 그사람의감정상태를분석해주는서비스도있다. 그리고무엇보다도이 미지인식기술은향후인간삶의방식을크게바꿀무인운송기술의핵 심이기도하다. < 그림 Ⅱ-11> 이미지인식서비스예시 < 상황인식> < 감정인식> 자료: 마이크로소프트
34 4차산업혁명과자본시장 현재이미지를인식하는가장대표적인방법은콘볼루션신경망 (convolution neural network) 을활용하는것이다. 이는인공신경망을기 반으로한모형으로이미지인식에특화된기능을제공한다. 일반적으로 이미지파일은적게는수천개에서많게는수천만개에달하는 2차원의 픽셀정보를포함하고있는데이를모두인공신경망의입력값으로집어넣 기에는그수가지나치게많다. 콘볼루션신경망에서는우선필터를통해 이미지의특성을추출하는콘볼루션(convolution) 단계와이미지의크기 를축소하는풀링(pooling) 단계를반복하여 2차원의이미지정보를 1차 원의데이터로변환하는작업을수행한다. 이렇게만들어진 1차원데이터 를앞서소개한일반적인인공신경망모형에대입하면최종예측값을만 들수있다. < 그림 Ⅱ-12> 콘볼루션신경망모형예시 자료 : MathWorks 초기이미지인식연구는 MNIST(Modified National Institute of Standards and Technology) 데이터베이스 17) 에서제공하는손글씨이미지를최대한정확하게인식하는것을목표로하였다. 그동안 MNIST 데이 17) MNIST 는손글씨로적은숫자들의이미지로구성된데이터베이스이다. 총 6만개의훈련용데이터와 1 만개의테스트용데이터로구성되어있다.
Ⅱ. 인공지능의활용 35 터를학습하기위해다양한머신러닝방법이시도되었지만콘볼루션신경 망이등장한이후에러율(error rate) 이크게낮아져획기적인발전을이 룬것으로평가받는다. 이분야연구자들이최근에선보인콘볼루션신경 망의 MNIST 데이터인식에러율은 0.2% 까지낮아진상황이다. 2009 년이후프린스턴대컴퓨터과학과에서제공하는이미지넷 (ImageNet) 데이터베이스를활용한이미지인식연구도활발하게진행되고있다. 해 당데이터베이스는총 1,400만개이상의사진을제공하며각사진에담 긴내용을약 5 만개의유형으로분류하고있다. 이를활용해이미지인 식기술의정확도를높이려는시도가이루어지고있는데매년개최되는 이미지넷경연대회결과를보면그발전속도를짐작할수있다. 2011년 에만해도 25% 에달했던에러율이 2017년에는 3% 내외로감소하였고 이는심지어인간의에러율( 약 5%) 보다낮은수준이다. 이러한발전에가 장기여한모형은 2012년경연대회에서 Krizhvsky et al.(2012) 이선보 인딥(deep) 콘볼루션신경망이다. 이들은콘볼루션신경망에딥러닝개 념을최초로도입하였으며그결과다른팀들보다무려 9% 포인트이상 에러율을감소시킬수있었다. 그들이개발한모형은전세계적으로딥러 닝열풍을불러오는계기가되기도하였다. 현재가장많이사용되는또다른머신러닝기술은인공신경망기반의 자연어처리기술이다. 애플이나구글, 아마존, 네이버, 카카오등국내외 내로라하는 ICT기업들은스마트폰또는인공지능스피커를통해가상비 서서비스를개발하고있으며이들은모두인공신경망을활용한자연어 처리기술을기반으로하고있다. 우리는이미가상비서를통해간단한 음성으로날씨를알아보거나음악을선곡할수있으며이동시목적지까 지가는길을물을수도있다. 심지어최근에는사물인터넷기능이탑재 된가전제품들이대거등장하면서음성으로전자레인지를돌리거나불을 켜고끄는등그활용도는날이갈수록확대되고있다. 특히인공신경망 모형을적용한자연어처리기술은외국어번역분야에서도획기적인발 전을일으켰다. 번역의정확도향상은물론오타또는새롭게등장하는 신조어도매끄럽게처리하는것이가능해졌다. 일례로구글브레인은자
36 4차산업혁명과자본시장 사의기존번역시스템을인공신경망형태로전환하여주요언어에서의 번역오류를 55~85% 줄였다고밝힌바있다. 이러한경험으로인하여 많은사람들은향후인간의삶이자연어처리기술을통해획기적으로변 화할것으로기대하고있다. 자연어처리는인간의일상생활언어를컴퓨터가처리할수있도록변 환시키는기술이며, 인공신경망은자연어처리에있어서가장우수한모 형으로인정받고있다. 그러나전형적인인공신경망모형에서는입력층에 서출력층으로한방향으로만정보가흐르기때문에문장또는단락의전 체문맥을고려하기가쉽지않다. 따라서자연어처리를위해서는통상 순환신경망(recurrent neural network) 이라불리는특수한형태의인공신 경망모형을활용한다. 순환신경망모형은정보의시퀀스(sequence) 를다룰수있도록설계 되었다. 즉, k번째음절에대한예측값을제시할때단순히 k번째입력값 만활용하는것이아니라전후의입력값을모두활용하여예측값을제시 하는식이다. 따라서순환신경망모형은자연어처리에서전체문맥을활 용하는데유용하게활용될뿐아니라이와유사한구조를가진시계열데 이터를처리하는데에도종종쓰인다. < 그림 Ⅱ-13> 순환신경망모형의개념 이미지인식과자연어처리를제외하면머신러닝에서가장활발하게쓰이는기술은이상탐지일것이다. 이상탐지는주어진데이터중에서흔
Ⅱ. 인공지능의활용 37 히나타나지않는비정상데이터를찾아내는기술이다. 예를들어 CCTV(Closed Circuit Television) 를통해특정구역을감시할때일상적인상황에서는경보를울리지않고비일상적인상황이감지되면자동으로관리자에게알려주는시스템을생각해볼수있다. 이를활용하면관리자는항시모니터를쳐다볼필요없이비정상적인상황이닥쳤을때만집중하여감시할수있으므로작업의효율성이크게증가한다. 이와유사하게온라인상에서서버에접속한모든사용자를지켜보는대신이상행동을보이는몇몇사용자에대해서만집중모니터링을실시하고필요시해당사용자의접근권한을자동으로축소하는사이버보안시스템도있다. 이와같이이상탐지기술은주로범죄예방및탐지와사이버보안, 그밖에도불공정거래및금융사기포착등에주로활용된다. 일반적으로이상탐지기술은비지도학습방식을활용한다. 대부분의데이터가정상이라고가정한다음, 정상데이터와다른특성을보이는데이터를비정상이라고탐지하는방식이다. 흔치는않지만지도학습을활용하는방법도있다. 사용자가각각의학습데이터에정상과비정상을표시한다음이를통해시스템을학습시키는방식이다. 비지도학습모형은정상에서벗어난데이터를비정상으로표시하지만지도학습모형에서는반드시그럴필요가없다. 때로는지도학습과비지도학습을결합한준지도학습을통해이상치를탐지하는경우도있다. 2. 자본시장에서의인공지능기술의활용 Citi(2018) 에따르면전세계금융회사의인공지능관련지출액은매 우높은수준이다. 2016년에이미 19억달러를투자하였으며이는전체업 종중 IT 업계에이어두번째로높은수준이다. 더욱이 2019년에는투자액 이크게늘어총 75 억달러에달할것으로전망하고있다.
38 4차산업혁명과자본시장 다른금융분야와마찬가지로자본시장에서도인공지능기술을도입하고활용하려는수요가점차늘어나고있음은명백하다. 본절에서는자본시장의각분야별로인공지능기술이어떻게활용되고있는지알아보고, 자본시장내플레이어들이어떠한노력을기울이고있는지그추세를살펴보고자한다. 가. 활용분야 본절에서는자본시장에서의인공지능기술의활용현황을다음의네 가지분야로구분하여각각살펴보았다. 첫째는자산운용분야에서의활 용이고, 둘째는신용평가부문, 셋째는챗봇을활용한업무효율화, 마지 막으로넷째는이상탐지분야에서의활용이다. 1) 자산운용 사실머신러닝은오래전부터자본시장에서자산가격을예측하는데쓰여 왔으며일정부분성과도있었던것으로여겨진다. 그러나글로벌 ICT기업 들이최근들어제공하는인공지능서비스만큼놀라울정도의혁신을보여 주지는못하였다. 머신러닝, 특히인공신경망모형이유독자산가격을예측 하는데에는그리신통치않았기때문이다. 머신러닝으로자산가격을예측하기어려운이유는다음과같다. 첫째, 과거학습데이터와미래현상간뚜렷한일관성이나타나지않는다. 인공경 망이크게성공을거둔이미지인식과자연어처리분야에서는과거학습 데이터와실제결괏값을예측하고자하는데이터가유사한특성을갖는 다. 예를들면, 고양이사진을포함한과거학습데이터와실제인식시키고 자하는고양이사진은모두공통적으로고양이를포착한사진이다. 고양 이의자세나사진을찍은각도, 주변배경은서로다를수있지만어쨌든 모두고양이를담고있다. 반면, 자산가격의경우과거분포와미래분포
Ⅱ. 인공지능의활용 39 가서로유사하리라는보장이전혀없다. 둘째, 금융시장에서는과거에없 던완전히새로운사건(event) 이수시로발생한다. 그렇기때문에과거 자산가격에영향을미쳤던요인들이향후지속적으로자산가격에영향을 준다하더라도, 수시로발생하는새로운이벤트로인해자산가격이예측 치로부터벗어날가능성이상당히높다. 셋째, 자산가격학습데이터는굉 장히많은잡음(noise) 을포함하고있다. 예를들어개별기업의주가는 기업의실적뿐아니라관련뉴스및소문에민감하게반응하고, 경기변 동과각종거시지표변화, 그밖에투자자심리(investor sentiment) 에도 영향을받는다. 인공신경망모형이복잡한문제를구현하는데장점을가 지긴하지만이렇게잡음이많이포함된데이터를학습하고유의미한패 턴을찾아내는것은결코쉬운일이아니다. 그럼에도불구하고금융권과학계에서는머신러닝을통해자산가격을 예측하려는시도가여전히활발하게이루어지고있다. 일례로 Moritz & Zimmermann(2016) 은개별주식의과거수익률이미래주식에어떠한영 향을미치는지머신러닝을통해살펴보았다. 이들은재무학에서주가예측을 위해전통적으로사용하는방식 18) 에비해자신들의결정트리기반머신 러닝모형이더욱우수한성과를보인다고주장하였다. 최근에는 Gu et al.(2018) 역시결정트리모형이나인공신경망모형을활용하였을때전 통적인방식에비해자산가격결정에있어획기적인성과개선을나타냈다 고밝혔다. 빅데이터의활용을통해자산가격결정모형의예측력이예전보다높아질 가능성도존재한다. 이미지인식과자연어처리등의인공지능기술은예 전에활용하지못했던비정형데이터를분석에활용할수있는정형화된 데이터로변환해준다. 예를들어인공위성이미지를분석하여특정기업의 주가에영향을미치는새로운정보를발굴할수있으며, SNS에서드러나 는소비자심리를분석하여특정제품이해당기업실적에미치는영향을 빠르게파악할수도있다. 전통적인데이터로포착할수없었던이러한정 18) 전통적으로는다중분류(multiple-sorting) 방식과 Fama-MacBeth 횡단면분석방식을주로활용해왔다.
40 4차산업혁명과자본시장 보는특히사람들의말과행동이중요한기초자료로쓰일수있는사회과 학분야에서더욱빛을발해미래예측력을크게향상시킬가능성이있다. 한편, 헤지펀드가제공하는데이터와플랫폼을통해자산가격을예측 하기위한경쟁이벌어지기도한다. WorldQuant 와 Numerai 등일부헤 지펀드들은직접개발한플랫폼을통해사용자가그안에서대규모금융 및경제데이터에접근하고이를활용해다양한매매전략을만들수있도 록하였다. 헤지펀드는이중에서성과가좋은매매전략을직접실행하고 사용자와수익을배분한다. 앞서이미지넷경연대회가인공신경망기반이 미지인식기술발전에크게기여하였듯, 이러한플랫폼을통한사용자간 경쟁이향후머신러닝에기반한자산가격발견에획기적인발전을가져오게 될가능성도존재한다. 헤지펀드업계에서는단순한지도학습이아니라알파고와같은강화학습 을이용하여수익을거두려는시도또한활발하게이루어지고있다. 현재까 지는뚜렷한진전이없는것으로보이지만언젠가는알파고와같이강화학 습을채택한시스템이금융시장에서도최적의매매전략을만드는날이올 수도있을것이다. 2) 신용평가 신용평가방법에는정량적방법과정성적방법이있다. 일반적으로대 규모자금을필요로하는중대형기업에대해서는정량적분석과더불어 애널리스트가직접해당기업의정성적인측면을분석하고신용도를평가 한다. 반면, 상대적으로소액자금을필요로하는소규모업체또는개인 대출자의경우애널리스트가일일이분석하기보다는대부분정량적평가 모형에기반하여신용등급이부여된다. 신용평가사가대출자의신용등급 을결정하기위해사용하는정량적정보는주로금융회사를통한거래또 는공과금납부및연체내역등으로한정되어있는데, 그러다보니해당 거래가많지않은대출자의경우실제상환능력과무관하게낮은신용등 급을받게된다는문제가있다.
Ⅱ. 인공지능의활용 41 이러한문제를해결하기위해신용평가시기존정량정보외에도대 출자의실제상환능력을확인할수있는각종빅데이터를추가로활용하 고자하는시도가이루어지고있다. 대표적인사례가미국의 Zest Finance 다. 이회사는구글 이 CIO(Chief Information Officer) 출신 Douglas Merrill 2009년설립한회사로기존신용평가사가전통적으로활용하는수십 가지의정량지표외에도수천개항목의빅데이터를추가로신용평가에 활용하고있다. 해당데이터는대출자의 SNS, 이메일, 문자메시지내역 등을포함하며이러한정보는대출자의행태, 사회적관계, 감정상태등 을반영한다. Zest Finance에따르면기존금융회사에서대출을받을수 없었던저신용자중상당수가빅데이터를통해충분한상환능력을입증하 여대출을받을수있게되었다고한다. 빅데이터를분석한신용평가는필연적으로인공지능의활용을수반하게 된다. 우선 SNS 와이메일, 문자메시지등빅데이터의상당부분은자연어 처리기술을필요로한다. 사용자의감정을파악하거나메시지의앞뒤문 맥을고려하여키워드를추출하는등의작업에서인공지능, 특히, 인공신 경망은필수다. 뿐만아니라전통적인선형(linear) 방식의모형으로는수 천개의항목을가지고있는빅데이터를효과적으로활용하기어렵다. 따 라서 Zest Finance를비롯하여빅데이터를신용평가에활용하는회사들은 정량분석을위해결정트리모형기반의랜덤포레스트 (random forests) 또는인공신경망등비모수(non-parametric) 구조를지닌머신러닝모형 을사용하고있다. 다만학습된머신러닝모형이신용평가결과에대해뚜렷한경제학적 근거를제공하지않는다는사실은단점으로꼽힌다. 인공신경망과같은 머신러닝모형은주로컴퓨터과학분야에서발전되어왔기때문에전통적 인경제학모형과는달리문제의원인을규명하기보다는문제의결과예 측에초점을맞춘다. 따라서알고리즘의발전은경제학적논리에기반하 기보다는결과의정확도향상을목표로해왔다. 그결과빅데이터를활용 하여더욱정확하게예측하는것은가능해졌지만왜그렇게되었는지설 명하는것은매우어려워졌다. 즉, 시스템이어떠한논리를통해해당신
42 4차산업혁명과자본시장 용등급을제시하였는지는알수가없는것이다. 이에따라향후문제가발생하였을때신용평가주체가왜그러한결정을내렸는지감독당국에설명하는것이어려우며, 누가법적책임을져야하는지도불분명해진다는한계를가진다. 이같은단점에도불구하고머신러닝기술을활용해더욱폭넓은빅데이터를활용하려는시도는계속해서나타나고있다. 특히금융거래정보가충분히축적되지않은개도국에서의활용, 새롭게부상하고있는 P2P(Peer to Peer) 대출서비스에서의활용가능성이크게높아지고있는상황이다. 3) 챗봇 앞에서언급하였듯인공지능을통한자연어처리기술은사물인터넷 확대와맞물려향후삶의방식을크게변화시킬것으로기대를모으고있 다. 가상비서또는챗봇을통해간단한명령어입력만으로쉽게일을처 리할수있는삶의영역이늘어나고있는것이다. 금융서비스도물론예 외가아니다. 인공지능시스템을통해소비자들은쉽고빠르게원하는금 융서비스를받을수있으며, 금융회사내부직원또한업무를더욱효율 적으로처리할수있게된다. 현재금융권에서는이와관련하여챗봇서비스쪽에많은공을기울이 고있다. 뱅크오브아메리카의챗봇서비스인 ERICA 가대표적인사례다. 고객은금융회사의웹페이지또는모바일앱이제공하는수많은기능을일 일이찾아볼필요없이챗봇을통해일상생활에서사용하는간단한명령 어를입력함으로써필요한서비스를받을수있다. 또한챗봇은고객개 개인의상황에기반한맞춤형서비스를제공할수도있다. 이러한이유로 일각에서는챗봇이기존웹페이지또는모바일앱의단점을보완하는새로 운금융상품판매채널역할을할것이라는관측도있다. 편리해지는것은 내부직원도마찬가지다. 통상금융회사는내부직원을위해사내용시스 템에몹시세분화된메뉴를구현한다. 워낙금융서비스의종류가많고
Ⅱ. 인공지능의활용 43 다양하다보니직원이이를모두숙지하기위해서는많은시간이필요하 다. 챗봇을활용하면이러한수고를줄이고간단한키워드또는문장만으 로원하는메뉴를쉽게찾을수있다. 뿐만아니라 수요일오후비는시 간에팀장님과회의약속잡아줘, 오늘오후에사용할회의실예약해 줘, 인사팀전화번호알려줘 등의간단한명령어입력을통해일일이 수행하기에번거로운작업을빠르게처리할수있다. 기본적인챗봇의원리는인공신경망을통한자연어처리기술과동일하 다. 다만금융회사가챗봇을활용하기위해서는금융서비스에특화된학 습과정이필요하다. 먼저각분야실무자에의해초기지도학습이수행되 어야하며이후로도충분한사용자확보를통해지속적으로학습이이루어 져야챗봇의기능을고도화할수있다. 향후 MRC(Machine Reading Comprehension) 와같이다량의문서를통째로학습할수있는고도화된 자연어처리기술이발전하면챗봇의활용도는더욱높아질것이다. 복잡 한금융상품약관이나자본시장관련법규등을모두챗봇이학습하여고 객및내부직원에게필요한내용을실시간으로제공할수있기때문이다. 4) 이상탐지 머신러닝을기반으로하는여러가지기술중이상탐지는특히자본시 장에서활용가능성이높다. 자본시장에서발생하는각종거래데이터를 효과적으로모니터링할수있기때문이다. 대표적인예로 2018년 5월한 국거래소는결정트리모형을활용한머신러닝기반의시장감시시스템을 구축하였다. 한국거래소는다양한변수를활용한강화학습을통해기존 시스템으로는적출되지않았던신종불공정거래유형을탐색하고연계계 좌를적출하는등의효과가있었다고발표하였다. 거래소의시장감시기 능외에도이상탐지기술은금융회사에서내부직원에의한각종사고를 방지하고내부통제를강화하기위해활용될수있다. 또한소비자의과 거거래패턴을학습하고이로부터현격히벗어난행위를포착하여금융 사고를최소화하는것도가능하다.
44 4차산업혁명과자본시장 한편이상탐지는금융시장및경제분석을위한데이터정제목적으로 도활용할수있다. 수많은데이터를다루는금융회사의특성상서로다른 데이터를결합하고활용함에있어서이상치나결측치, 중복값등이종종발 생하는데이상탐지기술은이러한부분을포착하여정제하는데큰도움을 준다. 나. 주체별동향 금융회사의규모또는성격에따라인공지능기술의활용양상은서로 다르게나타난다. 이미많은고객을보유하면서폭넓은서비스를제공하 고있는대형금융회사는대체로기존업무의효율을확대하고각종사고 방지및내부통제를강화하기위해인공지능기술을활용한다. 특히다 수의고객을상대하거나방대한자료를분석하는등많은인력이필요한 분야에인공지능기술을도입하여업무의효율성을높이려는경향이있 다. 예를들면앞에서언급했던챗봇서비스는기존콜센터를대신해다 수의고객을효과적으로응대할수있다. 또한로보어드바이저와같이자 동화된플랫폼을구축하고이에인공지능기술을적용함으로써많은인력 투입없이다수의고객에게저렴한비용으로투자자문서비스를제공할 수도있다. 갈수록교묘해지는사이버보안위협에대응하거나각종금융 사고탐지및내부직원모니터링에도인공지능기술은효과적으로적용 될수있다. 한편, 상대적으로규모가작은전문핀테크기업또는금융스타트업의 경우인공지능기술을적용해보다혁신적인금융서비스를개발하고자한 다. 예를들면 2013 년에설립된켄쇼(Kensho) 는자연어처리기술을적 용한금융시장분석엔진을개발하여사용자가일상언어로금융및투자 정보를손쉽게검색할수있도록하였다. 해당서비스는각종뉴스와기 업의공시정보, 주가정보, SNS 등다양한데이터로부터특정이벤트가주 가에미치는영향을빠르게포착하여분석결과를제공해준다. 또한켄쇼
Ⅱ. 인공지능의활용 45 는머신러닝기술을활용해 4차산업혁명관련 19개의세부테마로기업 을분류한신경제지수(new economies index) 를만들었으며국내에서도 이를추종하는펀드가출시된바있다. 전통적인업종분류방식으로정 의하기어려운로봇, 드론, 지능형교통등새롭게출현하거나사라지는 업종을머신러닝기술로찾아내지수화하는식이다. 2000 년에설립된디지털리즈닝 (Digital Reasoning) 은인공지능기술을 활용해내부직원의이메일, 메신저, 전화등을모니터링하여내부자거래 및기타부적절행위등을포착하는보안서비스를제공한다. 동서비스는 평소와유독다른직원의비정상행동을탐지할수있으며이메일이나메 신저등에서단순한키워드검색대신앞뒤문맥을고려한검색기능을 제공한다. 이회사는원래테러범죄와관련된메시지분석시스템개발 을전문분야로하였으나, 2012년거래감시시스템소프트웨어를판매하 기시작하면서금융업계와관계를맺었다. 현재자금세탁, 주가조작, 내부 자거래포착등폭넓은모니터링서비스를제공하고있으며골드만삭스, UBS, Nasdaq 등다수의금융회사들이이를활용하고있다. 마지막으로수준높은인공지능기술을보유한 ICT기업이이를활용하 여고객에게금융서비스를제공하려는추세도관찰된다. 인공지능을비롯 한각종 ICT 기술이모든분야에걸쳐워낙강력한파급력을가지고있다 보니, 해당기술에대한이해도가가장높은 ICT기업의금융서비스또한 높은경쟁력을가지게된것이다. Citi(2018) 에따르면고객들은금융거래 시기존금융회사들보다애플, 구글등대형 ICT기업을더욱신뢰하고있 는것으로나타났다. 해당기업들은풍부한자본력을보유하고있으며각종 온라인플랫폼을장악하여두터운잠재고객층을확보하고있다. 예를들 어, 페이스북은자회사인왓츠앱의메신저서비스를통해인도에서 2억 5천 만명의사용자를확보하고있으며이를기반으로계좌이체, 지급결제서비 스등금융서비스진출을본격화하고있다. 이들은자신들이가지고있는 대량의고객데이터를바탕으로효과적인마케팅을수행할수있으며플랫 폼내다른서비스와결합하여총체적인고객관리도가능하다. 이들은향 후인공지능을비롯한강력한 ICT 기술을장착하고보다적극적으로금
46 4차산업혁명과자본시장 융서비스를출시할것으로예상되며이는기존금융회사에큰위협으로 작용할전망이다. 3. 소결및시사점 인공지능기술은우리가공상과학영화에서보는것처럼인간을대신 해모든것을처리할수있는만능해결책이아니다. 이론적으로인공신 경망은어떠한복잡한함수라도근사하여모형화할수있지만, 복잡한문 제일수록많은수의뉴런을필요로하기때문에해당모형을학습하여현 실에적용하는데에는한계가있다. 현재인공신경망을통해학습가능한 최대뉴런수는수억개수준으로그마저도초당수백만와트에달하는 엄청난전기와방대한분량의저장공간을부담해야한다. 인간의신경망 이초당수십와트의에너지만가지고도 850억개의뉴런과이들을 3차 원으로잇는 100조개의시냅스를활용한다는사실을감안하면인공신경 망의활용도를인간과비교하기에는아직까지많이부족한상황이다. 그러나지금까지그래왔듯앞으로도학습데이터의기하급수적인증가, 알고리즘및하드웨어의꾸준한개선이이루어짐에따라인공지능의활용도 는지속적으로확대될전망이다. 우리는이미인공지능기술의적용이이미 지인식이나자연어처리등에있어얼마나획기적인성과를나타냈는지 확인하였으며, 이를적용한가상비서, 무인운송등의서비스가조만간우 리의삶을크게바꿔놓을것으로기대하고있다. 이와같이인공지능은각산업에빠른속도로적용되고있으며자본시 장도물론예외는아니다. 이미자산운용을비롯해신용평가, 챗봇, 이상탐 지등분야에서활용되고있으며향후인공지능적용분야는더욱다양해 질것으로전망된다. 주체별로대형금융회사는막대한운영비용을줄이 기위해인공지능기술을활용하고있으며, 상대적으로규모가작은핀테
Ⅱ. 인공지능의활용 47 크업체나스타트업등은인공지능을적용한획기적인서비스개발하는데 많은역량을쏟고있다. 기술적우위를지닌 ICT업체는그동안축적된고 객데이터를활용하여고객에기반한총체적인금융서비스를제공할것 으로예상된다. 이러한변화추세에대응하기위하여금융회사에서무엇보다필요한 것은양질의데이터확보다. 인공지능기반서비스의질은결국학습데 이터수준에의해결정된다. 향후인공지능을적용한서비스가점차늘어 날것으로예상되는만큼업계에서는인공지능기술에대한이해도를높 이는것은물론지금부터양질의데이터를최대한확보하려는노력이필 요하다. 가치있는데이터를발굴하고, 활용가능한형태로축적하며, 각 채널별로수집한데이터를전사적관점에서체계적으로관리해나가는것 이중요할것이다.
Ⅲ. 블록체인의활용 1. 블록체인개요: 개념및특성 2. 3. 4. 블록체인의문제점및대응 자본시장에서의블록체인기술의활용 소결및시사점
Ⅲ. 블록체인의활용 본장에서는 4 차산업혁명의두번째핵심기술로블록체인(blockchain) 을다룬다. 2008 년에비트코인(Bitcoin) 을구동하는기반기술로서세상에 등장한이후, 블록체인은세상을변화시킬수있는잠재력을가진파괴적 (disruptive) 기술로서많은관심의대상이되었고다양한분아에서의활 용가능성에대한논의와제안이쏟아졌다. 그러나 10여년의시간이경과 하면서초기의흥분(hype) 이진정되는가운데, 블록체인이갖고있는한 계와문제점들이드러나는동시에, 경제ㆍ사회전반에서블록체인의본격 적인활용은당초기대보다는상당히느리게진행되는모습을보이고있 다. 이에따라블록체인에대한관심역시변화하였다. < 그림 Ⅲ-1> 은가 상통화거래의급증에따라관심도역시올라가다가이후다시내려가는 모습을보여주고있다. < 그림 Ⅲ-1> 블록체인과비트코인관심도추이 (Google Trends) 120 100 Blockchain Bitcoin 80 60 40 20 0 Mar-13 Jun-13 Sep-13 Dec-13 Mar-14 Jun-14 Sep-14 Dec-14 Mar-15 Jun-15 Sep-15 Dec-15 Mar-16 Jun-16 Sep-16 Dec-16 Mar-17 Jun-17 Sep-17 Dec-17 Mar-18 Jun-18 Sep-18 주 : 구글검색빈도를이용한상대적관심도를나타낸다. 자료 : https://trends.google.com/
52 4차산업혁명과자본시장 특히자본시장에서는다수의자본시장플레이어들과스타트업들이자 본시장의가치사슬에블록체인을도입ㆍ활용하기위하여노력하고있으나 아직까지본격적인변화가감지되지는않고있다. 이러한블록체인의현 상황을고려하여본장은 Ⅱ장의인공지능과는다르게구성되었다. 먼저 1 절에서는블록체인의개념과특징을간략하게서술한다. 2절에서는그동 안드러났거나지적된블록체인의한계와문제점은무엇인지, 그리고그 에대한대응에는어떤것들이있는지를정리한다. 3절에서는대표적인 스타트업들과기타사례들을통하여금융, 특히자본시장영역에서블록 체인기술의활용현황을소개한다. 4절에서는향후전망및발전방향에 대한시사점을논의한다. 1. 블록체인개요: 개념및특성19) 가. 블록체인의개념및작동원리 블록체인은 디지털화된공개분산원장 (public distributed ledger) 에의 하여기록의무결성(integrity) 과신뢰성을확보하는컴퓨터네트워크기 술 이라고정의할수있다. 기존의방식에서는거래를승인하고, 거래내역 및그로인한자산보유의변화를원장(ledger) 에기록하여원장을업데이 트하며, 이원장을안전하게보관하는모든기능이단일의제3 자(third party) 에게집중되어있으며, 원장의무결성은제3자기관의신뢰성에의 존하는방식을취하고있다. 이와는달리블록체인은업데이트를포함한원장의관리와보관을제 3 자에게맡기는것이아니라, 컴퓨터네트워크상의모든참여자에게원장 19) 블록체인의개념, 작동원리, 특성은조성훈(2016) 에서상세하게서술하고있다. 본절에서는조성훈(2016) 의내용을압축ㆍ정리하여간략하게소개한다.
Ⅲ. 블록체인의활용 53 을공개하고, 참여자들이공동으로업데이트하고보관하는방식을취하는 P2P 형태의 탈집중화(decentralized) 된형태를갖는다. 블록체인은최초의암호화통화(cryptocurrency) 혹은가상통화(virtual currency) 20) 라고할수있는비트코인(Bitcoin) 을구동하는메커니즘으로 세상에처음등장하였다. 21) Satoshi Nakamoto라는미지의인물에의하여 만들어진것으로알려진비트코인은블록체인의원형(prototype) 으로, 이후 등장한다수의블록체인시스템들도모두비트코인의작동원리를거의동 일하게따르고있다. 통화( 혹은화폐) 가통화로서기능하기위해서는 이중지불(double spending) 의문제, 즉소유하고있지않은돈으로구매대금을지불하거 나소유하고있지않은재화를파는행위의가능성을완전하게봉쇄해야 한다. 실물화폐에서는한번지불을해버리면더이상화폐가없기때문에 이중지불의문제는자연스럽게해결된다. 그러나가상통화는그렇지않기 때문에다른방법에의한해결이필요하다. 즉, 각참여자가보유하고있 는가상통화의수량과그변동사항을정확하게원장에기록하고, 그원장 이변조되지않도록보관하는것, 즉원장의무결성을보장하는것이실 물화폐에서보다훨씬더중요하다. 블록체인은전술한바와같이원장의관리와보관을 노드(node) 라고 하는블록체인네트워크참여자들이공동으로담당한다는점이가장큰 특징이다. 상호간에누군지도모르고신뢰도없는노드들사이에서정직 하고정확하게원장의관리가이루어지도록하는것은 합의알고리즘 (consensus algorithm) 에의하여해결하였다. 즉, 사전에프로그래밍된 절차( 알고리즘) 에의하여거래가승인되고, 승인된거래가원장에기록되 고, 기록된원장의정확성이전체노드들에의하여검증되고승인되도록 하는것이다. 20) 다양한명칭이사용되고있으나, 본보고서에서는천창민ㆍ배승욱 (2018) 을따라 가상통화 라는명칭을사용한다. 21) 비트코인은년월일최초의블록이채굴되면서작동을 2009 1 3 (genesis block) 시작하였다.
54 4차산업혁명과자본시장 비트코인에서사용되는합의알고리즘은 작업증명(proof of work) 이 라고불리는절차이다. 비트코인네크워크상의노드들은비트코인을이 용한거래들을모아기록ㆍ저장하는 블록(block) 을생성한다. 이때생성 된블록이정확하고정직하게기록된거래내역을담고있음을입증하여야 하는데, 이를위하여비트코인시스템에서는특정조건을만족하는정수 값 22) 을찾는과제를자동적으로부과한다. 정수값은근의공식을이용하 여방정식을푸는것과같은방식으로는찾을수없고, 오직맞는값을 찾을때까지수많은값을반복적으로입력하는시행착오방식으로만찾을 수있다. 작업증명이갖는특징의하나는과제를해결하는것, 즉정수값 을찾는것은어렵지만, 찾아낸정수값이정말로맞는값인지를검증하는 것은매우간단하다는것이다. 따라서어떤노드가가장먼저해당정수 값을찾았을때, 즉작업증명을해결했을때다른노드들은그값이맞는 값인지의여부를검증하고검증이끝나면그블록은정확한거래기록을 담은블록으로승인된다. 그리고그직전까지의블록체인( 원장) 에연결되 어원장을업데이트하고, 업데이트된원장은전세계의노드들에의하여 공유된다. 23) 작업증명은하나의블록체인시스템이제대로작동하도록하는가장 핵심적인장치이며, 작업증명을해결하기위해서는상당한컴퓨터연산능 력과전력등비용과노력이투입된다. 따라서노드들이작업증명을수행 하게하기위해서는유인의제공이필요하며, 비트코인에서는작업증명이 해결될때, 즉새로운블록이만들어질때마다그노드에게비트코인을 신규로발행하여지급한다. 2018년 10월현재블록 1개생성에대하여 12.5 비트코인을지급하도록되어있으며, 이러한보상은약 21만블록 ( 약 4 년) 마다 1/2 로감소하도록설계되어있다. 작업증명의과정을흔히 채굴(mining) 이라고부르는것은작업증명의성공에의하여새로운비트 코인이발행되는것을땅속에새롭게금을캐내는것에비유한데그뿌 리를두고있다. 22) 이정수값을 논스(nonce) 라고한다. 23) 블록체인 이라는이름은 블록(block) 의 연결(chain) 이라는의미에서유래하였다.
Ⅲ. 블록체인의활용 55 1 비트코인가격을 6,000달러라고가정하면 12.5 비트코인은 75,000 달러에해당한다. 이보상을얻기위하여전세계의노드들은치열한채 굴경쟁을전개하고있다. 그리고막대한채굴설비, 즉컴퓨터연산장비 를구축하고, 채굴풀(mining pool) 을형성하는등경쟁에서이길확률을 높이기위한노력을경주하고있다. 블록체인의또하나의특징은원장에기록되는거래내역, 원장( 즉블록 체인) 을구성하는개별블록들간의연결구조등원장의관리와업데이 트전과정에걸쳐서고도의암호화(cryptographic) 기법이사용되고있 다는점이다. 비트코인을비롯한블록체인에서는일방향(one-way) 해시 함수(hash function) 를사용하여거래당사자및거래내역등을암호화하 여원장에기록하며, 해시함수의출력값으로부터원래의입력값을알아내 는것은거의불가능한것으로알려져있다. 또한한블록의헤더 (header) 에는바로전블록의해시값이포함됨으로써한블록의정보가 변경되면그블록및이후모든블록의해시값이모두달라지도록설계되 어있다. 나. 블록체인의진화 비트코인이세상에등장한이래 10여년의시간동안다수의블록체인 시스템이등장하였다. 비트코인은누구나공유할수있는 open source 로만들어졌기때문에, 이를이용하거나참고하여새로운블록체인시스 템을만들어낼수있다. 비트코인은 비트코인을이용한거래에따른비트 코인의소유변동을원장에기록하고관리하는 단일기능을수행하는블 록체인시스템이다. 이에서한발더나아가보다다양한기능을탑재, 수 행할수있는발전된형태의블록체인시스템이구현되기시작하였으며, 이중에서가장널리알려진것이 Vitalik Buterin에의하여 2014년에등 장한이더리움(Ethereum) 이다.
56 4차산업혁명과자본시장 이더리움은 이더(ether) 라는이름의가상통화를비트코인에서와동일 한과정을거쳐발행ㆍ유통할뿐아니라, 블록체인을기반으로한어플리 케이션을그위에서구동할수있도록한보다일반화된(generalized) 블 록체인이라고할수있다. 24) 즉블록체인을이용하여어떤어플리케이션 이나서비스를제공하려는주체는자신이직접노드들을포함한블록체인 네트워크를구성할필요없이블록체인위에서구동되는코드( 즉어플리 케이션) 를개발하여이더리움에올려놓으면된다. 이런방식으로구동되 는프로그램으로가장대표적인것이 스마트계약(smart contract) 이다. 2015년이후발행이증가하기시작한각종코인ㆍ토큰등가상통화중 상당수가이더리움을플랫폼으로하여발행되었다. 다. 블록체인의특성 블록체인은전술한바와같은네트워크구조및작동원리에따라다음 과같은몇가지의경제적ㆍ기술적특성을갖는다. 그리고블록체인을만 들고발전시켜온주역들은이특성들이기존의제3자기관집중형시스 템과비교할때블록체인의강력한장점으로작용한다고주장하고있다. 그첫번째특성은탈집중화(decentralization) 다. 제3자에게원장의 관리가맡겨지고, 원장의무결성은제3자에대한신뢰에전적으로의존하 는기존시스템과는달리, 블록체인에서는모든네트워크참여자들이원 장의관리에동등하게참여하고, 시스템의신뢰는작업증명과같은합의 알고리즘에의하여확보된다. 또한시스템전체를지배하거나통할하는 단일의의사결정주체는존재하지않으며, 시스템의운영과관련된중요 한의사결정역시참여자( 노드) 들간의합의에의하여내려진다. 아울러 탈집중화및노드들간의 P2P 구조에의한직접연결에의하여시스템 내부의투명성이제고된다. 기존시스템에서는제3자에의하여관리되는 원장이다른참여자에게공개되지않기때문이다. 24) Buterin(2014) 에서도 decentralized application platform 이라는표현을사용하고있다.
Ⅲ. 블록체인의활용 57 이와같은탈집중화의추구는다분히이념적인측면을상당히포함하 고있다. Satoshi Nakamoto 를비롯한블록체인의선도자들, 그리고옹호 자들의상당수가기존의제3자집중시스템에대한불신을갖고있는것 으로보인다. Nakamoto(2008) 와같이중앙은행에의한화폐발행독점에 대한불신, 블록체인기반의투표플랫폼이투표관리를담당하는기관에 의한, 혹은그기관을지배하는정치권력에의한투표조작을원천적으 로막을수있기때문에우월하다는주장 (Garner, 2018; Liebkind, 2018) 이대표적이다. 그리고이것은비트코인이나이더리움과같은개방 형(public) 블록체인이갖는특성이며, 후술하는폐쇄형혹은사적(private) 블록체인에는해당되지않는부분도있다. 블록체인이갖는특성이면서강점으로가장많이언급되는것이보안 성및안전성이다. 이는블록체인이라는공개원장에대한보안성을가리 키는것으로서, 작업증명을거쳐블록체인에기록된거래는변조하거나 취소할수없다는것을의미한다. 그리고이러한보안성은블록체인이갖 는몇가지구조적특징에그근거를두고있다. 우선원장이한군데가아닌모든참여자들에게공개되고분산저장된 다는것은이중에어느한참여자의원장을해킹하여기록을변조하거나 원장자체를파기하더라도다른참여자들이보관하고있는원장이있기 때문에문제가되지않는다는것이다 (no single point of attack). 블록체인의보안성을담보하는또하나의장치는블록의연결구조다. 전술한바와같이블록체인내각블록의헤더에는전블록헤더의해시값 이포함된다. 따라서블록체인내어느한블록의거래기록이변조되면 그블록의헤더가바뀌고그에따라블록헤더의해시값이바뀌고, 이후 모든블록들의헤더해시값이바뀌게된다. 따라서특정기록을변조하기 위해서는그기록이담겨있는블록뿐아니라이후모든블록의헤더해 시값을다시찾아변조해야하며, 동시에이모든작업을새로운블록이 생성되어블록체인이업데이트되기전 25) 에완료해야한다. 이론적으로단 25) 비트코인의경우분이다블록생성속도가빨라질수록기록변조는더욱어려 10. 워질것이다.
58 4차산업혁명과자본시장 일의주체가블록체인시스템전체의 hashing power, 노드가투입하는채굴을위한컴퓨터연산능력전체의 즉시스템의각 51% 이상을완전 히장악ㆍ통제하는경우블록체인의기록변조가가능한데( 이를 51% attack 이라한다.), 비트코인의경우네트워크의규모및투입되고있는 연산능력의크기를고려할때그럴가능성은매우낮다는것이블록체인 의보안성및안전성의근거로제시되고있다. 블록체인의강점으로주장되는또하나의특성은경제성ㆍ효율성이다. 제3자가존재하지않고거래당사자간에 P2P로거래가이루어지기때문 에거래완결을위하여거쳐야하는경로가짧아지고, 거래완결까지소 요되는시간을대폭단축할수있다. 또한거래완결에수반되는비용을 크게줄일수있는데, 이는원장관리를위한제3자기관을만들고유지 하는데드는비용및이기관에지불하는수수료등이필요없게되기때 문이다. 2. 블록체인의문제점및대응 비트코인의등장이후전세계는블록체인에열광하였다. 인터넷이후 세상을바꿀수있는가장파괴적기술중하나라는평가와함께비트코 인과같은가상통화를통한지급수단의제공에서출발하여, 금융, 물류, 각종공적기록의보관으로부터나아가정치과정에이르기까지매우다양 한분야에서의활용가능성이제시되었다. 그러나새로운기술이세상에 등장할때전형적으로나타나는초기의흥분(hype) 이가라앉고, 보다냉 정하게블록체인기술을평가하게되면서블록체인이갖고있는한계와 문제점들이노출되기시작하였다. 동시에이에대한대응으로이문제점 들을해결하기위한다양한노력이나타났으며, 현재도진행되고있다.
Ⅲ. 블록체인의활용 59 가. 블록체인의특성관련문제점과대응26) 1) 문제점 블록체인이갖는기술적한계와관련하여가장많이제기되는것은 scalability 라고불리는거래처리용량(capacity) 혹은속도의문제이다. 비트코인의경우 10분마다 1 개의블록이생성되며, 1개의블록에는수백 건에서수천건의거래가기록된다. 이러한거래처리속도는대부분의제 3 자기관이보유한집중형시스템의거래처리속도와비교할때현저하게 느린것으로, 신용카드사용이나주식거래와같이 1초당수만건이상의 거래가이루어지는곳에서는블록체인을사용하기곤란하다. 비트코인이 후새로운채굴알고리즘의개발등지속적인노력으로블록체인플랫폼 의거래처리속도는상당한수준으로개선되었으나, 모든거래가개별적 으로승인되고블록에기록되는순수한 P2P 블록체인플랫폼이제3자기 관에집중된기존시스템( 플랫폼) 의거래처리속도를따라잡을가능성은 높지않다. 그리고거래처리속도의향상을위한시스템의업그레이드도 블록체인에서는개별노드의자발적업그레이드에의존해야하고, 노드별 로상당한성능차이가존재할수있음에비하여기존시스템에서는시스 템운영에필요한하드웨어와소프트웨어가제3자기관에집중되어있기 때문에훨씬간단하게업그레이드가이루어질수있다. 주식시장거래시 스템을블록체인기반으로구성하려는시도가상장기업을대상으로하는 공적시장(public market) 이아니라비상장기업을대상으로하는사적시장 (private market) 에서먼저시도된것도이문제와관련이있는것으로 보인다. 27) 26) 본소절의내용은다음을참고ㆍ정리한것이다. BIS Annual Economic Report(2018), Carstens(2018), Digital Trends(2018), Economist(2018), MIT Technology Review(2018), 조성훈 (2018) 27) Nasdaq-Linq 가대표적사례이다.
60 4차산업혁명과자본시장 다음으로제기되는문제는블록체인의작동을위하여, 특히가장핵심 적인작동메커니즘이라고할수있는작업증명( 혹은채굴) 을위하여지 나치게많은자원이투입되고낭비된다는것이다. 블록체인의중요한강 점의하나로경제성ㆍ효율성이언급되고있는데, 이는주로제3자기관이 존재하지않기때문에이에수반되는비용이발생하지않는다는점에기 인한경제성ㆍ효율성을가리키는것으로보인다. 그런데이부분은정확 하게는이비용을전세계의자발적인네트워크참여자들에게분산시킨 것으로보아야할것이다. 즉, 블록체인은기존시스템에서제3자기관이 집중해서담당하던거래처리및원장관리를위한자원을전세계의네 트워크참여자들로부터 crowdsource 하는것으로볼수있으며, 이는상 당한비효율의가능성을내포하고있다. 작업증명에는전세계의수많은 노드들이경쟁하고있는데, 이과정에서막대한컴퓨터연산능력과전력 이투입되며, 여기에작지않은크기의원장파일28) 을수많은노드들이 동시에업데이트하고보관하는과정에서발생하는데이터트래픽등을고 려하면하나의블록체인시스템을유지하기위하여투입되는자원의합은 제3자기관이존재하는기존시스템에서소요되는자원의합보다클가능 성이높다. 또한작업증명에성공하여비트코인( 혹은다른가상통화) 을획 득하는노드는단하나이며, 나머지수많은노드들이투입한컴퓨터연산 능력과전력은그대로소비되어버려진다. 한추정에의하면비트코인의 작업증명에서소비되는전력은연간 22~73 TWH(TeraWatt-Hour) 이며 73 TWH 는오스트리아국가전체의전력소비와비슷한수준이다. 여기 에이더리움에서또다시 21 TWH 의전력을소비한다(de Vries, 2018). 블록체인에대하여제기되는세번째문제점은보안성ㆍ안전성에대한 의문이다. 우선블록체인의탈집중화된구조, 블록의연결구조, 암호화 기법에의하여담보되는보안성은원장의변조가능성을봉쇄하여무결성 을확보한다는의미에서의보안성이다. 가상통화와같은암호화된자산의 거래에참여하는개인이나중개기관 29) 이자신의자산을보관하는디지털지 28) 년월말현재비트코인의원장파일크기는약기가바이트이다 2018 9 185. (https://www.blockchain.com)
Ⅲ. 블록체인의활용 61 갑의보안성은이와는별개의문제이다. 디지털지갑개인키의유출이나해 킹에의한도난은블록체인의구조에의하여방지되지않으며, 실제로다수 의해킹사례가보도되고있다. 더욱이코인이나토큰과같은암호화자산 거래참여자와중개기관간의거래는대부분블록체인상에서이루어지지 않으며, 중개기관자체의보안능력에의존하고있다. 또한점차로블록체인 자체의보안성, 즉원장의무결성에대한의문도제기되고있다. 일각에서 는합의알고리즘의안정성에대한의문을제기하고있으며( 송수영, 2018), 전세계적으로채굴능력의집중화가급속도로진행되면서 실제로발생할가능성이존재한다는우려를제기하기도한다. 30) 51% attack 이 최근국 제결제은행(Bank of International Settlement: BIS) 은기술( 즉합의알고 리즘) 을통하여신뢰를확보하거나대체할수없다는입장을표명한바 있다 (BIS, 2018; Carstens, 2018) 탈집중화라는블록체인의핵심특성은필연적으로지배구조 (governance) 의문제를야기하게된다. 명확한리더십이없는순수한개방형블록체인에 서는시스템혹은플랫폼의운영과관련된제반문제를누가책임지고, 의 사결정은어떻게할것인지가불분명하게되고, 이는어떤문제에봉착했을 때의사결정및대응을느리고비효율적으로만드는요인이될수있다. 31) 29) 가상통화의경우흔히 거래소 로일컬어지고있으나, 본보고서에서는천창민ㆍ배승욱(2018) 을따라 중개기관 이라는용어를사용한다. 30) Economist(2018) 는탈집중화를추구하여블록체인이만들어졌음에도불구하고, 실제로는채굴능력, 가상통화보유, 가상통화거래중개( 거래소) 의세가지측면에서집중화가지속적으로진행되고있음을지적하고있다. 31) 물론여기에도이념적측면이존재한다. 의사결정의비효율성보다탈집중화및참여자간의합의를중요하게생각하면계속적으로순수한개방형블록체인에가치를부여할것이고, 실제활용에있어서의편의성및의사결정의신속ㆍ효율성을중요하게생각하면탈집중화를일부포기하더라도명확한리더십이존재하는형태를선택할것이다.
62 4차산업혁명과자본시장 2) 대응 이상에서정리한블록체인이안고있는문제점들을해결하려는다양한 시도가이루어졌다. 이중에서첫번째로꼽을수있는것은비트코인을 비롯한대부분의블록체인네트워크가채택하고있는 작업증명 이라는합 의알고리즘이갖는느린거래처리속도, 과도한전력소비라는문제를해 결하기위하여다양한대안적합의알고리즘이등장혹은제안되었다는것 이며, 그중에서가장대표적인것이 지분증명 (proof of stake) 이다. 32)33) 작업증명에서는전세계의노드들이경쟁적으로채굴에참여하며, 컴 퓨터연산능력이클수록이경쟁에서승리하여비트코인을획득할확률이 커진다. 이에비하여지분증명에서는각노드가보유하고있는지분 (stake) 에따라새로운블록을생성할수있는노드를선정하고선정된 노드가단독으로블록을생성한다. 지분 은존재하고있는전체가상통화 총량(coin-age) 중에서특정노드가보유하고있는가상통화의비중으로 정의된다. 예를들어 3% 지분을보유하고있는노드가블록생성노드로 선정될확률은 3% 가된다. 블록생성노드는작업증명에서와동일하게 자신이생성한블록을전세계노드들에게전송하여검증및승인절차를 거치게되며, 이절차가진행되는동안다음블록을생성할노드가선정 된다. 만일블록에부정확하거나조작된기록이포함되어승인이거절된 경우, 그리고노드가공개한자신의지분이거짓으로밝혀질경우에는그 노드가보유한가상통화지분전액을몰수하도록되어있다. 지분증명은 King(2012) 에의하여최초제안되었으며, PeerCoin이지 분증명을채택한최초의가상통화로알려져있다. 작업증명과비교할때 실제채굴( 블록생성) 을진행하는노드는하나이기때문에나머지노드들 에의한전력소모를줄일수있고, 처리속도도향상시킬수있다. 그러나 상대적으로작업증명에비하여보안성에대한우려는더커진측면이있 32) 지분증명외에제안된합의알고리즘으로는 Designate PoS(dPoS), Proof of Activity, Proof of Burn, Proof of Capacity 등이있다. 33) 지분증명에관한서술은다음을참고하였다. King(2012), Norman(2017), Investopedia(a)
Ⅲ. 블록체인의활용 63 다. 작업증명에서의컴퓨터연산능력의집중보다가상통화보유, 즉지분 의집중도가높고, 또집중도를높이는것도훨씬쉽다. 따라서단일의노 드가전체블록체인을지배할가능성이작업증명에서보다더높다는것이 일반적견해이다. 따라서아직까지유통량이많고어느정도안정적평판 을확보한가상통화블록체인중에서지분증명을채택하고있는곳은없 는것으로알려져있다. 34) 블록체인플랫폼의거래처리속도를높이기위하여이루어진다른방 향에서의시도는블록 1 개의크기를확대하는것이다. 블록의크기가확 대되면 1 개의블록에담길수있는거래의수가증가하고, 따라서블록에 담기지못하고다음블록이생성될때까지기다려야하는거래의수가줄 게되며, 이를통하여거래및블록의승인속도를높일수있다. 그런데 블록의크기를확대한다는것은블록체인의기본코드( 프로그램) 를수정 한다는것을의미하며, 이는매우중대한변화이다. 35) 비트코인과같은 명확한리더십이없는개방형블록체인에서이와같은코드수정을하기 위해서는참여노드들의동의가있어야한다. 블록체인에서기본코드또는프로토콜(protocol) 을수정하는것을 포 크(fork) 라고한다. 코드나프로토콜이수정된블록체인시스템은기존의 것과는완전히별개의시스템이된다. 결과적으로포크가발생하게되면 두개의블록체인시스템( 기존코드에의한것과수정된코드에의한것) 이일시적혹은영구적으로존재하게된다. 36) 블록크기의확대를위하여이루어진대표적인포크의사례는비트코 인으로부터 비트코인캐시(Bitcoin Cash) 가분리된것이다. 비트코인의 거래처리속도향상을위하여 1개블록의크기를 1 메가바이트에서 8 메 가바이트로확대하는코드수정이제안되었고, 이제안의채택여부를놓 고오랜기간노드들간의논쟁이전개되었다. 결국완전한합의에이르 34) 2017년 5 월, 이더리움의창시자 Buterin은이더리움의합의알고리즘을작업증명에서지분증명으로전환할것을검토ㆍ추진할것이라고발표하였으나 (Buterin, 2017; Investopedia(b), 2017), 최근까지전환완료발표는없는상태이다. 35) 합의알고리즘의변경역시중대한코드의수정이다. 36) 포크에관한서술은 Cointelegraph 와 Investopedia(c) 를참고하였다.