디지에코보고서 Issue&Trend 2017.04.04 4 차산업혁명을이끄는인공지능 - 딥러닝을중심으로 kt BigData Project-TF, 류성일 (ryu0121@kt.com) I. 인간의마지막자존심, 바둑을넘어선인공지능 II. 딥러닝 : 더인간처럼, 그리고인간을넘어 III. 인공지능의핵심경쟁력, 빅데이터 IV. 인공지능이할수있는일 V. 인공지능, 축복인가위협인가 알파고의등장으로요원할것만같았던인공지능의시대가한발더가까워졌다. 인공지능은바둑, 안면인식등많은분야에서사람의능력을뛰어넘고있다. 최근에는극본이나작곡등창작의영역에도인공지능의참여가이어지고있다. 최근인공지능의놀라운성취는바로딥러닝기술의등장때문이다. 본보고서에서는딥러닝이란무엇이며어떤과정으로작동하는지기본원리를살펴보았다. 그리고딥러닝을비롯한인공지능기술이발전할수있었던배경에대해알아보고, 4차산업혁명이후인공지능과함께살아갈인류의모습에대해고찰해보았다.
I. 인간의마지막자존심, 바둑을넘어선인공지능 1) 알파고의등장바둑은기계가이길수없는인간의마지막자존심의영역이었다. 이러한믿음은구글의알파고에의해무너졌다. 2016년 3월구글-딥마인드의 알파고 가상금 100만달러를내걸고이세돌 9단과 5차례대국을벌였다. 승리를믿어의심치않았던인간대표이세돌은 4:1로패배하고말았다. 이는바둑계는물론인공지능을연구하는전문가에게도충격으로다가왔다. 과거딥블루가체스에서모든경로를탐색하는무차별계산으로체스를정복하였지만바둑에서는이방법이통하지않는다. 바둑은체스나장기와는다르게수의경우가너무많아지금도모든경우의수를검토하는것은불가능하기때문이다. 때문에바둑에서는오랜시간연구하면서얻은인간의숙련된직관이반드시필요하다고믿었다. 보통사람이아무리바둑책을읽어도단시간내에프로기사의직관을이해할수는없다. 그래서바둑에서프로 9단을 입신의경지 라고한다. 그런데인공지능 알파고 는태어난지 3년만에그직관을이해하고마침내바둑을정복해버렸다. 2) 인공지능시장전망알파고의등장으로요원할것만같았던인공지능의시대가한발더가까워졌다. 이제우리는인공지능을필두로한 4차산업혁명의문턱에왔다. 학계와산업계를비롯하여전사회적관심도인공지능에집중되고있다. 글로벌시장분석기관 Tractica는인공지능시장의매출규모는 2016년 6.4억달러에서 10년후 2025년에는 368억달러로성장할것으로예측하였다. 그중누적매출이가장큰분야는정적이미지인식 / 분류 / 테깅으로총 80억달러이며, 2위는알고리즘트레이딩분야로총 75억달러에달할것으로보았다. 인공지능세계시장규모전망인공지능분야별시장규모 (2016~2025 누적 ) 출처 : Tractica(2016), ipnomics 재인용 출처 : Tractica(2016) 1
미국경제전문지포브스 (Forbes) 는향후 Top 10 인공지능기술로, 자연어생성, 음성인식, 가상에이전트, 머신러닝플랫폼, AI 최적화하드웨어, 의사결정, 딥러닝플랫폼, 생체인식, 로봇자동화프로세스, 텍스트분석및자연어처리를제시하였다. 조사기관포레스터리서치는 2017년부터 5년간일반인들의삶에가장큰변화를가져올 5대혁신기술중하나로인공지능과지능형에이전트를꼽았다. 이처럼여러분석기관에서인공지능기술의시장성및중요성을역설하고있다. 3) 인공지능의변천사 : 단순제어에서딥러닝까지인공지능이미칠영향과관련미래전략을논하기에앞서, 먼저그역사와내용에대해알아볼필요가있다. 인공지능 (AI) 이라는표현은 1956년미국다트머스대학의컴퓨터사이언스워크숍에서처음등장했다. 이때세계석학들이모여인간처럼생각하는기계를 인공지능 이라부르기로하였다. 간혹인공지능을로봇분야와혼동하여사용하기도하는데, 엄밀하게이둘은서로구분되어야한다. 로봇의두뇌에해당하는것이인공지능이며, 로봇에는그외기계제어, 전자제어등다양한분야의기술이사용된다. 인공지능의대상은단지로봇의뇌뿐만이아니다. 바둑의알고리즘을구현한다거나주식시장에서매매계획을세우는등의활동은특별히로봇의물리적인신체가필요하지않는분야이다. 로봇과인공지능의영역 알파고 가바둑을학습하는데이용된기술은바로딥러닝 (Deep Learning) 이라고하는인공지능방법론의하나이다. 지금의딥러닝기술이구현되기까지수많은연구와다양한기법들이소개되었다. 과거 1세대인공지능은가전제품에구현되는단순한제어프로그램수준에지나지않았다. 이기술은빠짐없이규칙이정해져있어서그대로수행되는구조이므로, 간단한작업밖에는할수없었다. 그후경로탐색과 DB 서치등을활용한 2세대인공지능이나왔다. 많은정보와규칙을두꺼운시나리오북으로미리준비하고탐색하는방식으로전문가시스템이라고도한다. 그후머신러닝으로대변되는 3세대인공지능시대가열렸다. 머신러닝이란전문가시스템처럼처음부터방대한규칙을 2
준비하는대신, 컴퓨터가스스로어떤판별이나예측비법을익히게하는것이다. 지금의 4세대인공지능은딥러닝으로대표된다. 딥러닝은기존신경망분석 (NN) 의발전된형태로써더추상화된고급지식을익힐수있다. 3세대의머신러닝에서는데이터를어떻게추상화하여로직을찾을지를인간이정해서알려주어야했다. 그러나 4세대의딥러닝에서는데이터를변형하고살피는인사이트조차도기계가스스로찾는다. 인공지능분야의발전단계 1세대 2세대 3세대 4세대 시기 ~ 1980년대 ~ 1990년대 ~ 2000년대 2010년대 ~ ( 현재 ) 방법 단순제어프로그램 경로탐색 / DB 검색 머신러닝 ( 기계학습 ) 딥러닝 (Deep Learning) 특징 - 전문가 ( 사람 ) 에의해제어알고리즘작성 - 기계 / 전기제어프로그램을탑재 - 제어공학 / 시스템공학 - 모든경우의수를탐색하는탐색트리 - 구축된 DB를통해정답을검색 - 전문가시스템 - 입력데이터를바탕으로규칙이나지식을스스로학습 - 로지스틱, D-Tree, SVM, 인공신경망 - 깊은인공신경망 - 추상화된특징표현 (Feature) 을알아냄 - 신경망에합성곱연산, 순환연결등기법추가 [ 자동세탁기 ] [ 딥블루 ] 체스정복 (1997) [ 문자 / 패턴인식 ] [ 알파고 ] 바둑정복 (2016) 사례 출처 : 마쓰오유타카, 인공지능과딥러닝 (2016), 재구성 이처럼인공지능의적용범위와방법론은역사적으로진화를계속해왔다. 과거에는첨단의인공지능으로분류되었던기술과제품들이시간이지나면서인공지능의지위를잃기도한다. 1980년대는세탁기에서세탁물의무게를인식하여세탁조에담을물의양이조절되거나, 세척과탈수코스가자동으로수행되는기술을인공지능이라고불렀다. 1997년인간체스 1인자를꺾은딥블루는탐색트리로모든경우의수를검토하여체스를두었다. 그러나지금은이런수준기술을더이상인공지능이라부르지않는다. 마찬가지로지금최고의인공지능방법으로부상한딥러닝도언젠가는마치 PC에서문서를작성하는행위처럼당연하고일상적인일로치부되는시대가올지모른다. 그때는더진보한기술이다음세대의인공지능패러다임을이어갈것이다. II. 딥러닝 : 더인간처럼, 그리고인간을넘어 1) 인간의뇌를흉내내다인간의뇌는뉴런 (neuron) 이라고부르는신경세포의네트워크로구성되어있다. 연결된뉴런가지들의결합부위를시냅스라고부른다. 시냅스에서는전기적자극이임계치를넘지 3
못하면신경전달물질이발화하지않고, 임계치를넘으면신경전달물질이발화하여뉴런사이에신호가전달된다. 이런복잡한얼개속에서기억이나지성이발현된다. 퍼셉트론 (Perceptron) 1 은인간의뉴런을수학적으로모방한계산알고리즘으로인공신경망과딥러닝의토대가된다. 하나의퍼셉트론은여러개의입력신호 (x 1,2,,n ) 에각각의가중치 (w 1,2,,n ) 를곱하여합산한후, 이를활성함수 (Active Function) 에넣어계산하고, 그값을출력신호 (y) 로내보낸다. 활성함수로는간단한직선함수, 구부러진곡선함수등필요에따라선택된다. 사람의뇌-신경계와퍼셉트론비교 단위구조 신호전달 사람의 신경세포 ( 뉴런 ) 퍼셉트론 수학적으로처리활성함수 (Activation Function) 의계산결과를전달. 활성함수는간단한직선, 구부러진곡선등으로선택. 퍼셉트론에서주로사용되는활성함수 Sigmoid 함수 tanh 함수 ReLU 함수 퍼셉트론을 2 개이상의층으로쌓아서다층퍼셉트론 (MLP: Multi-Layer Perceptron) 을 구성하면복잡한형태의방정식을표현할수있다. 이러한식을분류및예측로직으로 사용할수있는데, 이를인공신경망모델이라고한다. 아래표는스팸메일을판별하기위해 1 1957 년코넬대로젠블래트교수가발표한개념으로인간의뉴런을수학적으로모방한계산알고 리즘 4
6 개의입력변수를받아 2 개의층으로연결되는심플인공신경망모델을구성한예이다. 수식에포함된가중치들 (w n ) 은머신러닝으로학습하여얻어진결과로정해졌다. 이식에 주어진입력변수를대입하면스팸메일로판단되는확률값을얻을수있다. 심플인공신경망모델의예 ( 스팸메일예측 / 판별모델 ) 네트워크구성 계산식 각각의가중치 (w n ) 학습이완료된모델의수식 모델의 표현 해석 [x 1, x 2,..., x 6 ] : 동일단어반복회수, 본문에인터넷 url 주소가등장한회수등입력변수 6종 [y] : 스팸메일로판단할확률 (0~1) 입력변수 [x 1, x 2,..., x 6 ] 를이식에대입하여 출력값 [y: 스팸메일로판단할확률 ] 을도출함 ( 스팸메일여부를예측 ) 2 MLP의머신러닝과정에는경사하강법 (Gradient Descent) 과오차역전파법 (Backpropagation) 3 원리가사용된다. 경사하강법은함수의최소값의위치를찾기위해경사가하강하는방향을관찰하고그쪽으로조금씩이동해가면서검토를반복하는기법이다. 이때검토를시작하는출발점은랜덤하게정한다. 경사하강법 (Gradient Descent) 오차역전파법 (Backpropagation) 2 1908 년프랑스의수학자쟈크하마다드에의해소개된미분방정식의해를구하는방법 3 1980 년토론토대학의제프리힌튼교수가 3 층규모의 MLP 에대해머신러닝방법으로경사하강법기반으로 오차역전파법 (Backpropagation) 을적용하는방법을발표 5
오차역전파법은아무리복잡한 MLP 구조에서도누적오차는멀리떨어진깊은곳까지영향이전파될것이므로경사하강법을반복하면해찾기가가능하다는관점에서출발한다. 가중치들 (w n ) 각각에대해별도로경사하강을관찰하고, 누적오차감소에가장큰기여를하는 ( 기울기가가장가파른쪽의 ) 가중치한개값을이동시키는방법을반복하여해를찾아갈수있다. 여기서누적오차라함은앞의스팸메일판별모델에서그판별에실패한회수가될수있고, 사진에서강아지인식모델의경우라면그인식을틀린회수등이될수있다. 기계는이러한방법을이용하여식의가중치값들 (w..) 을스스로찾아간다. 2) 더인간처럼, 그리고인간을넘어연구가거듭되면서인공신경망을더깊게쌓아올릴수록복잡하고고도한지식을표현할수있음이밝혀졌다. 그러나오차역전파법을이용하더라도 3개층을넘어서는복잡한구조에서는기계가제대로학습을할수없는문제에봉착했다. 그렇게약 20년간인공신경망의발전은답보상태에빠졌다. 마침내 2006년, 토론토대학의힌튼교수는 MLP를한꺼번에학습하는것이아니라한층씩따로학습하는새로운해결방안을제시하였다. 그리고이방법으로수십층으로구성된깊은신경망을머신러닝으로학습하는것을 딥러닝 이라명명하였다. 힌튼교수팀이 2012년이미지인식경연대회에서우승하여딥러닝방법의우수성을실제로입증하면서, 딥러닝이인공지능의대세로떠올랐다. 딥러닝방법으로신경망의층을깊게쌓을수있게되면서더복잡하고추상화된인공지능을구현할수있게되었다. 이제랜덤포레스트, 서포트벡터머신등타머신러닝방법을사용하던분야에서도속속딥러닝으로선회하는추세이다. 앞서살펴본스팸메일판별모델은 2층의 MLP로구성한심플인공신경망으로, 다소길이가긴방정식으로표현할수있었다. 그러나 MLP의규모가수십층규모로확대되면노드 ( 변수 ) 의개수는수백, 수천개가될것이다. 이때부터는굳이식으로쓰는것이의미가없어진다. 다만컴퓨터가계산만할수있으면된다. 인간은그식을이해할수도없으며이해할필요도없다. 인간의뉴런은약 860억개이며그네트워크의깊이는약 15층수준으로알려져있다. 가족얼굴을알아보는모델, 자전거를탈수있는신체균형모델등 15층내외로쌓아진무수히많은모델이머릿속에구축되어있을것이다. 딥러닝은사람보다더깊은수준의모델을구축할수있다. 실제로 48층의인공신경망을사용한 알파고 가탄생하였고, 지금은 100개이상의층으로이루어진인공신경망모델을만들수있게되었다. 이제기계는 15층깊이에불과한인간이상상할수없는더깊고고도한지식을이해하고학습할수있게되었다. 6
사람의뉴런네트워크 딥러닝네트워크 약 860 억개의뉴런, 15 개층으로구성된여러개의모델 46 개의퍼셉트론, 9 개층으로구성된한개의모델 나아가딥러닝은영상이나이미지에적용시뛰어난성능을보이는합성곱 (Convolution: 콘볼루션 ) 처리과정을추가하거나 (CNN: Convolution Neural Network), 음악이나문장해석등연속 / 순차적데이터처리에유리한순환신경망 (RNN: Recurrent Neural Network) 구조를도입하는등분야별로특화된기법으로진화하고있다. 이런노력에힘입어딥러닝은영상, 음성인식등다양한분야에서성과를내었고인공지능의발전을주도하고있다. 3) 인간의 직관 마저도학습바둑프로기사에게어떤수를왜거기에두었는지를설명하라고하면대부분곤란해할것이다. 굳이말로설명하자면 내가수천판의바둑을둬오면서이러한모양에서는마늘모로이어두는편이나았고, 그리고상대방의우측이두텁기때문에이곳을더튼튼히... 와같은경험과직관에관계된장황한설명만들을수있을뿐이다. 물론일부러비법을감추려고말하지않는것은아니다. 왜그수가좋은지본인도논리적으로잘모르기때문이고, 알수가없으니말로표현할수도없는것이다. 그리고우리는그것을 직관 이라고에둘러표현을한다. 바둑뿐만이아니라다양한분야에서의전문가들은본인의전문성이직관에서나온다고주장한다. 김연아선수, 어떻게스케이트를그렇게잘타세요? 라고질문한다면, 김연아가언어로표현할수있는답은그다지많지않다. 많이연습했습니다., 수도없이넘어졌습니다. 정도이다. 하지만이것은진실이아니다. 스케이트를잘타는비결은뇌와팔, 다리및균형관련신경세포들간의시냅스체계에있다. 시냅스 2번, 7번, 11번은이럴때자극하고, 나머지시냅스는반응하지않고 와같은구체적인내용이근본적인대답일것이다. 이정보는분명존재하지만, 김연아자신도이것을말로표현할수는없다. 출처 : 김대식, 인간 vs 기계, 2016 딥러닝은복잡하고추상적인개념을이해하고또모방할수있다. 그래서인간이 직관 이라고표현하는영역도학습할수있다. 게다가사람의뉴런네트워크가 15 층 7
규모에불과한데반해딥러닝은수십층이상의규모로쌓아올릴수있어인간을능가하는것도가능하다. 바둑에서 딥러닝 이그랬고, 사진에서의얼굴인식도이미기계가사람을앞섰다. 인간은단지수많은바둑기보를입력하거나, 얼굴이포함된사진을제공해주기만하면된다. 판별하거나예측하는구체적인방법은기계가스스로학습할것이기때문이다. 구글은알파고를통해바둑을정복한후게임스타크래프트와 3D 둠플레이를트레이닝시키고있다. 단지게임을잘하는인공지능을만들기위함이아니다. 종국에는아주우수한성능의인공지능트레이딩알고리즘을만든다거나, 컴퓨터프로그래밍이나반도체칩설계에서도대강의목표가주어지면기계가스스로결과를도출하는인공지능을만들수있을것이다. 4) 딥러닝의장단점과거딥러닝이전의전통적인공지능방법에서는기계가어떤패턴을알게하려면각각의요소와그특징표현을하나하나설명을해주어야했다. 이미지에서자전거를알아보게하려면, 윤곽선을추출하고선의모양과연결을파악하여요약된특징표현을인간이직접정의하였다. 둥근바퀴가 2개, 핸들과안장의위치와형태, 각도, 그리고체인과페달의모양등을규정하는것이다. 이런추상적인수준의정보를인간의말이나수식으로표현하는것은상당히어려운일이었다. 그러나딥러닝에서는이러한특징표현을고민할필요가없다. 단지자전거를포함하는엄청나게많은사진자료를모으기만하면된다. 자전거에어떤요소가필요한지그리고그특징표현은어떠한지등은모두기계가스스로발견하고학습한다. 딥러닝에서는기계가스스로특징표현을찾아내므로, 특징판단에관여하는고도의수학적지식이나프로그래밍능력도필요하지않다. 또한아이러니하게도사람이손수만드는모델에비해기계스스로만들어내는모델이일반적으로성능이더우수하게나타난다. 딥러닝이전의인공신경망 딥러닝 아무리좋은머신러닝알고리즘을사용한다하더라도제공되는데이터의양이 부족하거나그품질이떨어진다면결코좋은결과를기대할수없다. 사진으로부터 8
자전거를구별하는방법을학습시키고자할때, 수십만장이상의이미지를어떻게구할것이며, 구한다하더라도그사진에자전거가 있다 vs. 없다 를어떻게표시 (Labeling) 할것인가? 수십에서백여장이면사람의손으로할수도있겠지만빅데이터규모에서는상당히어려운일이다. 결국데이터확보문제는시간과비용문제로귀결된다. 최근딥러닝이다양한인공지능분야에서좋은성과를보이고있지만그것만으로만능의인공지능이실현되는것은아니다. 딥러닝은철저히학습데이터에기반하여최적의판단이나예측값을찾아낼뿐이므로, 융통성과유연성이부족하다. 그래서학습에서접하지못했던전혀새로운입력을접하는경우치명적인오류를유발할수있다. 자동주행자동차알고리즘을예로들자면, 도로에갑자기나타나거나끼어드는물체나사람을인식하여회피하거나급정거하는등의방어운전모델이필요할것이다. 그런데학습데이터에서는한번도접하지못했던바퀴 3개짜리의유모차가갑자기도로에진입하는돌발상황이발생한다면, 인간의상식으로는이해할수없는예측불허의대응을할가능성도있다. 딥러닝은학습데이터에지나치게최적화되어실제적용해야할새로운입력에대해서는다소성능이떨어진결과를도출할수도있다. 이를막기위해학습을진행하고관리하는분석가가모델의일반화특성을높여과적합을피하도록모델을조정해나가야한다. 한편딥러닝을포함하는인공신경망계열의머신러닝기법은그모델의작동원리가철저히블랙박스로구성되어있다는점도문제이다. 기계의눈으로만들어진알고리즘이므로정작그안에서일어나고있는과정과원리를인간의머리로이해할수가없다. 그내용을인간이알수없기때문에모델을사람이직접튜닝하여개선하는것또한불가능하다. 모델의업그레이드역시기계만의몫이다. 훗날딥러닝기반의기술발전과정에서인간의역할이배제될지도모른다. 딥러닝의장점과단점 장점 - 컴퓨터에게알려줄특징표현을고민하지않아도된다 - 일반적으로사람이만든모델보다좋은결과를보여준다. - 고도의수학적지식이나프로그래밍능력을요구하지않는다 - 오픈소스알고리즘이풍부하여저렴하고빠르게개발할수있다. 단점 - 학습데이터확보에많은시간과비용이든다 - 학습데이터의범위를벗어나는패턴에대해서는제대로해석하지못한다. - 과적합문제가발생할수있다. ( 학습데이터에서는우수하지만실제적용데이터에서는미흡한결과를도출 ) - 생성된모델이블랙박스이기때문에인간이그내용을해석하거나개선하기어렵다. 출처 : 안명호외, 머신러닝을위용한알고리즘트레이딩시스템개발 (2016), 재구성 9
III. 인공지능의핵심경쟁력, 빅데이터 1) 인공지능발전의배경 : 알고리즘과하드웨어제약해소인공지능의 3대기술요소로알고리즘, 컴퓨팅파워, 데이터를꼽을수있다. 알고리즘이란기계를학습시키는소프트웨어, 즉머신러닝알고리즘이다. 2000년대에들어딥러닝이급속도로발전한배경에는바로혁신적인딥러닝알고리즘의등장이있다. 그런데최근이학습알고리즘은인터넷을통해쉽게구할수있게되었다. 지금머신러닝업계에서전례없는오픈소스공개의장이펼쳐지고있기때문이다. 구글은세계최고수준의딥러닝엔진인텐서플로 (TensorFlow) 를공개하였고, 그외에빅DL(BigDL), 오픈딥 (OpenDeep), 카페 (Caffe), 씨아노 (Theano), 토치 (Torch), 엠엑스넷 (MXNet) 등수많은툴이공개되면서, 공급과잉의상태다. 이제분석가는고도한딥러닝소프트웨어를손수개발할필요가없이, 이미공개된머신러닝소프트웨어를이용해누구나손쉽게인공지능서비스를만들수있다. 컴퓨팅파워역시딥러닝또는머신러닝에필수불가결한요소이다. 특히깊은층으로구성된신경망을학습하기위해서는높은성능의하드웨어가필요하다. 현재컴퓨터성능의발전은지수형그래프로그속도계계속빨라지고있다. 그리고세계에서가장빨랐던슈퍼컴퓨터도 6~8년후 500위리스트에서탈락하게되고, 8~10년이더지나면일반노트북수준의성능이된다. 이처럼빠르게발전하는컴퓨터성능의발전은복잡하고많은양의계산이필요한딥러닝이자리잡는데많은공헌을했다. 한편컴퓨터그래픽처리용으로개발되었던 GPU 카드를숫자연산기로탈바꿈시키는 GPGPU 4 기술이나오면서딥러닝의여건이더욱나아졌다. GPU는구조가단순하여패키지하나에최대 4천여개의코어로구성된다. 아무리비싼 CPU도 10~20개코어수준인점에비추어볼때 GPU의병렬처리수준이비교가안될정도로우수하다. GPU에이렇게많은코어를담을수있는이유는 CPU에포함된다양하고복잡하고기능의연산회로가빠져있기때문이다. 딥러닝에서의퍼셉트론연산은아주간단한행렬연산의반복으로만이루어지므로 GPU로도계산이가능하고, 그래서 GPU사용이딥러닝의표준이되었다. 2012년구글브레인프로젝트에서 3일동안이미지 1천만개를학습시키는데 16,000개의컴퓨터를이용했는데, 1년뒤바이두의인공지능연구소에서는동일한성능을단 3대의컴퓨터만으로구현하였다. 바로 GPU를사용했기때문이다. 4 GPGPU(General-Purpose computing on Graphics Processing Units) : 그래픽처리장치 (GPU) 를, 전통적으로중 앙처리장치 (CPU) 가맡았던응용프로그램들의계산에사용하는기술. NVIDIA 사의 CUDA 기술이대표적. 10
CPU 구조 vs. GPU 구조딥러닝을위한 GPGPU 시스템 복잡하고고도한수학적 연산유닛 (ALU) 20 개이하 단순행렬계산에적합한 계산유닛 1 천 ~4 천개 NVIDIA 사의 GPU 카드 10 여개를탑재한컴퓨터 2017년출시된 NVIDIA사의 GTX1080ti 카드 1장의성능은 2001년세계 1위의슈퍼컴퓨터성능을넘어섰고, 1996년세계최고슈퍼컴퓨터였던 CP-PACS 성능의 30배수준에달한다. 이처럼 GPGPU의발전은딥러닝분야에서컴퓨팅파워의성능및비용적제약을상당부분해소하였다. 슈퍼컴퓨터 (1996) GPU 카드 (2017) 1996 년 1 위슈퍼컴퓨터 CP-PACS : 368GFLOP/s NVIDIA 사의 GTX1080ti 카드 : 11,000GFLOP/s GFLOP/s (Giga Floating Point Operations Per Second) : 초당부동소수점수연산회수 ( x 10 억회 ) 2) 인공지능의핵심경쟁력은 빅데이터 인공지능선진기업들이앞다투어머신러닝알고리즘을공개하고있는까닭은무엇일까? 역설적이게도알고리즘은더이상인공지능핵심경쟁력이아니라고판단하기때문이다. 그렇다면학습알고리즘보다더중요한요소는무엇인가? 바로데이터이다. 인공지능발전의 3 대요소 11
데이터는머신러닝이학습하는재료이다. 최근딥러닝이급격히발전한까닭은바로인공지능이학습할재료가풍부해졌다는데있다. 디지털카메라와스마트폰사진촬영이대중화되면서분석가능한디지털사진이폭발적으로증가했다. 사진공유기반 SNS인스냅챗 (Snapchat) 의경우 1분마다 28만장이상의사진이전달되고있고, 유튜브에는 1분마다 300시간분량의새로운동영상이추가로업로드되고있다. 데이터의폭발적증가는사진뿐만이아니다. 오늘날매일생산되는디지털데이터의규모는 8ZB( 제타바이트 ) 에달한다. 8ZB는 80억 TB( 테라바이트 ) 에달하는양이다. 빅데이터분야의진화방향에서도인공지능과의만남을확인할수있다. 시대의흐름에따라데이터활용에대한산업적용도에많은변화가있었다. 데이터의규모와다양성이확대되면서점차단순통계 / 집계를넘어 BI 및 CRM을위한분석, 그리고최근에는예측 / 판단등지능화서비스를위한분석까지이르렀다. 빅데이터의용도가인공지능분야로진화한것이다. 데이터활용의진화방향 출처 : 노무라연구소 (2012), 재구성 앞으로의인공지능경쟁력은결국데이터에서창출될것이다. 딥러닝에서는데이터의양과질이모두중요하다. 사진을인식하고무언가를예측하고자한다면정답이적혀있는엄청난양의빅데이터확보가필연적이다. 예컨대사진으로부터개와고양이를인식하고자한다면수많은사진데이터와함께그사진에개가있는지고양이가있는지를라벨링을해야한다. 그래야기계가학습을할수있다. SNS에 개, 고양이 라는텍스트와함께올린 12
사진데이터가그러한조건에부합하는데이터일것이다. 이런광범위한빅데이터를가진회사는구글, 페이스북, 바이두등의전통적인터넷 / 모바일대기업들이다. 국내에서는네이버가확실히유리한위치에서있다. 알고리즘의가치보다빅데이터의가치가훨씬더크다. 목적에따라정확히라벨링된데이터를얻기위해서는많은시간과비용이소요된다. 결국양질의데이터를누가많이가지고있는지에따라머신러닝의품질이달라지게되고, 향후인공지능의미래를이끄는리더가될것이다. IV. 인공지능이할수있는일 1) 인간처럼보고듣고말하고현재머신러닝으로만들어지는인공지능은기본적으로 분류 기능이다. 잘분류할수있으면그것이곧문제를이해할수있는것이고, 이를기반으로판단하고또행동할수도있다. 사진에서강아지를인식한다는것은강아지가맞는가, 아닌가의분류이고, 바둑에서는다음수를이곳에두면내가더유리한가, 불리한가의분류이다. 즉 Yes와 No로판단하는것이다. 이사람을고용하면회사에이익이되는가? 지질데이터로미루어볼때지진이발생할것인가? 이주식의가격은오를것인가? 등의명제도모두분류문제에해당된다. 이미지에서사물을인식하고자할때사물의종류를 1만개라면 1만가지의출력단을가지는분류모델을구축하는것이다. 페이스북의 딥페이스 는인간수준으로얼굴을인식할수있고, 스탠포드대학비전랩은사진속사물을문자로표현해주는 덴스캡 을개발했다. 더나아가구글에서는사진속장면인식과자동번역기술을융합하여완전한문장으로묘사해주는알고리즘을발표하기도했다. 이때장면인식에는 CNN 기술, 언어로표현하는단계에서는 RNN 기술을이용되었다. 덴스캡 (DenseCap) 의사진해석결과 출처 : Justin Johnson et al., Fully Convolutional Localization Networks for Dense Captioning, CVPR, 2016 13
구글의사진속장면인식및문장묘사기술 출처 : Oriol Vinyals et al. (Google), Show and Tell: A Neural Image Caption Generator, CVPR, 2015 반고흐, 피카소등유명화가의화풍을어떻게특징화하여요약할수있을까? 이것역시인간의논리와언어로표현할수없는대단히추상화된영역의일이다. 딥러닝은추상화된특징표현을스스로발견할수있어서, 학습을통해반고흐의작품인지아닌지를순식간에판단할수있다. 과거에는사람의표정이나목소리에서감정을읽어내거나, 입술의움직임만으로대화를해석하는것은정신적이고추상적인일이어서인간만이할수있다고믿었다. 그러나이또한 Emotient와 LipNet 등의사례와같이딥러닝을통해구현되고있다. Emotient ( 애플 ) LipNet ( 옥스포드대 ) Cogito ( 스타트업 ) 사람의표정에서감정을읽는 AI 스타트업 ( 애플에피인수됨 ) 입술움직임만으로대화를이해 판독정확성 93% 수준달성 고객목소리에서감정과기분을 실시간분석하는콜센터솔루션 그림이나이미지외에도음성, 동영상과동작등으로부터각종패턴을인식하는인공지능은여러분야에서시도되고있다. 의료분야를예로들자면미국의스타트업 MedyMatch는의료영상기반뇌졸중진단 AI 기술을개발중이고, 스탠포드대학연구진이웨어러블기기를이용해사람의질병을미리예측하는기술을공개하였다. 하버드대연구진은인스타그램에올린사진의채도, 색상, 자신의표정등을분석하여우울증을 70% 적중률로예측하는알고리즘을개발하였다. 14
MedyMatch 스탠포드대연구팀하버드대연구팀 의료영상기반뇌졸중진단웨어러블기기로질병예측인스타그램으로우울증예측 콘텐츠업계에서는어떤콘텐츠를소비자가좋아할것인가를분류 / 예측함으로써맞춤형추천을제공할수있다. 미국의판도라 (Pandora) 와넷플릭스 (Netflix) 는각각음악과 VOD을추천하기위해인공지능기술을활용하고있다. 단순히콘텐츠를추천하는것을넘어집안의가전제품을제어하거나날씨와뉴스정보를읽어주는등종합인공지능에이전트서비스도속속등장하고있다. 대표적인서비스로아마존의 Echo, 그리고 kt의 GiGA- Genie, SKT의 누구 등이있다. 아마존 Echo(Alexa) kt GiGA-Genie SKT 누구 그외에는문맥과상황에맞게자연스러운번역을가능케하는기계번역, 챗봇알고리즘등에서도딥러닝기술을활용할수있다. 그리고사물인식, 동작인식등다양한모델의집약체로볼수있는자율주행자동차분야에서도상용화를위한연구가활발하다. 자율주행자동차분야에는테슬라 (Tesla), 구글 (Google) 을비롯하여포드, GM, 재규어등의기존메이저자동차제조사들도관련기술의스타트업을인수하며경쟁에뛰어들었다. 포드 GM 재규어 무인차핵심센서 LiDAR 개발스타트업 Velodyne 에투자 자율주행차기술스타트업 Cruise Automation 인수 비포장도로에서도다닐수있는전지형자율주행기술개발중 15
2) 인공지능의창작활동딥러닝으로학습한유명화가의화풍을분류나예측이아닌다른용도로활용한흥미로운시도가있었다. 명화의특징표현정보를합성하여다른사진을그화가의화풍으로변환시키는것이다. 이기술을이용하면이미세상을떠난거장의그림을무한대로창조해낼수있다. 인공지능이예술작품을만들어낼수있다는것이다. 구글은이방법을활용하여입력한사진을다소몽환적인느낌으로변환시키는 딥드림 을공개하였고, 그작품을모아전시회까지열었다. 트위터의 딥포저 와러시아개발사가공개한 Prisma 도사용자가사진을올리면피카소, 렘브란트등유명화가의화풍으로변형시켜주는유사한서비스를제공하고있다. 사진을유명화가의화풍으로변환한예 반고흐 < 별이빛나는밤 > 뭉크 < 절규 > 원본사진화풍으로변환한결과화풍으로변환한결과출처 : Leon A. Gatys et al., Image Style Transfer Using Convolutional Neural Networks, CVPR, 2016 그림뿐만아니라음악작곡이나소설, 각본등의작품영역에서도인공지능의역할이가능하다. 딥러닝을이용하여유명작곡가의음악의주파수와화음조합등의특징표현을발견하거나, 유명작가의소설이나드라마각본의서술형식과스토리전개특징을학습한다면, 이를모방한무수히많은곡이나이야기를재창조해낼수있다. 영화감독오스카샤프는딥러닝으로수백편의 SF 드라마와영어대본을학습시킨후헐리우드 B급수준의쓸만한내용의 SF 단편영화를만드는데성공했다. 이영화는 선스프링 이라는제목으로발표되었고, 현재유튜브에공개되어있다. 그리고지난해히토시마쓰바라교수팀이인공지능으로쓴소설을문학상공모전에출품하여 1차심사를통과해화제가되기도했다. 음악부문에서는재즈음악작곡이가능하다는인공지능 딥재즈 가선보였고, 구글은 마젠타 라는이름의인공지능기계를통해 80초짜리피아노연주곡을공개하기도했다. 이처럼인간고유의영역이라고믿었던작품의창작활동에까지인공지능의참여가이루어지고있다. 그렇다고해서기계가완전한창의성을가졌다는의미는아니다. 어디까지나기존의작곡가나작가의스타일을모방하여약간의변형을가하여작품을 16
재창조해내는수준이다. 그러나다소두려운마음이드는것은사실이다. 실제로모방은창작의어머니라고할만큼, 대부분의창작활동은전작의모방과학습을통해이루어지기때문이다. 모방을통한기계의작품활동을과연창의적인활동으로볼수있는지에대해논란이있을것으로보인다. V. 인공지능, 축복인가위협인가 1) 4차산업혁명이후의노동시장인공지능을중심으로일어날 4차산업혁명이후의인류는어떤삶을살게될까? 스탠포드대연구팀이발표한 2030년인공지능과삶 이라는보고서에따르면, 인공지능은전반적으로제품이나서비스비용을낮추는데기여하여인간의생활을더풍요롭게만들것이라고낙관적인전망을하였다. 일자리측면에서는로봇이인간의몫을일부대체할수는있겠지만, 대신데이터애널리리스트등의새로운직업이생겨날수있으므로지나친우려는경계하였다. 컨설팅사웨버샌드윅이 AI에대한소비자인식을조사한보고서에따르면, 전체응답자의 2/3가일자리감소측면에서 AI에대해우려의입장을보였다. 세계경제포럼 (WEF) 은 2020년까지미국, 영국등주요 15개국에서사무 / 행정, 생산 / 제조등의분야에서총 713만개의일자리가사라지는반면, 경영 / 재무 / 운영, 컴퓨터 / 수학등의분야에서총 196만개의일자리가증가하는데그칠것으로전망했다. 517만개의일자리축소가불가피하다는것이다. 한국고용정보원도 2025년에는국내일자리의 60% 이상을로봇과인공지능으로대체될것이라는보고서를발표했다. 그러나이들결과는현존하는직업체계를기준으로예측한것으로, 인공지능시대에새롭게등장할전혀다른형태의일자리가폭넓게고려되지는않았을것으로보인다. 2020 년일자리증감 ( 선진국 15 개국기준 ) 인공지능시대인간이배워야할분야 출처 : WEF, The Future of Jobs (2016) 출처 : 옥스포드마틴스쿨 & 시티그룹 (2016), 중앙일보재인용 17
한편, 옥스포드마틴스쿨과시티그룹이공동조사한바에따르면인공지능시대에인간이배워야할분야로컴퓨터 /IT와 STEM( 과학 / 기술 / 공학 / 수학 ) 을강조하는한편창의력과유연성도필요하다고밝혔다. 예상컨대미래인공지능시대에새롭게등장할직업은아마도이러한분야와밀접한연관이있는형태일것이다. 세계경제포럼에서광업 / 건설, 생산 / 제조등육체적노동의축소를예견한것과는달리, 전문직의종말이먼저찾아올것이라는정반대의시각도있다. 변호사, 법무사, 회계사, 제너럴닥터, 약사, 금융인등의전문직업무는딥러닝과같은머신러닝으로쉽게학습할수있으므로, 인공지능에의해대체되는 1순위타겟이된다는것이다. 그리고작업현장에서유연한대처가필요한전기배선이나목수등의일은좀처럼기계가완벽히해내기어려울것이기때문에, 오히려사람이계속담당하게될가능성이있다고본다. 오랜시간공부와훈련으로학습된고도의지식을사용하는전문직은역설적이게도인공지능이손쉽게넘볼수있는분야라는것이다. 이처럼인공지능과인간의일자리다툼에대하여전문가들사이에서도의견이갈리고있다. 인류는급변하는노동시장의변화를몇차례경험하였다. 1차산업혁명으로주요소득원이었던가내수공업이붕괴되면서공장노동자로써의삶을개척해야했고, 얼마지나지않아기계화 / 자동화의 2차산업혁명으로대규모실직을겪었다. 이처럼진통도있었으나새로운일자리도함께생겨났다. 대규모직물생산이가능해지면서의류산업, 디자인산업이일어났다. 3차산업혁명으로불리는정보화시대에는소프트웨어개발, 데이터분석, 디지털콘텐츠산업등이생겨났다. 기술의발전은인류의일자리를빼앗은것이아니라단지분야와형태만바꾸어놓았다. 그리고오히려새로운산업과일자리를더만들어냈다. 4차산업혁명에서도인공지능과공존할수있는새로운산업과직업의탄생을충분히기대할수있다. 4 차례산업혁명의흐름도 18
4 차례산업혁명과일자리변화 반면인공지능의어두운미래를점치는관점도있다. 인공지능의생산성을일부자본가가독점함으로써빈부격차가심화되는등부작용이속출할것이라는시각이있다. 결국대다수국민은소비여력을상실하게되고, 결국시장경제시스템이붕괴할것이라는우려도있다. 이에대해뇌공학자김대식교수는 1차산업혁명후공장의생산활동에부가가치세를도입한것처럼, 인공지능에도부가지능세와같은새로운조세개념을도입해야한다고주장하였다. 학계에서는이를로봇세나기계세등으로표현하기도한다. 인공지능의가치를재분배함으로써대규모실직의충격을막고자본주의시스템을지속할수있다는것으로최근대안으로설득력을얻고있다. 한편인공지능시대에새로운일자리가만들어지더라도, 적어도한세대가량은새로운패러다임에적응하지못하여전직에어려움을겪는 죽음의계곡 을건너야할것이라는우려의목소리가있다. 5 우리가그비운의세대가되지않으려면기계와차별화될수있는어떤경쟁력을키워야하는지많은고민이필요할것으로보인다. 2) 인공지능과함께살아갈미래역사를살피면미래를가늠할수있다. 과거에는보릿고개라는말이있었듯이우리는굶주림과싸워야했다. 프리츠하버가화학비료를발명하면서인류는드디어기아에서해방되었다. 이를녹색혁명이라부른다. 녹색혁명이후식량수급에여유가생기면서과거에는없었던편익을추구하게되었고공산품수요가나타났다. 이것은제조업의부상과상품의수요가창출되는배경이되었다. 더나아가대량생산에의해규모의경제가 5 이삼열, 4 차산업혁명이산업분야에미치는영향과쟁점 (2016) 19
실현되면서, 공산품의가격은더낮아지고, 소비자들은잉여의소득을또다른유희와소비에지출할수있었다. 영화, 음악과같은엔터테인먼트산업은그렇게성장하였다. 4차산업혁명에서는인공지능이인간의지적노동을자동화또는대량생산해낼것이다. 그러나지나친비관을할필요는없다. 인공지능이인간의지식노동을대체할수있다면, 그로부터얻은시간과노동의여유를또다른곳에사용할수있을것이다. 지금은상상할수없지만전혀새로운형태의수요가창출되고그에따른산업이탄생할것이다. 앞으로자율주행자동차기술이보편화되면, 무인자동차중심의소유하지않는자동차문화를확산시킬것이다. 자동차가필요하면근처를지나는무인자동차를호출하여이용하면된다. 자동차는 24시간주행을계속할수있고도심에서주차장은사라질것이다. 지금개인이소유하고있는자가용은실제로대부분의시간을주차장에서보낸다. 주차공간도확보해야하고, 이렇게가끔이용하는자동차를개인이소유한다는것은상당히비효율적이다. 무인자동차중심의사회에서는이러한사회적비용을크게줄임으로써효율성이크게증대될것이다. 아마도다음세대에는조상들이직접운전을했다는것을매우이상하게생각할것이다. 법률, 의료, 회계등대부분의전문직이담당하는지식집약적인업무는인공지능으로비교적잘실현되고대체될가능성이있다. 소프트웨어개발업무도그렇다. 구글은인공지능소프트웨어를만드는또다른인공지능소프트웨어를설계하고있다고밝혔다. 향후에는소프트웨어개발자들의작업일부가인공지능으로대체될것이다. 인간은다른창의적인업무를찾아야할것이다. 인공지능은그림, 음악, 영화극본처럼인간의전유물이라믿었던창작활동까지진출하였다. 물론인공지능이완벽히창의적인내용의작품을만들어내는것은아니다. 단지유명화가의화풍을흉내내거나, 과거의음악이나영화대본을많이학습해서이를모방하는것이다. 기존것의모방을기반으로한작품활동은딥러닝기술을통해실현가능하다는것이여러사례를통해확인되었다. 그렇다면이제판에박힌듯한걸그룹음악들, 그리고재벌 3세와결혼하는신데렐라이야기등뻔하고비슷한드라마극본은인공지능이얼마든지만들어낼수가있다. 이제인간이설길은남들이하지않았던새로운콘텐츠, 과거와는전혀다른방식의스토리를만드는것이다. 기계도할수있는모방을넘어서야한다. 물론항상새롭기만한창작은쉽지않은일이다. 예술계종사자의창작의고통은더커질것이다. 과거덧셈과뺄셈을직접하던우리가전자계산기와처음대면하게되었던때를생각해보자. 인간이암산과주판사용법을더숙련할지라도계산기와맞설수는없었을것이다. 다만우리는계산기의능력과효용을잘활용할수있는다른일에집중하였다. 20
인공지능을대하는태도도그래야한다. 인공지능은대결하여이겨야하는대상이아니라어떻게잘활용하고다른부가가치를창출할수있는지를고민해야하는대상이다. 전술한모든이슈를종합해볼때, 인공지능시대에인간이준비해야할것이무엇인가를묻는다면, 그정답은바로 유연하게적응하는능력 일것이다. 산업화와대량생산, 그리고정보화시대까지, 인간은다양한기술환경의변화에적응하였고인간의새로운역할을발견하였다. 그리고새로운분야의산업을탄생시켰고, 시장의수요를만들어냈다. 그저력은바로 유연성과적응력 에서비롯한것이다. 이것은인공지능시대에우리에게필요한능력이기도하다. 21