2018. 7. 31. 범용인공지능의개념과연구현황 추형석선임연구원
본보고서는 과학기술정보통신부정보통신진흥기금 을지원받아제작한것으로과학기술정보통신부의공식의견과다를수있습니다. 본보고서의내용은연구진의개인견해이며, 본보고서와관련한의문사항또는수정 보완할필요가있는경우에는아래연락처로연락해주시기바랍니다. 소프트웨어정책연구소기술 공학연구실추형석선임연구원 (hchu@spri.kr)
현대인공지능은유례가없을정도로빠르게진화하고있다. 이러한속도때문에, 많은전문가들은인공지능이사람을지배할것이라는예측을내놓고있다. 대표적으로, 테슬라최고경영자인엘론머스크는미래인공지능을핵무기에빗대어표현하면서그위험성을강조했다. 지난 2018년 3월작고한영국의물리학자스티븐호킹역시인공지능이인간을대체할수있다는것에두려움을표명했다. 그렇다면이처럼인공지능이인류를위협할수있다는사실은어디에서기인하는것일까? 그것은사람수준의인공지능 (Human-level intelligence), 즉범용인공지능 (Artificial General Intelligence) 이라고일컬을수있다. 범용인공지능은기본적으로사람수준의지능을구현한시스템이라고개념지을수있다. 범용인공지능은사람처럼학습하고, 추론하며, 문제를인식하고이것을해결하기위해능동적인대처를한다. 그러나사람수준의지능은전문가마다보는시각이매우다를수있다. 따라서범용인공지능의구체적인정의는각분야마다다르고, 연구자들은범용인공지능을개발하면서그정의를정립해나가고있다. 여기서중요한점은범용인공지능이사람수준을능가할수있는초지능 (Superintelligence) 로바라보는것이다. 만약범용인공지능이탄생한다면, 이것은자가향상 (Self-improvement) 을통해사람보다훨씬높은수준의지능에도달한다는관점이다. 이관점은대표적인미래학자인레이커즈와일이그의저서에서밝힌특이점과도일맥상통한다. 범용인공지능을초지능으로가는변곡점으로여긴다면, 앞서서술한세계석학과최고경영자의우려섞인예측도충분히상상가능한미래다. 그러나현재범용인공지능과관련된연구현황을살펴볼때, 아직범용인공지능이탄생하기에는시기상조로보인다. 그러나현대인공지능의눈부신발전은많은연구자들에게범용인공지능시대가도래할것이라는긍정적인신호를보내고있다. 이에국제사회는범용인공지능의출현에대비하기위해인공지능을인류에이롭게활용한다는대원칙을세우고있다. 우리도이러한국제사회의동정에적극참여하여범용인공지능시대를대비해야할것이다.
Modern artificial intelligence evolves to unprecedented speed. Because of this speed, many experts are predicting that artificial intelligence will dominate human. Typically, Elon Musk, Tesla CEO, stressed the dangers of future artificial intelligence as nuclear weapons. The British physicist Stephen Hawking, who died in March 2018, also expressed fears that artificial intelligence could replace humans. So where does the fact that artificial intelligence can threaten humankind? It can be called human-level intelligence, that is, Artificial General Intelligence (AGI). The AGI is basically a system that implements human intelligence. AGI can learn, inference, recognize problems, and take active steps to solve them like human. However, human-level intelligence can be very different for each expert. Therefore, the specific definition of the AGI is different for each field, and the researchers are in the process of establishing the definition while developing the AGI. What is important here is that the AGI can be regarded as superintelligence that can surpass the human level. If a AGI is born, this is a view that self-improvement will reach a much higher level of intelligence than humans. This view is in line with the singularity laid out by a representative futurist, Ray Kurzweil, in his book. If the AGI is regarded as an point to superintelligence, it is a imaginable future with the worries of the world scholars and CEO as described above. However, when we look at the present state of research related to the AGI, it seems that it is premature to produce the AGI. However, the remarkable development of modern artificial intelligence has sent a positive signal to many researchers that the era of AGI will come. Therefore, the international society is making a principle of using artificial intelligence beneficially to humanity. We should also actively participate in the trend of the international community and prepare for the age of the AGI.
1. 서론 1 2. 범용인공지능의개념과접근방법 4 3. 범용인공지능의연구현황 8 4. 결론 12
1. Introduction 1 2. Concepts and approaches of AGI 4 3. AGI R&D Trends 8 4. Conclusions 12
1. 서론 지난 2016년 3월구글이개발한바둑인공지능프로그램 AlphaGo는세계최정상바둑기사인이세돌 9단에맞서 4:1로완승했다. 그성공의원동력은심층학습 (Deep learning) 이다. 심층학습은기본적으로인간의뇌구조를모사한인공신경망 (Artificial Neural Network) 을학습하는기술이다. 여기서심층학습은더복잡하고깊은인공신경망 1) 을학습하는방법론으로그차별점을찾을수있다. 깊은인공신경망을성공적으로학습시키기위해서는필연적으로많은데이터와계산자원이필요하다. 현대인공지능의핵심기술로써의심층학습은그방법론의진화 2) 뿐만아니라, 폭발적으로성장한연산처리장치의성능 3) 과빅데이터의대중화가서로맞물려일어난결과다. 심층학습이본격적으로학계나산업계에널리퍼지게된계기는 2012년에개최된이미지인식경진대회 4) 의결과로부터출발한다. 2011년경진대회의우승자는약 25.8% 의객체인식오차를기록한반면 2012년에는심층학습기법중하나인합성곱신경망 (Convolutional Neural Network) 을활용하여 16.4% 의오차율을기록했다. 이것은컴퓨터비전분야의획기적인연구성과로주목받음과동시에다른학계에서의관심까지이끌어냈다. AlphaGo에서활용된인공신경망역시이미지인식에활용된합성곱신경망이다. 심층학습의성공사례는비단바둑이나이미지인식에그치지않는다. 게임인 공지능, 음성인식, 기계번역등심층학습은다양한분야에서가장좋은성능을 기록하고있다. 그러나심층학습은특정분야에최적화된기술이다. 이미지인식 을잘하는인공신경망이음성인식을잘할수없기때문이다. 그럼에도불구 하고심층학습의높은성능덕에심층학습에대한학계나산업계의관심은나날 이높아지고있는실정이다. 1) 인공신경망은노드 ( 퍼셉트론 ) 과링크 ( 퍼셉트론간의연결 ) 로구성되며, 다수의노드를하나의층 (layer) 으로지칭한다. 인공신경망은많은수의층 (layer) 를쌓을수록깊이가깊어지고, 일반적으로심층신경망일수록높은예측성능을기대할수있다. 2) 심층학습의선구자인토론토대학의제프리힌튼교수가개선한비지도학습, 전자공학에서사용되는활성함수 (Rectified Linear Unit) 의차용등방법론자체도진화 3) 매 18 개월마다연산처리장치의성능은 2 배향상된다 는무어의법칙 (Moore s Law) 아래연산처리장치는지수적으로그성능이향상됐으며, 대규모병렬처리에적합한그래픽연산처리장치 (Graphical Processing Units) 의대중화로심층학습에필요한시간을대폭감소시킴 4) Imagenet Large Scale Visual Recognition Challenge(ILSVRC) 는 120 만장의이미지에서 1000 가지의객체를분류하고위치를찾는경진대회 1
많은전문가들은심층학습의발전속도가유례없이빠르다고강조한다. 이세돌 9단과대결했던 AlphaGo는경기당시이상한실수를하는등완벽하지않았다. 또한많은전문가들은심층학습의낮은설명가능성으로인해 AlphaGo가더높은수준으로진화하기에는수년의세월이필요할것이라고예측했다. 그러나 AlphaGo 개발진인구글딥마인드는불과 1년만에인류의바둑지식을초월한 AlphaGo Zero를공개했다. AlphaGo Zero가더욱충격적이었던사실은 AlphaGo Zero가어떠한바둑기사의기보도학습에활용하지않았다는점이다. 이러한심층학습의놀라운성과는반대로다양한우려를낳고있다. 테슬라모터스의최고경영자인엘론머스크나천재물리학자스티븐호킹은미래의인공지능이인류를멸망시킬것이라고강조했다. 또한사회적으로는인공지능이직업을대체하여인류의일자리를위협할것이라는걱정도팽배해있다. 이러한부정적인관점에대한원인은현대인공지능의빠른발전속도로인해정말사람수준 (Human-level) 의인공지능이수십년내에만들어질것이라는점이다. 사람수준의인공지능, 즉범용인공지능 (Artificial General Intelligence) 의개발은정말로가능한것일까? 현재범용인공지능과관련된연구는무엇이있을까? 이보고서는이물음에대한답을찾기위해범용인공지능의개념과연구현황을살펴보고자한다. 본격적으로범용인공지능을다루기에앞서심층학습에대해조금더살펴보자. 먼저심층학습의장점은복잡한데이터에서패턴을인식하고예측하는성능이우수하다는것이다. 예를들어, 기계번역은 end-to-end라는심층학습방법을활용한다. 한국어를영어로번역하는과정에서한국어문장과그번역에해당하는영어문장을대응시켜방대한데이터셋을만들고, 이를학습시키는과정이 end-to-end 방법이다. 이것은전통적인자연언어처리방법과는다르게문장의구조나특정문맥에서의단어의의미를전혀파악하지않아도된다. end-to-end 심층학습은과거전통적인자연언어처리기술을활용한번역보다월등히성능이뛰어나기때문에현재기계번역분야에서많이활용되고있다. 심층학습은이러한장점과대비하여그한계도분명하다. 먼저심층신경망 5) 의 5) 심층신경망 (Deep Neural Network) 은개념적으로깊은인공신경망 (Artificial Neural Network) 이다. 또는, 신경망층 (layer) 을 2~3 개적층한구조를얕은신경망 (Shallow Network) 에대비되는개념으로도이해할수있다. 일반적으로심층학습의인공신경망은심층신경망을의미한다. 2
성능은특정분야에국한돼있다. 앞서소개한기계번역의 end-to-end 심층신경망은이미지나음성을인식할수없다. 인간은뇌라는하나의신경망으로사물을인식하고미래를추론하며바둑을둘수있다. 심층학습은이러한관점에서매우제한적인범용성을가지고있다. 흥미로운것은기술적인진전이조금씩진행되고있다는것이다. AlphaGo Zero는자체대국을통한자가학습과정을일반화하여 AlphaZero라는방법을제안했다. AlphaZero는바둑이외에체스, 쇼기등의보드게임에서도최정상실력을입증하여그가능성을시사했다. 그러나 AlphaZero는여전히보드게임이라는틀에서벗어나지못한것이현실이다. 심층학습의또다른한계는설명가능성에있다. 심층학습의결과물은매우뛰어난성능을보여주나, 이결과가왜산출되는가에대해명확히설명불가능하다는것이다. 이것은본질적으로인공신경망의구조에서그이유를찾을수있다. 인공신경망은다수의인공신경세포를연결해서만든구조다. 하지만어떻게연결해야최적의성능을보장할수있는가에대한이론적인근거가없다. 이사실로부터심층학습방법론은경험적인결과에의존한다고추론할수있다. 가능한한많은경우의수를수행하여최적의결과를도출하는심층학습은접근방법자체에서의태생적인한계가존재한다는것이다. 이러한심층학습의단점에도불구하고, 심층학습에대한관심은인공지능뿐만아니라과학기술전반에걸쳐매우높아지는추세다. 그첫번째이유는바로성능이다. 설명가능성이높은방정식기반의고전적인모델링보다데이터를학습해추론하는심층학습의성능이월등하기때문이다. 하지만심층학습은만능이아니다. 심층학습은일반적으로학습을위해방대한데이터를필요로한다. 또한경험적으로많은시도를해야하기때문에필연적으로많은계산을요구한다. 이렇게심층학습을객관적으로보자면심층학습이발전하여범용인공지능으로진화한다는것은시기상조일수있다. 그렇다면심층학습과범용인공지능의관계는어떻게될까? 심층학습이범용인공지능으로가는길에가장핵심적인기술일까? 아니면요소기술중하나일까? 이보고서는범용인공지능의개념과연구현황에대해서논의할것이다. 먼저범용인공지능의개념과접근방법을소개하고, 분류별로활발히수행되고있는연구내용을살펴보겠다. 마지막으로범용인공지능의미래에대해결론지을것이다. 3
2. 범용인공지능의개념과접근방법 범용인공지능은 1956년다트머스회의에서인공지능의개념이처음정립됐을때부터출발한다. 여기서논의된궁극적인인공지능의형태가바로범용인공지능이기때문이다. 그러나범용인공지능으로가기위한기술적한계 6) 는극명했다. 이로인해인공지능은지난 60여년간부침의역사를겪었고, 결국인공지능은컴퓨터과학의한분야로인간의지능적행동의일부를모사하기위한접근을취했다. 최근범용인공지능이라는키워드가다시부상한이유도심층학습의눈부신성장때문이라고도볼수있다. 하지만범용인공지능은아직개발되지않은기술이기때문에, 그정의역시구체적이지않은것이사실이다. 많은학자들은범용인공지능을인간수준의지능 (Human-level intelligence) 로일컫는다. 이것은인간처럼정보를학습하고, 의미를부여하며, 다양한문제를인지하여해결책을도출하는과정을구현함에있다. 물론범용인공지능을단순히사람수준의지능이라고바라보는것은어폐가있다. 범용인공지능이자의식 (self-consciousness) 이나감정 (emotion) 이필요한가? 혹은범용인공지능을위해물리적인몸체 (physical body) 가필요한가? 에대한대답은분야별전문가에따라상당히다르기때문이다. 따라서범용인공지능에대한정의는아직도논의가진행중이다. 그정의가모호하기때문에, 오히려연구자들이범용인공지능에대한실체를만들어나가는중이라고볼수있다. 앞서언급했듯이범용인공지능을인간수준의지능을구현한기계장치로바라본다면, 범용인공지능은다양한목표를달성하기위해능동적으로해결책을찾는시스템이라고볼수있다. 범용인공지능분야에서활발하게활동중인벤괴르첼 (Ben Goertzel) 박사는이것을핵심범용인공지능가설 (The Core AGI Hypothesis) 이라고제시했다. 이가설이맞다면범용인공지능은좁은인공지능 (narrow AI) 7) 의반대개념으로구분될수있다는관점이다. 6) 인간의뇌가어떠한방식으로동작하는가에대한생리학적인규명의부재, 의식 (consciousness) 과감정 (emotion) 에대한구현방안, 인간이학습하고추론하는방식에대한메카니즘등 7) 좁은인공지능 (narrow AI) 은세계적인미래학자인레이커즈와일 (Ray Kurzweil) 의저서 The Singularity Is Near 에서소개된개념으로특정한상황에서특정한지능적행동을하는시스템으로정의된다. 좁은인공지능은상황이나행동을약간변화시킨다면, 일정수준의프로그래밍과재구성이필요하다. 심층학습은좁은인공지능의대표적인예로볼수있다. 4
The Core AGI Hypothesis Ÿ 충분히넓고 ( 인간수준 ) 강한범용성을갖는인공지능의창조나연구. 질적인측면에서상당히좁고약한범용성과반대되는개념 Ÿ 원문 : the creation and study of synthetic intelligences with sufficiently broad (e.g. human-level) scope and strong generalization capability; is at bottom qualitatively different from the creation and study of synthetic intelligences with significantly narrower scope and weaker generalization capability 자료 : Artificial General Intelligence: Concept, State of the Art, and Future Prospects, Ben Goertzel (2017) 이러한개념상의범용인공지능을고려해보면, 심층학습은아직그수준에도달하지못했다. 그러나심층학습으로촉발된인공지능의성능발전속도를보면범용인공지능의출현은그리먼미래가아닐수도있다. 실제로비영리단체인 Future Life Institute(FLI) 는인공지능전문가 1,634명을대상으로범용인공지능의출현시기를설문조사했다. 그결과 45년뒤에 50% 의확률로인공지능이인간을초월할것이라고전망했고, 인간의모든직업을대체하는데는 120년이걸릴것으로예측했다. 8) 만약범용인공지능이실제로출현하면인류는인공지능의지배아래놓이게될까? 세계적인미래학자인레이커즈와일은그의저서에서밝혔듯이범용인공지능이출현하는시점을특이점 (Singularity) 으로정의했다. 특이점이후의인공지능은자가발전 (self-improvement) 하여인간을뛰어넘는초인공지능 (superintelligence) 이되는것이다. MIT의물리학과교수인맥스테그마크역시범용인공지능의출현은곧초인공지능을의미한다고밝혔다. 9) 이관점은인간과범용인공지능은단순한주종관계가아니라, 서로공존하는관계로정립돼야함을내포한다. 이에인공지능연구자들은 2017년아실로마학회에서인공지능을이롭게활용하기위한 23개원칙 < 표 1> 을정립했다. 10) 8) When Will AI Exceed Human Performance? Evidence from AI Experts (2018) 9) How to get empowered not overpowered by AI, Max Tegmark, TED talk (2018) 10) 아실로마 AI 원칙, Future of Life Institute (2017), https://futureoflife.org/ai-principles-korean/ 5
용어내용 연구목표 연구비지원 인공지능연구의목표는방향성이없는지능을개발하는것이아니라인간에게유용하고이로운혜택을주는지능을개발하는것이다. 인공지능에대한투자에는컴퓨터과학, 경제, 법, 윤리및사회연구등의어려운질문을포함해유익한이용을보장하기위한연구비지원이수반되어야한다. 과학정책연결인공지능연구자와정책입안자간에건설적이고건전한교류가있어야한다. 연구문화인공지능연구자와개발자간에협력, 신뢰, 투명성의문화가조성되어야한다. 경쟁피하기 안전 인공지능시스템개발팀들은안전기준에대비해부실한개발을피하고자적극적으로협력해야한다. 인공지능시스템은작동수명전반에걸쳐안전하고또안전해야하며, 적용가능하고실현가능할경우그안전을검증할수있어야한다. 장애투명성인공지능시스템이손상을일으킬경우그이유를확인할수있어야한다. 사법적투명성 사법제도결정에있어자율시스템이사용된다면, 권위있는인권기구가감사할경우만족스러운설명을제공할수있어야한다. 고급인공지능시스템의디자이너와설계자는인공지능의사용, 오용및행동의 책임 도덕적영향에관한이해관계자이며, 이에따라그영향을형성하는책임과기회를 가진다. 가치관정렬 고도로자율적인인공지능시스템은작동하는동안그의목표와행동이인간의가치와일치하도록설계되어야한다. 인간의가치 인공지능시스템은인간의존엄성, 권리, 자유및문화적다양성의이상에적합하도록설계되어운용되어야한다. 개인정보보호 인공지능시스템의데이터를분석및활용능력의전제하에, 사람들은그자신들이생산한데이터를액세스, 관리및통제할수있는권리를가져야한다. 자유와개인정보 개인정보에관한인공지능의쓰임이사람들의실제또는인지된자유를부당하게축소해서는안된다. 공동이익 인공지능기술은최대한많은사람에게혜택을주고힘을실어주어야한다. 공동번영 AI 에의해이루어진경제적번영은인류의모든혜택을위해널리공유되어야한다. 인간의통제력 비파괴 인간이선택한목표를달성하기위해인간은의사결정을인공지능시스템에위임하는방법및여부를선택해야한다. 고도화된인공지능시스템의통제로주어진능력은건강한사회가지향하는사회적및시정과정을뒤엎는것이아니라그과정을존중하고개선해야한다. 인공지능무기경쟁치명적인인공지능무기의군비경쟁은피해야한다. 인공지능능력에관한주의 중요성 위험 재귀적자기개선 공동의선 합의가없으므로향후인공지능능력의상한치에관한굳은전제는피해야한다. 고급 AI는지구생명의역사에심각한변화를가져올수있으므로, 그에상응한관심과자원을계획하고관리해야한다. 인공지능시스템이초래하는위험, 특히치명적인또는실존적위험에는, 예상된영향에맞는계획및완화노력이뒷받침되어야한다. 인공지능시스템이재귀적자기복제나자기개선을통하여빠른수적또는품질증가를초래한다면, 설계된시스템은엄격한안전및통제조치를받아야한다. 초지능은널리공유되는윤리적이상을위해, 그리고몇몇국가나조직이아닌모든인류의이익을위해개발되어야한다. 자료 : 아실로마 AI 원칙, Future of Life Institute (2017), https://futureoflife.org/ai-principles-korean/ 6
범용인공지능의접근방법은크게두가지가있다. 11) 첫번째접근방법은기호적범용인공지능 (Symbolic AGI) 이다. 기호적범용인공지능의근간인기호적인공지능 (Symbolic AI) 은과거전문가시스템에서현대의 IBM 왓슨에이르기까지지속적으로활용돼왔다. 사람은물체를인식할때기호를부여한다. 그리고그기호간의관계를정립함으로써논리적인구조를만들고비슷한상황을추론할때활용한다. 이렇게기호적인공지능은지능이기호를다루는행위로정의하는분야다. 기호적범용인공지능의장점은접근방법자체가일반화에가장적합한도구라는것이다. 따라서심층학습과는다르게다양한지능적활동을할수있다. IBM 왓슨이질문응답시스템 (Q&A 시스템 ) 으로출발했지만, 현재응용분야는의료, 금융등다양하게그적용영역을넓히고있기때문이다. 그러나기호는간단한지각이나동기로인해변화하거나진화할수있기때문에, 단순히기호와규칙만으로범용지능을구현하기에는한계가존재한다. 범용인공지능의두번째접근방법은창발적범용인공지능 (Emergentist AGI) 이다. 창발적범용인공지능접근방법은인간의뇌의작동방식을다양한방식으로모사하여구현하는인공지능을의미한다. 특히, 뇌의구조와기능을역공학 (reverse engineering) 으로해석하여기계로구현하는방법이일반적이다. 심층학습역시큰의미에서보자면창발적접근방법이다. 심층학습에서활용되는인공신경망은본질적으로뇌신경망을모사하여만들었기때문이다. 흥미로운것은인공신경망의구조가조금더실제뇌를반영하도록진화하고있다는것이다. 그러나뇌의생리학적규명이아직완벽하지않기때문에, 더불어창발적범용인공지능의물리적한계가존재할수있다고볼수있다. 위에소개한두가지접근방법은물과기름처럼정확히나뉘는것은아니다. 실제로두가지를혼합한 (hybrid) 접근방법도존재한다. 또한위의접근방법이외에다른방식으로범용인공지능을해석하는관점도존재한다. 이보고서에서는위에서소개된두가지접근방법을준용하여, 이어지는 3장에서는접근방법별로대표적인범용인공지능연구현황을소개하겠다. 11) Artificial General Intelligence: Concept, State of the Art, and Future Prospects 에서소개된내용을정리 7
3. 범용인공지능의연구현황 (1) ACT-R (Adaptive Control of Thought Rational) ACT-R은대표적인기호적범용인공지능접근방법의인지아키텍처 (Cognitive Architecture) 12) 로 1973년부터시작된유서깊은인공지능연구다. ACT-R은인간의인지 (cognition) 가어떻게작동하는지에대한이론을컴퓨터를활용해구현하여다양한임무를해결하는데접목됐다. ACT-R의이론은심리학실험에서파생된수많은사실과인간의인지의과정에대한가정 (assumption) 을통해정립된다. ACT-R은일종의 SW 프레임워크로정립된이론을통해다양한문제 13) 를해결하는환경을제공한다. 연구자들은특정임무를해결하기위해 ACT-R을활용하여모델 ( 컴퓨터프로그램 ) 을만들수있고, 여기에연구자들은문제에대한가정을추가한다. 이가정은실제사람이동일한임무를수행한것과비교하여검증하는단계를거친다. 비교의측정기준은임무를해결하는데소요된시간과정확도, 최근에는사람의기능적자기공명영상 (FMRI) 도활용한다. 자료 : ACT-R homepage 에서재구성, http://act-r.psy.cmu.edu/about/ ACT-R 을활용한연구결과는약 700 건이상에이르며, 대표적인응용분야는 인간의기억, 자연언어처리, 인지뇌과학, 교육등다양하게활용된다. ACT-R 은 개선을거듭하여 2017 년 7 월기준 7.5 버전이공개돼있다. 14) 12) 인지아키텍처는인간의사고를구조화하는이론을기계장치에구현하는분야 13) 하노이탑문제, 문서나단어의기억, 언어이해, 의사소통, 비행기조종시뮬레이션등 14) ACT-R software, http://act-r.psy.cmu.edu/software/ 8
(2) Soar Soar는 ACT-R과마찬가지로대표적인기호적범용인공지능연구이며인지아키텍처이다. Soar는 1983년처음연구프로젝트가시작됐고 ACT-R과함께전통적인인공지능연구를대표한다. Soar는범용지능을갖는에이전트를만들기위해그구성요소기술 (building blocks) 을개발하는것을목표로한다. 이에이전트는인간의거의모든지적활동을대체할수있는것으로의사결정, 문제해결, 계획수립, 자연언어처리등광범위한일을할수있는범용인공지능이다. Soar는 ACT-R과마찬가지로인간의인지 (cognition) 에대한이론의정립과이를컴퓨터공학적으로구현함에있다. Soar는범용인공지능의기능과효율성에집중을한반면, ACT-R은인간의인지에대한세부적인모델링에중점을뒀다는것으로그차별점을찾을수있다. Soar는인간의인지에대한가설몇가지를제시한다. 첫번째가설인문제공간가설 (Problem Space Hypothesis) 은아무리복잡한임무도세부적으로분할될수있으며, 이것은간단한의사결정의연속 (sequence) 로볼수있다는것이다. 두번째가설은간단한의사결정이순차적이아닌병렬적으로이루어진다는점이다. 또한 Soar의기본구조는모듈화되어있고, 하나의모듈이언어나계획등기능적인지능활동이라기보다는장단기기억, 시각적인기억등기억에관련된모듈로구성돼있다. [ 그림 2] 는 Soar의메모리모듈을나타낸다. 기간별, 종류별로기억을세분화하여다양한지능적행동을수행하는것이가장큰특징이다. Soar의대표적인응용분야는추론을요구하는퍼즐과게임, 파일럿시뮬레이션, 자연언어이해, 로보틱스등이있다. Soar 역시 ACT-R과마찬가지로인공지능프로그램을공개SW 형태로제공한다. 자료 : Extending the Soar Cognitive Architecture, John E. Laird (2008) 9
(3) CBMM (Center for Brains Minds+Machines, MIT) 15) CBMM은 MIT의연구소로인간의뇌구조를역공학으로구현하는연구를수행한다. CBMM은궁극적으로범용인공지능을개발하는것을목표로하고있고, 현재는시각지능 (Visual Intelligence) 에집중하고있다. 현재심층학습기술은이미지에서사물을인식하는데매우뛰어난성능을보유하고있다. 그러나사람이가지고있는시각적인지능은복합적인의사결정의결과다. 예를들어 500명이앉아있는강당의첫번째줄에있는사람에게 당신뒤에몇명이나있나요? 혹은 당신에서가장가까운벽은얼마나떨어져있나요? 에대한질문에대해뒤나벽을보지않고도대답할수있을것이다. 이처럼사람의시각지능은비단시각적인정보뿐만아니라경험과직관에의해구성된다는점이다. 따라서현대의심층학습은지능이라기보다고성능의패턴인식기술이라고볼수있다. 사람처럼행동할수있는시각지능을구현하기위해 CBMM은다양한분야의전문가와협업을하고있다. 특히유아의행동발달과정을분석하는심리학자와협업하여시각지능을구현하기위한가설을세우고실험을통해증명해나가고있다. 그결과유아의행동을역공학적으로분석하여아래 [ 그림 3] 과같은가설을세웠다. 이것을구현하는방법론으로는확률적프로그램 (Probabilistic program) 으로소개했다. 확률적프로그램은기호적지능표현과확률적추론, 그리고심층학습구조를융합하여만든개념이다. 자료 : MIT AGI: Buliding machines that see, learn, and think like people (2018) 15) MIT 의 AGI 강의 MIT AGI: Buliding machines that see, learn, and think like people (Josh Tenenbaum) 에서요약 10
(4) Meta-learning and Self-play 16) 메타학습방법은기본적으로심층학습에서파생되어나온분야다. 따라서큰의미에서메타학습은창발적범용인공지능의접근방법으로해석할수있다. 메타학습의출발은강화학습으로부터시작한다. 강화학습은 AlphaGo의자체대국 (Self-play) 에서도활용됐듯이, 행위에대한보상으로전략을가다듬는역할을한다. 강화학습의가장큰관건은보상에대한정의다. 바둑의경우승패가명확하기때문에그보상에대한설계도쉽다. 그러나사람이걷는행위나물건을집는행위는단순히맞다틀리다로구분짓기어렵다. 또한강화학습은승리하기위한전략에치중하여성공을통해서는학습할수있으나실패를통해학습하기는쉽지않다. 그이유는성공과실패의경우의수가같지않은경우가대부분이기때문이다. 강화학습은컴퓨터시뮬레이션을통해학습하고, 이것을물리적인로봇으로이식하는것이가능하다. 하지만실제물리적인로봇에서는중력이나관성등다양한현실적인모수들이존재하기때문에, 실제로적용하려면다시학습해야하는어려움이있다. 이것은대처하기위해다양한시뮬레이션환경을무작위로부여하여학습하는방법론이소개됐다. 한가지흥미로운연구는보상을사람이직접개입하여주는형태로도성공적인학습이가능하다는것을시사했다. 신경망구조탐색 (Neural Architecture Search) 은최적의심층신경망의구조를도출하기위해심층학습을활용한기술이다. 쉽게말하자면학습하는방법을학습하는기술이다. 신경망구조탐색은 [ 그림 4] 와같이순환신경망을통해파생되는신경망을학습하여최적의인공신경망구조를탐색한다. 인공신경망을일종의다변문자열 (variable-length string) 로표현하여 [ 그림 4] 의 controller는일정확률 p로인공신경망문자열 (child network) 을생성한다. 이문자열로구성된인공신경망은학습데이터로학습되고, 그정확도를되먹임 (Feedback) 하여최적의신경망을찾는다. 신경망구조탐색은심층신경망구조자체가미지수이기때문에매우높은자유도 (degree of freedom) 를갖고있다. 이로인해상당한수준의계산자원을필요로한다. 최근연구결과에서는고성능그래픽카드한장으로도높은성능을이끌어냈다. 17) 16) MIT 의 AGI 강의 OpenAI Meta-Learning and Self-Play (Ilya Sutskever) 에서요약 17) Pham, Hieu, et al. "Efficient Neural Architecture Search via Parameter Sharing." arxiv preprint arxiv:1802.03268 (2018). 11
자료 : Neural architecture search with reinforcement learning 에서재구성 강화학습을비롯한심층학습이범용인공지능으로가기위해서는해결해할숙제는크게두가지가있다. 먼저학습과시험용데이터의본질적인차이다. 우리가지금까지측정한심층학습의성능은학습및시험용데이터가거의동일한구조를가지고있다는것을가정하기때문이다. 위의로봇시뮬레이션예시에서도알수있듯이, 실제시험용데이터는학습용데이터와상당히다를것이다. 두번째숙제는현재심층학습기술은지속적인학습이거의불가능하다는점이다. 이미학습된인공신경망에데이터를추가적으로학습하기위해서는상당히많은데이터가필요하기때문에, 이를극복하기위한노력이필요하다는것이다. 12
4. 결론 지금까지범용인공지능의개념과접근방법, 연구현황을살펴봤다. 현재범용인공지능연구와관련된문헌이나활동을종합해보면아직범용인공지능의출현은먼미래로보인다. 다만, 심층학습을필두로한인공지능의성능은눈부시게발전하고있다는것은사실이다. 그러나전통적인기호적인공지능의연구사례를살펴보면심층학습과는전혀다른접근방법을취하고있다. 그렇기때문에과연심층학습의발전이범용인공지능과상관관계가있을까? 라는의문을품게된다. 전문가들은기호적인공지능과심층학습의유기적인결합을강조한다. 각분야에특화된임무가서로다를수있기때문이다. 한편으로는뇌를역공학으로분석하여구현하는창발적범용인공지능연구가진행되고있다. 이접근방법은유아의행동발달과정이나뇌의네오코텍스 (neo-cortex), 혹은뇌전체를슈퍼컴퓨터로구현하는것을목표로한다. 많은전문가들이강조했듯이범용인공지능이출현한다면그것은인간의수준을쉽게뛰어넘는초인공지능이될것이다. 이사실은사람과인공지능이더이상주종관계가아니고공존하는관계여야함을시사한다. 이에많은인공지능연구자들은미래인공지능의윤리와정책에대해서도심도있는논의를진행하고있다. 또한, 인공지능은반드시사람에게이롭게활용돼야한다는대원칙아래, 전세계인공지능연구자는인공지능을이롭게활용하기위한 23가지원칙을정립했다. 이러한움직임은그만큼범용인공지능에대한파급력이크다는사실을반증한다. 우리도인공지능을이롭게활용해야한다는대전제에동참하여앞으로의인공지능 R&D 방향을설정해야할것이다. 특히인공지능에대한윤리는본격적인연구가필요하다고본다. 또한현재인공지능은그활용측면에서산업계의확산이매우빠르게일어나고있다. 인공지능을통한산업진흥도중요한분야지만, 더막대한파급력을갖고있는범용인공지능에대한투자도아끼지말아야한다고본다. 13
[ 별첨 ] 범용지능에대한다양한해석 앞서범용인공지능은사람수준의지능이라고소개했다. 그렇다면사람수준의지능이라는실체는무엇일까? 사람의일반적인지능적행동을지칭하는단어로는범용지능 (General Intelligence) 이있다. 이범용지능을구체화하기위해다양한분야의연구자들은자신들의해석을밝혔다. 18) 먼저실용적관점 (Pragmatic Approach) 이있다. 이관점의대표적인예는 1950 년앨런튜링이제안한 튜링테스트 이다. 튜링테스트는사람과인공지능의대화에서누가사람인지인식할수있는지의여부를판단하는것이다. 이것을확대해서보면사람의지능과인공지능의기능적측면을비교하여범용인공지능을판단하는접근이다. 다시말하자면, 사람의지능적행동에방해될만큼인공지능기술이발전했다면이것이곧범용지능이라는관점이다. 두번째는심리학적관점이다. 범용지능의심리학적관점은실용적관점보다는더원론적인접근을취한다. 심리학관점에서는범용지능을크게두가지원칙으로해석한다. 먼저개인이형성한도메인지식 (Knowledge domains) 은서로상관성이있기때문에, 해당도메인별지식의수준 (level) 이크게다르지않다. 이것을개인내다양성 (intra-individual variability) 이라고한다. 두번째원칙은개인간의도메인지식은상당한수준으로상이할수있다는것으로, 개인간다양성 (inter-individual variability) 라고지칭한다. 심리학자가드너 (Gardner) 는이것을바탕으로인간의지능에대해 8가지 19) 로구분지었다. 심리학적관점에서인간수준의범용지능논의하기개최된 2009년 AGI Roadmap workshop에서는 14가지 20) 의분류체계를제시했다. 다음은인지아키텍처 (cognitive architecture) 관점의범용지능이다. 인지아 키텍처는 SW 의속성이강하다. 따라서인지아키텍처연구자들은범용지능을 18) Artificial General Intelligence: Concept, State of the Art, and Future Prospects 에서소개된내용을정리 19) 1 언어적 (linguistic), 2 논리적 수학적 (logical-mathematical), 3 음악적 (musical), 4 운동감각적 (bodily kinesthetic), 5 공간적 (spatial), 6 대인관계 (interpersonal), 7 자기내부적 (intrapersonal), 8 자연주의적 (nautralist) 지능, 다중지능이론, Gardner(1999) 20) 인지 (perception), 구동 (actuation), 기억 (memory), 학습 (learning), 추론 (reasoning), 계획 (planning), 주목 (attention), 동기 (motivation), 감정 (emotion), 모델링 (modeling self and other), 사회적상호작용 (social interaction), 소통 (communication), 정량적 (quantitative), 창조 (building/creation) 14
구현하기위해 SW적인관점에서의요구사항을논의한다. 예를들면, 다양한작업을수행함에있어 SW 구조는고정되어야한다는점이다. 새로운작업을수행하기위한논리나알고리즘이 SW상에구현돼있어그구조는동일해야함을의미하는것이다. 네번째는수학적방법이다. 수학적방법의주된가정은범용지능을구현하기위해서무한대의계산이필요하다는점이다. 이것은제한된계산자원으로는범용지능을달성할수없으나, 특정시스템은다른시스템보다더지능적일가능성이있다고해석할수있다. 이가정은사람역시완벽한범용지능이라고볼수없는모순에직면한다. 그러나사람은다른시스템 ( 곤충, 파충류등 ) 보다더지능적이라고볼수있기때문에수학적접근으로지능을해석하는것이일견타당한면이있다. 마지막은주변환경과밀접하게관련된적응주의적 (Adaptationist) 관점에서범용지능을접근하는방법이다. 인공지능연구자인 Pei Wang은범용지능을 제한된자원을활용해환경에적응하는것 으로개념화했다. 지금까지범용지능을특징화한다섯가지접근에대해서살펴봤다. 이것을정리하면다음 < 표 2> 와같다. 접근방법내용 실용적관점심리학적관점인지아키텍처관점수학적관점적응주의적관점 - 사람의지능과인공지능의기능적측면을비교하는접근 - 대표적인예 : 튜링테스트 - 지능의해석 : 개인내다양성, 개인간다양성 - 인간의지능분류 : Gardner 의 8 가지분류 - SW의관점에서범용지능의해석 - 다양한작업을수행함에있어 SW구조는고정돼야함 - 범용지능을구현하기위해서는무한대의계산자원이필요 - 제한된계산자원으로는상대적으로우수한범용지능을구현 - 제한된자원을활용해환경에적응한다는접근 자료 : Artificial General Intelligence: Concept, State of the Art, and Future Prospects, Ben Goertzel (2017) 15
[ 참고문헌 ] 1. 국외문헌 Goertzel, Ben. "Artificial general intelligence: concept, state of the art, and future prospects." Journal of Artificial General Intelligence 5.1 (2014): 1-48. Grace, Katja, et al. "When will AI exceed human performance? Evidence from AI experts." arxiv preprint arxiv:1705.08807 (2017). Kurzweil, Ray. The singularity is near. Gerald Duckworth & Co, 2010. Laird, John E. "Extending the Soar cognitive architecture." Frontiers in Artificial Intelligence and Applications 171 (2008): 224. Pham, Hieu, et al. "Efficient Neural Architecture Search via Parameter Sharing." arxiv preprint arxiv:1802.03268 (2018). Zoph, Barret, and Quoc V. Le. "Neural architecture search with reinforcement learning." arxiv preprint arxiv:1611.01578 (2016). 2. 국내문헌 AlphaGo 의인공지능알고리즘분석, 이슈리포트 2016-002, 소프트웨어정책연구소 (2016) AlphaGo Zero 의인공지능알고리즘, 이슈리포트 2017-009, 소프트웨어정책연구소 (2017) 3. 기타 ACT-R software, http://act-r.psy.cmu.edu/software/ How to get empowered not overpowered by AI, Max Tegmark, TED talk (2018) MIT AGI Lectures (2018), https://agi.mit.edu/ 아실로마 AI원칙, Future of Life Institute (2017), https://futureoflife.org/ai-principles-korean/ 16
주의 1. 이보고서는소프트웨어정책연구소에서수행한연구보고서입니다. 2. 이보고서의내용을발표할때에는반드시소프트웨어정책연구소에서수행한 연구결과임을밝혀야합니다. [ 소프트웨어정책연구소 ] 에의해작성된 [SPRI 보고서 ] 는공공저작물자유이용허락표시기준제 4 유형 ( 출처표시 - 상업적이용금지 - 변경금지 ) 에따라이용할수있습니다. ( 출처를밝히면자유로운이용이가능하지만, 영리목적으로이용할수없고, 변경없이그대로이용해야합니다.)