인공지능컴퓨팅인프라의중요성과실태조사현황및시사점 A Report of Importance of AI Computing Infrastructure and Current Status / Implications on Survey
집필기관및참여인원 : 소프트웨어정책연구소 추형석
목 차 제 1 장서론 1 제 1 절연구배경및필요성 1 제 2 절연구방법및범위 6 제2장인공지능컴퓨팅인프라의중요성 7 제1절개요 7 제2절인공지능과컴퓨팅환경 9 제3절인공지능과 GPU 컴퓨팅 15 제4절인공지능사례분석 게임인공지능을중심으로 18 제3장중소기업 스타트업의인공지능컴퓨팅인프라실태조사 25 제1절개요 25 제2절인공지능컴퓨팅인프라실태조사 26 제3절소결 37 제 4 장요약및시사점 39 참고문헌 40 별첨 1. 실태조사설문지 41 별첨 2. 실태조사결과표 47
Contents Part 1. Introduction 1 1. Backgrounds 1 2. Methods 6 Part 2. Importance on AI Computing Infra 7 1. Introduction 7 2. AI and Computing Infra 9 3. AI and GPU Computing 15 4. Game AI examples 18 Part 2. Importance on AI Computing Infra 25 1. Introduction 25 2. Result of Survey on AI Computing Infra 26 3. Conclusion 37 Part 4. Summary and Implications 39 References 40 Attachment 1. Survey form 41 Attachment 2. Survey results (chart) 47
< 표 2-1> 병렬계산의효율성 14 < 표 2-2> 게임인공지능과컴퓨팅환경 19 < 표 3-1> 인공지능컴퓨팅인프라실태조사일반현황 26 < 표 3-2> 설문조사 GPU 모델 28 < 표 3-3> 인공지능컴퓨팅인프라지원형태의장 단점 29 < 표 3-4> 인공지능컴퓨팅인프라실태조사범위 29 < 표 3-5> 72개실태조사응답기업에대한특성 30 < 표 3-6> GPU 현황및향후수요 ( 설문응답 72개기업대상 ) 32 < 표 3-7> 전체설문조사대상 215개기업의매출액분포 32 < 표 3-8> 인공지능컴퓨팅인프라사업관련주요의견 37 - ii -
[ 그림 1-1] 인공지능의 70년역사 2 [ 그림 1-2] 인공지능성공의원동력 4 [ 그림 2-1] 삼성갤럭시 S7에탑재된 GPU의이론성능과슈퍼컴퓨터의비교 10 [ 그림 2-2] 현대연산처리장치의성능 11 [ 그림 2-3] 폰노이만연산처리장치의개념도 12 [ 그림 2-4] 다양한계산자원의루프라인 13 [ 그림 2-5] 다양한알고리즘의연산강도 16 [ 그림 2-6] 유효숫자별 cublas의성능실측치 17 [ 그림 2-7] 계산자원별소비시간비교 19 [ 그림 2-8] 합성 (Convolution) 의수학적모형 20 [ 그림 2-9] 이미지합성 (Convolution) 의과정 21 [ 그림 2-10] 합성곱층의개념도 21 [ 그림 2-11] 합성곱의계산 행렬곱 22 [ 그림 3-1] 심층학습및 GPU 활용여부설문결과 31 [ 그림 3-2] 인공지능컴퓨팅인프라지원방법에대한선호도조사 34 [ 그림 3-3] 인공지능기술수준조사결과 36 - iii -
요약문 1. 제목 인공지능컴퓨팅인프라의중요성과실태조사현황및시사점 2. 보고서의목적인공지능과컴퓨팅인프라의관계를기술적으로분석하여그중요성에대해분석한다. 최근인공지능기술로가장널리활용되는심층학습은경험적으로결과를도출하는것이일반적이다. 또한심층학습은빅데이터에서패턴을예측한다는점에서필연적으로많은계산을요구한다. 이러한인공지능의특징으로인하여인공지능컴퓨팅인프라의수요는전세계적으로급증하고있다. 글로벌 IT 기업은인공지능전용컴퓨팅환경을구축하여클라우드서비스를제공하고있으며, 일본은 195억엔규모의인공지능클라우드인프라를구축할예정이다. 우리나라역시이러한중요성을인지하고인공지능컴퓨팅인프라지원사업을추진하고있으나양적인측면이미흡하다. 이번보고서에서는인공지능관련중소기업 스타트업의인공지능컴퓨팅인프라의현황과향후수요에대한실태조사결과를분석한다. 이결과를활용하여현재국내중소기업과스타트업의컴퓨팅인프라수요를가늠하고, 정책설계자료로활용하는데목적을둔다. 3. 보고서의구성및내용보고서는크게두가지주제로구성된다. 먼저인공지능의성공요인을바탕으로인공지능연구에있어컴퓨팅인프라의중요성에대해분석했다. 현대연산처리장치의발전사와특성을바탕으로 왜인공지능연구에컴퓨팅인프라가필수적인가? 에대해기술적으로분석하여논리적인근거를제시한다. 특히인공지능연구에가장활발히활용되고있는그래픽연산처리장치 (GPU) 의하드웨어적인특성을소개한다. 다음은인공지능관련중소기업 스타트업의인공지능컴퓨팅인프라현황과향후수요를파악하기위한실태조사결과를기술했다. 실태조사대상을중소기업과스타트업으로한정한이유는인공지능인프라지원사업을설계할때가장먼저지원해야할부분으로고려했기때문이다. 중소기업이나 - iv -
스타트업은대기업과다르게인프라구축및운영에대한비용을감당하기에상대적으로어렵기때문이다. 또한현재인공지능의기술을견인하는주체는전세계적으로스타트업에집중돼있다. 실태조사에서는현재보유하고있는인공지능컴퓨팅장비와향후인공지능연구에활용할컴퓨팅장비의수요에대해조사했다. 조사결과의의미와한계를제시함으로써지표의객관성을확보했다. 또한정부의인공지능컴퓨팅인프라지원방법에대한선호도조사를통해현재산업에서요구하는사항이무엇인지파악했다. 4. 활용 인공지능컴퓨팅인프라지원정책의설계자료로활용 - v -
Summary 1. Title A Report of Importance of AI Computing Infrastructure and Current Status / Implications on Survey 2. Purpose Analyze the importance of artificial intelligence and computing infrastructure technically. Deep learning, which is the most widely used artificial intelligence technology in recent years, is generally based on empirical results. Also, deep learning requires a lot of computation in that it predicts patterns in big data. Due to the characteristics of this artificial intelligence, the demand for artificial intelligent computing infrastructure is rapidly increasing worldwide. Global IT companies are providing cloud services by establishing a dedicated computing environment for artificial intelligence. On the other hands, Japan will build an artificial intelligence cloud infrastructure of 19.5 billion yen. Korea is aware of this importance and is supporting the artificial intelligence computing infrastructure project, but it is not enough quantitative aspect. In this report, I analyze the current state of artificial intelligence computing infrastructure of artificial intelligence-related SMEs and start-up, Using these results, I aim to measure the demand of computing infrastructure of domestic SMEs and start-ups and utilize them as policy design data. 3. Contents and Details The report consists of two main topics. First, based on the success factors of artificial intelligence, I analyzed the importance of computing infrastructure in artificial intelligence research. With the evolution and characteristics of modern computation processing devices, it provides a logical basis for the technical analysis of why computing infrastructure is essential for artificial intelligence research. Especially, I introduce hardware characteristics of GPU which is most actively used in artificial intelligence research. - vi -
The following describes the status of the artificial intelligence computing infrastructure of small-enterprises and start-ups, and the results of actual surveys to identify future demand. The reasons for limiting the survey to SMEs and start-ups are considered to be the first step in designing an artificial intelligence infrastructure support project. Unlike large companies, SMEs and start-ups are relatively difficult to cope with infrastructure construction and operation costs. In addition, the subject that is currently driving the artificial intelligence technology is focused on start-up around the world. In this research, I investigated the demand for artificial intelligent computing equipment and computing equipment to be used in future artificial intelligence research. By presenting the meaning and limitations of the survey results, the objectivity of the indicators was secured. I also examined the preferences of the government policy on how to support the artificial intelligence computing infrastructure to understand what the industry needs. 4. Application Utilize policy design of artificial intelligence computing infrastructure - vii -
제 1 장서론 제1절연구배경및필요성지난 2016년 3월 알파고쇼크 로기억될세기의대국에서인공지능바둑프로그램알파고가세계최정상바둑기사이세돌 9단을 4:1로꺾었다. 이기세를이어지난 2017년 10월, 인간의기보를전혀학습하지않은 알파고제로 가바둑을정복하기에이르자인공지능의가능성에대한일말의의심을불식시켰다. 이처럼인공지능의성능이급성장하게된계기는무엇일까? 먼저인공지능의역사에서그단서를얻을수있다. 1. 인공지능의역사인공지능은 1956년다트머스회의에서그개념이최초로정립되면서인간의지능을대체할학문분야로인정받았다. 1970년대에는특정분야에전문적인지식을탑재한전문가시스템 (Expert System) 에막대한연구자금이투입되어인공지능의첫번째황금기를맞이했다. 하지만부풀었던기대와는다르게전문가시스템이목표문제를해결하지못함에따라 1980년대중반까지내리막길을걷게된다. 이어 1985년신경망학습에대한획기적인연구성과로반전을겪는다. 인공신경망 (Artificial Neural Network) 으로잘알려진다층퍼셉트론 (Multi-Layer Perceptron) 의학습방법인오류역전파법 (Error back-propagation method) 이지능적문제를해결할수있는가능성을보여줬기때문에인공지능분야는다시한번탄력을받기시작했다. 그러나오류역전파법역시제한적인데이터, 컴퓨팅파워등물리적인한계로인해빛을발하지못했고인공지능은다시암흑기에진입했다. 한편, 2006년캐나다토론토대학의제프리힌튼교수는인공지능부활의신호탄을알리는논문을발표했다. 이것은바로급부상하고있는키워드인심층학습 (Deep Learning) 이다. 심층학습은기존의인공신경망을더욱깊게구성하는기술로그동안지적되어왔던오류역전파법의한계를극복했다. 인공신경망을학습한다는개념은곧비용함수의전역최소값 (global minimum) 을 - 1 -
찾는문제로귀결하는데, 초기값에대한의존성이커서신경망을새로학습할때마다일관성이없는결과를도출했기때문이다. 이에힌튼교수연구진은자율학습 (unsupervised learning) 이라는개념을도입하여문제를해결하는방안을제시했다. 이자율학습이적용된결과가대중에도잘알려진구글브레인프로젝트이다. 구글브레인은유튜브영상에서고양이를인식하는실험을했는데학습과정중에는고양이의정보를알려주지않았다. 연구결과높은확률로고양이를인식하는데성공했고, 이결과를바탕으로많은연구진들이차차심층학습을도입하기시작했다. 현재인공지능분야에서는이미지인식, 필기인식, 음성인식, 영어의자연어처리가가장성공적인분야로꼽힌다. 이미지에서의객체인식률은이미사람에버금가는수준에도달했고, 중국어와영어음성을동시에인식하는기술이소개됐으며, 필기체인식은 99% 에육박하여우편물처리자동화에이미적용됐다. [ 그림 1-1] 인공지능의 70 년역사 자료 : 알파고의능력은어디에서오는가?, 소프트웨어정책연구소 (2016) - 2 -
현대인공지능의성공요인두번의황금기와암흑기를지나세번째황금기를맞이하고있는인공지능은정보통신기술혁명의자연스러운결과이다. 그혁명의저변에는크게세가지요소가있다. 컴퓨팅환경의고도화가그첫번째요소이다. 컴퓨터연산처리장치는지수적인성능향상을달성하며발전했으며, 실리콘칩의대량생산에따라저렴한가격으로보급이가능해졌다. 발전속도를정량적으로비교해보자면현재스마트폰에탑재된 AP(Application Processor) 의 GPU( 그래픽연산처리장치, Graphical Processing Unit) 는약 265 GFLOPs 1) 의이론성능을보유하고있다. 1996년 6월발표된세계 1위슈퍼컴퓨터인일본의 SR2201/1024의실측성능은약 220 GFLOPs로스마트폰의 GPU의이론성능에육박한다. 20년전약 500억원에달하는슈퍼컴퓨터가손안에들어온시대가된것이다. 이러한환경변화에도불구하고학습기반의인공지능연구에는여전히막대한계산량을필요로한다. 예를들어심층학습기술은신경망구성에대한이론이나원칙이경험적으로짐작 (Rule of Thumb) 되기때문에많이시도해보는것이중요하다. 바둑인공지능프로그램알파고의기보학습에는약 3주간의시간동안 50장의그래픽카드를활용하여계산했는데, 이결과를얻기까지수천, 수만번의반복계산이필요했을것이다. 따라서인공지능연구에는고성능연산처리장치의보급이가장핵심적인역할을했다고볼수있다. 두번째요소로는빅데이터의대중화이다. 제4차산업혁명에서데이터의중요성은언급을하지않아도될정도로공감대가형성됐다. 인터넷을통한데이터의보급은새로운먹거리를창조할뿐만아니라지능적의사결정을위한인공지능연구에도활용하고있다. 빅데이터여론분석을통해기업의이미지와상품의피드백을추측할수있으며, 타겟형소비자매칭으로영업이익을극대화하는것이현실적으로가능해졌다. 학습기반의인공지능분야에서는자율학습 (unsupervised learning) 이라는개념이등장함에따라데이터를재가공하기위한비용이절감됐다. 기존의감독학습 (supervised learning) 은데이터와대응값이 1:1로쌍을이뤄야했기때문에학습에필요한데이터셋을 1) FLOP( 부동소수점연산수, Floating point Operation) 은연산수를나타내는단위로연산처리장치의성능을측정하는지표로사용됨. FLOP/s( 초당부동소수점연산수 ) 는 1 초에얼마나많은연산을처리할수있는지를나타내는것으로슈퍼컴퓨터의성능비교등에적용 - 3 -
구성하는것이무엇보다중요했다. 하지만자율학습에서는대응값이필요하지않다. 따라서인공지능분야에서빅데이터의대중화는로켓엔진의연료역할을하여기술적진화를가속화한것이다. 마지막으로공개소프트웨어가인공지능성공의원동력이다. 현재인공지능및기계학습관련공개소프트웨어는글로벌 IT 기업이주도적으로개발하고있다. 구글의텐서플로우 (TensorFlow), 마이크로소프트의 CNTK(Computational Network ToolKit), 페이스북의토치 (Torch) 등현재까지공개된인공지능관련소프트웨어는 50가지가넘는다. 이러한공개소프트웨어의힘으로인공지능연구의진입장벽이현저히낮아졌다. 연구자들은데이터를확보하여모델링하는업무에집중할수있는환경이조성된것이다. 또한공개소프트웨어는집단지성을통해발전하여최신연구까지반영된신기술이적용됐다. GPU와같은고성능계산자원역시병렬화과정이모두구현되어컴퓨팅인프라를십분활용할수있다. [ 그림 1-2] 인공지능성공의원동력 자료 : 알파고의능력은어디에서오는가?, 소프트웨어정책연구소 (2016) - 4 -
3. 인공지능컴퓨팅인프라이보고서에서는현대인공지능의 3가지성공요인중컴퓨팅환경의고도화를집중적으로다루고자한다. 앞서기술했듯이현대인공지능의핵심인심층학습은경험적인결과를바탕으로한다. 따라서많은경우를고려하여다양한접근으로시도하는것이무엇보다중요한데, 이것은필연적으로막대한계산량을요구한다. 알파고개발진인딥마인드는구글에인수된뒤풍부한클라우드인프라를활용하고있다. 알파고역시구글클라우드계산자원을활용한결과라고볼수있다. 알파고의초기버전은최대 1,920개의 CPU와 280장의 GPU를활용한결과였다. 이를규모측면에서환산해보면당시약 380위정도에해당하는슈퍼컴퓨터에달한다. 실제로알파고는 30초의초읽기시간동안약 10만수를예측하고착수를결정한다. 이것을일반 PC에서처리하기위해서는약 80분이필요한것으로볼때컴퓨팅인프라는인공지능의필수적인요소임을확인할수있다. 이러한중요성으로인해일본은 195억엔 ( 약 1,840억원 ) 규모의인공지능전용클라우드를 2018년 1분기까지구축한다고밝혔다. 미국이나중국과같이글로벌 IT기업 ( 구글, 바이두 ) 이상대적으로약세인일본은인공지능분야에서선도적인입지를다지기위해컴퓨팅인프라를우선적으로지원하겠다는것이다. 현재우리나라역시인공지능과컴퓨팅인프라의중요성을인지하고관련된정부차원의지원정책을펼치고있으나, 그규모가미흡한것이현실이다. 또한인공지능을활용해제품이나서비스를개발하는기업이얼마나많은수요를가지고있는지가불분명하기때문에적정한지원규모를산정하기어렵다는점도있다. 이번보고서에서는먼저다양한관점에서인공지능과컴퓨팅인프라의중요성을설명하고자한다. 이어인공지능관련중소기업과스타트업의인공지능컴퓨팅인프라현황과향후수요를파악하는실태조사결과를분석한다. 총 215개의설문대상에서유효응답기업은 72개이며, 이를토대로인공지능컴퓨팅인프라현황과향후수요를분석하겠다. - 5 -
제2절연구방법및범위인공지능컴퓨팅인프라의중요성은고성능컴퓨팅 (High Performance Computing, HPC) 분야를위주로분석했다. HPC는대규모과학계산을수행하기위한컴퓨팅기술로, 일반적으로슈퍼컴퓨터를활용하는컴퓨팅기술을일컫는다. 현대인공지능컴퓨팅인프라에서가장주목받는연산처리장치는 GPU다. GPU는수천개의사칙논리연산유닛 (Arithmetic Logical Units, ALU) 를활용하여계산하는매니코어시스템이다. 따라서고성능병렬처리가필수이며이는필연적으로 HPC분야라고볼수있다. 또한게임인공지능분야의사례를심층분석하여인공지능컴퓨팅인프라의중요성을강조했다. 이어인공지능관련중소기업 스타트업의인공지능컴퓨팅인프라실태조사결과를분석했다. 실태조사의주된목적은중소기업 스타트업의인공지능컴퓨팅인프라의현황과향후수요가얼마나되는지에대한것을파악하기위함에있다. 이를토대로인공지능인프라지원정책의현실적인규모를산정할것이다. 또한인공지능컴퓨팅인프라와직 간접적으로연관된설문과인공지능관련일반설문도진행했다. 이번보고서에서는주요설문문항에대해문항별결과를분석할것이다. - 6 -
제 2 장인공지능컴퓨팅인프라의중요성 제 1 절개요 인공지능의부침의역사를살펴보면, 컴퓨팅파워가부족함으로인해암흑기를 맞이했던과거가있다. 1980 년대인공신경망기술은인간의뇌신경망을 모사하여지능적행동을구현한다는점에있어서인공지능의두번째황금기를 이끄는원동력이됐다. 인공신경망기술은비선형적인현상을분류할수있는 기능이이론적으로입증됐으나, 이를실제로구현할수있는계산능력이매우 부족했다. 또한데이터의부족과학습방법의일관성결여로인해인공지능의 암흑기 (AI winter) 를초래하기에이른다. 그러나컴퓨팅파워는무어의법칙 2) 에의해지수적인성장을하게된다. 이러한폭발적인성장에힘입어인공신경망기술역시점차구현가능한 영역으로조명받게되기에이른다. 무어의법칙에따르면지난 20 년동안 5,000 배에가까운성능이향상됐다. 무어의법칙이법칙으로서정립되기까지는 사실순탄치않은여정이었다. 초기의연산처리장치의발전은클럭스피드를 높이는것으로진행됐다. 클럭스피드가 3GHz 를넘어서자발열이지나치게 증가하여냉각을위해많은전력을요구했다. 전력대비성능의효율이급격하게 악화되자, 연산처리장치생산기업들은연산처리장치를병렬로탑재하기시작한다. 현재의쿼드코어 (4 개의 CPU) 나옥타코어 (8 개의 CPU) 는연산처리장치를병렬화한 것을의미한다. 이로써무어의법칙은명맥을이어갔으나연산처리장치를 활용하는측면에서어려움이발생하게된다. 바로알고리즘의병렬화에대한 필요성이다. 알고리즘의병렬화는 HPC 분야의전통적인연구분야다. 특히슈퍼컴퓨터는 여러대의고성능컴퓨터를고속통신망으로연결하여활용하기때문에, 알고리즘의병렬화가필수적이다. 기본적으로슈퍼컴퓨터의활용에의해서 발전한 HPC 분야는 HW 의성장과함께발전했다. 연산처리장치의지수적인 성장은과거에해결할수없었던문제에도전할수있는원동력이됐다. 큰 맥락에서인공지능역시마찬가지라고볼수있다. 2) 매 18 개월마다연산처리장치의성능이 2 배향상된다는법칙으로연산처리장치를구성하는트랜지스터의공정이 18 개월마다축소되는것을의미 동일한면적의집적도가향상 - 7 -
그렇다면알고리즘의병렬화에대해조금더살펴볼필요가있다. 통상적으로알고리즘이라고하면명령을순차적으로처리하는순차알고리즘을의미한다. 순차알고리즘의전부또는일부를병렬화하는것을병렬알고리즘이라고하는데, 모든순차알고리즘의병렬화가능한것은아니다. 예를들면, 수학점화식이있다. 점화식의 n차항을구하기위해서는초기항부터 n-1항의정보가필요하다. 이경우병렬화가불가능하다. 현재의정보가이전정보에의존하여변경되는순차알고리즘의경우병렬화가거의불가능하다고볼수있다. 병렬화가불가능하다는요인은현재의멀티코어, 매니코어시스템을십분활용하는데주요한병목이발생한다. 결국지수적으로발전한연산처리장치를활용하는데전제돼야하는조건은병렬화가능성이다. 결론적으로심층학습인공지능알고리즘은병렬화가능성이매우높다. 먼저경험적으로많은경우를수행하고최적의결과를도출한다는점에서태스크수준의병렬화 (task-level parallelism) 가용이하다. 또한심층학습의세부알고리즘은병렬화가효율이가장좋은것으로구성된점역시현대 HW의성능을십분활용가능하다. 비단 CPU 뿐만아니라 GPU를비롯해거의모든현대연산처리장치에서최대의성능을도출할수있다는것이다. 이번장에서는인공지능, 특히심층학습영역에서왜컴퓨팅인프라가핵심적인역할을하는지에대해기술할것이다. 이어지는 2절에서는인공지능과컴퓨팅환경에대해소개하고, 3절에서는인공지능과 GPU 컴퓨팅, 4절에서는게임인공지능사례를중심으로인프라의중요성을설명할것이다. - 8 -
제 2 절인공지능과컴퓨팅환경 1. 현대연산처리장치개요연산처리장치의성능은초당부동소수점연산수 (FLoating Point Operation per Second, FLOPS) 로측정한다. 부동소수점은일반적으로 IEEE-754 표준에의해단정밀도 (32bit, single precision), 배정밀도 (64bit, double precision) 로구분된다. 보편적으로슈퍼컴퓨터의연산능력을표현하는지표로는배정밀도를사용한다. 현재세계에서가장빠른슈퍼컴퓨터인중국의선웨이타이후라이트는 93.0 PFLOPS( 페타플롭스, 초당 1천조연산 ) 의성능을보유하고있다. 통상적인 CPU나 GPU의경우에는 GFLOPS( 기가플롭스, 초당 1조 ) 나 TFLOPS( 테라플롭스, 초당 10억 ) 를활용한다. 부동소수점연산수는프로그램의덧셈과곱셉연산의수로측정된다. 뺄셈은음수의덧셈으로대체가가능하다. 나눗셈의경우는여러번의덧셈과곱셈으로구성되기때문에, 나눗셈을하나의연산으로보기는어렵다. 예를들어 100차원의두벡터를내적하는연산은덧셈과곱셈이각각 100번수행되는것으로총연산량은 200 FLOP이라고볼수있다. 수치적인연산의특징을살펴보면, 덧셈과곱셈이동시에이루어지는경우가많으므로특정연산처리장치는덧셈과곱셈을한꺼번에처리하는기능을탑재하고있다. 현대연산처리장치의눈부신발전은손안의작은컴퓨터로인식되는스마트폰과과거의슈퍼컴퓨터의비교에서도찾아볼수있다. 스마트폰의두뇌는어플리케이션연산처리장치 (Application Processor, AP) 로저전력고성능의특징을가지고있다. 스마트폰은고해상도사진촬영및영상재생, 물체인식등그래픽처리를위한 GPU도탑재하고있다. 2016년출시된갤럭시 S7의 GPU Mali-T880 MP12는 265.2 GFLOPS의이론성능을보유하고있다. 이수치는지난 1996년세계에서가장빠른슈퍼컴퓨터로등극한동경대의 Hitachi SR2201/1024의실측성능 (220.4 GFLOPS) 에육박한다 [ 그림 2-1]. 앞서기술했듯이일반적인수치적인계산이가능한대표적인연산처리장치에는 CPU와 GPU가있다. 고성능 CPU의경우는 22개의코어와 1.5 TFLOPS의이론성능을보유하고있다. CPU는비단계산뿐만아니라다양한작업을처리해야하기때문에기본적으로높은범용성을갖는다. 이로인해순수한계산성능은동일가격 GPU에대비하여약 10배정도낮다 [ 그림 2-2]. - 9 -
[ 그림 2-1] 삼성갤럭시 S7에탑재된 GPU의이론성능과슈퍼컴퓨터의비교 자료 : top500.org, Performance Development https://www.top500.org/statistics/perfdevel/ Samsung Exynos, Wikipedia https://en.wikipedia.org/wiki/exynos GPU는본질적으로모니터에그래픽을출력하는역할을한다. 개인용컴퓨터가본격적으로보급된이후 PC 게임시장이급격하게커지면서화려한 3D 그래픽처리를위해고성능 GPU를개발하기에이른다. GPU는 CPU와다르게그래픽용도의목적이확고했기때문에, CPU와같이높은범용성은필요없다. 따라서 GPU는고속처리를위한연산기능을극대화하는방향으로발전했다. 2006년슈퍼컴퓨팅학회 (Supercomputing Conference) 에서는 GPU를활용해과학계산을시도한사례가처음소개됐다. 2008년에는세계최대의 GPU 벤더인 NVIDIA가 GPU에서프로그래밍가능한 CUDA(Compute Unified Device Architecture) 툴킷을공개한다. 이로써 GPU를과학계산에접목하는연구가활발히이루어졌으며, 슈퍼컴퓨터에탑재되기에이르러현대연산처리장치의핵심적인역할을수행하고있다. GPU가괄목할만한성공에이르자가속기형태의계산자원을활용하기위한프레임워크인 OpenCL(Open Computing Language) 도공개됐다. - 10 -
GPU는구조상 SIMD(Single Instruction Multiple Data) 형식의병렬화가가장일반적이고효율이높다. SIMD는하나의연산을수행하는다수의데이터를동시에처리하는데이터수준병렬화 (Data-level parallelism) 를뜻한다. 예를들면, 100차원의두벡터의덧셈은 100개의서로다른데이터가덧셈이라는하나의연산으로구성되기때문에 SIMD 방식으로구현이가능하다. CPU와 GPU이외의연산처리장치는크게가속기 (Accelerator) 의영역에속한다. GPU 역시일반적인컴퓨터시스템에서계산을가속한다는관점에서가속기로취급할수있다. 가속기는크게두가지형태가있다. 첫번째는 Intel에서개발한 Xeon Phi다. Xeon Phi는그간 Intel이개발했던 Atom이나 Pentium 프로세서를병렬로집적해제작한가속기다. Xeon Phi의가장큰장점은멀티코어프로세서에서작성한병렬프로그램을손쉽게이식할수있다는것이다. Xeon Phi는 Intel 연산처리장치와동일한 x86계열의명령어집합을활용하기때문이다. 이러한장점으로인해전통적인 CPU기반의슈퍼컴퓨터를활용하는영역에서많은수요가있다. 두번째는 FPGA(Field Programmable Gate Array) 다. FPGA를쉽게표현하자면프로그래밍가능한연산처리장치라고볼수있다. 따라서특정연산에최적화가능한장점이있다. 더불어이장점은저전력의특징과도맞물린다. 그러나도입에필요한높은비용, 어셈블리어수준의복잡한프로그래밍등으로인해진입장벽이매우높다. 최근 OpenCL을활용해프로그래밍장벽을낮추려는시도가있었으나, 최적화에는여전히많은시간을필요로한다. [ 그림 2-2] 현대연산처리장치의성능 자료 : Intel Xeon Processor E5-2699 v4, http://ark.intel.com/products/91317 Nvidia Tesla P100, http://www.nvidia.com/object/tesla-p100.html Intel Xeon Phi 7120P, http://ark.intel.com/products/75799-11 -
2. 현대연산처리장치의활용측면에서의이슈현대연산처리장치의성능을판단하는기준은이론성능과실측성능이있다. 이론성능은말그대로연산처리장치의 HW 구성에따라서달성할수있는최대성능을나타낸다. 실측성능은실제로수치적인연산이나응용프로그램을수행했을때나타내는수치를말한다. 슈퍼컴퓨터의성능역시이론성능과실측성능으로측정된다. top500.org에서는매년 2회 (6월과 11월 ) 1위부터 500위까지의슈퍼컴퓨터순위를공개하는데그기준은실측성능이다. 보편적으로슈퍼컴퓨터급시스템에서는실측성능으로이론성능의 70% 이상을달성한다. 이것을달성하기위해서는고속통신망구축, 소프트웨어최적화등의 HPC 기술이필요하다. 슈퍼컴퓨터의실측성능은전통적으로대규모선형대수프로그램 (High Performance Linpack 3) ) 으로측정한다. 선형대수프로그램은과학문제를해결하기위해가장보편적이고필수적으로활용된다. 그렇다면이론성능과실측성능의차이에대해서더깊게살펴볼필요가있다. 현대연산처리장치가작동하는방식은폰노이만아키텍처로부터시작한다 [ 그림 2-3]. 연산처리장치의성능은크게두가지요소로좌우된다. 첫번째는연산처리장치자체의계산성능이다. 두번째는연산처리장치에서연산을수행하기위해정보를전송하기위한메모리관련장치의전송성능이다. [ 그림 2-3] 폰노이만연산처리장치의개념도자료 : Von Neumann Architecture, Wikipedia. https://en.wikipedia.org/wiki/von_neumann_architecture 3) Linear Algebra Package 의약자로밀집행렬연산으로구성 - 12 -
과거연산처리장치는메모리전송속도는빠르나연산처리장치의계산능력은상대적으로느렸다. 그러나연산처리장치의성능은무어의법칙에의해지수적으로성장한반면, 메모리전송장치의성능은선형적으로향상됐다. 이로인해현대연산처리장치는계산성능은매우탁월하나계산을위한메모리전송속도는느려지는경향성을갖는다. 이러한성능의불균형으로인해알고리즘의계산집적도에따라계산의효율이극명하게나뉜다. 연산강도 (Arithmetic Intensity) 는알고리즘의총연산수와메모리전송량의비율로결정된다. 계산강도가높을수록전송된메모리를재사용하여계산하는것으로분석할수있다. 연산강도와연산처리장치의성능은루프라인 (Roofline) 모델로표현할수있다. 여기서루프 (Roof) 의의미는연산처리장치가 HW적으로달성할수있는최대이론성능이다. 앞서기술했다시피연산강도가낮으면연산처리장치의최대성능을사용하지못하기때문에, 연산강도가높아질수록선형적으로그성능이증가한다. 일정연산강도이상에서는이론성능을달성할수있기때문에상수로수렴하게된다. 여기서선형적증가가상수로변하는시점은해당연산처리장치의메모리대역폭과연산성능의비율로결정된다. [ 그림 2-4] 는다양한연산처리장치와알고리즘에대한루프라인모델이다. [ 그림 2-4] 다양한계산자원의루프라인 자료 : How will the fast multipole method fare in the exascale era? (2013.07) [ 알고리즘설명 ] SpMV : 희소행렬 (Sparse Matrix) 과벡터의곱 Stencil : 편미분방정식의수치해법에적용되는연산 3D FFT : 3차원고속푸리에변환 (Fast Fourier Transformation) FMM : 고속멀티폴방법 (Fast Multipole Method) - n-body 연산에활용 DGEMM : 배정밀도행렬곱연산 (Double-precision GEneralized Matrix Multiplication) - 13 -
정리하자면루프라인모델에서선형적으로증가하는부분은메모리전송에 소요되는시간동안연산처리장치가유휴상태 (idle) 에처한다고볼수있다. 루프라인모델에서의가장큰가정은알고리즘자체가병렬화가능한것을 전제로한다. 루프라인모델을다른시각에서한번더살펴보면우리가간과하기쉬운 내용을짚어볼수있다. 시중에가장보편적으로판매되고있는쿼드코어 (4 개의 연산처리장치 ) CPU 를예로들어보자. 예를들어 12 차원의두벡터의원소별 합을구하는알고리즘을생각해보자. 이것은곧 12 번의덧셈이고, 서로독립적인 연산이기때문에병렬화가가능한알고리즘이다. 12 번의덧셈을 4 개의코어에 3 번의덧셈을각각할당하여계산하는상황을가정해보면, 1 개의코어에서 12 번의덧셈을수행하는시간보다 4 배빠른결과가나올것이라고판단할수 있다. 그러나이것은사실과다르다. 현대연산처리장치에서는오히려 1 개의 코어를사용하나 4 개의코어를사용하나소요되는시간은비슷하게측정된다. 12 차원의벡터가아닌 12 만차원의벡터를적용해도동일한결과가나온다. 그 이유는연산강도를계산해보면명확해진다. 두벡터의합을구하는알고리즘의 연산강도는 1/16 4) 으로고정되기때문이다. 이수치를 [ 그림 2-4] 에대입해보면 거의모든계산자원에서상당히낮은수준의성능을나타낸다. 따라서성능 향상은거의기대할수없는것이다. 위예제를표로정리하면 < 표 2-1> 과같다. < 표 2-1> 병렬계산의효율성 Q. 12 개의원소를갖는두벡터의합을구하는연산이있다고가정하자. 만약 4 개의코어를갖는연산처리장치를활용한다면단일코어대비 4 배의성능향상을달성할수있는가? A. 반드시 4 배의성능향상을보장할수없다. 위연산의연산강도를계산해보면약 1/16 으로, [ 그림 2-4] 에서추정할수있듯이메모리전송량에의해최대성능을달성하기어렵다. 4) 위문제를수식으로나타내면, 여기서 는 12 개의원소를갖는벡터임. 12 개의원소를갖는실수형벡터의 메모리크기는 4byte 12 = 48byte. 계산에필요한벡터 와결과값을저장하는벡터 가계산을위해연산처리장치의 레지스터에전송되고, 결과값 를다시내려받아야하기때문에 4 번의 12 차원벡터전송이발생. 따라서메모리전송량은총 192byte 인반면계산량은 12 번이기때문에연산강도는 1/16-14 -
제3절인공지능과 GPU 컴퓨팅 GPU는본질적으로 3D 게임이나 CAD와같은그래픽관련작업에최적화된연산처리장치이다. 따라서 CPU와는다르게범용성이낮다. 특히 GPU는수천개의사칙논리연산유닛을탑재한매니코어시스템으로, 병렬처리가필수적이다. 앞서소개했듯이 GPU는 2009년부터본격적으로과학계산에활용됐다. 같은가격의 CPU대비 10배이상의계산성능을보유한 GPU는차세대연산처리장치로큰주목을받아왔다. 특히많은계산을필요로하는컴퓨터시뮬레이션분야, 나아가 HPC 시스템을활용하는슈퍼컴퓨터의영역에서 GPU를활용하는연구가활발히진행됐다. 그러나 GPU는학계의기대와는다르게매우제한된영역에서만활용됐다. 이것은 GPU의구조적특징에서기인한것으로 GPU에최적화된소수의알고리즘만이같은가격의 CPU대비 10배이상의성능을확보할수있었다. 결국 CPU에서도병렬화가어렵거나성능이보장되지않는알고리즘은 GPU에서역시성능향상을기대할수없다는것이다. 물론 GPU의높은계산성능을적극적으로활용하고자하는노력도있었다. 하지만 HW 아키텍처에기반하는최적화로인해 SW 개발에소요되는비용이매우컸다. GPU의구조적특징에대해더자세히살펴보자. GPU는일반적으로컴퓨터의주변기기에해당되어일반적으로 PCIe(Peripheral Component Interconnect Express) 에연결된다. PCIe는 GPU를활용함에있어가장먼저직면하는병목이다. PCIe의메모리대역폭은 GPU 메모리의대역폭보다수십배이상차이가나기때문이다. 또한 GPU 메모리대역폭에비해 GPU의연산능력이수배높기때문에상당히높은연산강도를갖는알고리즘이아니라면최대성능을달성하기더욱어려운요인을가지고있다. 정리하자면 GPU는연산능력이매우뛰어나나이를보장해주는메모리대역폭이상대적으로낮은이유로활용에있어매우제한적인요소로작동한다. GPU는메모리전송속도와계산성능의지나친불균형을해소하기위해서메모리전송속도를향상시키는전략을꾀하고있다. 고대역폭메모리 (High Bandwidth Memory, HBM) 등을활용하여 PCIe 병목을줄이는접근을적용하고있다. - 15 -
[ 그림 2-5] 는알고리즘별로다양한연산강도를나타낸다. GPU에서거의이론치에가까운성능을내는알고리즘은밀집행렬연산이나 n-body 시뮬레이션등이있다. 희소행렬-벡터곱은사칙연산보다메모리전송에소요되는시간이높기때문에메모리대역폭에의한성능으로제한된다. [ 그림 2-5] 다양한알고리즘의연산강도 자료 : Roofline Performance Model, https://crd.lbl.gov/departments/computer-science/par/research/roofline/ 정리하자면현대연산처리장치를십분활용하기위한전제조건은매우많다. 먼저현대연산처리장치는연산처리장치의병렬화, 연산성능과메모리전송속도의불균형이라는큰특징을가지고있다. 따라서특정한알고리즘이연산처리장치의최대성능을활용하기위해서는높은병렬화가능성과연산강도를보유해야한다. 이두가지요소로인해연산처리장치의활용측면이상당부분제한되는것이다. 혹은기존의순차알고리즘을연산처리장치의 HW 구조에맞게재설계하는것도방법이다. 심층학습으로대두되는현대인공지능은결론적으로연산강도가높고병렬화가능성이높은알고리즘으로구성돼있다. 따라서 GPU의성능을십분활용할수있는응용분야로각광받음에따라, HPC분야에서도인공지능의가능성에대해주목하고있다. 심층학습의대표적인학습방법인오류역전파법은세부적으로기초선형대수루틴 (Basic Linear Algebra Subprogram, BLAS) 으로구성된다. BLAS는크게세가지수준으로분류된다. BLAS-1은벡터-벡터연산, BLAS-2는행렬-벡터연산, BLAS-3은행렬-행렬연산으로구분된다. 연산강도를살펴보면 - 16 -
[ 그림 2-5] 와같이 BLAS-1과 BLAS-2는낮은연산강도를보유한반면 BLAS-3는매우높은연산강도를갖고있다. 인공지능학습알고리즘의대부분이행렬연산이 BLAS-3에속하기때문에연산처리장치의성능을최대한사용할수있다. 사실 BLAS는병렬처리를필수로요구하는슈퍼컴퓨팅분야에서지속적으로발전해왔다. 수치해석적인연산을위해 BLAS는가장기저에있는역할을하기때문이다. NVIDIA는 GPU 전용 BLAS인 cublas 5) 를개발하여자사 GPU에최적화된성능을보여준다. [ 그림 2-6] 은 NVIDIA K40m 모델을활용하여정밀도별 cublas의연산성능이다. [ 그림 2-6] 유효숫자별 cublas 의성능실측치 자료 : cublas Performance https://developer.nvidia.com/cublas NVIDIA는 cublas를기반으로 cudnn(cuda Deep Neural Network) 6) 이라는심층학습라이브러리를제공한다. 현재 NVIDIA GPU는인공지능학계에서가장널리활용되고있으며, cudnn은다양한인공지능공개sw와연계되어 GPU 활용에대한진입장벽을낮췄다. 5) cublas, NVIDIA, http://docs.nvidia.com/cuda/cublas/ 6) cudnn : Efficient Primitives for Deep Learning, https://arxiv.org/pdf/1410.0759.pdf - 17 -
제4절인공지능사례분석 게임인공지능을중심으로지금까지현대연산처리장치의지수적인성장과그방향, 그리고이에따른활용측면에서의제약사항, 인공지능학습알고리즘과 GPU를설명했다. 정리하자면인공지능학습알고리즘은현대연산처리장치를십분활용할수있기때문에특히 GPU를많이활용하고있다. 그렇다면인공지능의계산량측면은어떨까? 인공지능은빅데이터를학습한다는점에서일견많은계산량이필요할것으로추정된다. 또한그간역사적인대결을수행했던게임인공지능역시슈퍼컴퓨터급자원을활용한결과였다. 이러한사실을바탕으로할때인공지능에필요한컴퓨팅인프라는상당히많을것이라고추정이가능하다. 이번절에서는구체적인게임인공지능사례를바탕으로인공지능의계산량에대해분석할것이다. 2016년 1월바둑인공지능으로는최초로프로바둑기사와대결하여승리한 AlphaGo는심층학습을활용했다. AlphaGo는두가지형태의인공신경망을활용했다. 정책망 (Policy Network) 은전문바둑기사의착수선호도를학습한인공신경망이다. 특정바둑판상태가정책네트워크에입력으로들어가게되면, 출력으로규칙상착수가능한모든수에대해서착수선호도 ( 확률값 ) 가산출된다. AlphaGo는이를위해 16만개의바둑기보에서 2,940만개의바둑판상태를추출하여학습에활용했다. 정책망의기능은게임트리의폭을줄이는용도로, 전문바둑기사의관점에서착수할지점을선별하는역할을한다. 가치망 (Value Network) 은현재바둑판상태에서승리할근사한확률을찾아내는역할을한다. 바둑은거의무한대경우의수를가지고있기때문에, 특정바둑판상태의승률을정확히예측하기는어렵다. 따라서승률을예측하기위한접근을취할수밖에없다. AlphaGo는가치망을학습하기위해자체대국으로생성된 3,000만개의바둑판상태를활용했다. 가치망의기능은게임트리의깊이를줄이는역할을한다. AlphaGo의인공신경망은한번계산하는데 30 GFLOP의연산량을필요로한다. 특히 AlphaGo의컴퓨팅환경은바둑게임의 30초초읽기동안약 10만개의경우의수를탐색하기때문에, 30초동안계산해야하는연산수는 6 PFLOP (6천조번연산 ) 7) 이다. - 18 -
[ 그림 2-7] 은다양한연산처리장치에서 6 PFLOP을처리하는데소요되는시간을표현한다. 일반적인 PC에서 6 PFLOP을처리하기위해필요한시간은약 80분으로 AlphaGo 시스템에비해약 160배나많은시간이소요된다. [ 그림 2-7] 의계산자원은 [ 그림 2-2] 에서소개한연산처리장치를대상으로소요시간을추정했다. 여기서계산자원의성능은이론성능의 80% 8) 로계산했으며, AlphaGo의컴퓨팅환경은 GPU 176개를활용했다고가정한다. [ 그림 2-7] 계산자원별소비시간비교 자료 : 인공지능의핵심인프라 고성능컴퓨팅환경의중요성, 이슈리포트 2016-013, 소프트웨어정책연구소 (2016) AlphaGo 이전의게임인공지능역시슈퍼컴퓨터급컴퓨팅환경을활용한 결과다. 슈퍼컴퓨터의성능순위는매년 6 월과 11 월에 1 위부터 500 위까지 top500.org 에서집계한다. 인간과대결해승리한게임인공지능의컴퓨팅환경을 살펴보면 < 표 2-2> 와같이약 2~300 위수준의슈퍼컴퓨터가활용됐다. 연산처리장치 IBM Deep Blue IBM Watson Google AlphaGo 9) 30 노드 POWER2SC (120Hz) VLSI 체스칩 480 개 90 노드 POWER7(3.5GHz, 8 코어, 32 쓰레드 ) 약 35~40 노드 CPU 1,920 코어 GPU 280 장 연산성능 11.38 GFLOPS 80 TFLOPS 약 300 TFLOPS top500 순위 < 표 2-2> 게임인공지능과컴퓨팅환경 259 위 (1997 6 월 ) 192 위 (2011 6 월 ) 382 위수준 (2015 년 11 월 ) 자료 : 인공지능의핵심인프라 고성능컴퓨팅환경의중요성, 이슈리포트 2016-013, 소프트웨어정책연구소 (2016) 7) 심층학습알고리즘에국한된연산수. 10 만개의경우의수를탐색하기위해필요한심층학습연산은 20 만번으로 6PFLOP 이필요함. 8) 심층학습은연산강도가높은알고리즘으로구성되기때문에이론성능에가까운성능을보임. 9) AlphaGo 의경우구글클라우드를활용하여연산을수행했기때문에, 정량적으로정확한계측이불가능함 - 19 -
< 표 2-2> 를보면단편적으로연산처리장치의경향을볼수있다. CPU의성능이제한적이었던 1990년대후반에는전용칩 (IBM Deep Blue) 을제작하여계산에활용했다. 이후 CPU의성능이지수적으로향상되자 CPU기반의슈퍼컴퓨터가등장 (IBM Watson) 하고, 현대에는가속기를탑재한슈퍼컴퓨터 (Google AlphaGo) 가활용됐다. 슈퍼컴퓨터급컴퓨팅환경의수요는결국학습에요구되는데이터의양에도직결된다. IBM Watson은초당 500 GBYTE 10) 에해당하는정보를처리할수있으며, AlphaGo는 16만개의프로바둑기사의기보 11) 를한달간학습했다. 이제구체적으로 AlphaGo의인공지능알고리즘에대해살펴보자. AlphaGo의인공신경망은이미지인식에최적화돼있는합성곱신경망 (Convolutional Neural Network) 를활용했다. Facebook의얼굴인식알고리즘 (DeepFace) 역시 4백만장의얼굴이미지를합성곱신경망으로학습한결과이다. 합성 (Convolution) 의수학적의미는두함수의합성을표현한것으로, 일반적으로는임의의두합수가겹치는영역을적분한값을나타낸다 [ 그림 2-8]. [ 그림 2-8] 합성 (Convolution) 의수학적모형 자료 : Convolution, https://en.wikipedia.org/wiki/convolution 이미지에서합성의과정은이미지의경계를찾거나 (edge detection), 이미지자체를흐리게또는선명하게하는데사용되는필터를의미한다. [ 그림 2-9] 는이미지의합성과정을표현하는데 3x3 행렬로표현된합성필터가이미지를이동하며각픽셀값을곱해서합하는연산으로계산된다. 합성필터의역할은이미지의특징을추출하는것으로, 합성필터의값에따라부각해서보고자하는관점이달라진다. 합성곱신경망에서는바로합성필터가가중치역할을하여학습의대상이된다. 10) 약백만권의책에해당하는용량 11) 수치적인데이터의용량은 1.85 TBYTE - 20 -
[ 그림 2-9] 이미지합성 (Convolution) 의과정 자료 : ios Developer Library - vimage Programming Guide [ 그림 2-10] 합성곱신경망에서활용되는합성필터의역할을나타낸다. 여기서특징맵 (Feature map) 은이미지의속성을나타내는것으로, 이미지의가장대표적인특징맵은 RGB(Red, Green, Blue) 의 3채널을활용한다. AlphaGo를예로들어보면, AlphaGo에서활용한특징맵은총 48가지이다. 이것은백돌, 흑돌, 빈칸, 상수, 활로, 꼬부림, 단수등의바둑정보를담고있다. [ 그림 2-10] 합성곱층의개념도 자료 : 인공지능의핵심인프라 고성능컴퓨팅환경의중요성, 이슈리포트 2016-013, 소프트웨어정책연구소 (2016) - 21 -
더세부적으로합성곱신경망의과정에대해살펴보자. 합성곱신경망에서이미지에합성필터를적용하는과정은먼저합성필터와필터크기만큼의이미지의원소간의곱을한뒤모두더하는것이다 [ 그림 2-9 참조 ]. 합성필터를행렬이아닌벡터형태로변환했을때는벡터간의내적으로합성과정을수행할수있다. 합성필터벡터와특정이미지의영역벡터의내적결과값은곧다음특징맵의원소가된다. 이것은곧 [ 그림 2-11] 과같이합성필터와이미지를중복을허용하여큰두개의행렬곱으로표현할수있다. 여기서이미지는, 합성곱필터는 라고볼때, 과 은행렬을벡터화한것이다. 따라서이미지전체에합성필터를적용한다는것은 과 의곱으로표현할수있다. [ 그림 2-11] 합성곱의계산 행렬곱 자료 : cudnn : Efficient Primitives for Deep Learning, https://arxiv.org/pdf/1410.0759.pdf 행렬곱은 [ 그림 2-5] 의다양한연산강도에서찾아볼수있듯이, 연산강도가매우높은알고리즘에속한다. 결론적으로합성곱신경망의학습 (training) 이나추론 (inferencing) 은행렬곱기반의연산으로이루어졌기때문에, 현대계산자원의성능을최대한활용할수있다. - 22 -
AlphaGo 의계산량분석 Ÿ AlphaGo 의계산의대부분은합성곱신경망의계산 12) [ 그림 9] 로비유해서표현하자면, 필터행렬인 의크기는 192 9, 바둑판기보행렬에대응하는 의크기는 9 69312 AlphaGo 의첫번째합성곱층은 19 19 바둑판을 48 가지관점에서분류한특징맵이입력값으로사용 13) * 48 가지관점은예를들어흑돌의위치, 백돌의위치, 빈칸의위치, 활로, 꼬부림등이진수로표현가능 * 첫번째합성필터의크기는 5 5 이고총 192 개의서로다른필터를사용하여다음합성곱층에사용될 192 개의특징맵을생성 * 따라서 48 개의 19 19 입력값에 192 개의 5 5 필터와합성 (Convolution) 하는데필요한계산량은약 4.159 GFLOP 14) 두번째에서열세번째합성곱층은 192 개의 19 19 의정보가입력값이고필터의크기와개수는각각 3 3 과 192 개 * 첫번째합성곱층과동일하게계산할경우총 23.715 GFLOP 15) 따라서특정바둑판상태가입력된경우착수확률분포를계산하거나승산을계산할때약 30 GFLOP 의계산량이필요 16) * NVIDIA 의계산전용그래픽카드인 K40 의 cudnn 실측성능은약 1.2 TFLOPS 17) 로초당약 40 번의콘볼루션신경망계산가능 Ÿ AlphaGo 의합성곱신경망은정책네트워크와가치네트워크두가지로구성 18) 정책네트워크는프로바둑기사의착수선호도를예측하는것으로특정바둑판이입력되면빈칸에대한착수확률의분포를산출 * 바둑게임의탐색에서착수가능한모든지점을고려하지않고높은착수확률분포를갖는지점을기준으로탐색 ( 게임트리의폭을줄이는과정 ) 가치네트워크는현재바둑판상태의승산을근사 * 예측한승산이정확할수록게임트리를깊게탐색해야하는소요를줄일수있음 ( 게임트리의깊이를줄이는과정 ) 특정바둑판상태에서성공적인탐색을위해서는정책과가치네트워크를모두계산해야함 * 앞서소개한합성곱신경망계산량에따르면 176 개의 GPU 19) 를활용하면초당 7,040 번의합성곱신경망의계산이가능하나정책 / 가치네트워크를모두계산해야하므로초당 3,520 번의착수를계산할수있음 따라서 30 초의초읽기가주어진다면, 176 개의 GPU 를활용하여약 100,000 개의바둑판상태에대하여착수확률분포와승산을계산할수있음 정책과가치네트워크를학습하는과정은위계산량에더하여네트워크의가중치를조정하는오류역전파법에대한계산을고려해야함 - 23 -
지금까지 AlphaGo에필요한연산의양과알고리즘적인특성에대해살펴봤다. 정리하자면이미지인식에최적화된합성곱신경망의학습및추론과정은행렬곱연산으로대체되어현대연산처리장치의성능을십분활용할수있다. 또한합성곱신경망의구조가복잡해질수록, 학습에투입되는데이터의양이많을수록최종적인계산량이증가하기때문에결과적으로굉장히많은양의계산을필요로한다. 인공신경망을활용해최적의결과를도출하는방법에서역시고성능컴퓨팅자원을필요로한다. 인공신경망의가장큰단점은입력과출력의인과관계를설명하지못한다는점이다. AlphaGo역시최정상의바둑실력을보유하고있으나왜바둑을잘두는지에대해대답하기어렵다. 그이유는 AlphaGo의성능은경험적으로얻어진결과이기때문이다. AlphaGo의합성곱신경망은 13층을활용했다. 딥마인드연구진의이전논문을살펴보면합성곱신경망이 10층인경우도테스트를해봤다. 또한 48개의특징맵중 30개를사용하는등수많은시도를했다. 그결과최적의인공신경망의구조를도출해낸것이다. 경험적인연구결과라는것은다른말로개선의여지가여전히남아있다고도볼수있다. 따라서풍부한계산자원을활용하여다양하게시도를해보는것이무엇보다중요하다. 인공지능알고리즘자체역시현대의계산자원에특화돼있지만, 경험적인결과를도출하기위해많은시도를해야한다는점역시컴퓨팅인프라의막대한수요를간접적으로나타낸다. 최근인간의정보를전혀사용하지않고학습한 AlphaGo Zero는데이터를스스로생산했다. 그러나데이터의학습에는여전히고성능컴퓨팅인프라가활용됐다. 결론적으로인공지능연구에서컴퓨팅인프라는최상의결과를도출하기위해필수적인요건이라고볼수있다. 12) Mastering the game of Go with Deep neural networks and tree search, Nature (2016) 13) 자세한신경망구조는다음보고서참고. AlphaGo 의인공지능알고리즘분석, 소프트웨어정책연구소 (2016) 14) 19 19 바둑판 * 48 개특징맵 * 5 5 필터 * 25 덧셈 ( 원소끼리곱한후더하는과정, 내적에서의덧셈 ) * 192 개필터 * 2 개연산 ( 활성함수계산 ) = 4.159 Gflop 15) 19 19 바둑판 * 192 개특징맵 * 3 3 필터 * 9 덧셈 ( 원소끼리곱한후더하는과정, 내적에서의덧셈 ) * 192 개필터 * 2 개연산 ( 활성함수계산 ) * 11 층 = 23.715 Gflop 16) 콘볼루션층만을계산할때는이론적으로 27.874 Gflop 이필요하나, 활성함수의계산, fully connected layer 등을고려해볼때도합약 30 Gflop 이필요함 17) cudnn : Efficient Primitives for Deep Learning, https://arxiv.org/pdf/1410.0759.pdf 18) 자세한내용은 AlphaGo 의인공지능알고리즘분석 보고서참고, https://spri.kr/post/14725 19) 판후이 2 단과의대국당시사용된분산 AlphaGo 의 GPU 개수 - 24 -
제 3 장중소기업 스타트업의인공지능컴퓨팅인프라의실태조사 20) 제1절개요지금까지인공지능과컴퓨팅인프라의중요성에대해서살펴봤다. 현대인공지능기술에서가장주목받고있는심층학습은필연적으로대규모컴퓨팅인프라를필요로한다는점에서많은수요가있다는사실은쉽게체감할수있다. 그러나그수요가구체적으로얼마인지는실태조사없이는파악하기가어렵다. 인공지능컴퓨팅관련해외동향을살펴보면우선상용클라우드서비스가상당수준활성화돼있다. 구글, 아마존, 마이크로소프트등글로벌 IT기업은계산전용클라우드인프라를구축 서비스하고있다. 특히심층학습에성능이좋은 GPU위주의환경이주류를이루고있다. 구글은알파고대국에서활용된심층학습전용 HW인 TPU(Tensorflow Processing Unit) 를기계학습클라우드서비스를통해제공하고있다. 또한국가차원에서의인공지능클라우드컴퓨팅인프라구축도진행중이다. 일본은 195억엔 ( 약 1,900억원 ) 규모의인공지능전용클라우드인프라인 ABCI (AI Bridging Cloud Infrastructure) 를 2018년 1분기까지구축한다고밝혔다. 일본은자국의인공지능연구를활성화하는차원에서신뢰기반의클라우드컴퓨팅서비스를지원한다. 21) 이번장에서는인공지능관련중소기업과스타트업의인공지능컴퓨팅인프라실태조사결과를다루고자한다. 실태조사대상을중소기업과스타트업으로한정한이유는대기업에비해비용적으로인프라구축이어렵기때문이다. 실태조사의가장큰목적은중소기업 스타트업의인공지능연구개발을위한컴퓨팅인프라의현황과향후수요를파악하는데있다. 이것을바탕으로정부차원의인공지능컴퓨팅인프라지원정책을구체화할것이다. 더불어정부차원의인공지능컴퓨팅인프라지원형태에관한설문조사도실시했다. 20) 3 장의내용은 중소기업 스타트업의인공지능컴퓨팅인프라현황과시사점, 소프트웨어정책연구소 (2018) 에서인용 21) 일본 ABCI 도입배경과운영방안, SPRi 해외전문가초청세미나, 소프트웨어정책연구소 (2017) - 25 -
제 2 절인공지능컴퓨팅인프라실태조사 1. 실태조사개요 중소기업 스타트업의인공지능컴퓨팅인프라현황과향후수요를파악하기위해인공지능관련중소기업 스타트업 215개社를대상으로정했다. 실태조사대상을선정한모집단은지능정보산업협회의협조를얻었다. 실태조사대상 215개기업에대해서개별방문면접을통한설문조사를수행했으며유효한표본은 72개기업을확보했다 < 표 3-1>. < 표 3-1> 인공지능컴퓨팅인프라실태조사일반현황 조사대상 조사방법 국내인공지능관련중소기업 스타트업 215 개社 조사대상선정은지능정보산업협회에서협조를얻음 개별방문면접을설문조사 유효표본 215 개社중 72 개社 조사기간 2017 년 9 월 13 일 ~ 9 월 29 일 실태조사설문설계에서중점적으로고려한사항은다음과같다. 인공지능컴퓨팅인프라의대부분의수요는심층학습을활용하는여부가가장큰영향을미친다고가정했다. 그이유는 2장에서설명했듯이심층학습은경험적으로최적의결과를도출해내고, 빅데이터를처리한다는관점에서매우많은계산을요구하기때문이다. 또한컴퓨팅인프라가제역할을하기위해서는학습을위한데이터의현황도파악해야하기때문에데이터관련설문문항도설계했다. 인공지능컴퓨팅인프라의현황과향후수요를측정하는기준은 GPU의보유량과향후수요량으로파악했다. 심층학습은 CPU를활용해도충분히시험수준의연구는가능하다. 그러나 GPU의이론성능은동일가격대비 CPU보다 10배이상높은것이일반적이기때문에, CPU 현황을조사한다고해도결국 GPU의보유현황과향후수요로결정되기때문이다. GPU의대안으로는 Intel의 XeonPhi, 구글 TPU가있으나저변확대가미흡하기때문에 GPU만을조사했다. - 26 -
심층학습알고리즘의특성과 HW Ÿ 심층학습알고리즘은병렬처리효율이높고연산강도 * 가높은서브루틴으로세분화 22) * 연산강도는해당알고리즘의연산수를메모리전송량으로나눈값으로, 연산강도가높다는것은메모리전송량보다연산이많다는것을의미 현대연산처리장치는연산성능이메모리전송속도보다월등히뛰어나므로, 연산강도가높은알고리즘에적합 특히, 매니코어시스템인 GPU 의경우연산처리를담당하는산술논리장치 (Arithmetic Logical Unit) 가수천개탑재되어있기때문에알고리즘의병렬화가능성이높을수록기대성능이향상 심층학습알고리즘은병렬화효율이높은기초선형대수프로그램 (Basic Linear Algebra Subprograms) 으로구성되고, 그중연산강도가매우높은행렬곱연산이대부분을차지함 Ÿ 따라서, 심층학습은현대연산처리장치를가장효율적으로활용할수있는알고리즘이며, 가격대비연산처리성능이높은 HW 가보다높은효율을보유하기때문에시판중인 HW 중에서 GPU 가가장적합 Ÿ (GPU) GPU 는모니터에그래픽출력을담당하는전용 HW 로 3D 작업이나게임에주로활용됐으나, 무어의법칙에의해연산성능이지수적으로향상되면서과학계산에의활용이확산 Ÿ ( 가속기 ) 대표적인가속기는 Intel 의 Xeon Phi 와 FPGA(Field Programmable Gate Array) 등이있으나비용이매우높아범용성이낮음 Ÿ (TPU) 구글이개발한심층학습전용 HW 로저전력고성능의특징을가지고있으며, 구글의기계학습공개 SW 인텐서플로우와연동이가능하여편의성은높으나구글의기계학습클라우드플랫폼에서만활용가능 Ÿ (Neuromorphic Chip) 뇌신경망을모사하여 HW 로구현한뉴로모픽칩은현재상용목적으로출시되지않았고, 스파이킹신경망 (Spiking Neural Network) 를활용해학습해야함 22) 세부내용은 인공지능의핵심인프라 고성능컴퓨팅환경의중요성 이슈리포트참고 - 27 -
인공지능컴퓨팅인프라의현황과향후수요를측정하는방법은가장대중화된 GPU 모델별개수로파악했다. 현재심층학습분야에서가장대중화된 GPU는 NVIDIA의 GPU다. 그대안으로 AMD가생산하는 GPU도있지만심층학습관련 SW의최적화가미흡하여저변확대가진행중인상황이다. 대부분의공개SW 역시 NVIDIA GPU에서의계산을주로지원하기때문에, 사실심층학습에활용되는 HW는 NVIDIA GPU를활용한다고여겨도무방하다. 인공지능컴퓨팅인프라의현황과향후수요는대표적인세가지 NVIDIA GPU에대해서보유현황과향후수요를파악하여이론성능을곱한뒤모두합산한수치로정량화했다. 설문조사에고려한 GPU 모델과이론성능 23) 은 < 표 3-2> 와같다. < 표 3-2> 설문조사 GPU 모델모델명 GTX 1070 GTX 1080 GTX 1080Ti, TITAN X, P100 급 이론성능 (TFLOPS) 5.2 8.2 10.6 자료 : List of NVIDIA graphical processing units, Wikipedia https://en.wikipedia.org/wiki/list_of_nvidia_graphics_processing_units 또한정부차원의인공지능컴퓨팅인프라지원정책의형태에대한선호도를파악하는설문문항을설계했다. 인공지능컴퓨팅인프라지원정책의형태는크게두가지로구분될수있다. 먼저클라우드형태는민간상용클라우드와유사한과금체계를부여하여보다많은연구주체가활용하는것이다. 중소기업 스타트업의적극적인활용을유도하기위해서상용클라우드대비적절한가격을설문했다. 두번째형태는제안서기반의지원방식이다. 클라우드형태는보다많은기업이인프라의수혜를받는접근이라면, 제안서기반은소수의인공지능기업이컴퓨팅인프라를점유하는형태다. 이것은슈퍼컴퓨터활용과유사한방식으로컴퓨팅인프라활용제안서를검토평가하여특정기업에집중적으로무상지원하는형태이다. 설문조사에서는두가지를병행하여운영하는형태에대한문항도설계했으며, 혼합운영시적절한비율도조사했다. 클라우드와제안서기반지원방식에대한장 단점은 < 표 3-3> 과같다. 23) 이론성능은단정도부동소수점 (single precision floating point) 연산을기준으로함 - 28 -
< 표 3-3> 인공지능컴퓨팅인프라지원형태의장 단점 지원방식장점단점 클라우드 제안서 다수가혜택을받을수있는환경 과금형방식으로지속가능한운영에용이 특정기업에집중적인지원으로성과제고에용이 인프라환경의운영이상대적으로용이 클라우드운영에대한소요발생 인프라환경의규모에따라집중운영에대한어려움발생 다수가혜택을받기어려움 아이디어구현위주의단순한테스트불가 실태조사의범위는크게두가지로나뉜다. 첫번째는실태조사의궁극적인목적인컴퓨팅인프라의현황과향후수요를파악하는데있다. 이부분에서는심층학습과 GPU 활용여부를시작으로 < 표 3-2> 에해당하는 GPU 현황과향후수요를조사했다. 또한정부의인공지능컴퓨팅인프라운영방식에대한설문과기추진된사업에대한인지 수혜여부를파악했다. 두번째는인공지능 R&D 및기술수준에대한조사도병행했다. 구체적인실태조사범위는 < 표 3-4> 와같다. < 표 3-4> 인공지능컴퓨팅인프라실태조사범위구분조사범위 컴퓨팅인프라현황 인공지능 R&D 및기술수준 인공지능연구분야, 데이터의종류, 데이터의양 현재와향후수요 심층학습, GPU 활용여부, 인공지능계산 GPU 규모 현재와향후수요 선호하는정부의인공지능컴퓨팅인프라지원사업운영방식 ( 클라우드, 제안서 ) 인공지능컴퓨팅인프라관련정부지원사업인지여부, 수혜경험, 애로사항 인공지능관련 R&D 예산비율 현재및향후 인공지능제품및서비스개발을위한 SW 사용현황 인공지능컴퓨팅인프라사업에대한의견 인공지능기술분류체계에대한해당영역설문 해당인공지능기술분야에대한기업과우리나라의기술수준 설문조사대상 215 개기업에서유효한응답을한 72 개기업의특성은다음 < 표 3-5> 와같다. - 29 -
< 표 3-5> 72개실태조사응답기업에대한특성구분응답기업수백분율 ( 단위 : %) 전체 72 100.0 2000년이전 20 27.8 설립년도 2000-2010 년 25 34.7 2010년이후 27 37.5 10억미만 17 23.6 10-30억미만 17 23.6 30-50억미만 6 8.3 매출액기준 50-80 억미만 4 5.6 80-120 억미만 3 4.2 120-200억미만 9 12.5 200-500억미만 8 11.1 500억이상 8 11.1 비활용 19 26.4 심층학습활용 활용 31 43.1 활용예정 22 30.6 비활용 31 43.1 GPU 활용 활용 26 36.1 활용예정 15 20.8 정부지원인지여부 인지 26 36.1 비인지 46 63.9-30 -
2. 실태조사결과중소기업 스타트업의인공지능컴퓨팅인프라의조사결과에앞서심층학습과 GPU활용여부에대한결과를먼저기술하겠다. 설문조사설계상인공지능컴퓨팅인프라의대부분의수요는심층학습을활용해제품이나서비스를개발하는기업과심층학습을위해 GPU를활용하는기업에서발생할것이라고가정했기때문이다. 이결과는간접적으로국내인공지능관련중소기업 스타트업중어느정도의비율이인공지능기술을직접적으로활용하고있는지에대해가늠할수있다. 먼저심층학습을활용하고있는기업은 31개 (43.1%) 기업이며, GPU를사용은 26개 (36.1%) 기업으로조사됐다. 국내인공지능연구는지난 2016년 알파고쇼크 가촉진제역할을했기때문에, 심층학습이나 GPU를활용하는기업은과반에미치지못했다. 그러나활용예정이라고답한수치를합산해보면심층학습을활용하고있거나활용할예정인기업은 53개 (73.7%) 기업, GPU 활용및활용예정기업은 41개 (56.9%) 기업으로파악됐다. 이결과는향후인공지능과관련된인프라의잠재적인수요가있다는것으로분석할수있다. 심층학습을활용하고있는기업중 GPU를활용하는경우는 74.2%, GPU를활용하는기업중심층학습을활용하는경우는 88.5% 로높은상관성을나타냈다. 인공지능관련중소기업 스타트업의심층학습적용은상당히높을것으로판단되나, 본격적인서비스개발에필요한 GPU 활용은다소소극적으로분석된다. 그이유는심층학습을시험하는초기단계에는반드시 GPU가필요한것은아니기때문으로추정된다. [ 그림 3-1] 심층학습및 GPU 활용여부설문결과 - 31 -
유효한응답을한 72개기업에대한컴퓨팅인프라현황은 11.37 PFLOPS이며, 향후수요는 22.04 PFLOPS로파악됐다. 조사대상을 215개기업으로추정 24) 할 경우인공지능컴퓨팅인프라현황은 25.94 PFLOPS이며, 향후수요는 47.14 PFLOPS로조사됐다. < 표 3-2> 에해당하는모델별 GPU 설문조사결과는 < 표 3-6> 과같다. < 표 3-6> GPU 현황및향후수요 ( 설문응답 72개기업대상 ) 모델명 GTX 1070 GTX 1080 GTX 1080Ti, TITAN X, P100 급 현황 194개 117개 887개 향후수요 553개 230개 1,630개 연산량환산 25) ( 현황 ) 총계 ( 현황 ) 연산량환산 ( 수요 ) 총계 ( 수요 ) 1,008.8 TFLOPS 959.4 TFLOPS 9,402.2 TFLOPS 11.37 PFLOPS 2,875.6 TFLOPS 1,886 TFLOPS 17,278 TFLOPS 22.04 PFLOPS < 표 3-6> 결과를토대로전체설문조사대상인 215 개기업으로추정하기위해 215 개기업의 2016 년매출액기준으로구분한현황은 < 표 3-7> 과같다. < 표 3-7> 전체설문조사대상 215 개기업의매출액분포 구분 10 억원미만 10 30 억원미만 30 50 억원미만 50 80 억원미만 80 120 억원미만 120 200 억원미만 200~500 억원미만 500 억원이상 72 개대상 215 개대상 17 17 6 4 3 9 8 8 54 40 20 15 20 24 23 19 24) 추정방법은 215 개기업의 2016 년매출애기준으로산정 25) GPU 조사현황에 < 표 3> 의이론성능을곱한수치 - 32 -
설문조사를통한인공지능컴퓨팅인프라현황과향후수요수치의의미는해석에주의가필요하다. 먼저국내인공지능관련중소기업 스타트업의수가절대적으로부족하다. 또한설문에응답한 72개기업의컴퓨팅인프라수요를 215개기업의수요로확대한경우역시 72개기업의대표성에편향이있을수있다. 일부편향을고려하더라도국내인공지능관련중소기업과스타트업의컴퓨팅인프라현황과향후수요는 215개기업으로추정한것을활용하는것이적절하다. 인공지능컴퓨팅인프라의현황과향후수요의실태조사결과로산출된연산량 (FLOPS) 은이론적인최대치를의미하는것이다. 예를들면 215개기업의향후수요량이라고측정된 47.14 PFLOPS는이수치를단일시스템으로구성해야하는것은아니다. 단정밀도 (single precision) 으로 47.14 PFLOPS라는수치는 2018년도입이예정된국가슈퍼컴퓨터 5호기의이론성능 26) 에못미친다. 슈퍼컴퓨터 5호기는장비가격만 500억원이넘는고가의장비이고, 수십 PFLOPS의연산을한번에처리할수있는성능을갖는다. 따라서현황이나향후수요는단일시스템이라기보다는분산된컴퓨터로봐야한다. 또한인공지능컴퓨팅인프라의현황과향후수요는단순합산으로산출됐기때문에활용률측면은고려되지않았다. 활용률은장비의가동현황을나타내는것으로 100% 일경우유휴상태 (idle) 없이작동하는것을의미한다. 이러한이유로단순합산수치에는인프라를구성하는형태에대한정보는없다. 예를들면, 컴퓨터 1대에 GPU를여러장활용할수있고, 이러한컴퓨터를클러스터로구축할수도있다. 이부분은설문이지나치게기술적인측면으로집중되기때문에, 이번설문조사에서는제외했다. 결론적으로인공지능컴퓨팅인프라현황과수요로추정된수치는컴퓨팅인프라지원정책을설계하는데고려할자료로활용될수있지만, 반드시저수치를달성해야한다는의미는아니다. 인공지능컴퓨팅인프라의현황과향후수요는매출액 30억미만의기업, 2010년이후에설립된기업, 심층학습과 GPU를활용하는기업일수록높게나타났다. 인공지능컴퓨팅인프라현황의 87.9%( 약 10 PFLOPS) 가매출액 30억미만의기업이차지하며, 향후수요역시 76.6%( 약 16.9 PFLOPS) 로높은비중을차지했다. 26) 슈퍼컴퓨터 5 호기의이론성능은 25.7 PFLOPS( 배정밀도 ). 단정밀도로추정할경우 51.4 PFLOPS - 33 -
< 표 3-3> 에서소개한두가지인공지능컴퓨팅인프라지원방법에대한설문 결과이다 [ 그림 3-2]. [ 그림 3-2] 인공지능컴퓨팅인프라지원방법에대한선호도 조사 설문조사결과클라우드형태와제안서형태의혼합운영을 26개 (36.1%) 기업이선택하여가장선호하는형태로조사됐다. 혼합운영시클라우드와제안서형태의비중은평균적으로 50:50이었다. 슈퍼컴퓨터활용과유사한제안서형태는 25개 (34.7%) 기업이선호했다. 혼합운영이나제안서형태를선택한응답기업 51개에대해서제안서형태의정책에대한구체적인방법을설문했다. 제안서형태의정책에대한방법은크게두가지가있다. 1 컴퓨팅인프라활용의최대치를제한하되, 보다많은기업에지원한다. 2 지원받는기업의수를제한하되, 컴퓨팅인프라활용의최대치를제한하지않는다. 제안서형태의구체적인지원방법인 1안과 2안의선호도는 50:50으로중립적인의견이대다수였다. 제안서형태의컴퓨팅인프라적정활용기간에대한조사에서는 6개월활용후심사를통해연장 하는방안이 61%(31개기업응답 ) 를차지했다. - 34 -
일정비용을지불하고사용하는클라우드형태는 18개 (25%) 기업이선택했다. 정부가지원의클라우드서비스는사용활성화를위해상용서비스보다저렴한가격정책이필요하다. 따라서혼합운영이나클라우드형태를선택한응답기업 44개에대해서적절한클라우드사용료를설문한결과상용대비평균 45% 로분석됐다. 설문응답기업이향후확보하고자하는데이터의양 9,083 테라바이트 (TB) 는현재구축한 1,837TB 대비평균적으로 4.8배증가할것으로조사됐다. 데이터는종류는크게정형텍스트, 비정형텍스트, 이미지및영상, 신호, 음성및청각데이터로세분화하여중복응답을허용하는것으로질문을설계했다. 자연어처리에주로활용되는정형텍스트와비정형텍스트는각각응답기업의 50%, 48.5% 가활용하고, 이어이미지및영상데이터활용은응답기업의 43.1% 가활용했다. 전기사용, 금융거래등신호형식의데이터는 25% 가활용하며, 음성인식등청각에관련된데이터는 18.1% 의응답기업이활용하는것으로분석됐다. 데이터의양적인측면에서는 1~2TB 27) 수준으로데이터를구축 활용하고있는기업 (23개, 31.9%) 이가장많은것으로조사됐고, 향후구축할데이터양이 50TB 이상인경우는 30.6% 으로많은수요가발생할것으로예상된다. 설문응답 72개기업이현재활용하고있는데이터의양은평균적으로 26.76TB이며, 향후구축예정인데이터의양은평균 129.76TB이다. 특히향후구축데이터의양은심층학습이나 GPU를활용예정이라고응답한기업에서높게나타났다. 결론적으로인공지능컴퓨팅인프라구축시막대한데이터를저장 가공하기위한스토리지서버역시구축해야할필요성역시존재하는것으로분석된다. 현재정부가추진하고있는인공지능컴퓨팅인프라지원사업에대한인지여부도조사했다. 정부가추진하고있는인공지능컴퓨팅인프라관련사업은크게두가지로컴퓨팅인프라지원은아직본격적으로시작하지않은상황이다. HPC 이노베이션허브구축사업의 2017년예산은 77억원이며, 20개스타트업에컴퓨팅인프라를지원할계획을갖고있다. 지능정보산업인프라조성사업의 2017년예산은 50억원이며, 지식베이스, 인공지능 SW 이용환경구축등을수행하고인공지능컴퓨팅인프라는일부지원하고있다. 27) 1TB 는 2 백만장의 500 킬로바이트 (KB) 이미지, 약백만권의책이저장가능 - 35 -
정부의인공지능컴퓨팅인프라사업에대한인지여부조사결과 63.9% 가인지하고있지않은것으로조사됐다. 향후정부의인공지능컴퓨팅인프라지원사업에대한활용의사를설문한결과 63개 (87.5%) 기업이활용의사가있는것으로높게나타났다. 응답기업의인공지능기술영역의최고기술보유국대비국내수준과자사의수준을설문조사한결과모두 다소뒤쳐진수준 으로조사됐다 [ 그림 4]. 이결과는설문응답수의평균으로추정했다. [ 그림 3-3] 인공지능기술수준조사결과 인공지능컴퓨팅인프라사업관련의견에서는연구인력의지원요구가 18.1% 로가장많았으며, 인프라운영에대한기술적인완성도에대한필요성이 제기됐다 < 표 3-8>. - 36 -
< 표 3-8> 인공지능컴퓨팅인프라사업관련주요의견 인력지원 기술지원 연구개발인력지원필요 - 인공지능컴퓨팅인프라구축에앞서인력지원이선행돼야함 - 특히, 빅데이터의이해를갖춘전문인력양성을요구 인력양성을위한커리큘럼필요 - 컴퓨팅인프라를활용하기위한교육필요 사용성에대한고려 - 고장이나오작동에대한실시간대처필요 - 행정적인절차에대한간소화 - 정부지원사업의홍보필요 기술지원및보안 - 시스템오류를해결할수있는기술적지원필요 - 데이터의보안에대한신뢰가있어야함 다양한플랫폼에의연동 - 다양한공개SW 지원, 게임 로봇등응용분야와의연계필요 제3절소결중소기업 스타트업의인공지능컴퓨팅인프라현황과향후수요조사결과향후 3년이내현재보다 2배정도의인프라수요가발생할것으로예산된다. 인공지능컴퓨팅의주요수요처는매출액 30억원이하의기업과 2010년이후에설립된기업에에집중되어있으며, 심층학습과 GPU를활용한다고응답한기업일수록컴퓨팅인프라의현황과향후수요가높게측정됐다. 특히자금운용이상대적으로어려운스타트업에우선적으로인프라를공급할필요성제기된다. 또한, 심층학습과 GPU를활용예정으로응답한기업에대한잠재적인수요도고려해야하므로신속한인공지능컴퓨팅인프라구축이필요할것이다. 인공지능컴퓨팅인프라관련설문조사의결과는 GPU 장비의단순합산으로산정된것이기때문에, 정책설계의유의가필요하다. 정부의인공지능컴퓨팅인프라지원의형태에관한설문결과클라우드와제안서형태를혼합한방법을가장선호하는것으로조사됐다. 클라우드와제안서형태두가지방법에서는제안서형태를더선호하는것으로파악된다. 클라우드형태는상용클라우드 - 37 -
서비스의 45% 정도의요금이적절한것으로분석됐으며, 제안서형태의경우적정활용기간은 6개월활용후재심사를선호했다. 인공지능연구에활용하고자하는데이터의양도현재대비향후 4.8배증가할것으로전망되어, 데이터와관련한인프라구축의병행필요할것이다. - 38 -
제 4 장요약및시사점 이번보고서에서는인공지능과컴퓨팅인프라의중요성에대해서심도있게분석했다. 현대인공지능의핵심인심층학습은경험적으로최상의결과를도출해낸것이다. 심층학습은수많은변수가존재하기때문에, 다양한가능성을상정하여많이시도해보는것이가장일반적인접근이다. 또한심층학습의특성상대규모데이터를필요로하므로사실인공지능에컴퓨팅인프라가중요하다는사실은직관적으로이해할수있다. 심층학습의세부알고리즘은현대연산처리장치를십분활용할수있는연산들로구성된다. 다시말하자면컴퓨팅인프라를 2배구축하면기존보다 2배에가까운성능을기대할수있다는것이다. 이처럼유연한확장성 (Scalability) 을갖는인공지능알고리즘의특성상컴퓨팅인프라가많이확보될수록빠른연구결과를도출할수있는밑거름이될것이다. 현재인공지능분야의기술발전속도는매우넓고빠르게진행된다. 인공지능은범용기술 (General Purpose Technology) 로발전함에따라컴퓨터공학을넘어자연 사회과학까지영역을넓히고있다. 인공지능연구의특징은매우빠르다는점과점진적으로개선된다는점에서 SW의특성과비슷하다. 인공지능컴퓨팅인프라의확보는이러한인공지능의특성을반영한연구환경에직결된다고볼수있다. 이번보고서에서는상대적으로자금운용이어려운중소기업 스타트업의인공지능컴퓨팅인프라에대한실태조사결과를분석했다. 가장큰특징은신생기업일수록, 매출액 30억원미만의작은기업일수록인공지능컴퓨팅인프라의수요가높게측정됐다. 설문대상기업과의인터뷰에서도대다수의스타트업이컴퓨팅인프라지원이필요하다고밝힘에따라, 정부차원의인공지능컴퓨팅인프라정책은큰실효를거둘가능성이높다. 이실태조사결과는향후본격적인인공지능컴퓨팅인프라지원정책을설계하는데기반자료로활용할수있을것이다. - 39 -
참고문헌 1. Silver, D. et al., Mastering the game of Go with Deep neural networks and tree search, Nature vol 529, pp. 484-489, 28 Jan 2016. 2. cudnn : Efficient Primitives for Deep Learning, https://arxiv.org/pdf/1410.0759.pdf 3. Barba, Lorena A., and Rio Yokota. "How will the fast multipole method fare in the exascale era." SIAM News 46.6 (2013): 1-3. 4. AlphaGo의인공지능알고리즘분석, 소프트웨어정책연구소 (2016) 5. 국가슈퍼컴퓨팅역량강화방안, 소프트웨어정책연구소 (2017) 6. 인공지능의핵심인프라 고성능컴퓨팅환경의중요성, 소프트웨어정책연구소 (2017) 7. 중소기업 스타트업의인공지능컴퓨팅인프라현황과시사점, 소프트웨어정책연구소 (2018) 8. Convolutional Neural Network, http://cs231n.github.io/convolutional-networks/ 9. cublas, NVIDIA, http://docs.nvidia.com/cuda/cublas/ 10. CUDA Toolkit Documentation, NVIDIA, https://docs.nvidia.com/cuda/cuda-c-programming-guide/ 11. Deep Blue https://www-03.ibm.com/ibm/history/exhibits/vintage/vintage_4506vv1001.html 12. Fused Multiply-Add, https://en.wikipedia.org/wiki/multiply%e2%80%93accumulate_operation 13. Top500, http://www.top500.org 14. Intel Xeon Processor E5-2699 v4, http://ark.intel.com/products/91317 15. Intel Xeon Phi 7120P, http://ark.intel.com/products/75799 16. Nvidia Tesla P100, http://www.nvidia.com/object/tesla-p100.html 17. Roofline Performance Model https://crd.lbl.gov/departments/computer-science/par/research/roofline/ 18. Samsung Exynos, Wikipedia https://en.wikipedia.org/wiki/exynos 19. Watson (computer), Wikipedia, https://en.wikipedia.org/wiki/watson_(computer) - 40 -
별첨 1. 실태조사설문지 통계법제 33 조 ( 비밀의보호등 ) 1 통계작성과정에서알려진사항으로서개인또는법인이나단체의비밀에속하는사항은보호되어야한다. 2 통계작성을위하여수집된개인또는법인이나단체의비밀에속하는기초자료는통계작성의목적외에사용하여서는아니된다. ID 중소기업 스타트업의인공지능컴퓨팅인프라현황과수요조사 안녕하십니까? 귀사의무궁한발전을기원합니다. 소프트웨어정책연구소에서는인공지능과고성능컴퓨팅인프라의중요성을강조하며, 중소기업 스타트업을위한컴퓨팅인프라지원사업에대해정책연구를수행하고있습니다. 이에본조사는중소기업 스타트업의인공지능컴퓨팅인프라현황과수요를파악하고자합니다. 인공지능은빅데이터를학습해패턴을도출하고미래를예측한다는점에있어막대한계산량을필요로합니다. 따라서현실적이고효과적인인공지능컴퓨팅인프라지원정책을위해귀사의적극적인도움을요청드립니다. 응답결과는정책개발을위한기초자료로만활용할예정이며, 그외의목적으로는절대사용되지않습니다. 응답하신내용은통계법제 33 조에의해철저히비밀을보장받습니다. 인공지능컴퓨팅인프라정책결정을위한귀중한자료로사용할예정이오니바쁘시더라도귀사의고견을응답해주시기바랍니다. 2017 년 9 월 주관 : 소프트웨어정책연구소 조사기관 : 마크로밀엠브레인 사업체일반현황 기업체명설립년도년월 상장여부 1 코스피 2 코스닥 3 코넥스 4 비상장 응답자성명 응답자전화번호 조사일시 2017 년월일 ( 오전 / 오후 ) 시 분부터 시 분까지 조사원성명 관리자 (SV) 에디터 검증원 - 41 -
A. 컴퓨팅인프라현황및전망 인공지능계산을위한컴퓨터 인공지능연구개발에활용하고있는계산용서버및 PC 기준, 클라우드컴퓨터의경우도포함. 단, 웹서버및인트라넷용서버는제외 문 1. 귀사의인공지능연구를적용하고있는분야를모두선택해주십시오. 1 의료 2 국방 3 교육 4 농업 5 법률 6 웰니스 7 제조 8 홈 9 금융 10 문화관광 11 유통 12 사무관리 13 도시 14 교통 15 에너지 16 안전 17 공공서비스 18 기타 ( ) 문 2. 귀사에서인공지능연구에활용하고있는데이터의종류를모두선택해주십시오. 1 이미지및영상 2 정형텍스트 3 비정형텍스트 4 음성및청각데이터 5 신호 6 기타 ( ) 예시 1 이미지 / 영상 : 일반적인사진, 의료사진및영상, CCTV 영상, 위성영상등 2 정형텍스트 : 일반적인데이터베이스를활용할수있는텍스트데이터 ( 구매이력등 ) 3 비정형텍스트 : 신문기사, 문서등정형적으로데이터베이스화할수없는데이터 4 음성 : 음성, 음파등청각과관련된데이터 5 신호 : 시계열적인특성이있는데이터 ( 시간에대한의존성이있는경우 ) 6 기타 : 위범주에해당하지않는데이터는자세하게기술해주시기바랍니다. 문 3. 귀사에서인공지능연구에활용하고있는데이터의양을작성해주십시오. ( ) 테라바이트 * (TeraByte, TB) * 테라바이트는 1,000 기가바이트 ( 일반 PC 에탑재되는하드디스크용량은 1 테라바이트 ) 문 4. 귀사에서향후인공지능연구에활용하기위해확보하고자하는데이터의양을작성해주십시오. ( ) 테라바이트 (TeraByte, TB) 문 5. 귀사에서는인공지능연구에딥러닝 * 을활용하고계십니까? 1 활용하고있지않다 2 활용하고있다 3 활용할예정이다 * 딥러닝은기계학습의한종류로빅데이터를학습하여패턴을인식하는알고리즘. 본문항에서의딥러닝은 - 42 -
합성곱신경망 (CNN), 순환신경망 (RNN), 심층신경망 (DNN) 등을포함하고, 기존인공신경망 (Artificial Neural Network) 에서파생된신경망방법론도모두포함문 6. 귀사에서는인공지능연구에 GPU* 를활용하고계십니까? 1 활용하고있지않다 2 활용하고있다 3 활용할예정이다 * GPU는그래픽연산처리장치 (Graphical Processing Units) 으로 3D 가속이나그래픽처리를하기위한용도로주로활용됐으나, 계산용도특히딥러닝에최적화된연산처리장치로부상문 7-8. 귀사에서인공지능계산을위한 GPU 규모 * 현황과수요 ** 를아래표에작성하여주십시오. * 현시점에서가장널리활용되는학습용 (training) 연산처리장치는 GPU이기때문에 GPU의규모로현황과수요를파악하고자함 ** GPU 규모에대한수요부분은향후 3년이내추진하고자하는인공지능제품및서비스개발에필요한규모작성 성능별보기참조 현황의경우, GPU를활용하는경우만작성부탁드립니다. < 응답표 > GPU 모델명성능요약계산능력 1 GTX 1070 2 GTX 1080 3 GTX 1080Ti 4 GTX TITAN X (Pascal, 10series) 5 P100 (P40 포함 ) 6 해당사항이없는경우 이론성능 : 5.2 TFLOPS 메모리 : 8GB 이론성능 : 8.2 TFLOPS 메모리 : 8GB 이론성능 : 10.6 TFLOPS 메모리 : 11GB 이론성능 : 10.1 TFLOPS 메모리 : 12GB 이론성능 : 10.6 TFLOPS (11.8 TFLOPS) 메모리 : 16GB (24GB) 모델명을알고있을경우별도기입 이미지학습 : 초당 100여장기계번역 1) : 1배성능향상이미지학습 : 초당 150여장기계번역 : 1.5배성능향상 이미지학습 : 초당 200 여장 2) 기계번역 : 2 배성능향상 1) 기계번역성능기준 : K80 활용시 1 배 (LSTM + RNN 활용 ) - 문 7. 현재보유규모 장 장 장 장 문 8. 향후희망규모 장 장 장 장 2) 3, 4는데스크탑보급형그래픽카드이고, 5의경우는계산전용으로생산하여워크스테이션급으로활용가능 (5는한컴퓨터에최대 8장으로구성가능, DGX-1) 문 9. 귀사에서인공지능 R&D를위한향후컴퓨팅인프라형태를어떤비율로계획하고있습니까? 아래의표에합이 100% 가되도록응답하여주십시오. 클라우드자체구축합계 % % 100% - 43 -
문 10. 정부에서인공지능을위한컴퓨팅인프라를지원하는사업을시행하는것을알고있습니까? ( 예 - 지능정보산업인프라조성사업, 글로벌 HPC 이노베이션허브구축사업 ) 1 알고있다 2 모른다 문 11. [ 문 10 의 1 응답자만 ] 최근 1 년간정부에서추진하고있는인공지능관련컴퓨팅인프라 지원사업의수혜를받은경험이있습니까? 1 컴퓨팅인프라수혜경험있음 2 컴퓨팅인프라수혜경험없음 문 12. 귀사에서인공지능관련사업을수행하시면서컴퓨팅인프라와관련한애로사항이있습니까? 전혀어려움이없다 그다지어려움이없는편이다 보통이다 어려움이약간있는편이다 어려움이매우많다 1 2 3 4 5 문 13. 정부에서인공지능연구를위해클라우드컴퓨팅인프라지원사업을운영할시, 다음중귀사에서선호하는지원사업운영방식은무엇입니까? 1 상용보다저렴한과금형클라우드서비스 è 문 13-1 로이동 2 제안서채택으로일정규모컴퓨팅인프라무상지원 è 문 13-2 로이동 3 1과 2의혼합운영 è 문 13-1 로이동 4 기타의견 ( ) è 문 13-5 로이동 문 13-1. [ 문13의 1, 3 응답자 ] 저렴한과금형클라우드서비스를지원하는형태로운영될시, 상용클라우드요금대비적절한과금형클라우드요금의비율은몇 % 라고생각합니까? ( %) 문 13-2. [ 문13의 2, 3 응답자 ] 제안서채택방식으로컴퓨팅인프라를보급할경우적정한기준은어떤것인지선택해주십시오. 1 컴퓨팅인프라활용의최대치를제한하되, 많은기업에지원하는방식 2 지원받는기업의수를제한하되, 컴퓨팅인프라활용의최대치를제한하지않는방식 문 13-3. [ 문13의 2, 3 응답자 ] 제안서채택방식으로컴퓨팅인프라를보급할경우적정한활용 기간은어떤것인지선택해주십시오. 1 1개월 ~ 6개월 2 6개월 ~ 1년 3 6개월활용후심사를통해연장 4 기타의견 ( ) 문 13-4. [ 문13의 3 응답자 ] 과금형클라우드방식과제안서채택방식의혼합형태로구성할경우 그비율을작성해주십시오. - 44 -
과금형클라우드제안서채택방식합계 % % 100% 문 13-5. [ 문 13 의 4 응답자 ] 귀사에서선호하시는정부클라우드컴퓨팅인프라운영방식에대해 자유롭게제안해주시기바랍니다. 문 14. 정부에서인공지능을위한컴퓨팅인프라를지원하는사업을시행할경우귀사에서는정부에서 지원하는컴퓨팅인프라활용의사가있으십니까? 1 활용의사있음 2 활용의사없음 B. 인공지능관련 R&D 투자및개발현황 문 15. 귀사에서현재인공지능관련 R&D에투입하고있는예산비율을선택해주시기바랍니다. 1 매출의 5% 이하 2 매출의 5~10% 3 매출의 10~20% 4 매출의 20~30% 5 매출의 30% 이상 문 16. 귀사에서향후인공지능관련 R&D에투입할예정인예산규모비율을선택해주시기바랍니다. 1 매출의 5% 이하 2 매출의 5~10% 3 매출의 10~20% 4 매출의 20~30% 5 매출의 30% 이상 문 17. 귀사에서인공지능제품및서비스개발을위해사용하고있는 SW를모두선택해주십시오. 1 텐서플로우 (Tensorflow) 2 토치 (Torch) 3 띠아노 (Theano) 4 카페 (Caffe) 5 CNTK/DMTK 6 케라스 (Keras) 7 매틀랩 (MATLAB) 6 R( 통계프로그램 ) 7 기타 ( ) 문 18. 최근 1년간정부에서추진하고있는인공지능관련 R&D 사업에선정되신적이있으십니까? 선정된적이있으시다면, 지원받으신연구비금액을적어주십시오. 1 정부 R&D 사업선정경험있음 ( 총지원받은연구비 : 원 ) 2 정부 R&D 사업선정경험없음 - 45 -
문 19. 인공지능컴퓨팅인프라지원사업에대한귀사의자유로운의견을부탁드립니다. 제시하신의견은향후정책설계의자료로활용됩니다. 귀사에서당면하고있는과제를작성하셔도좋습니다. ( 예시 ) 컴퓨팅인프라의보안이매우중요하다. 컴퓨팅인프라를직접적으로활용할수있는 HPC(High Performance Computing) 엔지니어가필요하다. C. 인공지능기술수준 문 20. 다음중귀사에해당하는인공지능영역을모두선택해주십시오. 지능정보기술 4대분야 17대기술中 인공지능 SW(7종 ) 1 추론및기계학습 2 지식표현및언어지능 3 청각지능 4 시각지능 5 복합지능 6 지능형에이전트 7 인간-기계협업 문 21. 다음중귀사에서가장연관도가높은데이터 네트워크기술을모두선택해주십시오. 지능정보기술 4 대분야 17 대기술中데이터 네트워크 (4 종 ) 1 사물인터넷 2 클라우드컴퓨팅 3 빅데이터 4 모바일 (5G) 문 22. 귀사의인공지능분야에서세계최고수준대비우리나라의기술수준과귀사의기술수준은각 각어느위치에있는지응답해주십시오. 세계최고 100점기준대비 (%) 우리나라기술수준 귀사기술수준 1 100점 : 세계최고수준 1 1 2 90~99점 : 최고산업기술과동등한수준 2 2 3 80~89점 : 최고산업기술국에근접한수준 3 3 4 70~79점 : 최고산업기술국보다다소뒤쳐진수준 4 4 5 60~69점 : 최고산업기술국보다낮은수준 5 5 6 59점이하 : 최고산업기술국보다아주낮은수준 6 6 문 23. 귀사의재무현황에대해응답해주십시오. 구분 2016년 2017년 ( 연말추정치 ) 2018년 ( 목표치 ) 전체매출액 백만원 백만원 백만원 인공지능매출액 백만원 백만원 백만원 끝까지설문에응답해주셔서감사합니다 - 46 -
별첨 2. 실태조사결과표 별첨 2 는중소기업 스타트업의컴퓨팅인프라현황과향후수요에대한 설문결과데이터로구성된다. < 표별첨 2-1> 인공지능연구분야 [Base: 전체응답자 (n=72), Unit: %] (Base) 사무공공서비금융교육제조에너관리지스 유통의료국방홈교통안전법률문화관광도시농업웰니스 기타 전체 (72) 33.3 33.3 30.6 26.4 26.4 16.7 15.3 13.9 13.9 13.9 13.9 9.7 8.3 5.6 5.6 4.2 4.2 18.1 2000 년이전 (20) 25.0 15.0 20.0 25.0 15.0 15.0 5.0 10.0 15.0 10.0 20.0 15.0 5.0 0.0 15.0 0.0 5.0 25.0 설립년도 2000-2010 년 (25) 44.0 52.0 28.0 20.0 24.0 16.0 16.0 8.0 20.0 12.0 12.0 4.0 8.0 8.0 0.0 0.0 4.0 16.0 2010 년이후 (27) 29.6 29.6 40.7 33.3 37.0 18.5 22.2 22.2 7.4 18.5 11.1 11.1 11.1 7.4 3.7 11.1 3.7 14.8 10 억미만 (17) 29.4 29.4 35.3 5.9 23.5 5.9 17.6 29.4 11.8 29.4 5.9 23.5 11.8 5.9 5.9 5.9 11.8 17.6 10-30 억미만 (17) 29.4 41.2 23.5 35.3 35.3 29.4 11.8 11.8 17.6 11.8 5.9 0.0 11.8 11.8 0.0 5.9 0.0 5.9 30-50 억미만 (6) 33.3 33.3 33.3 50.0 33.3 16.7 16.7 0.0 16.7 33.3 33.3 0.0 0.0 0.0 0.0 0.0 0.0 33.3 매출액 50-80 억미만 (4) 75.0 50.0 50.0 50.0 25.0 25.0 25.0 25.0 25.0 0.0 50.0 25.0 0.0 0.0 0.0 0.0 0.0 25.0 80-120 억미만 (3) 33.3 100.0 66.7 66.7 0.0 33.3 66.7 0.0 0.0 0.0 33.3 0.0 33.3 0.0 0.0 0.0 0.0 33.3 120-200 억미만 (9) 44.4 33.3 44.4 11.1 0.0 11.1 11.1 11.1 33.3 0.0 22.2 0.0 11.1 0.0 22.2 0.0 0.0 11.1 200-500 억미만 (8) 25.0 12.5 12.5 37.5 37.5 12.5 0.0 0.0 0.0 12.5 0.0 0.0 0.0 12.5 0.0 12.5 0.0 25.0 500 억이상 (8) 25.0 12.5 12.5 12.5 37.5 12.5 12.5 12.5 0.0 0.0 12.5 25.0 0.0 0.0 12.5 0.0 12.5 25.0 비활용 (19) 31.6 26.3 36.8 26.3 36.8 10.5 21.1 10.5 21.1 15.8 10.5 10.5 15.8 10.5 10.5 5.3 5.3 26.3 딥러닝활용 활용 (31) 32.3 41.9 29.0 35.5 22.6 25.8 6.5 19.4 12.9 9.7 16.1 6.5 9.7 3.2 3.2 0.0 3.2 9.7 활용예정 (22) 36.4 27.3 27.3 13.6 22.7 9.1 22.7 9.1 9.1 18.2 13.6 13.6 0.0 4.5 4.5 9.1 4.5 22.7 비활용 (31) 29.0 29.0 35.5 25.8 29.0 12.9 19.4 12.9 16.1 12.9 9.7 9.7 16.1 9.7 9.7 6.5 9.7 19.4 GPU 활용 활용 (26) 34.6 42.3 34.6 34.6 23.1 30.8 7.7 19.2 11.5 11.5 19.2 7.7 3.8 3.8 0.0 0.0 0.0 15.4 활용예정 (15) 40.0 26.7 13.3 13.3 26.7 0.0 20.0 6.7 13.3 20.0 13.3 13.3 0.0 0.0 6.7 6.7 0.0 20.0 정부지원인지여부 인지 (26) 26.9 34.6 34.6 30.8 26.9 19.2 11.5 19.2 11.5 7.7 23.1 15.4 11.5 7.7 7.7 7.7 0.0 7.7 비인지 (46) 37.0 32.6 28.3 23.9 26.1 15.2 17.4 10.9 15.2 17.4 8.7 6.5 6.5 4.3 4.3 2.2 6.5 23.9-47 -
< 표별첨 2-2> 인공지능연구활용데이터종류 [Base: 전체응답자 (n=72), Unit: %] (Base) 정형텍스트 비정형텍스트 이미지및영상 신호 음성및청각데이터 빅데이터 전체 (72) 50.0 45.8 43.1 25.0 18.1 1.4 2000 년이전 (20) 40.0 30.0 55.0 25.0 20.0 0.0 설립년도 2000-2010 년 (25) 60.0 52.0 36.0 28.0 20.0 0.0 2010 년이후 (27) 48.1 51.9 40.7 22.2 14.8 3.7 10 억미만 (17) 47.1 52.9 35.3 23.5 5.9 0.0 10-30 억미만 (17) 58.8 52.9 47.1 41.2 23.5 0.0 30-50 억미만 (6) 16.7 33.3 66.7 0.0 33.3 16.7 매출액 50-80 억미만 (4) 50.0 50.0 25.0 25.0 25.0 0.0 80-120 억미만 (3) 66.7 66.7 33.3 33.3 33.3 0.0 120-200 억미만 (9) 55.6 55.6 66.7 22.2 33.3 0.0 200-500 억미만 (8) 75.0 37.5 25.0 0.0 12.5 0.0 500 억이상 (8) 25.0 12.5 37.5 37.5 0.0 0.0 비활용 (19) 52.6 42.1 31.6 21.1 10.5 5.3 딥러닝활용 활용 (31) 45.2 54.8 58.1 22.6 32.3 0.0 활용예정 (22) 54.5 36.4 31.8 31.8 4.5 0.0 비활용 (31) 54.8 41.9 25.8 22.6 16.1 3.2 GPU 활용 활용 (26) 50.0 53.8 57.7 26.9 26.9 0.0 활용예정 (15) 40.0 40.0 53.3 26.7 6.7 0.0 정부지원인지여부 인지 (26) 53.8 57.7 53.8 26.9 23.1 0.0 비인지 (46) 47.8 39.1 37.0 23.9 15.2 2.2-48 -
< 표별첨 2-3> 인공지능연구활용데이터양 [Base: 전체응답자 (n=72), Unit: %, TB] (Base) 1TB 미만 1-2TB 미만 2-5TB 미만 5-50TB 미만 50TB 이상 모름평균합계 전체 (72) 9.7 31.9 12.5 25.0 18.1 2.8 26.76 1,873 2000 년이전 (20) 10.0 45.0 15.0 10.0 15.0 5.0 31.79 604 설립년도 2000-2010 년 (25) 8.0 28.0 12.0 32.0 20.0 0.0 26.46 662 2010 년이후 (27) 11.1 25.9 11.1 29.6 18.5 3.7 23.36 607 10 억미만 (17) 17.6 29.4 17.6 17.6 17.6 0.0 26.67 453 10-30 억미만 (17) 0.0 35.3 11.8 29.4 23.5 0.0 21.06 358 30-50 억미만 (6) 0.0 50.0 0.0 33.3 16.7 16.7 4.60 23 매출액 50-80 억미만 (4) 0.0 25.0 0.0 50.0 25.0 0.0 22.75 91 80-120 억미만 (3) 33.3 33.3 0.0 33.3 0.0 0.0 3.67 11 120-200 억미만 (9) 11.1 44.4 22.2 0.0 22.2 0.0 34.72 313 200-500 억미만 (8) 0.0 25.0 12.5 25.0 37.5 12.5 25.00 175 500 억이상 (8) 25.0 12.5 12.5 37.5 12.5 0.0 56.13 449 비활용 (19) 10.5 42.1 10.5 10.5 15.8 10.5 38.51 655 딥러닝활용 활용 (31) 9.7 29.0 12.9 29.0 19.4 0.0 18.18 563 활용예정 (22) 9.1 27.3 13.6 31.8 18.2 0.0 29.76 655 비활용 (31) 16.1 35.5 16.1 12.9 12.9 6.5 25.82 749 GPU 활용 활용 (26) 3.8 26.9 7.7 34.6 26.9 0.0 29.00 754 활용예정 (15) 6.7 33.3 13.3 33.3 13.3 0.0 24.67 370 정부지원인지여부 인지 (26) 11.5 26.9 11.5 26.9 23.1 0.0 22.93 596 비인지 (46) 8.7 34.8 13.0 23.9 15.2 4.3 29.02 1,277-49 -
< 표별첨 2-4> 향후인공지능연구활용을위한확보데이터양 [Base: 전체응답자 (n=72), Unit: %, TB] (Base) 1TB 미만 1-2TB 미만 2-5TB 미만 5-50TB 미만 50TB 이상 모름평균합계 전체 (72) 2.8 8.3 13.9 41.7 30.6 2.8 129.76 9,083 2000 년이전 (20) 0.0 15.0 10.0 55.0 15.0 5.0 64.21 1,220 설립년도 2000-2010 년 (25) 4.0 12.0 16.0 36.0 32.0 0.0 101.06 2,527 2010 년이후 (27) 3.7 0.0 14.8 37.0 40.7 3.7 205.26 5,337 10 억미만 (17) 5.9 0.0 23.5 35.3 35.3 0.0 164.16 2,791 10-30 억미만 (17) 0.0 5.9 11.8 41.2 41.2 0.0 57.35 975 30-50 억미만 (6) 0.0 33.3 16.7 0.0 33.3 16.7 420.90 2,105 매출액 50-80 억미만 (4) 0.0 0.0 0.0 75.0 25.0 0.0 36.25 145 80-120 억미만 (3) 33.3 0.0 0.0 66.7 0.0 0.0 5.00 15 120-200 억미만 (9) 0.0 22.2 22.2 22.2 33.3 0.0 114.33 1,029 200-500 억미만 (8) 0.0 0.0 12.5 50.0 25.0 12.5 164.57 1,152 500 억이상 (8) 0.0 12.5 0.0 75.0 12.5 0.0 109.00 872 비활용 (19) 0.0 15.8 10.5 52.6 10.5 10.5 85.16 1,448 딥러닝활용 활용 (31) 3.2 6.5 19.4 32.3 38.7 0.0 116.55 3,613 활용예정 (22) 4.5 4.5 9.1 45.5 36.4 0.0 182.84 4,023 비활용 (31) 6.5 9.7 12.9 45.2 19.4 6.5 58.27 1,690 GPU 활용 활용 (26) 0.0 7.7 11.5 38.5 42.3 0.0 131.11 3,409 활용예정 (15) 0.0 6.7 20.0 40.0 33.3 0.0 265.63 3,985 정부지원인지여부 인지 (26) 3.8 3.8 23.1 23.1 46.2 0.0 164.65 4,281 비인지 (46) 2.2 10.9 8.7 52.2 21.7 4.3 109.14 4,802-50 -
< 표별첨 2-5> 딥러닝활용여부 [Base: 전체응답자 (n=72), Unit: %] (Base) 활용하고있지않음활용하고있음활용할예정임 전체 (72) 26.4 43.1 30.6 2000 년이전 (20) 45.0 35.0 20.0 설립년도 2000-2010 년 (25) 16.0 52.0 32.0 2010 년이후 (27) 22.2 40.7 37.0 10 억미만 (17) 17.6 35.3 47.1 10-30 억미만 (17) 17.6 70.6 11.8 30-50 억미만 (6) 50.0 16.7 33.3 매출액 50-80 억미만 (4) 25.0 50.0 25.0 80-120 억미만 (3) 0.0 66.7 33.3 120-200 억미만 (9) 33.3 44.4 22.2 200-500 억미만 (8) 25.0 37.5 37.5 500 억이상 (8) 50.0 12.5 37.5 비활용 (19) 100.0 0.0 0.0 딥러닝활용 활용 (31) 0.0 100.0 0.0 활용예정 (22) 0.0 0.0 100.0 비활용 (31) 54.8 16.1 29.0 GPU 활용 활용 (26) 3.8 88.5 7.7 활용예정 (15) 6.7 20.0 73.3 정부지원인지여부 인지 (26) 3.8 69.2 26.9 비인지 (46) 39.1 28.3 32.6-51 -
< 표별첨 2-6> GPU 활용여부 [Base: 전체응답자 (n=72), Unit: %] (Base) 활용하고있지않음활용하고있음활용할예정임 전체 (72) 43.1 36.1 20.8 2000 년이전 (20) 65.0 25.0 10.0 설립년도 2000-2010 년 (25) 32.0 40.0 28.0 2010 년이후 (27) 37.0 40.7 22.2 10 억미만 (17) 47.1 35.3 17.6 10-30 억미만 (17) 17.6 64.7 17.6 30-50 억미만 (6) 50.0 16.7 33.3 매출액 50-80 억미만 (4) 25.0 50.0 25.0 80-120 억미만 (3) 33.3 66.7 0.0 120-200 억미만 (9) 55.6 11.1 33.3 200-500 억미만 (8) 50.0 25.0 25.0 500 억이상 (8) 75.0 12.5 12.5 비활용 (19) 89.5 5.3 5.3 딥러닝활용 활용 (31) 16.1 74.2 9.7 활용예정 (22) 40.9 9.1 50.0 비활용 (31) 100.0 0.0 0.0 GPU 활용 활용 (26) 0.0 100.0 0.0 활용예정 (15) 0.0 0.0 100.0 정부지원인지여부 인지 (26) 19.2 57.7 23.1 비인지 (46) 56.5 23.9 19.6-52 -
< 표별첨 2-7> 현재보유인공지능계산 GPU 규모 [Base: 전체응답자 (n=72), Unit: TFLOPS] 평균 합계 (Base) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) 전체 (72) 52.6 14.2 13.3 130.6 11,370 1,009 959 9,402 2000 년이전 (20) 11.4 19.2 12.3 3.7 684 364 246 74 설립년도 2000-2010 년 (25) 9.6 12.7 14.4 1.7 720 317 361 42 2010 년이후 (27) 123.0 12.1 13.1 343.9 9,966 328 353 9,286 10 억미만 (17) 97.5 21.7 6.3 264.4 4,970 369 107 4,494 10-30 억미만 (17) 98.6 2.8 11.1 281.8 5,027 47 189 4,791 30-50 억미만 (6) 4.8 0.9 13.7 0.0 87 5 82 0 매출액 50-80 억미만 (4) 33.5 0.0 82.0 18.6 402 0 328 74 80-120 억미만 (3) 5.8 17.3 0.0 0.0 52 52 0 0 120-200 억미만 (9) 8.9 22.0 0.0 4.7 240 198 0 42 200-500 억미만 (8) 23.8 39.7 31.8 0.0 571 317 254 0 500 억이상 (8) 0.9 3.0 0.0 0.0 21 21 0 0 비활용 (19) 40.4 3.3 3.0 114.9 2,303 62 57 2,184 딥러닝활용 활용 (31) 69.3 18.7 25.4 164.5 6,447 562 787 5,099 활용예정 (22) 39.7 17.5 5.2 96.4 2,620 385 115 2,120 비활용 (31) 26.5 6.0 4.5 69.1 2,468 187 139 2,141 GPU 활용 활용 (26) 82.2 19.8 31.5 196.1 6,413 494 820 5,099 활용예정 (15) 55.3 21.8 0.0 144.2 2,490 328 0 2,162 정부지원인지여부 인지 (26) 67.5 19.8 7.9 174.9 5,267 515 205 4,547 비인지 (46) 44.2 11.0 16.4 105.5 6,103 494 754 4,855-53 -
< 표별첨 2-8> 현재보유인공지능계산 GPU 규모 - 추정 [Base: 전체응답자 (n=215/ 모집단 ), Unit: TFLOPS] 평균 합계 (Base) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) 전체 (72) 49.8 14.7 14.0 120.7 32,093 3,135 3,017 25,941 2000 년이전 (20) 11.4 18.2 12.0 4.7 2,021 1,036 707 278 설립년도 2000-2010 년 (25) 10.8 13.8 17.0 1.5 2,492 1,067 1,311 113 2010 년이후 (27) 116.8 13.1 12.7 324.7 27,580 1,032 998 25,550 10 억미만 (17) 97.5 21.7 6.3 264.4 15,788 1,173 339 14,276 10-30 억미만 (17) 98.6 2.8 11.1 281.8 11,827 110 444 11,273 30-50 억미만 (6) 4.8 0.9 13.7 0.0 291 17 273 0 매출액 50-80 억미만 (4) 33.5 0.0 82.0 18.6 1,508 0 1,230 278 80-120 억미만 (3) 5.8 17.3 0.0 0.0 347 347 0 0 120-200 억미만 (9) 8.9 22.0 0.0 4.7 640 527 0 113 200-500 억미만 (8) 23.8 39.7 31.8 0.0 1,643 912 731 0 500 억이상 (8) 0.9 3.0 0.0 0.0 49 49 0 0 비활용 (19) 44.9 3.4 2.6 128.7 7,221 183 142 6,897 딥러닝활용 활용 (31) 59.2 18.3 27.7 132.2 16,552 1,664 2,578 12,310 활용예정 (22) 40.6 18.9 4.4 98.6 8,320 1,288 297 6,734 비활용 (31) 27.6 5.5 3.6 73.8 7,628 509 335 6,784 GPU 활용 활용 (26) 69.6 21.9 33.6 154.1 16,686 1,694 2,682 12,310 활용예정 (15) 60.1 21.6 0.0 158.8 7,779 932 0 6,847 정부지원인지여부 인지 (26) 59.4 20.7 7.6 149.7 15,151 1,759 651 12,741 비인지 (46) 43.5 10.8 18.2 101.6 16,942 1,376 2,366 13,200-54 -
< 표별첨 2-9> 향후희망하는계산 GPU 규모 [Base: 전체응답자 (n=72), Unit: TFLOPS] 평균 합계 (Base) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) 전체 (72) 102.0 41.1 26.6 240.0 22,040 2,876 1,886 17,278 2000 년이전 (20) 51.2 30.9 41.4 82.7 3,069 588 828 1,654 설립년도 2000-2010 년 (25) 26.5 55.7 20.8 3.8 1,989 1,394 500 95 2010 년이후 (27) 209.6 34.4 20.7 575.1 16,981 894 558 15,529 10 억미만 (17) 152.9 37.6 12.1 409.0 7,798 640 205 6,954 10-30 억미만 (17) 178.1 8.5 22.6 505.1 9,082 135 361 8,586 30-50 억미만 (6) 33.7 87.5 13.7 0.0 607 525 82 0 매출액 50-80 억미만 (4) 40.6 0.0 82.0 39.8 487 0 328 159 80-120 억미만 (3) 9.0 20.8 2.7 3.5 81 62 8 11 120-200 억미만 (9) 73.5 46.2 0.0 174.3 1,985 416 0 1,569 200-500 억미만 (8) 61.6 72.2 112.8 0.0 1,479 577 902 0 500 억이상 (8) 21.7 74.3 0.0 0.0 520 520 0 0 비활용 (19) 79.6 0.8 4.7 233.2 4,537 16 90 4,431 딥러닝활용 활용 (31) 143.0 37.3 51.9 344.0 13,303 1,082 1,558 10,664 활용예정 (22) 63.6 80.8 10.8 99.3 4,200 1,778 238 2,184 비활용 (31) 74.2 25.8 8.5 188.4 6,904 801 262 5,841 GPU 활용 활용 (26) 148.8 33.4 64.9 353.1 11,604 801 1,624 9,180 활용예정 (15) 78.5 84.9 0.0 150.5 3,532 1,274 0 2,258 정부지원인지여부 인지 (26) 124.5 36.2 14.2 324.5 9,711 905 369 8,438 비인지 (46) 89.3 43.8 33.7 192.2 12,328 1,971 1,517 8,840-55 -
< 표별첨 2-10> 향후희망하는계산 GPU 규모 - 추정 [Base: 전체응답자 (n=215/ 모집단 ), Unit: TFLOPS] 평균 합계 (Base) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) GTX 1070 GTX 1080 GTX 1080Ti /GTX TITAN X (Pascal,10series)/ P100 (P40 포함 ) 전체 (72) 95.1 40.5 26.6 219.3 61,312 8,520 5,651 47,141 2000 년이전 (20) 49.3 30.3 40.8 78.2 8,754 1,718 2,412 4,624 설립년도 2000-2010 년 (25) 25.2 50.3 22.5 3.4 5,824 3,880 1,685 260 2010 년이후 (27) 198.0 38.3 19.8 537.1 46,734 2,923 1,554 42,257 10 억미만 (17) 152.9 37.6 12.1 409.0 24,771 2,032 651 22,088 10-30 억미만 (17) 178.1 8.5 22.6 505.1 21,369 318 849 20,202 30-50 억미만 (6) 33.7 87.5 13.7 0.0 2,024 1,751 273 0 매출액 50-80 억미만 (4) 40.6 0.0 82.0 39.8 1,826 0 1,230 596 80-120 억미만 (3) 9.0 20.8 2.7 3.5 541 416 55 71 120-200 억미만 (9) 73.5 46.2 0.0 174.3 5,293 1,109 0 4,183 200-500 억미만 (8) 61.6 72.2 112.8 0.0 4,253 1,659 2,593 0 500 억이상 (8) 21.7 74.3 0.0 0.0 1,235 1,235 0 0 비활용 (19) 88.4 0.9 4.1 260.2 14,211 48 219 13,944 딥러닝활용 활용 (31) 122.6 36.0 53.0 282.0 34,259 3,186 4,812 26,261 활용예정 (22) 62.7 77.4 9.1 101.6 12,843 5,286 620 6,936 비활용 (31) 73.7 21.7 6.9 192.5 20,332 1,993 631 17,709 GPU 활용 활용 (26) 125.0 35.1 64.7 279.1 29,965 2,641 5,020 22,303 활용예정 (15) 85.1 90.1 0.0 165.3 11,015 3,887 0 7,129 정부지원인지여부 인지 (26) 105.0 35.8 13.5 266.6 26,792 2,964 1,146 22,682 비인지 (46) 88.6 43.6 35.3 188.3 34,520 5,556 4,505 24,459-56 -
주의 1. 이보고서는소프트웨어정책연구소에서수행한연구보고서입니다. 2. 이보고서의내용을발표할때에는반드시소프트웨어정책연구소에서수행한연구결과임을밝 혀야합니다. 93000 9 788961 084048 ISBN 978-89-6108-404-8 [ 소프트웨어정책연구소 ] 에의해작성된 [SPRI 보고서 ] 는공공저작물자유이용허락표시기준제 4 유형 ( 출처표시 - 상업적이용금지 - 변경금지 ) 에따라이용할수있습니다. ( 출처를밝히면자유로운이용이가능하지만, 영리목적으로이용할수없고, 변경없이그대로이용해야합니다.)