주간기술동향 2018. 9. 26. 설명가능한 AI 기술을포함한인공지능의 IP-R&D 전략 윤태승한국특허전략개발원전문위원 DNN(Deep Neural Network)/CNN(Convolutional Neural Network) 과같은딥러링인공지능은학습으로얻어지는인공지능의판정결과에서괄목할만한성과를거두고있으나, 연구자들은 DNN/CNN에서드러나는여러가지문제점을인지하고이를해결하기위한방안을모색하기시작했다. 특히, 블랙박스처럼취급되는네트워크내부의정보는 AI가어떤근거로그결과를제시하는지에대한확인이어렵고 Adversarial Attack에취약하다는단점들이있었다. DARPA 에서진행하는 X-AI(Explainable AI) 과제와같이자체를 transparent하게만들어서설명가능한 AI를구현하거나혹은 AI 구조를그대로두고, interpreting하기위한부가적인모델을생성하거나 Interpretable Interface를접목하는등의인공지능내부네트워크해석에대한연구가활발히진행되고있다. 이에본고에서는설명가능한 AI에대한특허동향을살펴보고, 앞으로의 IP-R&D 전략에대한의견을제시하고자한다. I. 서론 인공지능 (AI) 은구글의최종도착지입니다. 구글은사용자가원하는것을정확히이해하고가장적합한답을줄것입니다. 구글의래리페이지가 2018년개발자데이에서한발언이다. 장기간침체에있던인공지능 (Artificial Intelligence: AI) 은최근구글을중심으로한딥러닝기술의발달로산업전반에적용가능한수준으로발전하고있다. 2016년구글딥마인드의 AI 알파고 (AlphaGo) 와이세돌 9단의바둑대국을계기로인공지능에대한관심이폭발적으로증가하기시작했다. 알파고이전의인공지능은머신러닝으로지금도범용적인응용분야에서많이사용되고있다. 사실인공지능의역사는매우깊다. * 본내용은윤태승전문위원 ( 02-3475-1321 tsyun@kista.re.kr) 에게문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 IITP 의공식적인입장이아님을밝힙니다. 2 www.iitp.kr
기획시리즈 인공지능 우리가인공지능과함께인식하는것은로봇으로, 로봇의개념은이미 1920년대연극에서시작되었다. 로봇 (robot) 이란용어는체코슬로바키아의소설가차페크 (Karel Capek) 가 1921년발간한 R.U.R(Rossum s Universal Robots) 이라는희곡에서처음으로사용되었다. 로봇의어원이체코어의노동을의미하는단어 로보타 (robota) 인만큼, 로봇의역할은인간의노동을대신수행하는데서찾을수있다. 시스템또는소프트웨어로서의인공지능보다도더오랜역사를지닌하드웨어로서의로봇개념이인간에게는일상의끝단에서접하기때문일것이다. 또한, 초기인공지능의개념은 1956년미국다트머스학술회의에서존매카시가 기계를인간행동의지식에서와같이행동하게만드는것 이라고제안하면서유래되었다. 1950년앨런튜링은기계가인간과얼마나비슷하게대화할수있는지를기준으로기계에지능이있는지를판별하고자하는테스트로튜링테스트 (Turing test) 를제안했다. 2018년구글이개발자데이에서발표한듀플렉스인공지능은음성으로사람을완벽하게속였다는점에서튜링테스트를완벽하게통과했다고볼수있다. 최근인공지능은빅테이터의발달과정보처리 (CPU, 메모리, 저장매체등 ) 능력의향상, 딥러닝알고리즘향상및클라우드기반환경등의영향으로학습, 추론, 인지기술을발달시킬수있는기반이조성됨에따라더욱발전하고있다. II. AI 트렌드 1. AI 기술개발동향 딥러닝기반인공지능의핵심은학습과추론등을수행하는인간의뇌특성을뉴럴네트워크로모델화했으며, 기존의신경망과달리초고용량학습알고리즘의특징으로인해고성능을발휘한다. 딥러닝의한계점이나약점도분명많은것이사실이다. 학습수행과정의높은복잡도와학습데이터의오버피팅문제, 일부응용에만강점을보이는문제등이있어이를해결하기위한다양한연구와시도가이루어지고있다. 특히, 도출한최종결과의근거, 도출과정의타당성등을제공하지못하는블랙박스이슈가최근의가장큰해결과제로떠오르고있다. 이는인공지능시스템에대한사용자와사회의수용과신뢰에대한문제로강한인공지능이슈와함께우려와관심의대상이되고있다. 특히, 미국방성산하국방고등연구계획국 (DARPA) 에서는 2017년부터 X-AI(Explainable AI) 관련프로젝트 (X-AI 학습모델개발및테스트 ) 를추진하고있다. X-AI는사용자가인공지능시스템의동작과최종결과를이해하고올바르게해석하여결과물이 정보통신기술진흥센터 3
주간기술동향 2018. 9. 26. < 자료 > DARPA [ 그림 1] 설명가능한 AI 의개념 생성되는과정을설명가능하도록해주는기술을의미한다. 예를들어, 인공지능시스템이고양이이미지를분류할경우, 기존시스템은입력된이미지의고양이여부만을도출하지만, X-AI는고양이여부를도출하고, 인공지능판단의근거 ( 털, 수염등 ) 까지제공하는진보된개념의인공지능이라할수있다. 최근의인공지능은인간의지능을목표로하고있는것처럼보이지만, 사실인간에게필요한것은인간과같은지능이아닌인간에게필요한, 인간을편리하게해줄수있는지능일것이다. 즉, 인공지능이의도하던의도하지않던인간의지능을목표로하고있으나, 실제응용분야에서는꼭인간의지능을필요로하지않으며, 그지능또한우리가우려하는강한인공지능만은아닐지도모른다. 설명가능한 AI는최근우려되고있는강한인공지능및인공지능이인간을넘어서는시기에대한우려와는별개로인공지능의투명성과설명가능성을높여인간에게설득력있는데이터를제공하기위한근본적인접근방식이다. 특히, 암진단과같은인간의생명을다루는응용분야에서인공지능의블랙박스형태결과만으로판단한다는것은많은리스크와문제를수반하기때문에, 설명가능한 AI 기술은사람에게더욱절실하고중요한이슈일수있다. 4 www.iitp.kr
기획시리즈 인공지능 2. AI 와오픈소스 구글은물론대부분의글로벌 IT기업들과개발자들은인공지능연구개발에오픈소스를활용하고있는추세이다. 특히, 기업의경우플랫폼장악을위해오픈소스를통해시장영향력을확대하는방향으로가고있다. 구글의텐서플로우 (Tensorflow) 를비롯하여페이스북의토치 (Torch), 마이크로소프트의프로젝트 AIX, 삼성전자의베레스 (Veles), 테슬라가지원하고있는 Open AI 등이오픈소스프로젝트로공개되어다양한분야에서활용되며, AI 기술의발전에기여하고있다. 구글을비롯한 IT 대기업들이오픈소스정책을통해 AI 기술을공유하는데는이유가있다. 오픈소스자체가기술의공유를통해기술개발을촉진하고자함이고, AI 알고리즘의다양한분야응용에있어금융, 의료, 교육등의필드노하우와실제데이터가매우중요하기때문이다. 공유를통한플랫폼확장의의도는너무도당연하다. 이러한개방형혁신생태계를통해다양한분야에서인공지능기술을응용하는주체들이협력함으로써인공지능기술의확산과보급이가능하기때문일것이다. 이와같은인공지능오픈소스들은머신러닝이나딥러닝, 강화학습등의 AI 기본알고리즘을공유하여인공지능생태계가이를쉽게구현및응용할수있도록관련기능을모듈화하고 API 형태로라이브러리화함은물론직관적인유저인터페이스를제공함으로써인공지능의확산과발달에기여하고있다. 오픈소스 SW를활용할경우개발에필요한시간을단축할수있으며, 그에따른진입비용의경감과신뢰성확보등의장점이있는반면, 차별화와지식재산권확보가어려워지며, 제3자특허권으로인한특허침해소송가능성의리스크가발생할수있다. 2016년정보통신산업진흥원 (NIPA) 공개 SW 역량프라자에서수행한상용 SW 라이선스검증결과, 90% 이상의프로젝트가오픈소스를사용한것으로조사되었으나, 이중에약 42% 의 SW에서라이선스위반이확인된것으로조사되었다. GPL(Greneral Public License) 에따를경우 GPL 코드를사용하는특허권자가묵시적으로후속사용자에게특허라이선스를부여하는것으로해석될수있다는우려가있다. 이런라이선스의애매모호함때문에 GPL 라이선스나자유소프트웨어를사용하려고하는기관들은 GPL 사용조건을면밀하게검토해야만하며, 개발자는라이선스프로그램을선택하기전에해당라이선스조건이가지는비즈니스적의미와리스크에대한완벽한이해가필요하다. 1) 1) 삼성이나 LG 의경우도오픈소스라이선스에대한이해부족으로인한소송에휘말려경제적비용과이미지타격으로어려움을경험한사례가있으며, 이러한리스크는오픈소스라이선스타입과조건및기업의비즈니스전개방식등에따라라이선스타입을선택하고이해한후제품에적용해야만함 정보통신기술진흥센터 5
주간기술동향 2018. 9. 26. 구글은머신러닝프레임워크인 TensorFlow를 2015년 11월에오픈소스로공개하였다. 원래 TensorFlow는내부의인공지능연구조직용 AI SW 라이브러리였다. 뒤이어알파고를개발한구글딥마인드는 2016년 12월 5일내부용인공지능연구플랫폼딥마인드랩 (DeepMind Lab) 을공개하였다. 구글은물론 Facebook, Microsoft, OpenAI, IBM 등도이러한인공지능오픈소스에동참하고있으며, 각기장점이있는분야를중심으로널리쓰이고있는상황이다. 페이스북은머신러닝프레임워크 Torch 기반의인공지능모듈을오픈소스로공개하였다. 특히, 이미지패턴인식이나얼굴인식등에좋은결과를보이고있어구글의 TensorFlow와함께많이사용되고있다. 마이크로소프트의대표적인공지능오픈소스프로젝트인옥스퍼드는얼굴인식용 Face API, 음성인식용 Speech API, 이미지용 Vision API, 자연어처리용 LUIS 등으로이루어져있다. 이외에도 IBM의머신러닝플랫폼이오픈소스로공개되어넷플릭스의영화DB 추천기능등에사용되고있으며, 삼성은다수의 GPU 병렬컴퓨팅을지원하는인공지능플랫폼 Veles를 2015년 11월에공개하였다. III. X-AI 특허동향 1. 분석범위및방법 특허분석은의료영상및비의료분야를포함하는 X-AI 기반기술을대상으로하였으며, X-AI [ 표 1] X-AI 기반기술분류 중분류 Interpretable Interface Description - 의료영상인식 ( 분류 / 검출 / 분할 ) 을위한설명가능한인공신경망설계기반기술연구를중점으로 - Transparent Model, 설명가능성과연계되어변경가능한구조, 새로운 neural network 개념 - 병렬 / 평행형 (parallel), 통합 / 집적형 (integrated) - 인간의신경망을모방하는새로운관련기술등 - 의료영상인식 ( 분류 / 검출 / 분할 ) 을위한설명가능한인공신경망의 interpretable interface 기술 - 인공신경망의 neuron, layer, node 의성능과활동도 (activity) 를분석하거나모니터링하는기술등 시각화 (Visualization) < 자료 > 한국특허전략개발원, 2018. - 의료영상인식 ( 분류 / 검출 / 분할 ) 을위한설명가능한인공신경망의시각화 (visualization) 기술 - heatmap, attention model 등을이용한시각화 - pixel 기반시각화, layer/neuron/node 기반시각화기술등 6 www.iitp.kr
기획시리즈 인공지능 기술은아직기술적으로충분히성숙된단계가아니므로, X-AI 기술을구성할것으로예상되는기술요소들을포함하여 X-AI 기반기술을조사대상으로선정하였다. 검색 DB는 WISDOMAIN 특허 DB를사용하였으며, 1998년 1월 1일이후출원된한국 (KIPO), 미국 (USPTO), 일본 (JPO), 유럽 (EPO), 중국 (SIPO), 국제특허 (WIPO) 를대상으로조사하였다. 2. X-AI 기술의특허동향 설명가능한 AI 기술의기술분류별분포와국가별출원현황을살펴보면, X-AI를위한새로운에관한특허가 54% 를차지하고있으며, 미국특허가 38%, 중국특허가 22% 및국제출원이 21% 를차지하고있어, 미국과중국시장을중심으로새로운에대한연구개발결과가특허출원으로이어지고있음을확인할수있다. < 자료 > 한국특허전략개발원, 2018. [ 그림 2] 설명가능한 AI 기술의분야별및국가별특허동향설명가능한 AI 기술의연도별출원현황과국적별분포를살펴보면, 미국, 중국, 국제출원, 한국, 일본등주요국가에서모두 2012년이후특허출원이급증하는추세를보이고있으며, 2016년과 2017년의특허출원은일부미공개특허가존재하는점을감안하면더욱급격한증가세로추정된다. 특히, 54% 를차지하고있는새로운에대한출원증가세에서알수있듯이, 설명가능한 AI를포함한차세대인공지능기술에서의경쟁력확보를위한 key Player 들의연구개발투자가동분야를중심으로이루어지고있다. 2) 2) 각나라별로자국출원이중심을이루고있는것으로나타남 정보통신기술진흥센터 7
주간기술동향 2018. 9. 26. < 자료 > 한국특허전략개발원, 2018. [ 그림 3] 설명가능한 AI 기술의연도별및국적별특허동향 가장큰시장인미국의특허청에대한출원과국제출원에서는미국국적의출원인 (Google, MS, Facebook 등 ) 이다수의특허를출원하고있으며, 한국, 중국, 일본국적의출원인은자국중심의출원을진행하고있음을알수있다. 중국의경우특허출원과응용분야등에서두각을나타내고있으며, 특허출원에있어서는자국중심의양적인특허가대부분을차지하고있으나, 향후기술력과특허확보및시장장악등의전략적미래를고려했을때지속적인분석과대응이필요할것으로사료된다. 설명가능한 AI 기술의출원인별출원현황을살펴보면, Microsoft, Google, IBM, Facebook 등의미국국적기업들이두드러진특허출원활동을보이고있으며, Microsoft의경우와인터페이스및시각화기술모든분야에서압도적인출원건수를기록하고있어, 관련응용및원천기술에서의기업의투자를가늠해볼수있다. 특히, 차세대인공지능와관련된다양한아이디어및기술을특허로출원하고있어관련분야연구에서의세심한분석과참고가필요할것으로판단된다. 구글또한알파고와그들의오픈소스인공지능기술을뒷받침할수있는다양한네트워크관련원천기술들을출원및등록하고있으며, IBM은왓슨의특성상 8 www.iitp.kr
기획시리즈 인공지능 < 자료 > 한국특허전략개발원, 2018. [ 그림 4] 설명가능한 AI 기술의출원인별출원현황 의료관련 AI 기술이주를이루고있다. 바이두나베이징대학과같은중국출원인들또한새로운및인터프리터블한인터페이스나시각화관련된기술을개발하고특허로출원하고있으나, 그건수나기술의수준은미국보다는낮은수준이라고할수있다. 그러나한국및일본의특허출원현황과기술력평가 ( 인용도등 ) 등을고려해볼때미국과대적할수준의인공지능기술을개발하고있는국가는중국이유일하다고말할수있을것으로판단된다. 우리나라의경우 ETRI와삼성을제외하면차세대인공지능과관련된기술개발투자가많이이루 정보통신기술진흥센터 9
주간기술동향 2018. 9. 26. 어지지않고있는것으로판단되며, 이외에주요출원인중특이할만한회사로는트위터에인수된영국의 Magic Pony Technology로 CNN 및딥러닝영상처리와관련한핵심특허를다수확보하고있어관련 SW 및 HW 연구에세심한분석이필요할것으로사료된다. 설명가능한 AI 기술에대한미국특허를통해기술경쟁력을살펴보면, 다출원인중 Microsoft는평균피인용횟수가높아상대적으로기술수준이우수하고시장확보력도평균수준에있으며, 질적수준과양적측면에서모두강세를보이고있는기업으로파악되며독자적인원천기술을확보하고있는수준에있음을알수있다. Oracle은 X-AI 기반기술과의료용 AI 분야에걸쳐출원을하고있으며피인용횟수가높아독자적인기술경쟁력을갖춘것으로파악되나, 출원수가많지않은점을고려해야할것이다. Google, Facebook 및 IBM은평균피인용횟수가매우낮은데, 이는 Microsoft 등경쟁기업들과비교할때극히최근에출원이집중되고있는점을고려해야하며, 또한 X-AI 기반기술자체가매우초기단계임을고려하면, 보다세심한분석을필요로할것이다. SIEMENS는 X-AI 기반기술분야에서특허출원이많지않으며, 피인용횟수도높지않게분석되었으나, 의료분야에있어서는다양한아이디어와응용기술을확보하고있어의료관련인공지능응용기술의사업화단계에서반드시살펴보아야할기업으로사료된다. [ 표 2] 미국특허로본기술경쟁력 출원인 분석항목 국적 출원건수 특허건수 인용도 미국특허로본기술경쟁력 피인용 (CPP) 영향력 (PII) 기술력 (TS) 시장확보력 (PFS) 주력기술분야 MICROSOFT 미국 36 22 8.78 7.14 1.46 257 1.89 GOOGLE 미국 9 6 16.78 0.67 0.14 6 2.33 IBM 미국 15 10 4.93 0.93 0.19 14 1.13 FACEBOOK 미국 8 2 1.88 0.25 0.05 2 1.25 ORACLE 미국 2 1 9.50 36.50 7.47 73 1.00 SIEMENS 독일 4 2 6.00 0.75 0.15 3 1.75 PHILIPS 네덜란드 1 0 0.00 0.00 0.00 0 5.00 < 자료 > 한국특허전략개발원, 2018. Interpretable Interface 10 www.iitp.kr
기획시리즈 인공지능 IV. 인공지능기술의 IP-R&D 전략 구글과 IBM, MS, Facebook 등미국 IT 공룡들의오픈소스중심의인공지능플랫폼전략은오픈소스생태계의장점을적극활용하여다양한분야에서인공지능을적용하는데기여하며인공지능의기술개발에도기여하고있다. 그런가하면중국의인공지능투자는미국의기술과투자를넘어서려고하는시기에있으며, 로봇기업화낙과토요타등일본기업의인공지능개발과투자는경제부흥을준비하고있는일본의새로운성장동력이될것으로예상되고있다. IT 공룡들이원천과응용을모두고려한기술개발에나서고, 관련제품및서비스를출시하고있는가운데, 병렬컴퓨팅과비트코인등의영향으로뉴로모픽 HW의필요성이더욱대두되고있으며, IoT와빅데이터기반의서비스와인프라가가속화되고있어, 인공지능은일부의시스템과기기를벗어나모바일은물론 Anytime, Anything을 Intelligent하게만들어주는필수기술 (AI는이제 Anything Intelligence로표현해야하지않을까?) 로자리잡을것이다. 최근들어, 우리나라의 IT 경쟁력은대부분의지표에서바닥권으로떨어졌다. 그러는동안중국은인공지능을비롯한차세대원천 IT 기술에서미국과선두를다툴정도의기술력과시장경쟁력을바탕으로세계의공장에서세계의이노베이션센터로거듭나고있는상황에서과연우리는어떤전략으로지난공백을극복하고나아갈것인가? 다행히, 정부는지난 5월 14일인공지능 R&D 전략을수립해발표했다. 세계적인수준의 AI 기술력을확보하기위해향후 5년간 2조 2,000억원을투자하고인재 5,000명을양성한다는청사진을공표한것이다. 이와함께스타트업이나중소기업등이인공지능개발에활용할수있도록학습용데이터 1억 6,000만건을 2022년까지구축하여기업에제공할계획이라고한다. 늦었지만천만다행으로인공지능생태계전반과원천및응용, 기반데이터를구축하는이정표가될수있기를기대한다. 아울러, 이러한정부의로드맵과시장의전망을고려한원천기술의확보와이와함께다양한분야에적용가능한응용기술의개발과강력한 IP가뒷받침된특허포트폴리오의구축이필요한시점이다. 특히, 정부와출연연 ( 대학 ) 및기업이각자역할을충실히할필요가있다. 정부와관련기관은현재우수특허창출지원사업등의다양한지원프로그램을통해인공지능을포함한미래유망기술에대한특허청사진을구축하고, 원천기술에대한탐색과가능한영역을발굴하고핵심 IP에대한다양한아이디어와가능성을제시하고있다. 출연연과대학은지원프로그램또는 IP-R&D 프로세스를바탕으로확보가능한원천기술영역에서의확고한기술개발에전념하고, 이를뒷받침하는강력한 정보통신기술진흥센터 11
주간기술동향 2018. 9. 26. IP를확보할필요가있다. 이를통해, 독보적인기술영역을구축함과동시에응용분야의사업화및확장을고려한핵심응용 IP포트폴리오를구축하여기술의가치를제고하고기업의 IP 리스크를해소함으로써기술의사업화가능성을높이고이를통한인공지능의확산과인공지능관련산업의발전과기업및국가의생산성제고에도기여할수있을것이다. V. 결론및시사점 대한민국은인구나면적, 경제규모, 기술기반등에서결코작은나라가아니다. 특히, ICT, 반도체, 디스플레이, 스마트폰, 가전, 제품생산능력등에서세계상위권에자리하고있는기술강국이다. 물론, 대기업중심의다소척박한생태계가문제일수도있으나, 앞으로전개될 AI(Anything Intelligent) 시대가도래하면, 소규모의창의적인집단으로그중심은이동하게될것이며, 이에따라우리의창의적인혁신아이디어와결과물은더욱빛을발하게될것으로기대된다. 2015년을기준으로우리나라의공학박사배출규모는 3,332명으로, 결코적은인력이아니다. 정부지원을비롯한연구소의관련 R&D와기업의일자리, 관련생태계가받쳐준다면대부분의기술분야를개발하고원천기술을확보하는데에문제가없는규모다. 따라서 AI를기반으로한 4차산업혁명을준비하기위해서는원천기술개발지원은물론응용기술개발및사업화, 기업의 Open Source 리스크분석, IP-R&D 전략지원, 스타트업 IP컨설팅등의다양한지원과생태계활성화및자원, 인력의투입과전문인력의양성이제대로이루어질수있는토대를마련해나간다면 ICT와대한민국이다시한번날아오르는시기가보다빨리다가올것이라고확신한다. 인공지능이가져올 4차산업혁명의세상은우리의생활패턴과직업은물론미래의경제및사회구조를바꿀만큼파급효과가클것이다. 공장과생산시설이선진국으로유턴하고기술과공급의중심이다시선진국중심의폐쇄적방식으로돌아갈수도있으며, 4차산업혁명의기반기술인 AI 또한오픈소스중심이아닌블랙박스의방식으로바뀔수도있다. 결국 AI 기술의경쟁력이기업과국가의경쟁력이될수있을만큼중요하다고할수있다. 오픈소스와저작권, 제3자특허권 (Hidden patent) 문제를해결하기위해 IP관련기관과저작권및학계의다양한지원과연구가필요할것이며, 기업들의오픈소스리스크를해소해줄수있는지원프로그램과전문가의양성이절실하다. 12 www.iitp.kr
기획시리즈 인공지능 [ 참고문헌 ] [1] 금융보안원, 설명가능한인공지능소개, 2018. 3. 23. [2] KISTEP, 지능정보사회선도 AI 프로젝트, 2016년도예비타당성조사보고서, 2017. 1. [3] 남충현, 오픈소스 AI: 인공지능생태계와오픈이노베이션, KISDI, 2016. 12. 21. [4] 정재훈, 최근 IT산업발전과소프트웨어특허의필요성을중심으로, 계간창작과권리, 2004. [5] DeepMind Lab, https://deepmind.com/blog/open-sourcing-deepmind-lab/ [6] TensorFlow, https://www.tensorflow.org/ [7] OpenAI, https://openai.com/blog/ [8] Torch, http://torch.ch/ 정보통신기술진흥센터 13