특허정보를활용한인공지능기술분석 ( 인공지능기술특허분석을통한미래비즈니스연구 ) SMART TEAM 오호연 경기대학교산업경영공학과 ohyeon11@nate.com
I. INTRODUCTION 1
I. INTRODUCTION 인공지능산업의전망과우리나라상황 < 그림 1> 2016-2025 인공지능시장예측보고서 < 그림 2> 주요국가인공지능기술수준비교 Source : Tractica, 2016 Source : 정보통신기술진흥원, 2016 ü ü 인공지능시장은 2016년약 6만달러에서 2025년약 368억달러규모로확대될것으로전망하였다 ( 트랙티카, 2016). 이에비해국내의인공지능기술에대한연구개발실정은선진국에비해많이뒤처지고있으며, 국내인공지능시장의규모, 기술력, 관련전문기업이부족하다는평가받고있다 ( 현대경제연구원, 2016). 2
I. INTRODUCTION 연구목적 ü 본연구는전세계적으로화제가되는인공지능기술에대하여살펴보고자하며, 그중인공지능기술의연구개발이시급한국내의인공지능기술에대하여분석하고자한다. - 본연구는특허초록및본문의분석을기반으로인공지능기술분야를살펴보고연도별주요트 렌드를파악한다. - 국내의인공지능기술과적용분야를분석할수있으며, 미래의비즈니스기회요인은무엇인지 파악할수있다. 3
II. LITERATURE REVIEW 특허분석관련선행연구 ü 특허는기술의원천정보를바탕으로상업적가치를유형화시킬수있는수단 ü 특허분석은다양한정보를추론할수있는실용적도구 (Campbell, 1983; Lee et al., 2009) < 표 1> 특허정보를활용한기술연구방법 방법론 특허동시인용분석 (Patent Co-citation analysis) 특허동시분류분석 (Patent Coclassification analysis) 특허동시단어분석 (Patent Co-word analysis) 정의및방법 특정특허가이후출원된특허에서얼마나인용되고있는지를분석하는것이다 (Yoo et al., 2006). 인용과피인용정보를통해선행기술과후행기술의관계를알수있으며, 기술의확산경로를예측할수있다 (Nelson, 2009). 하나의특허가두개이상분류코드에분류되는특징을기반으로한분석방법이다. 하나의기술이두개이상의분류코드에분류된다는것은그자체로해당기술이다수의산업및기술영역에관련되어있다는것을의미한다 ( 김승겸, 2007). 서로다른기술분야에동시할당된특허들이많다면두기술분야는상호연관성이높으며기술간융합의가능성이높다고할수있다 (Leydesdroff, 1989). 특허문서에기재된키워드들의상호연관성을분석하는방법이다 (Kostoff et al., 1998). 특허문서에기재된제목, 초록등의텍스트의키워드를텍스트마이닝하여의미를도출하는방법을말한다. 구체적인기술키워드를도출하여분석을수행하는만큼융 복합성분석에있어논리적이며체계적인접근법이라고할수있으며, 지적구조를분석하는데사용할수있다 ( 한국보건산업진흥원, 2014; 강전학, 2016). 4
III. RESEARCH PROCESS : Research Process < 그림 3> 연구프로세스 Text-Mining 5
III. RESEARCH PROCESS : ü 한국의특허검색사이트인 KIPRIS 를이용하여출원후등록및공개된특허들을대상으로하였다. ü 본연구는선행연구 * 를토대로인공지능기술코드로가장많이분류된 IPC G06N 을기준으로데이터를수집하였다. * 배영임 and 신혜리 (2017) 의연구에서인공지능의기술분류별분포중에서 IPC G06N (Electrical engineering: Computer technology; 특정계산모델방식의컴퓨터시스템 ) 이 88.5% 로가장높게나타났다고밝혔다. Search result (IPC=[G06N]) < 그림 4> 연도별인공지능특허건수 2006 년부터 2016 년까지출원된총 605 개의문서를대상으로분석 6
III. RESEARCH PROCESS : 키워드의표준화및정규화 ü 605 개의특허문서의초록및본문에서추출된키워드에대해표준화및정규화과정을수행한다. ü 데이터표준화및정규화의전과정은 R(ver. 3.4.1) 을통해수행하였으며, 형태소분석은 KoNLP 패키지 (Jeon, 2013) 를활용하였다. < 표 2> 데이터전처리의표준화기준 < 그림 5> 추출된단어의빈도수 기준 예 단어수 1 특허문서상많이나오는단어제거상기, 본, 발명등 2 불용어 ( 관사, 조사, 접속사등 ) 제거단, 및, 의등 3 핵심키워드라고보기어려운단어 제거 추출된 3,871 개의명사중에서, 표준화및정규화작업을거쳐 765 개의의미있는키워드를추출하였다. 출력, 모듈, 현재등 4 동일어를하나의단어로통일 deeplearning= 딥러닝등 5 인공지능분야에서쓰이는단어추가 인공신경망,neuralnetwork 등 추출된단어의빈도수 7
III. RESEARCH PROCESS : 연관규칙분석과동시발생행렬분석의한계점및활용방안 < 표 3> 연관규칙분석과동시발생행렬분석비교 구분연관규칙분석동시발생행렬분석 기능 인공지능기술과관련한키워드의인과관계 및연관관계분석 인공지능기술과관련한키워드의빈도수및 상관관계분석 한계점 연관규칙분석만으로는키워드의빈도수로써 대변할수있는이슈들이빠질수있다. 동시발생행렬분석만으로는키워드들의 전 우항관계를파악하기힘들다. ü 두개의분석결과를통해키워드간전 우항관계, 빈도수와함께등장하는상호연관정도를명확 히파악하고자한다. ü 키워드간의빈도, 상관관계, 인과관계를시각화하여보여줄수있다. 8
IV. RESEARCH RESULTS ; 2006 년인공지능특허의기술분석 2006 년인공지능특허의기술분석 / 17 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 6> 2006 년인공지능특허분석결과 ü 인공지능의기초적인단어위주로나타났다. ü < 그림 6-(b)> 에서 게임 분야에인공지능이적용되어나타나고있었다. ü < 그림 6-(b)> 에서 취향 과 다양 이라는키워드를통해서추천알고리즘의기초적인모습으로볼수있다. 9
IV. RESEARCH RESULTS ; 2007 년인공지능특허의기술분석 2007 년인공지능특허의기술분석 / 11 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 7> 2007 년인공지능특허분석결과 ü < 그림 7> 에서는 음악, 추론, 순위 등의단어들이같이나타나고있다. ü 2007년은아직스마트폰이상용화되기전으로서, 음악포털사이트등에서음악추천서비스를선보였을것으로보인다. 10
IV. RESEARCH RESULTS ; 2008 년인공지능특허의기술분석 2008 년인공지능특허의기술분석 / 6 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 8> 2008 년인공지능특허분석결과 ü 2008년에집계된특허수는 6건으로, 분석의한계가존재한다. ü 2008년의분석결과에서 광고 라는단어를볼수있으며, < 그림 8-(a)> 를통해 순위 라는단어와연결이되어있음을알수있다. 이는추천알고리즘이광고에적용된것으로볼수있다. 11
IV. RESEARCH RESULTS ; 2009 년인공지능특허의기술분석 2009 년인공지능특허의기술분석 / 20 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 9> 2009 년인공지능특허분석결과 ü < 그림 9-(a)> 에서추천알고리즘을통해 구매 를유도했다고볼수있다. ü < 그림 9-(b)> 에서는오른쪽아래에 언어, 구현 이라는단어가출현하였는데, 이는인공지능기술로언어를인지하고구현하는기술이나타났다고볼수있다. 12
IV. RESEARCH RESULTS ; 2010 년인공지능특허의기술분석 2010 년인공지능특허의기술분석 / 19 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 10> 2010 년인공지능특허분석결과 ü ü < 그림 10-(a)> 에서 센서 에의해 관절 이라는키워드가나타났으며, 의료분야에인공지능기술이적용되었음을알수있다. < 그림 10-(b)> 에서는 센서 및 신호 라는키워드가이전에비해다른키워드와많이출현하였으며메인그룹에나타남을알수있다. 13
IV. RESEARCH RESULTS ; 2011 년인공지능특허의기술분석 2011 년인공지능특허의기술분석 / 69 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 11> 2011 년인공지능특허분석결과 ü < 그림 11> 의키워드의상호관계를통해인공지능알고리즘을활용한산업분야의최적화된시스템연구가이루어졌을것으로예상할수있다. 14
IV. RESEARCH RESULTS ; 2012 년인공지능특허의기술분석 2012 년인공지능특허의기술분석 / 27 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 12> 2012 년인공지능특허분석결과 ü ü < 그림 12-(a)> 에서 질병, 측정, 분류 라는키워드를통해 2010년에이어의료분야에도적용되는모습을보여주고있다. 연결관계를살펴보면질병의정보를알려주고이를측정하는형태로볼수있다. < 그림 12-(b)> 에서는 패턴 이라는키워드가 설정, 침입 등의키워드와함께나타난것으로보아방범시스템에적용되었을것으로예상해볼수있다. 15
IV. RESEARCH RESULTS ; 2013 년인공지능특허의기술분석 2013 년인공지능특허의기술분석 / 37 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 13> 2013 년인공지능특허분석결과 ü ü < 그림 13-(a)> 에서 품질, 공정, 추정 등의단어를통해 4차산업혁명과관련하여인공지능분야가적용되었을것으로판단된다. < 그림 13> 에서 텍스트, 변환, 복잡 등의키워드를통해인공지능을통해인간과소통하는시스템에적용되고있다고볼수있다. 16
IV. RESEARCH RESULTS ; 2014 년인공지능특허의기술분석 2014 년인공지능특허의기술분석 / 53 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 14> 2014 년인공지능특허분석결과 ü 2014 년에도 언어 관련키워드들이뭉쳐서등장하였다. ü 언어, 훈련, 구축, 모델, 분석 등을통해인공지능로봇, 인공지능컴퓨터등의언어처리능력을뜻하는것으로볼수있다. 17
IV. RESEARCH RESULTS ; 2015 년인공지능특허의기술분석 2015 년인공지능특허의기술분석 / 138 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 15> 2015 년인공지능특허분석결과 ü < 그림 15-(a)> 에서는두개의의료분야그룹이분석되었다. ü 하나는 질병, 정보, 신호 로서헬스케어분야의그룹과 건강, 패턴, 검사 으으로, 인공지능으로의학정보를학습시키는모델을생각해볼수있다. ü 통신 키워드의등장은사물인터넷 (IoT, Internet of Things) 을나타내는그룹으로볼수있다. 18
IV. RESEARCH RESULTS ; 2016 년인공지능특허의기술분석 2016 년인공지능특허의기술분석 / 208 건 ( 특허건수 ) : 주요트랜드 : 신규트랜드 < 그림 16> 2016 년인공지능특허분석결과 ü 2016년에는새롭게등장하는키워드는 오디오, 검출 이있다. ü 이는많은기업들이개발중인인공지능스피커와관련한기술로볼수있다. ü < 그림 16-(b)> 에서 통신 그룹이전년도보다중심에위치한것으로보아 IoT 시스템의활성화를알수있다. 19
V. CONCLUSIONS & IMPLICATIONS 연구결과및시사점 연도 분석결과 시사점 2006 게임 / 추천알고리즘 2007 추천알고리즘 2008 광고산업추천알고리즘 2009 구매유도추천알고리즘 / 언어처리 2010 광고산업추천알고리즘 / 의학분야 / 센서측정및신호처리 2011 산업분야의시스템최적화 2012 의학분야 / 방범시스템적용 2013 센서를활용한품질공정측정 (4차산업혁명 ) / 언어처리 2014 언어처리 / 정보추론 2015 헬스케어 / 의학분야 / 사물인터넷 2016 사물인터넷 / 음성시스템 / 의학분야 v 특허의시계열분석을통해국내의인공지능기술의적용흐름을한눈에파악할수있음 v 2006 년부터 2009 년까지인공지능기술의활용범위가인터넷이나웹에서만적용됨 v 이후다양한산업 ( 의학 / 보안 / 언어 ) 에인공지능기술이적용되어나타남 1. 국내의인공지능기술은추천알고리즘 / 의학및헬스케어분야 / 언어처리 / 가전제품의인공지능기술적용 ( 예. 인공지능스피커 ) 로분석되었다. 2. 특허정보분석을통해인공지능기술기반의고도화된고객맞춤형서비스제공으로더많은비즈니스기회를도출할수있음을분석하였다. 20
V. RESEARCH LIMITATIONS 연구한계점 1. 분석결과로서키워드의빈도수와전 우항연결관계를통해서만해석하였기때문에해석의타당성부족및주관적인측면이있다. 2. 데이터수집단계에서대상이한국의특허에만한정되어있으며, 특허의등록기간등에의해최근데이터가모두반영되지못하였다. 3. 인공지능기술에대한특허를수집할때, 단일 IPC 코드만고려하였기때문에다양한인공지능기술이포함되지못하였다. 21
THANK YOU
Reference 1) Agrawal, R., & Srikant, R., Fast algorithms for mining association rules, In Proc. 20th int. conf. very large data bases, VLDB, 1215, pp.487-499, 1994. 2) Campbell R. S., Patent trends as a technological forecasting tool, World Patent Information, 5(3), pp.137-143, 1983. 3) Grupp, H, Spillover effects and the science base of innovations reconsidered: an empirical approach, Journal of Evolutionary Economics, 6(2), pp.175-197, 1996. 4) Karki, M. M. S., Patent citation analysis: A policy analysis tool, World Patent Information, 19(4), pp.269-272, 1997. 5) KERI, 인공지능기술의특허경쟁력과기술-산업연관성분석, 2017. 6) Kostoff, R. N., Eberhart, H. J., & Toothman, D. R., Database tomography for technical intelligence: A roadmap of the near-earth space science and technology literature, Information Processing & Management, 34(1), pp.69-85, 1998. 7) Lai, K. K., & Wu, S. J., Using the patent co-citation approach to establish a new patent classification system, Information processing & management, 41(2), pp.313-330, 2005. 8) Lantz, B., Machine learning with R, Packt Publishing Ltd, 2013. 9) Lee, S., Yoon, B., & Park Y., An approach to discovering technology opportunities: Keyword-based patent map approach, Technovation, 29(6), pp.481-497, 2009. 10) Leydesdroff, L., Words and co-words as indicators of intellectual organization, Research policy, 18(4), pp.209-223, 1989. 11) Nelson, A. J., Measuring knowledge spillovers: What patents, licenses and publications reveal about innovation diffusion, Research Policy, 38(6), pp.994-1005, 2009. 12) Todorov, R., Representing a scientific field: A bibliometric approach, Scientometrics, 15(5-6), pp.593-605, 1989. 13) Tseng, Y. H., Lin, C. J., & Lin, Y. I., Text mining techniques for patent analysis, Information Processing & Management, 43(5), pp.1216-1247, 2007. 14) Wartburg I. V., Teichert T., & Rost, K., Inventive progress measured by multi-stage patent citation analysis, Research Policy, 34(10), pp.1591-1607, 2005. 15) Watts, D. J., & Strogatz, S. H., Collective dynamics of'small-world'networks, nature, 393(6684), 1998. 16) Yoo, S. H., Lee, Y. H., & Won, D. K., A study on estimation of technology life span using analysis of patent citation, Journal of the Korean Operations Research and Management Science Society, 31(4), pp.1-11, 2006. 17) Yoon, B. and Park, Y., Development of new technology forecasting algorithm: hybrid approach for morphology analysis and conjoint analysis of patent information, IEEE Transactions on Engineering Management, 54(3), pp.588-599, 2007. 18) Zha, X. & Chen, M., Study on early warming of competitive technical intelligence based on thepatent map, Journal of Computer, 5(2), 2010. 19) 강전학, 특허토픽모델링과동시인용분석을활용한클라우드컴퓨팅유망기술도출, 서울과학기술대학교석사학위논문, 2016. 20) 김승겸, TOPSIS를활용한기술간연결관계및중요기술파악방법 : 특허의동시인용과동시분류분석의비교, 서울대학교석사학위논문, 2007. 21) 미래창조과학부, 창조경제실현을위한 K-ICT전략, 2015. 22) 박영진, 고남욱, & 윤장혁. 보유특허기반의기술기회탐색을위한특허추천방법, pp.169-200, 2015. 23) 윤병운, 백재호, & 박용태, 데이터마이닝을이용한특허인용분석, 한국경영과학회학술대회논문집, pp.583-586, 2001. 24) 이자람, 특허정보를활용한융합기술분류체계및특성에관한연구, 한양대학교석사학위논문, 2015. 25) 조용래, & 김의석, 특허네트워크와전략지표분석을통한기업기술융합전략연구, 지식재산연구, 9(4), pp.191-221, 2014. 26) 조일구, 인공지능 (AI) 기술분야주요특허동향, 정보통신산업진흥원, 2016. 27) 최정섭, 통계적분석방법을이용한주제어기반특허동향분석, 지식재산연구, 8(1), pp.223-252, 2013. 28) 최진호, 김희수, 임남규, 기술예측을위한특허키워드네트워크분석, 지능정보연구, 17(4), pp.227-240, 2011. 29) 한국보건산업진흥원, 국내특허정보를활용한보건산업융복합동향분석, 2014. 30) 한국전자통신연구원, 인공지능기술과산업의가능성, 2015. 23 31) 현대경제연구원, AI시대, 한국의현주소는?-국내 AI( 인공지능 ) 산업기반점검, 2016.