오픈소스 AI : 인공지능생태계와오픈이노베이션 남충현 정보통신정책연구원부연구위원 요약문 1. 서론 2. AI 플랫폼의개념 3. 인공지능플랫폼오픈소스화현황 4. AI 개방형혁신생태계구축을위한과제 [ 참고문헌 ]

Similar documents
Ch 1 머신러닝 개요.pptx

제1강 인공지능 개념과 역사

[NO_11] 의과대학 소식지_OK(P)

ICT À¶ÇÕÃÖÁ¾

보안연구부 인공지능 (AI) 개요및기술동향 - 딥러닝 (Deep Learning) 기술의발달을중심으로 - ( 보안연구부보안기술연구팀 / ) 개요 기술연구및투자의장기간침체가있었던인공지능 (AI) 은최근딥러닝기반기술의발달및기존기술과의결합

빅데이터_DAY key

<B1E2C8B9BDC3B8AEC1EE2DC0B1C5C2BDC22DBCF6C1A42E687770>

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

2007

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

Data Industry White Paper

PowerPoint 프레젠테이션

00Àâ¹°

00Àâ¹°

<4D F736F F D20302EC0CEC6AEB7CE2BC1BEB8F1B8AEBDBAC6AE2BBCBAB0FA BCBAB0FABEF7B5A5C0CCC6AEBFCFB7E1292E646F6378>

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

PowerPoint 프레젠테이션

W7_Business_ 제품설계

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

006_026_특집_정일권.indd


[한반도]한국의 ICT 현주소(송부)

?

선진사례집(0529)

강창훈

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

Microsoft PowerPoint _Monthly InsighT 19년 1월.pptx

제4차 산업혁명과 인공지능 차 례 제4차 산업혁명과 인공지능 2 제46회 다보스포럼이 2016년 1월 21일~24일 4차 산업혁명의 이해 라는 주제로 개최 되었습니다. 4차 산업혁명은 인공지능에 의해 자동화와 연결성이 극대화되는 단계 로서 오늘날 우리 곁에 모습을 드러

PowerPoint 프레젠테이션

목 차 주요내용요약 1 1. IBM 왓슨 (Watson) 2 2. IBM 왓슨의특징 3 3. IBM 왓슨의사업화 8 4. IBM 기술개발 구글알파고 (AlphaGo) 구글 AI 활용 구글의 AI 기술확보방법 구글의 AI 생태계

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

4 차산업혁명과지식서비스 l 저자 l 한형상 / 한국산업기술평가관리원지식서비스 PD 김 현 / 한국전자통신연구원 IoT 연구본부장 SUMMARY 4차산업혁명의성격은초연결 초융합 초지능의세키워드로요약된다. 초연결은사람, 사물등객체간의상호연결성이확장됨을말하며이는곧실시간데이

Art & Technology #5: 3D 프린팅 - Art World | 현대자동차

< C0DAC0B2C5BDB1B820BFEEBFB520B8DEB4BABEF32D33C2F720C6EDC1FD2E687770>

SW 기초교양교육이수가이드라인 경희대학교 SW 중심대학사업단 4 차산업혁명에대비하기위해대한민국정부는초 / 중 / 고교에 SW 교육을의무화하고, 보다더빠른준비를위해대학 생전체에 SW 기초교양교육을권장하고있습니다. 특히, 과학기술정보통신부는 'SW 중심대학 ' 사업을통해

PowerPoint 프레젠테이션

Europe 2020 Strategy 글로벌산업기술생태계의융합과발전을선도하는일류산업진흥기관 EU 기술협력거점 *EU Issue Paper EU : KIAT EU ( ,

PowerPoint 프레젠테이션

5월전체 :7 PM 페이지14 NO.3 Acrobat PDFWriter 제 40회 발명의날 기념식 격려사 존경하는 발명인 여러분! 연구개발의 효율성을 높이고 중복투자도 방지할 것입니다. 우리는 지금 거센 도전에 직면해 있습니다. 뿐만 아니라 전국 26


PowerPoint 프레젠테이션

<C0CCBCF8BFE42DB1B3C1A4BFCFB7E12DB1E8B9CCBCB12DC0DBBCBAC0DAB0CBC1F5BFCFB7E12DB8D3B8AEB8BBB3BBBACEC0DAB0CBC1F52E687770>

슬라이드 1

PowerPoint 프레젠테이션

[Summary] 딥러닝이란인간뇌의학습처리과정을모방한머신러닝방법의한종류로, 사람의사고방식을컴퓨터에게가르치는것을의미 1980년대등장한인공신경망 (ANN, artificial neural networks) 에기반하여설계된개념으로, IT기술의발전과함께단점으로여겨지던과적합문제

**09콘텐츠산업백서_1 2

Introduction to Deep learning

<B3EDB9AEC0DBBCBAB9FD2E687770>

슬라이드 1

(01~64)550지학-정답(1~5단원)


Q172DS

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

<B1E2C8B9BDC3B8AEC1EE2DB9DABFDCC1F82E687770>

Microsoft Word - ICT Zoom

슬라이드 1

PowerPoint 프레젠테이션

OM2M 기반의 OHP-M2M 오픈소스설치가이드 2015 년 8 월 경북대학교통신프로토콜연구실 최예찬, 강형우 요약 사물인터넷 (Internet of Things: IoT) 이이슈가되면서다양한사

歯_ _ 2001년도 회원사명단.doc

Microsoft PowerPoint - 30.ppt [호환 모드]

행정학석사학위논문 공공기관기관장의전문성이 조직의성과에미치는영향 년 월 서울대학교행정대학원 행정학과행정학전공 유진아

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

2009방송통신산업동향.hwp

[Brochure] KOR_TunA

2

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

Windows 10 General Announcement v1.0-KO

PowerPoint Presentation

H3250_Wi-Fi_E.book

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<C7C1B8AEB9CCBEF6B8AEC6F7C6AE D3032C8A3202DBECBC6C4B0ED2DC3D6C1BEC0CEBCE2BFEBC6C4C0CF402E687770>

기술개요 NVIDIA GPU CLOUD 딥러닝프레임워크 NVIDIA GPU Cloud 의최적화된프레임워크컨테이너가이드

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

04 Çмú_±â¼ú±â»ç

슬라이드 1


Layout 1

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DBDC5C0E7BFEB>

서현수

KAKAO AI REPORT Vol.01

PowerPoint 프레젠테이션

170918_hjk_datayanolja_v1.0.1.

협업 필터링이란 대규모의 기존 사용자 행동 정보를 분석하여 해당 사용자와 비슷한 성향의 사용자들이 기존에 좋아했던 항목을 추천하는 기술이다. 가장 일반적인 예는 온라인 쇼핑 사이 트에서 흔히 볼 수 있는 이 상품을 구매한 사용자가 구매한 상품들 서비스이다. 예를 들어

Motor Control Solution

용자들_MKT_Proposal_201504_V6.pptx

< 목차 > Ⅰ. 개요 3 Ⅱ. 실시간스팸차단리스트 (RBL) ( 간편설정 ) 4 1. 메일서버 (Exchange Server 2007) 설정변경 4 2. 스팸차단테스트 10

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

52 l /08

IT.,...,, IoT( ),,.,. 99%,,, IoT 90%. 95%..., (PIPA). 디지털트랜스포메이션은데이터보안에대한새로운접근방식필요 멀티클라우드사용으로인해추가적인리스크발생 높은수준의도입률로복잡성가중 95% 는민감데이터에디지털트랜스포메이션기술을사용하고있음

歯155호

歯156호

歯150호

歯148호

歯154호


문학석사학위논문 존밀링턴싱과이효석의 세계주의비교 로컬 을중심으로 년 월 서울대학교대학원 협동과정비교문학 이유경

holiday webinar 2013 _ Korean webinar order.pptx

Slide 1

Transcription:

ISSN 2233-6583 16-10 오픈소스 AI : 인공지능생태계와 오픈이노베이션 남충현정보통신정책연구원부연구위원

16-10 2016. 12. 21 오픈소스 AI : 인공지능생태계와오픈이노베이션 남충현 정보통신정책연구원부연구위원 요약문 1. 서론 2. AI 플랫폼의개념 3. 인공지능플랫폼오픈소스화현황 4. AI 개방형혁신생태계구축을위한과제 [ 참고문헌 ] 4 7 10 17 22

오픈소스 AI : 인공지능생태계와오픈이노베이션 남충현 정보통신정책연구원부연구위원 *namch@kisdi.re.kr, 043-531-4180 * 연세대학교경제학과학사, 석사 *University of Warwick 경제학박사 오픈소스 AI : 인공지능생태계와 오픈이노베이션 요약문 최근알파고로유명한구글딥마인드에서인공지능기술테스트플랫폼인딥마인드랩 (DeepMind Lab) 을외부에무료공개하기로결정하였다. 이는지난해구글의인공지능플랫폼텐서플로우 (Tensor Flow) 공개등일련의인공지능기술오픈소스화흐름의연속선상에있다. 이러한인공지능알고리즘을구현한플랫폼의개발에는대규모자본이투입되어야하며고도의기술력이집약되어있는것인데왜무료로외부에공개를하는것일까? 그이유는첫째로, 딥러닝등인공지능의핵심알고리즘은이미어느정도정립이되어있어서알고리즘보다는이알고리즘이적용되는기반데이터가더욱중요해졌다는점이있다. 둘째로는, 인공지능기술은전통적인 ICT 산업부문을넘어전통산업을포괄하는매우광범위한영역으로응용이되며, 또응용대상영역에서얻어지는데이터및사용자피드백등케이스의존적인성격이강하기때문이다. 예를들어머신러닝의기본알고리즘은금융, 의료, 교육등모든분야에응용가능하지만개별적인응용대상분야자체에대한노하우가없으면그러한알고리즘이실제로구현될수가없는것이다. 따라서구글과같은거대글로벌선도기업도혼자만의힘으로는인공지능기술의보급확산을달성할수없으며,

오픈소스 AI : 인공지능생태계와오픈이노베이션 개방형혁신생태계를통하여다양한분야에서인공지능기술을응용하는주체들이모두협력하여야인공지능기술의확산및보급이가능하다. 따라서국내에서도이러한인공지능알고리즘의표준화및오픈소스라이브러리화작업이필요하며, 인공지능기술의개발에필수적인테스트및트레이닝용데이터셋의확보가요구된다. 그러나데이터의확보에는많은비용이소요되어, 규모가작은스타트업의입장에서이러한데이터의확보는쉽지않은일이다. 정부및공공부문의역할은이러한인공지능기술생태계에서훈련용데이터셋과오픈소스라이브러리, 기술평가기준정립과같은공공재의공급을촉진하는것에있다. 특히정부가축적한방대한양의데이터를민간스타트업생태계와공유하는것이필요하며, 이과정에서직면하게되는빅데이터의상업적응용과정에서의보안문제나데이터완결성문제, 사생활침해로인한윤리적문제등에대해서가이드라인을제시해야할필요가있다. 또한, 인공지능기술의초기수요를견인하여시장을창출해내기위하여정부의공공 IT 시스템에자연어처리등인공지능기술과인터페이스를적극적으로도입하는등의정책을제안할수있다.

오픈소스 AI : 인공지능생태계와오픈이노베이션 1. 서론 AI 기술오픈소스화트랜드 l 구글등글로벌선도 ICT 기업들은 AI 기술관련소스코드및 API, 트레이닝및테스트베드환경등개발플랫폼을전세계에무료로공개하고있음 - 구글뿐아니라 Facebook, Microsoft, OpenAI, IBM 등도이러한인공지능플랫폼오픈소스화대열에동참함 -기존에오픈소스에부정적이었던것으로알려진 Microsoft 도 OpenAI 와협력관계를체결 -이러한인공지능개발플랫폼들은딥러닝이나강화학습등의인공지능기본알고리즘들을누구나쉽게구현할수있도록모듈화ㆍ라이브러리화하고, 직관적인인터페이스를제공한다는점이공통점 각기업들의인공지능연구성과를집약한것으로기존에사내연구개발용으로쓰여왔던것들임 l 이들글로벌 ICT 선도기업들은많은투자를통해개발한인공지능플랫폼을무료로공개하면서자사주도의인공지능혁신생태계를조성하려고하고있음 - 딥러닝과강화학습등인공지능의기반기술의알고리즘은이미보편화되어있으며, 이런공통적인인공지능알고리즘을모듈화하면다양한인공지능관련개발작업의진입장벽을크게낮출수있음 4

1. 서론 - 인공지능구현모듈들을직접개발하는것은많은투자가필요하여 스타트업이수행하기에벅차지만이렇게이미개발된인공지능개발 툴이공개되면규모가작은스타트업도손쉽게참여가가능함 AI 기술공개와오픈이노베이션 l 인공지능기술은기존의전통적 ICT 산업의테두리를넘어전산업및사회의모든영역에걸쳐응용가능하기때문에고도의융합적속성을지님 - 기술융합의트렌드에대응하기위하여기업은자신의고유영역이외의새로운전문지식을습득해야하며이는혁신을위하여기업이외부의지식을적극적으로받아들여야함을의미함 1) - 구글과같은글로벌 ICT 선도기업조차도인공지능기술의광대한영역을사내의혁신역량만으로대응하기는역부족이며, 이에따라개방형 AI 혁신생태계의필요성이크게부각됨 딥러닝의경우 context 의존적이며매우다양한사례별로별개로접근하는식으로, 데이터에맞추어소프트웨어가개발되는실정 l ICT 선도기업들이공개한인공지능개발툴을중심으로, 이를실제로응용하는다양한스타트업들및관련연구주체들을포괄하는인공지능기술혁신분업구조가형성 - 기본적으로핵심알고리즘을개발하는것은스타트업보다는구글등선도기업의역할 - 구글이인공지능스타트업 DeepMind 를인수한사례에서볼수있듯 1) Curran et al(2011) 참조 5

오픈소스 AI : 인공지능생태계와오픈이노베이션 원천기술보유스타트업을인수하여기술을흡수함으로써선도기업들의인공지능원천기술도업그레이드되어온것임 l 반면, AI 기술플랫폼의공개에도불구하고기업보유데이터셋의공개는상대적으로부진함 - 인공지능기술은알고리즘만으로는작동하지않으며, 대량의훈련용데이터를사용하여학습을시켜야만작동함 -학습과정뿐만아니라인공지능구현소프트웨어의테스트를위해서도역시대량의데이터셋을필요로함 - 딥러닝과강화학습등의인공지능기술의기본원리는이미보편화되었기때문에진짜기업의핵심경쟁력은알고리즘보다는보유데이터에서나오게되었음 l 정부는이러한스타트업생태계를조율하고공공재를공급하는역할을수행해야함 - 미국 National Science and Technology Council (2016) 는훈련용데이터셋의공개, 공공기관의데이터셋공개및오픈소스툴킷개발등에서정부의역할을명시 - 공공전산시스템의인공지능도입, 자연어인식기반인터페이스를공공기관사이트에도입 -공공데이터셋을공개하면서데이터공개와투명성, 안정성등에대해정부가주도하여표준을설정 - 예를들어지난미국대선에서페이스북가짜뉴스논란은데이터신뢰성및공공성에대해환기시키는계기가되었음 6

2. AI 플랫폼의개념 2. AI 플랫폼의개념 AI 플랫폼의필요성 l 인공지능기술의양대축은알고리즘과데이터이며, 이중알고리즘의경우다양한문제해결에공통적으로적용될수있는범용툴을개발하여구현하는것이효율적 -현재인공지능기술의주류는딥러닝과강화학습등의머신러닝기술로, 이는매우대량의데이터로부터통계적인최적화연산을수행하여문제에대한솔루션을찾아내는방식임 예를들어, 기존의영한번역문에대한방대한데이터에서 Apple 이란단어와사과라는단어가높은빈도로함께출몰한다면 Apple 은한국어로곧사과를뜻한다는답을찾아낼수있음 -딥러닝등의인공지능기술은해당주제에대한데이터로부터통계적인최적화연산의무수한다단계반복을통하여답을찾아내는과정이며, 이러한연산을최대한효율적으로수행하는것이관건 딥러닝이요구하는반복최적화연산에적합한 GPU ( 그래픽연산용프로세서 ) 등의하드웨어뿐아니라최적화연산알고리즘의성능도중요함 - 인공지능기술의적용분야가다르더라도거기적용되는최적화알고리즘들은높은수준의공통성이있으므로이를모듈화하여다양한케이스에반복적사용이가능함 l AI 플랫폼은알고리즘, 알고리즘을소프트웨어적으로구현하여모듈화한 라이브러리및그러한라이브러리의구성모듈들을불러내어도구로 사용할수있게하는인터페이스등으로구성됨 7

오픈소스 AI : 인공지능생태계와오픈이노베이션 - 머신러닝의복잡한수학적ㆍ통계학적알고리즘을소프트웨어모듈로 구현하면, 개발자들은그자세한내부로직을알지못하고도해당 모듈들을도구로사용하여기술구현이가능함 이는계산기의곱셈버튼을누르면구구단을몰라도곱셈연산을수행할수있는것에비유할수있음 - 머신러닝구현알고리즘모듈들의집합인라이브러리를효율적으로개발자가활용하기위하여인터페이스가존재함 이는 C, R, Python 등의프로그래밍언어와시각적인그래픽인터페이스를모두 포괄함 AI 플랫폼과도메인지식 l AI 플랫폼은다양한영역의문제를해결하기위한도구에불과하며, 실제구현을위해선해당영역자체에대한지식을뜻하는도메인지식 (Domain Knowledge) 이결합되어야함 - 하나의 AI 플랫폼및이플랫폼이구현하는 AI 알고리즘은음성인식, 사진인식, 자율주행차, 자동번역, 금융및의료데이터분석등다양한영역에응용가능 - 그러나, 언어, 교통, 의료, 금융등 AI 가적용되는해당영역에대한 지식 (Domain Knowledge) 이선행되지않으면실제로 AI 기술을구현하는 것은불가능 - 이러한도메인지식은고도의다양성을가지기때문에경쟁력있는 AI 플랫폼을만들어낸기업이도메인지식에서도동시에우위에있을 수있다는보장이없음 8

2. AI 플랫폼의개념 l 현재인공지능의주류를이루는딥러닝등의머신러닝기술은데이터및컨텍스트에의존적이기때문에도메인지식의중요성이더욱큼 - 현재의기계학습은특정한상황에국한하여비슷한상황에대한데이터를반복학습시키는식으로구현되기때문에, 다른영역의 task를수행하기위해서는새로운학습이별도로필요함 - 더욱이, 머신러닝은단순히해당영역의데이터를수집하여입력하는것만으로되는것이아니라지도학습 (supervised learning) 등인간에의한해석과판단이추가되어야만학습이이뤄지는경우가많음 9

오픈소스 AI : 인공지능생태계와오픈이노베이션 3. 인공지능플랫폼오픈소스화현황 구글 l 알파고를개발한구글딥마인드는 2016 년 12월 5일내부에서사용하던플래그쉽인공지능연구플랫폼인딥마인드랩 (DeepMind Lab) 을공개함 - 딥마인드랩은 3D 게임을통해인공지능기술을테스트할수있는구글딥마인드의내부연구플랫폼임 - 일인칭시점에서게임속캐릭터가과일줍기나언덕오르기등의다양한동작을수행할수있도록학습시키면서새로운인공지능알고리즘을테스트할수있다 -해당플랫폼을무료로개방하여누구나인공지능기술을테스트하기위하여활용할수있게하였음 자료 : DeepMind 10

3. 인공지능플랫폼오픈소스화현황 l 구글은이미머신러닝프레임워크인 TensorFlow 를 2015 년 11월오픈소스로공개하였음 - TensorFlow 는원래구글의인공지능연구조직내에서머신러닝과신경망연구를위해개발된소프트웨어라이브러리임 TensorFlow 는 1세대머신러닝플랫폼 DistBelief 의뒤를잇는제 2세대플랫폼으로, 보다유연하며확장성이향상됨 - TensorFlow 를구성하는라이브러리는특정하드웨어에의존적이지않으므로개발자는기반하드웨어에상관없이사용이가능함 스마트폰으로부터대형분산시스템에이르기까지수많은종류의기기에적용 가능함 자료 : 구글 TensorFlow 11

오픈소스 AI : 인공지능생태계와오픈이노베이션 - TensorFlow 의특징은머신러닝의기본이되는연산을수행하면서그 과정과결과를플로우차트와그래프를사용하여직관적인방식으로 디스플레이한다는것임. 가장직관적인프로그래밍언어의하나로불리는 Python 인터페이스를지원하는등개발자에게보다직관적인개발환경을제공하는것을추구 - 지메일의스팸필터링및구글포토서비스의이미지자동분류등이미다양한구글서비스에 TensorFlow 를통해개발된머신러닝기술이들어가있음 페이스북 l 페이스북의인공지능개발조직인 FAIR(Facebook Artificial Intelligence Research) 는머신러닝프레임워크인 Torch 기반으로제작된인공지능 모듈들을오픈소스로공개함 - Torch 는페이스북뿐아니라구글, MS 등많은기업에서사용하는 공개인공지능개발플랫폼이며, 페이스북에서사진패턴인식, 맞춤형 광고를위한패턴분석등에활용됨 - FAIR 에서 Torch 를기반으로최적화한딥러닝모듈들을공개하기로 페이스북은발표하였음 - 페이스북은딥러닝소프트웨어모듈뿐만아니라, 이미지패턴인식등 딥러닝연산에최적화된하드웨어의설계까지도함께공개하였음 페이스북이공개한딥러닝용서버 Big Sur 는페이스북이이미이미지인식, 뉴스피드관리, 자동번역등에사용중이며머신러닝관련대량반복연산에특히적합한 GPU( 알파고에사용 ) 를다수연결하여활용하는구조임 12

3. 인공지능플랫폼오픈소스화현황 마이크로소프트 l MS는프로젝트옥스퍼드를오픈소스로공개함 - 마이크로소프트의프로젝트옥스퍼드 (Project Oxford) 는얼굴을인식하는 Face API, 음성인식을수행하는 Speech API, 이미지를인식하는 Vision API, 자연어인식기능을수행하는 LUIS 등으로이뤄짐 - 마이크로소프트는 2015년 10월프로젝트옥스퍼드의 API 개발킷을공개하였으며 2), MS는구글의 TensorFlow 나 Torch 등과비교하여더욱속도가빠르고효율적이라고주장함 OpenAI l 비영리인공지능연구기관인 OpenAI 는인공지능플랫폼인 OpenAI Gym을 2016년 4월에공개함 - OpenAI 는테슬라자동차의앨론머스크와 Y-combinator 의샘알트만등이총 10억달러를공동출자하여 2015 년 12월창설한비영리목적의인공지능연구기관 - 인공지능기술의안전성및오남용가능성에대한우려는인공지능기술이최대한많은사람에게보급됨으로써가장잘해결할수있다는것이설립모토이며모든인공지능연구성과를공개하는것을추구 - Gym은강화학습 (Reinforcement Learning) 3) 에강점을가진개발툴임 2) 2015 년 4 월비상업적목적의사용자만을대상으로공개하였으나이후기업포함전체사용자로대상확대 3) 강화학습은게임플레이어와같은특정한 agent 가특정한상황속에놓여있을때그상황하에서어떻게행동하는것이최적인가 ( 예를들어게임의룰을알려주면자동으로게임을배우는 AI) 를계산하는머신러닝의한형태. 자율주행차등에적용가능하여특히주목받음. 13

오픈소스 AI : 인공지능생태계와오픈이노베이션 IBM l IBM은머신러닝플랫폼 SystemML 을오픈소스로공개함 - IBM은오픈소스개발자커뮤니티인아파치의빅데이타시스템인스파크프로젝트와제휴하면서자사가개발한 System ML의소스코드를기증하였음 - System ML은 IBM에서이미오래동안사내에서인공지능기술개발용으로활용해왔으며, 넷플릭스 (Netflix) 의영화 DB의영화추천기능등에도사용됨 삼성 l 삼성전자는인공지능플랫폼 Veles 를개발하여 2015 년 11월공개하였음 - Veles 는딥러닝알고리즘구현을위한분산형구조의플랫폼이며, 알파고와유사하게다수의 GPU를연결한병렬컴퓨팅을지원한다 - 구글 TensorFlow 와비슷하게플로우형식의그래픽인터페이스를지원하며, 다중프로그래밍언어기반이기때문에구글 TensorFlow 와마찬가지로사용하기쉬운파이썬 (Python) 기반프로그래밍인터페이스를제공한다 에어비엔비 l 에어비엔비 (AirBnB) 도 2015 년 6 월머신러닝소프트웨어인에어로솔브 (Aerosolve) 를오픈소스로공개함 14

3. 인공지능플랫폼오픈소스화현황 - 에어로솔브를이용하여 Pricing Tips 라는기능이개발이되었는데, 이는여행객의예약트랜드를날짜별로분석하여집주인에게알맞은가격을추천하는기능임 - 에어로솔브를활용하여방사진을올릴때어떤스타일로올려야이용객들이좋아하는지등을찾아낼수있음 - 에어비엔비의오픈소스머신러닝소트프웨어는구글 TensorFlow 와같은완전한범용툴이라기보다는숙박업계의특정한니즈에특화된응용툴에가까움 자료 : Airbnb 바이두 l 바이두는음성인식에특화된딥러닝소프트웨어모듈인 WARP-CTC 를 오픈소스로공개함 15

오픈소스 AI : 인공지능생태계와오픈이노베이션 - 오픈소스머신러닝라이브러리인 Torch 를활용하여개발된응용 모듈이며, 자연어인식에서특히중국어에강점을가짐 - 바이두는 WARP-CTC 모듈을활용하여음성인식소프트웨어인딥 스피치 (Deep Speech) 2 를개발함 Deep Speech 2 는차량내부등다양한노이즈환경속에서수만시간이상의학습을거쳤으며, 일부영역에서사람보다도음성인식능력이뛰어난것으로나타나화제가되었음 - 이러한음성인식인공지능모듈소스코드를개방함으로서, 한자 입력이나중국어인식등바이두를중심으로한중국의인터넷생태계의 이용환경개선을꾀할수있음 16

4. AI 개방형혁신생태계구축을위한과제 4. AI 개방형혁신생태계구축을위한과제 개방형 AI 혁신체계의중요성 l 인공지능기술알고리즘을구현하는기반플랫폼을구축하는것은 구글등대기업의역할이지만그기반으로실제로다양한환경에서 인공지능기술을구현하는데스타트업의역할이필수적 - 딥러닝이나강화학습등인공지능의기반기술들은그기본적인 기법이나원리가공통적으로광범위하게응용되고있으며따라서 일반적인개발툴이거의모든인공지능문제해결에적용가능함 - 그러나, 그구체적인응용및문제해결에서는해당주제영역에대한 지식 (domain knowledge) 이필요하고해당주제에특유한문제들에 직면함 예를들어, 알파고개발의경우엔개발진의바둑에대한이해가선행되어야했으며, 금융인공지능소프트웨어의경우엔금융에대한지식이, 의료인공지능의경우엔의학적사전지식이필요함 - 인공지능기술은전통적 ICT 산업의범주를넘어사회의거의모든영역에 적용이가능하며, 이런고도의다양성은구글등소수의대형선도기업의 역량만으로는도저히대응할수가없음 - 인공지능개발플랫폼의응용단계뿐이아니라오픈소스화된개발 플랫폼의업그레이드과정에도개방형혁신의형태로대학과공공 연구기관및스타트업의참여가가능함 17

오픈소스 AI : 인공지능생태계와오픈이노베이션 - 인공지능은 모든것에대한기술 에해당하며, ICT 선도기업과 ICT 스타트업뿐만이아니라기존의전통산업및정부와공공부문, 대학과 금융기관등모든주체가협력해야만성공적구현이가능함 l 국내에서도한국실정에맞는특화된인공지능플랫폼개발및공유 촉진정책이필요하며이를중심으로혁신주체간유기적협력이 이뤄져야함 - 인공지능알고리즘을구현하는원천기술 / 플랫폼은인공지능생태계의 중심이되지만, 이의개발은진입장벽이높아구글과같은글로벌선도 ICT 기업의우위가확고함 더욱이구글등글로벌선도기업들의인공지능개발플랫폼오픈소스화정책트랜드는국내업체들이이러한플랫폼을직접개발하는것보다는이미오픈소스화된개발플랫폼을활용할유인을강화함 - 그러나, 인공지능개발플랫폼의경우에도구글 TensorFlow 나 Torch 등과같은범용플랫폼이아니라 Airbnb 의숙박최적화용플랫폼 등특정한용도로특화된응용플랫폼은진입장벽이보다낮음 - 예를들어, 한국어음성인식기술의경우일반적인음성인식알고리즘 부분은기존오픈소스기술을활용하면서도한국어에특유한부분에 대한독자플랫폼기술개발및공개촉진이필요 - 공공전산시스템에자연어처리등인공지능기술을도입하는등공공 부문이자체적으로초기단계기술수요를창출하여인공지능생태계의 초기정착을지원할수있음 18

4. AI 개방형혁신생태계구축을위한과제 기반데이터확보의중요성 l 인공지능기술의확산에서알고리즘이나이를구현하는소프트웨어 / 하드웨어보다는이알고리즘을통해학습을실시할기반데이터가더욱중요하게되었음 -구글등의 ICT 분야민간선도기업들이개발플랫폼은공개하고있지만보유데이터는공개하고있지않으며, 이는스타트업에게진입장벽으로작용할수있음 l 미국과학기술위원회 (National Science and Technology Council, 2016) 보고서등은공공데이터셋의제공을권유하고있음 - 인공지능기술의트레이닝및테스트를위한데이터셋과테스트베드인프라를공공재로간주하여, 공공부문의참여를촉구 - 또한공공부문은방대한데이터셋의활용과정에서의법적윤리적문제에대한가이드라인을제시해야함 - 공공부문은자체적으로도거대한데이터를생성하는주체이며이를명확하고투명한가이드라인을거쳐공개함으로써인공지능생태계를활성화하는데기여할수있음 인공지능알고리즘및데이터의투명성제고 l 지난미국대선의페이스북가짜뉴스 4) 논란에서보이는것처럼, 인공 4) 페이스북을통하여여과없이각선거운동진영의조작된주장들이이용자들에게전달되어선거에영향을미쳤다는논란임. Bloomberg (2016.11.10.) 는전통적인언론매체라면팩트체크과정을통해충분히걸러졌을허위주장이 SNS 상에서는걸러지지않았다는점을문제제기하고잇음 19

오픈소스 AI : 인공지능생태계와오픈이노베이션 지능을활용한기술들의활용에서내부알고리즘의비공개로인하여투명성이나신뢰성에의문이제기되는경우가나타남 - 예를들어페이스북의뉴스피드나맞춤형광고에서높은우선순위로추천되는정보가과연그럴만한가치가있는것인가? 조작가능성은없는것인가? 라는의문이제기가능 - 소비자입장에서블랙박스와도같은인공지능알고리즘의작동결과제시되는결과에대해소비자가어떤통제권을가질수있는가? 라는의문임 -앨론머스크등이 OpenAI 를설립하고모든인공지능기술의공개화를주장한이유도이것이었음 기술표준과평가기준의중요성 l 딥러닝등의인공지능관련기술들은대부분설명가능성 (explainability) 와 투명성 (transparency) 의문제가있음 - 딥러닝기술은블랙박스와같아서학습시킨데이터를기반으로 통계적으로답을찾아내지만, 왜그런결과가나왔는지사용자입장 에서는이해하기어려움 예를들어알파고이세돌대결에서 NHK 기자는이해할수없는수가묘수로드러났는데, 이런똑같은일이인공지능이환자진료에적용되었을때발생되면어떡할것인가? 라는질문을던진적이있음 - 개별소비자가인공지능관련제품의신뢰성을확인하기는불가능에 가깝기때문에인공지능기술이적용된제품이정확하게작동하는지의 신뢰성여부에대한객관적인공인기준이필요함 20

4. AI 개방형혁신생태계구축을위한과제 - 게다가개방형생태계라는특성상인공지능적용제품에서문제가발생하면어느단계에서문제가발생한것인지식별하기쉽지않을수도있음 l 다양한주체들이참여하는인공지능생태계에서개발된인공지능기술을평가하기위한표준 (Standard) 와평가기준 (Benchmark) 가필요하며, 여기서공공부문은주도적인리더쉽발휘가필요함 - NIST(National Institute of Standards and Technology) 가주도한 TREC(Text Retrieval Conference) 와 FRVT(Face Recognition Vendor Test) 를공공부문이주도한 benchmark 설정의성공사례로꼽힘 5) 5) National Science and Technology Council (2016.10) 21

오픈소스 AI : 인공지능생태계와오픈이노베이션 참고문헌 삼성 VELES, https://velesnet.ml/airbnb Airflow, http://nerds.airbnb.com/airflow/ Bloomberg, Facebook and Twitter Contend With Their Role in Trump's Victory https://www.bloomberg.com/news/articles/2016-11-09/facebook-and-t witter-contend-with-their-role-in-trump-s-victory?utm_source=mit+ TR+Newsletters&utm_campaign=8fd52cc4f3-newsletters-the-download &utm_medium=email&utm_term=0_997ed6f472-8fd52cc4f3-153925993 &goal=0_997ed6f472-8fd52cc4f3-153925993&mc_cid=8fd52cc4f3&mc_ eid=86e9a84406 Curran, C.-S., & Leker, J. (2011), Patent indicators for monitoring convergence - examples from NFF and ICT, Technological Forecasting and Social Change, 78(2), 256-273. DeepMind Lab, https://deepmind.com/blog/open-sourcing-deepmind-lab/ FAIR (Facebook Research), https://research.fb.com/fair-open-sources-deep-learning-modules-for-torch/ IBM SystemML, http://researcher.watson.ibm.com/researcher/view_group.php?id=3174 Microsoft Project Oxford, https://staging.www.projectoxford.ai/ MIT Technology Review, China s Baidu Releases Its AI Code, https://www.technologyreview.com/s/545486/chinas-baidu-releases-itsai-code/ National Science and Technology Council (2016.10), The National Artificial Intelligence Research and Development Strategic Plan OpenAI, https://openai.com/blog/ TensorFlow, https://www.tensorflow.org/ Torch, http://torch.ch/ 22

MEMO

MEMO