제 31 회 KISTEP 수요포럼
이경일 Tony LEE ( 주 ) 솔트룩스 대표이사, 사장 미래부빅데이터자문단자문위원 국가공공데이터전략위실무위원 안전행정부정부 3.0 자문위원 인하대정보통신공학부겸임교수 EU STI International Board Member 컴퓨터지능소사이어티이사 ISO TC37 전문위원 KM/ECM 협의회회장 휴먼테크논문대상, 삼성전자 (1995) 신SW상품대상, 지경부장관 (95,03,10) 사회공헌대상, 벤처협회 (1999) 대한민국SW대상, 대통령 (2010) 대한민국포장산업훈장, 대통령 (2011) 가족친화기업대통령표창, 대통령 (2013)
빅데이터와인공지능 Ⅰ Size? 1,000,000,000 Tera = 1,000,000 Peta = 1,000 Exta = 1 Zetta 1.2ZB 1.8ZB 2.5ZB 7.9ZB 35ZB 2010 2011 2012 2015 2020 120 분 HD 영화 3 천억편 1 사람이 6,500 만년볼수있는분량 Volume 1 초당 3 백만이메일 1 분당 20 시간동영상 1 일당 5 천만트윗 3V? Velocity Variety DBMS 센서로그텍스트이메일오피스이미지오디오비디오 2
빅데이터와인공지능 Ⅰ 기존방법으로처리하기힘든 복잡도가큰데이터집합 F.A.C.T!! (Fragment x Ambiguity x Context x Trustability) 3
빅데이터와인공지능 Ⅰ Nasa s Supercomputer to send a man to moon 4
빅데이터와인공지능 Ⅰ 5
빅데이터와인공지능 Ⅰ King of Data : Linking Open Data (LOD) 6
빅데이터와인공지능 Ⅰ 7
빅데이터와인공지능 Ⅰ Big Data Deep Learning 8
빅데이터와인공지능 Ⅰ 9
빅데이터와인공지능 Ⅰ 10
빅데이터와인공지능 Ⅰ 무료에가까워지고있다! 클라우드인프라인공지능알고리즘빅데이터 11
빅데이터와인공지능 Ⅰ [ 백만달러 ] 40,000 35,000 30,000 25,000 20,000 15,000 10,000 5,000 0 빅데이터와인공지능시장동향 [ 출처 : IDC, EU, Market Reports, 2013] 2010 2011 2012 2013 2014 2015 응용서비스시장 지능형로봇 / 웨어러블서비스 빅데이터 인공지능 빅데이터시장은연평균 30% 이상성장 (2015 년 170 억달러예상 ) 인공지능시장은빅데이터기술발전에따라 2013 년이후폭발적성장중 (2013 년 8 억달러 2015 년 370 억달러 ) 인공지능비서 / 의사결정지원 무인자동차 / 스마트펙토리 12
빅데이터와인공지능 Ⅰ 1980s 1990s 2000s 2010s H/W, System OS, S/W Service Platform Big Data + AI 인공지능서비스플랫폼경쟁확산 MS Cortana Apple Siri Amazon echo Google Now MIT Jibo Docomo SC 13
빅데이터와인공지능 Ⅰ 언어지능 IBM Watson 컴퓨터제퍼디쇼우승 (2011) - Power 750 * 9대 (2880 코어, 16TB 메모리 ) - 200억페이지, 4단계추론 시각지능 구글 Brain (X-Project) (2011) - 9 계층의 Deep 뉴럴네트워크 - 유투브이미지 / 영상랜드마크자동인식서비스 학습지능 SRI 인터내셔날 CALO Project (2007) - 1.8억달러규모의기계학습 / 대화추론 - 애플시리로 spin off (2010) 뇌인지컴퓨팅 DARPA/IBM SyNAPSE Project (2013) - 뇌시뮬레이션, 뉴로모픽칩, 시스템구조등 - 목표 : 100억개뉴론, 100조개시냅스연결 IBM Cognitive Computer 응용 : 해파리로봇 - 해양안전 14 ( 출처 : IITP, 2015)
인공지능의이해 Ⅱ 환경을감지하고스스로행동 함으로자신의목표를달성할 수있는자동시스템 (Russell) 학습, 추론, 지각, 이해등인 간수준의지능을갖는컴퓨터 실현을위한 SW 기술 (IITP) 인간처럼생각하는시스템 인간처럼행동하는시스템 합리적으로생각하는시스템 합리적으로행동하는시스템 인간의학습, 추론지각능력을컴퓨터기술을이용하여구현함으로써문제해결을할수있는기술 (KISTEP) 15
인공지능의이해 Ⅱ 강한인공지능 기계가스스로의지각과자아를가지고능동적사고, 의사결정을할수있다는것으로, 인공지능의궁극적목표 약한인공지능 기계의자각능력과상관없이인간의지적행동일부를모사함으로인간의지적능력을강화, 혁신할수있는가에대한연구 계획 ( 의사결정 ) 학습추론지식표현 학습 추론 계획 음성 / 이미지인식 인식 자연어처리 / 센서구동장치 / 스크린 행동 정보전송 / 결제 상황ㆍ환경 16
기계 사람 인공지능의이해 Ⅱ 자연언어 (Natural Language) 시각언어 (Visual Language) 주석, 태깅 (Tagging) 기호언어 (Symbolic Language) 의사결정나무 (Decision Tree) 규칙 (Rules) 데이터베이스 (Database System) 논리언어 (Logical Language) 프레임언어 (Frame Language) 시맨틱네트워크 (Semantic Network) 통계적지식 (Statistical Knowledge) 인공신경망 (Artificial Neural Net.) 글로쓰여진사람의말 : 지구는타원궤도로태양을돌고있다 그림, 구조도, 흐름도, 설계도등시각적으로지식을표현개체에연관된키워드, 기호, 이미지등을부착해지식을표현수학등을포함해기호로표현된지식 : x 2 /a 2 + y 2 /b 2 = 1 복잡한의사결정을위해구성된나무모양의그래프구조인간지식을여러규칙들의조건부결합으로표현개체와관계로구성된테이블형태의지식표현체계논리기호, 연산을통한지식표현 : Woman Person Female 값혹은타프레임의포인터를저장한슬롯들로지식표현개념간의의미적관계를그래프구조로구성한지식표현확률과통계에기반한지식표현, 기계학습기술접목가능기계학습과 DNN을포함한인공신경망기반지식추상화 지식학습 17
빅데이터와인공지능 Ⅰ 사람 한채영 가정적인도대체바람둥이알사람수없 그냥는능력있는사람젊은사람남자 양성애자행복한사람 (???) (?) 이름나이성별키 ( 배우자 / 애인 ) ( 소속 ) ( 자녀 ) 27 세 여자 167cm ( 배우자 / 애인 ) ( 소속 ) ( 자녀 ) X 1:1 이경일 30세남자 183cm ( 배우자 / 애인 ) ( 소속 ) ( 자녀 ) O O 한효주 28세여자 165cm ( 배우자 / 애인 ) ( 소속 ) ( 자녀 ) 정지훈 X 여 : 남 25세남자 180cm ( 배우자 / 애인 ) 솔트룩스소프트웨어기업서울시강남구 이혜원 4 세 여자 95cm 싸이더스연예기획사서울시강남구 ( 소속 ) ( 배우자 / 애인 ) ( 자녀 ) ( 소속 ) ( 자녀 ) 18
인공지능의이해 Ⅱ 자연언어 기업에종사하는종업원은사람들이고, 기업과종업원은모두법적존재이다. 기업은직원들을위해여행예약을할수있다. 여행은한국내도시, 혹미국의도시를오고가는비행기혹은기차를통해가능하다. 기업들과출장지는도시에위치하고있다. 솔트룩스는홍길동을위해서울과뉴욕왕복항공편인 OZ510을예약하였다. 규칙언어 ( 규칙 ) 만약누군가가날고있다면, 여행중인것이다. ( 규칙 ) 만약누군가의여행이한회사에서예약되었다면, 그는그회사의종업원이다. ( 규칙추가 ) 만약동일국가의근거리여행이라면, 종업원은기차를이용해야한다. ( 추론 ) 비행예약이되어있는홍길동은솔트룩스의종업원이다 ( 추론 ) OZ510은미국과한국을오가는비행편이다. 19
instanceof instanceof instanceof instanceof subclssof kindof subclssof subclssof kindof 인공지능의이해 Ⅱ 법적존재 법적존재 법적존재 이름고유번호 위치 법적존재 이름 ( 필수 ) 고유번호 ( 필수 ) DISJOINT 사람사람 기업 기업 사람성별 books 나이 여행 기업업종주소지 startfrom endsin 사람기업성별 { 남, 녀도시 } 업종나이 > 25 주소지 서울 종업원종업원 홍길동 홍길동 instanceof 솔트룩스 instanceof 솔트룩스 participatesin 종업원 직급 #3502 홍길동 P12345 남자 37 과장 비행기 instanceof OZ510 instanceof 기차 #4831 솔트룩스 C98765 소프트웨어서울삼성동 종업원 직급 임원 한국도시 #3502 홍길동 P12345 남자 37 과장 instanceof 서울 미국도시 instnaceof 뉴욕 (a) 시맨틱네트워크 (b) (a) + 프레임 ( 프로퍼티 ) (c) (b) + 논리제약 instanceof #4831 솔트룩스 C98765 소프트웨어서울삼성동 20
인공지능의이해 Ⅱ 21
인공지능의이해 Ⅱ CALO 22
인공지능의이해 Ⅱ 추론 : 기존사실들로부터새로운사실을 도출하거나결론에도달하는과정 연역적추론 (deductive reasoning) 전제 1: 모든사람은죽는다. 전제 2: 소크라테스는사람이다. 결론 : 소크라테스는죽는다. 귀납적추론 (Inductive reasoning) 전제 : 지금까지태양은매일아침서쪽에서떴다. 결론 : 내일도태양은서쪽에서뜰것이다. 온톨로지 / 규칙 기계학습 귀추추론 (Abductive reasoning) 유비추론 (Analogical reasoning) 23
인공지능의이해 Ⅱ 24 24
인공지능의이해 Ⅱ 학습 (Learning) 주어진상황에대해되풀이되는행동의경험을통해동일 ( 유사 ) 상황에대한행동의변화 지식의습득과기존지식으로부터추론된결과의재학습능력필요 궁극적으로컴퓨터가새로운것을배우고환경에적응하는것 영화, 인류멸망보고서중 25 25
인공지능의이해 Ⅱ A B 26
인공지능의이해 Ⅱ A B 27
인공지능의이해 Ⅱ A B 28 28
인공지능의이해 Ⅱ Black Box (learning machine) Test-data Training data Model Prediction Support vector machines Inductive logic programming Decision tree learning Association rule learning Artificial neural networks Genetic programming Clustering Bayesian networks Reinforcement learning Representation learning Sparse Dictionary Learning 29
인공지능의이해 Ⅱ Classification Clustering Regression Bayesian Net Decision tree Neural Net 30 Trend Prediction Fraud detection Sentiment Analysis Spam detection Document classification Diagnostics Recommendations Path finding Collaborative Filtering 30
인공지능의이해 Ⅱ http://www.nickgillian.com/wiki/pmwiki.php/grt/gettingstarted 31 31
인공지능의이해 Ⅱ 여러비선형변환기법의조합을통해높은수준의추상화를시도하는기계학습 (machine learning) 알고리즘의집합 데이터입력과출력사이에다수레이어로구성된뉴럴네트워크를통한기계학습방법 1960 년대에이미 perceptron 수렴이론이제안되었으며, 1989 년 DNN 기술이정립 과적응, 느린학습문제로소외됨 Geoffrey Hinton 등의연구를통해이문제의많은부분이해결됨 ( 비지도 RBM 을통해사전훈련을시키고, 지도형역전파 (backpropagation) 을통한학습진행, 과적응문제해결 ) 인간뇌와같이다수의레이어와연결구조를통해대상의 특징 을계측적식별, 처리함으로 인식문제 해결에서탁월한성능제공 GPGPU 및병렬분산처리기술발전, 빅데이터와결합되큰성과가기대되고있음 32 32
인공지능의이해 Ⅱ 산업응용사례 컴퓨터비전 음성인식 자연언어이해 로보틱스 바이오, 화학분야 33 P. Baldi University of California
인공지능의이해 Ⅱ Imagenet 대상 Over 1 million images, 1000 classes, different sizes, avg 482x415, color 16.42% Deep CNN dropout in 2012 6.66% 22 layer CNN (GoogLeNet) in 2014 4.9% (Google, Microsoft) superhuman performance in 2015 Sources: Krizhevsky et al ImageNet Classification with Deep Convolutional Neural Networks, Lee et al Deeply supervised nets 2014, Szegedy et al, G oing Deeper with convolutions, ILSVRC2014, Sanchez & Perronnin CVPR 2011, http://www.clarifai.com/ Benenson, http://rodrigob.github.io/are_we_t here_yet/build/classification_datasets_results.html 34
인공지능의이해 Ⅱ 35
인공지능의이해 Ⅱ ( 출처 : 미래부 /IITP) GCS ( 전문기업육성 ) 평생기계학습 자율지능 / 인지 브레인패턴인식 SWRC( 센터, SW 스타랩 ) 유망신기술확보 국가혁신형 (SW 그랜드챌린지 ) 엑소브레인 ( 언어 ) 딥뷰 ( 시각 ) 국내 R&D 는기초원천중심의출연연 ( 전문기업참여 ) 및대학중심으로진행중 산업체주관의사업화 R&D 는취약한상황 36
인공지능미래 Ⅲ 37
인공지능미래 Ⅲ 한국일보 2015.03.10 38
인공지능미래 Ⅲ 39
인공지능미래 Ⅲ 지능적금융투자분석, 예측, 대리집행 ( 주식, 금, 석유, 원자재등 ) 투자위험예측, 관리와조기대응 환거래, 환투기등실시간환관리응용 지능적금융및보험사기방지, 보험상품최적화 날씨예측정밀화, 농업수요예측과작물관리 정부경제정책 ( 금리, 재정등 ) 수립지원 40
인공지능미래 Ⅲ 지능형웨어러블컴퓨터와개인비서 ( 컨시어지 ) 보다개인화되고맞춤화된미디어및광고산업 무인주행자동차 ( 승용차, 화물차등 ) 의상용화 지능로봇을통한물류 / 유통센터, 국제물류혁신 지능형의료상담및진료의사결정시스템의상용화 생산시스템지능화, 수율향상, 수요예측, 가격조정 에너지손실방지와최적화시스템 41
인공지능미래 Ⅲ 의사결정결과의법적책임 인공지능시스템을통한시민감시와통제 지능시스템을통한신종범죄문제 개인정보활용과개인화서비스의법적문제와한계 오작동, 오용에따른인명, 재산피해책임 삶의질양극화와부의편중 교육형태의변화와의사결정의기계의존도증대 42
인공지능미래 Ⅲ 인공지능기반뉴스미디어산업변화 ( 인공지능저널리즘 ) 음악작곡과미술분야의혼란 ( 인공지능작곡 / 작사 ) 인공지능소설의실질적성공 인공지능에대한의존과감정이입 43
인공지능미래 Ⅲ 정 책 자잘한경쟁사업, R&D가아닌비전적대형정책사업 ( 대규모협력적 R&D 혹은인프라사업 ) 장기학연산 ( 중-대 ) 생태계구축촉진정책 ( 창업, M&A 포함 ) 성공을전제로한중장기 R&D 사업관리 법 규 규제해소 예산산업인프라 의료데이터개방가이드라인등 ( 美 HIPAA, 1996년 ) 정책적기술선도사업의산업생태계구축촉진 ( 참여제한성격이아닌역할분리, 협력체계 ) 선도기술 / 제품에대한직접구매를통한시장활성화 국산첨단기술 / 제품에대한역차별해소 ( 유지관리등 ) 새로운 BM 확보와젊은창업자들을위한공통 AI인프라 ( 빅데이터센터, IOT 센터등의인공지능플랫폼강화 ) 인공지능기술육성을위한 LOD 기반데이터개방가속 44
결언 Ⅳ Neuron ~100 Billion # ~ # of Web Pages Synapse ~100 Trillion # ~ # of Web Links 45
200m 결언 Ⅳ x 1,300 200m 1 : 1000 46
결언 Ⅳ 47
결언 Ⅳ 48
결언 Ⅳ 49
결언 Ⅳ 50
결언 Ⅳ 51
결언 Ⅳ Hyper Connected People; Devices; Machines; Services; Data; Knowledge 52
결언 Ⅳ 직감그리고통찰력 적혹은친구? 비용그리고생산성 논리적 합리적 감성적 창의적 데이터분석 반복작업 < 협력 > 미래사회의경쟁력 53
컴퓨터는놀랍게빠르고, 정확하지만대단히멍청하다. 사람은놀랍게느리고, 부정확하지만대단히똑똑하다. 이둘이힘을합치면상상할수없는힘을가지게된다. - 알버트아인슈타인 -
유일한성공방법은, 미래를예측하는것이아니라 이미시작된변화를이해, 그시간차를이용하는것! Peter Drucker
감사합니다.