딥러닝 (Deep Learning) 2016 04 29 변경원
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 2
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 3
딥러닝이란무엇인가? 딥러닝과인공지능 딥러닝은세상을이해하고감지하는인공지능을개발하는데가장촉망받는기술이되고있음. 최근에는여러가지인지능력프로젝트에집중되고있고수많은성공사례들이발표되고있음. 인터넷포탈회사들이 ( 구글, 바이두, 페이스북 ) 가장앞서서개발을하고있으며 GPU 를사용한다양한딥러닝연구들과성과들이적용되고있음. 4
딥러닝이란무엇인가? 적용가능한딥러닝예제들 이미지분야 언어응용 이미지분류, 물체감지, 위치와움직임인식, 장면이해 음석인식, 음성번역, 자연어처리 자동차응용 의학응용 보행자감지, 교통신호및표지판인식 유방암조직체세포분열감지, 체적의뇌이미지분할 5
딥러닝이란무엇인가? 인공지능을구성하기위한인공신경망 (ANN, Artificial Neural Networks) 에기반하여컴퓨터에게사람의사고방식을가르치는방법. 사람이가르치지않아도컴퓨터가스스로사람처럼학습할수있는인공지능기술. 6
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 7
인공지능이란무엇인가? 지능적기계특히지능적컴퓨터프로그램을만드는과학과공학이다. 컴퓨터 (Computer) 를사용해서인간지능 (Intelligence) 을이해하는작업들과관련되어있으며생물학적인방법에만국한되지는않는다. 8
인공지능이란무엇인가? 딥러닝 표현학습 * 머신러닝 인공지능 * 표현학습 : 기계가데이터로부터유용한정보를추출하는방법을연구하는분야 9
10 출처 : http://biz.chosun.com/site/data/html_dir/2015/03/27/2015032702050.html
머신러닝이란무엇인가? 컴퓨터에게사람이직접로직 (Logic) 을지시하지않아도데이터를통해컴퓨터가 학습 을하고그것을사용해컴퓨터가자동으로문제를해결하도록하는것을의미한다. 머신러닝은기계학습으로사용됨. 11
머신러닝이란무엇인가? 머신러닝 지도학습 (Supervised Learning) 비지도학습 (Unsupervised Learning) 분류 (Classification) 회귀 (Regression) 군집 (Clustering) 12
머신러닝이란무엇인가? 머신러닝 가르쳐주는학습 (Supervised Learning) 자율학습 (Unsupervised Learning) 분류 (Classification) 회귀 (Regression) 군집 (Clustering) 13
꽃 타블렛 레몬과얼음물이들어있는컵 지도학습 (Supervised learning) 비지도학습 (Unsupervised learning) 커피컵 아침식사가차려진식탁 어떤사람이식탁에앉아있음 14
머신러닝이란무엇인가? 가르쳐주는학습 (Supervised Learning) 15
머신러닝이란무엇인가? 자율학습 (Unsupervised Learning) 16
머신러닝이란무엇인가? 자율학습 (Unsupervised Learning) 17
인공지능이란무엇인가? 18
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 19
딥러닝은왜필요한가? 기존머신러닝관점 원본데이타특징추출분류기결과 SVM, shallow neural net, HMM, shallow neural net, 말하는사람의신분, 음성을문자로 Clustering, HMM, LDA, LSA 준제분류, 번역, 내포된의미분석 20
딥러닝은왜필요한가? 딥러닝 훈련 강아지 분류기 강아지 (O) 21
딥러닝은왜필요한가? 딥러닝 훈련 강아지 분류기 강아지 (O) 고양이 분류기 고양이 (O) 22
딥러닝은왜필요한가? 딥러닝 훈련 강아지 분류기 강아지 (O) 고양이 분류기 고양이 (O) 고래 분류기 상어 (X)!!!!!! 23
딥러닝은왜필요한가? 딥러닝 반복교육 훈련 고래 분류기 상어 (X) 24
딥러닝은왜필요한가? 딥러닝 반복교육 훈련 고래 분류기 상어 (X) 반복교육 고래 분류기 고래 (O) 25
딥러닝은왜필요한가? 딥러닝 훈련완료 강아지 분류기 강아지 (O) 고양이 분류기 고양이 (O) 고래 분류기 고래 (O) 26
딥러닝은왜필요한가? 딥러닝 테스트 분류기 강아지 (O) 임의의사진입력 27
딥러닝은왜필요한가? 딥러닝 훈련 아이유 분류기 아이유 (O) 혜리 분류기 혜리 (O) 황정음 분류기 하니 (X)!!!!!! 28
딥러닝은왜필요한가? 딥러닝 훈련 반복교육 황정음 분류기하니 (X)!!!!!! 29
딥러닝은왜필요한가? 딥러닝 훈련 반복교육 황정음 분류기하니 (X)!!!!!! 반복교육 황정음 분류기 황정음 (O) 30
딥러닝은왜필요한가? 딥러닝 테스트 임의의사진입력 분류기 아이유 (O) 황정음 (O) 혜리 (O) 31
딥러닝은왜필요한가? 딥러닝 32 출처http://karpathy.github.io/2015/10/25/selfie/
33 출처 http://karpathy.github.io/2015/10/25/selfie/
34 출처 http://karpathy.github.io/2015/10/25/selfie/
딥러닝은왜필요한가? 딥러닝 35 출처 http://karpathy.github.io/2015/10/25/selfie/
딥러닝은왜필요한가? 딥러닝이사용되는사례 입력 출력 사진 강아지 음성 안녕하세요환영합니다 문자 " 안녕하세요. 어떻게지내세요?" "Bonjour, comment allez-vous?" 사진 조그만아이가인형을안고자고있어요 36
딥러닝은왜필요한가? 신경망 (ANN)* 시냅스의결합으로네트워크를형성한인공뉴런 ( 노드 ) 이학습을통해시냅스의결합세기를변화시켜, 문제해결능력을가지는모델전반 생물학적뉴런 37 *ANN : Artificial Neural Network
딥러닝은왜필요한가? 신경망 (ANN)* 시냅스의결합으로네트워크를형성한인공뉴런 ( 노드 ) 이학습을통해시냅스의결합세기를변화시켜, 문제해결능력을가지는모델전반 생물학적뉴런 Y = ax + b **w : 가중치 (weight) 38 *ANN : Artificial Neural Network
딥러닝은왜필요한가? 신경망 (ANN)* 시냅스의결합으로네트워크를형성한인공뉴런 ( 노드 ) 이학습을통해시냅스의결합세기를변화시켜, 문제해결능력을가지는모델전반 생물학적뉴런 인공신경 y **w 1 w 2 w 3 x 1 x 2 x 3 y=f(w 1 x 1 +w 2 x 2 +w 3 x 3 ) F(x)=max(0,x) **w : 가중치 (weight) 39 *ANN : Artificial Neural Network
딥러닝은왜필요한가? 신경망 (ANN)* 숨겨진단계 ( 영역 ) 들 입력단계 출력단계 충분히훈련이된인공신경망은내부의복잡한기능들을통해서출력을예측할수있음. 40
딥러닝은왜필요한가? 심층신경망 (DNN)* 원본데이터하위레벨특징들중간레벨특징들상위레벨특징들 어플리케이션구성 : 목적 : Identify face 훈련데이터 10-100M images 망아키텍처 ~10 층 1B 매개변수훈련알고리즘 ~30 Exaflops ~30 일 GPU 입력 결과 *DNN : Deep Neural Network 10 18 (exa : 백경 ), 10 15 (peta : 천조 ), 10 12 (tera : 조 ), 10 9 (giga : 십억 ) 41
딥러닝은왜필요한가? 특징표현방법 과거 : 입력 사진, 문자, 음성, 기타 수작업을통한특징추출 분류 / 통합 / 변화 연산자 출력 결과값 42
딥러닝은왜필요한가? 특징표현방법 과거 : 입력 사진, 문자, 음성, 기타 수작업을통한특징추출 분류 / 통합 / 변화 연산자 출력 결과값 현재 : 입력사진, 문자, 음성, 기타 하위단계구조 딥러닝 심층아키텍처를통한특징추출 중간단계구조 상위단계구조 분류 / 통합 / 변화 연산자 출력 결과값 계층형특징표현 이미지인식화소 모서리 물제의일부분 물체 문자인식글자 단어 구절 문장 음성인식스펙트럴대역 단음 음소 단어 43
딥러닝은왜필요한가? 충분히많은데이터를가지고반복적인학습을통해올바른결론을도출해내기위해 44
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 45
딥러닝은어떤역할을하는가? 나선구조적인신경망 (CNN)* 완전연결단계 예 : 200 x 200 이미지구성단위 : 40,000 매개변수 : ~ 20 억 - 공간상관관계 - 자원의낭비 + 충분히훈련이되지못함 *CNN : Convolutional Neural Network 46 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인신경망 (CNN)* 예 : 200 x 200 이미지구성단위 : 40,000 필터사이즈 : 10 x 10 매개변수 : 4M *CNN : Convolutional Neural Network 47 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인신경망 (CNN)* 예 : 200 x 200 이미지구성단위 : 40,000 필터사이즈 : 10 x 10 매개변수 : 4M *CNN : Convolutional Neural Network 48 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인신경망 (CNN)* 인접영역과매개변수를공유 *CNN : Convolutional Neural Network 49 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 50 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 51 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 52 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 53 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 54 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 55 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 56 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 57 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 58 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 59 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 60 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 61 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 62 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 63 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 64 출처 : http://yann.lecun.com/
딥러닝은왜필요한가? 나선구조적인층 (Convolutional Layer) 65 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 66 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 나선구조적인층 (Convolutional Layer) 다중필터예 : 200 x 200 이미지필터 : 100 개, size : 10 x 10 매개변수 : 10K 67 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 최대값모으기 (Max Pooling) 검은색원 ( 예 : 3x3 필터라면 ) 에서단일 3x3 의데이터를얻기위해샘플링을함. 방법 : 평균값, 선형조합값, 최대값. 68 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 대비 ( 차이 ) 정형화작업 69 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 대비 ( 차이 ) 정형화작업 70 출처 : http://yann.lecun.com/
딥러닝은어떤역할을하는가? 충분히많은데이터를가지고반복적인학습을통해효율적으로올바른결론을도출해내기위한과정 71
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 72
딥러닝은어떻게만들어야하는가? 나선구조적인신경망 (CNN)* 인간의시각령과같이매우탁월함 시각특징의계층적구조가짐 지역화소특징들은크기와변형의변화가없음. 시각적으로물체의본질과일반화가잘맞음 73 *CNN : Convolutional Neural Network
딥러닝은어떻게만들어야하는가? 나선구조적인신경망 (CNN)* 74 *CNN : Convolutional Neural Network
딥러닝은어떻게만들어야하는가? Y. LeCun et al. 1989-1998 : Handwritten digit reading 75
딥러닝은어떻게만들어야하는가? A. Krizhevsky, G. Hinton et al. 2012 : Imagenet classification winner 76 *CNN : Convolutional Neural Network
Alexnet 이란? 나선형신경망 (CNN) 을이용하여깊은신경망 (Deep Neural Network) 구현 -. GTX580 3GB 2 개사용 -. 8 개의 Layer 구성 -. 트레이닝시간 : 5 ~ 6 일소요 -. 필요한계산양이단일 CPU 만으로불가능에가깝도록커짐 Dropout Layer Classifier Layer CNN : Convolutional Neural Network 77 원문 : http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
딥러닝의획기적인도약 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Traditional CV IMAGENET Accuracy Rate Deep Learning -. IMAGENET : 1000 개의카테고리와 100 만개의이미지로구성되어정확도를겨루는대회 -. 2012 년 IMAGENET 정확도 84.7% 도달 ( 알렉스 : 딥러닝이용 ) 획기적인사건 : 10 여년동안 75% 를넘는정확도를보이지못함이후의대부분의참가자들이딥러닝을사용 알렉스딥러닝에러율 0% 2009 2010 2011 2012 2013 2014 2015 2016 78
Alex Krizhevsky 는누구? -. IMAGENET CHALLENGE 에서딥러닝을직접구현 -. 마의벽 80% 정확도를극복 -. 소스코드공개 -. 딥러닝의붐업을이끔 스탠포드딥러닝튜토리얼 : 딥러닝대표기술저자중의한명으로선정 Ilya Sutskever Alex Krizhevsky Geoffrey Hinton http://deeplearning.stanford.edu/tutorial/ 79
딥러닝은어떻게만들어야하는가? Google net 80
딥러닝은어떻게만들어야하는가? Google net 81
딥러닝은어떻게만들어야하는가? MSRA 2015 Imagenet Chanllenge(152 Layer) 82
딥러닝은어떻게만들어야하는가? MSRA 2015 Imagenet Chanllenge 83
딥러닝은어떻게만들어야하는가? 충분히많은데이터를가지고반복적인학습을통해효율적으로올바른결론을도출해내기위한시스템설계 85
86 출처 : http://biz.chosun.com/site/data/html_dir/2015/03/27/2015032702050.html
왜딥러닝이떠올랐는가? 87
왜 딥러닝이 떠 올랐는가? 빅 데이터 매일 350 백만개의 이미지업로드 시간당 2.5 Petabytes 고객데이터 생성 매분당 150시간의 비디오들이 업로드 88
왜 딥러닝이 떠 올랐는가? 빅 데이터 새로운 딥러닝 기술 매일 350 백만개의 이미지업로드 시간당 2.5 Petabytes 고객데이터 생성 매분당 150시간의 비디오들이 업로드 89
왜 딥러닝이 떠 올랐는가? 빅 데이터 새로운 딥러닝 기술 GPU 가속 매일 350 백만개의 이미지업로드 시간당 2.5 Petabytes 고객데이터 생성 매분당 100시간의 비디오들이 업로드 90
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 91
GPU 의역할 Image Recognition Challenge 1.2M training images 1000 물체들의범주 92
Google Brain CPU 서버 1,000 대 스탠포드대인공지능랩 GPU 서버 3 대 16,000 코어 18,432 코어 50 억원 3 천 3 백만원 60 만와트 4 천와트 93
GPU 의역할왜딥러닝에 GPU 가좋을까? GPU 의장점 - 예측정확도가같거나더좋음 - 빠른결과 - 차지하는공간이작음. - 저전력 - 저비용 94
GPU 의역할 GPU vs CPU 비교 Batch 사이즈 훈련시간 CPU 훈련시간 GPU GPU 가속능력 64 images 64 초 7.5 초 8.5 배 128 images 124 초 14.5 초 8.5 배 256 images 257 초 28.5 초 9.0 배 ILSVRC12 winning model: Supervision 7 layers 5 convolutional layers + 2 fully-connected ReLU, pooling, drop-out, response normalization Implemented with Caffe Training time is for 20 iterations Dual 10-core Ivy Bridge CPUs 1 Tesla K40 GPU(2880 core) CPU times utilized Intel MKL BLAS library GPU acceleration from CUDA matrix libraries (cublas) 95
GPU 의역할 GPU vs CPU 비교 96 출처 : http://www.cvlibs.net/datasets/kitti/eval_object.php
GPU 의역할엔비디아가지원하는딥러닝요소들 음성이해이미지분석언어처리 사용자어플리케이션들 DIGITS GPU 딥러닝가속되는프레임딥러닝 ( 산업프레임웍표준, 연구 (Caffe, / 개발 Torch, 프레임웍들 Theano) ) 최적의라이브러리성능을( 연산처리에낼수있는집중된라이브러리각종의 (cudnn, 라이브러리 cublas) ) 시스템 CUDA-소프트웨어최고의병렬( 각프로그램 OS별드라이버툴킷) GPU- 세계최고의하드웨어딥러닝하드웨어 97
GPU 의역할 GPU 가속딥러닝프레임웍의종류 (Tensorflow, CNTK) CAFFE TORCH THEANO MINERVA KALDI Domain Deep Learning Framework Scientific Computing Framework Math Expression Compiler Deep Learning Framework Speech Recognition Toolkit cudnn 4.0 4.0 4.0 4 -- Multi-GPU via DIGITS 2 In Progress In Progress (nnet2) Multi-Node (nnet2) License BSD-2 GPL BSD Apache 2.0 Apache 2.0 Interface(s) Command line, Python, MATLAB Lua, Python, MATLAB Python C++ C++, Shell scripts Embedded (TK1) 사용예 머신비전 구글, 트위터, 페이스북 다차원배열라이브러리 음성인식 98
GPU 의역할 EDUCATION TENSORFLOW WATSON CNTK TORCH CAFFE THEANO MATCONVNET MOCHA.JL PURINE START-UPS CHAINER DL4J KERAS OPENDEEP MINERVA MXNET* SCHULTS LABORATORIES VITRUVIAN NVIDIA GPU PLATFORM *U. Washington, CMU, Stanford, TuSimple, NYU, Microsoft, U. Alberta, MIT, NYU Shanghai 99
GPU 의역할 100
GPU 의역할 딥러닝을위한엔비디아솔루션 DIGITS DevBox 4 개의 TITAN X GPU 7TFlops 단일정밀도 336.5 GB/s 메모리대역 12GB Ubuntu 14.04 w/caffe, Torch, Theano, cudnn v4, CUDA 7.5 DIGITS NVIDIA Deep Learning GPU Training System (DIGITS) 101
GPU 의역할 딥러닝을위한엔비디아솔루션 NVIDIA DGX-1 World s First Deep Learning Supercomputer Engineered for deep learning 170 TF FP16 8x Tesla P100 in hybrid cube mesh Accelerates major AI frameworks 1.33 billion images/day 102
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 103
딥러닝의기여 딥러닝의전체흐름도 104
딥러닝의기여구글무인차 105
딥러닝의기여예술작품스타일인식과모방 http://demo.vislab.berkeleyvision.org/ 106
강화학습다양한게임 Google DeepMind 107
1. 딥러닝이란무엇인가? 2. 인공지능이란무엇인가? 3. 딥러닝은왜필요한가? Agenda 4. 딥러닝은어떤역할을하는가? 5. 딥러닝은어떻게만들어야하는가? 6. GPU 의역할 7. 딥러닝의기여 8. AlphaGo 와 GPU 108
이세돌 vs 알파고비교 데뷔시기 ( 나이 ) 1988 년 (33 세 ) 2015 년 (2 세 ) 프로경력 21 년 ( 우승 47 회 ) 1 년 ( 우승 1 회 ) (2016 딥마인트첼린즈매치 ) 단위 ( 段位 ) 9단 2 ~ 5단 ( 자체추정 ) 경험치 10,000경기 100,000경기 트레이닝 30,000시간 30,000시간 (GPU) 검색파워 100 위치 / 초 100,000 위치 / 초 컴퓨팅파워본인두뇌 100 GPUs 109
알파고 (AlphaGo) 컴퓨팅파워비교 상대자 Fan Hui( 유럽챔피언 ) 이세돌 시합일자 2015.10.05 ~10.09 2016. 03 09 ~ 15 대국수 5 (5:0 알파고승 ) 5 (4:1 알파고승 ) 트레이닝 GPU : 50개 GPU : 100개 경기 CPU : 1202 개 GPU : 176 개 CPU : 1920 개 GPU : 280 개 KGS 6 ~ 9 단의 160,000 경기로부터 29,400,000 위치정보를뽑아서학습 http://www.economist.com/news/science-and-technology/21694540-win-or-lose-best-five-battle-contest-another-milestone 110
알파고 (AlphaGo) 의구조와성능 구분탐색쓰레드 CPUs GPUs Elo rating * 단일 (Single) 40 48 8 2890 분산 40 1202 176 3140 탐색쓰레드 CPU 의역할 GPU 의역할 쓰레드개수만큼바둑의경기경로를탐색 CPU 한개당 1 초에 1000 회이상의시뮬레이션 (Fast rollout 방법 ) 딥러닝을사용하여바둑판상태의승률과다음착수예측 * Elo rating : 게임플레이어간의실력을상대적으로나타낸것으로, 단일 / 분산 AlphaGo의 Elo rating을측정하기위하여기존인공지능프로그램과대결하여산출 111 http://spri.kr/post/14725
알파고 (AlphaGo) 의구조와성능 인공지능바둑프로그램 버전착수시간설정 CPUs GPUs KGS 랭크 Elo rating 분산 AlphaGo 5 초 1202 176-3140 AlphaGo 5 초 48 8-2890 CrazyStone 2015 5 초 32-6d 1929 Zen 5 5 초 8-6d 1888 Pachi 10.99 5 초 (400,000sims) 16-2d 1298 Fuego svn1989 5 초 (100,000sims) 16 - - 1148 GnuGo 3.8 5 초 (level10) 1-5k 431 CrazyStone 4 4 접바둑 5 초 32 - - 2526 Zen 4 4 접바둑 5 초 8 - - 2413 Pachi 4 4 접바둑 5 초 (400,000sims) 16 - - 1756 프로 (p), 아마추어단 (d), 아마추어급 (k) http://spri.kr/post/14725 http://www.nature.com/news/google-ai-algorithm-masters-ancient-game-of-go-1.19234 112
알파고 (AlphaGo) 수준 113
AlphaGo 가바둑을선택한이유 10 360 가지의경우수존재 바둑규칙을고려한평균경우수 250 개, 바둑평균약 150 수정도, 250 150 10 360 우주의원자수 : 10 80 현존하는컴퓨팅파워로는경우수를모두파악하기어려움 경우의수 ( 트리탐색 ) 를줄이는방법이관건 114
체스탐색트리 115
바둑탐색트리 116
AlphaGo 트레이닝딥러닝 Human expert Data (100K games) 117
AlphaGo 트레이닝딥러닝 Human expert Data (100K games) Supervised Learning Policy network Classification 118
AlphaGo 트레이닝딥러닝 Human expert Data (100K games) Supervised Learning Policy network Reinforcement Learning Policy network Classification Self Play 119
AlphaGo 트레이닝딥러닝 Human expert Data (100K games) Supervised Learning Policy network Reinforcement Learning Policy network Generates New Data (30M Positions) Classification Self Play Self Play 120
AlphaGo 트레이닝딥러닝 Human expert Data (100K games) Supervised Learning Policy network Reinforcement Learning Policy network Generates New Data (30M Positions) Value network Classification Self Play Self Play Regression 121
AlphaGo 트레이닝딥러닝 Policy and Value Networks Policy Network (Probability Distribution over moves) 122
AlphaGo 트레이닝딥러닝 Policy and Value Networks Policy Network (Probability Distribution over moves) Value Network (Real numbers : 0 White, -1 Black) 123
AlphaGo Tree search and Rollouts Selection Q : Action Value of Move P : Prior Probability of Move 124
AlphaGo Tree search and Rollouts Selection Q : Action Value of Move P : Prior Probability of Move 125
AlphaGo Tree search and Rollouts Evaluation Q : Action Value of Move P : Prior Probability of Move 126
AlphaGo Tree search and Rollouts Backup Q : Action Value of Move P : Prior Probability of Move 127
알파고 (AlphaGo) 수준 128
129
$500B OPPORTUNITY OVER 10 YRS Deep Learning Total Revenue by Segment World Markets: 2015-2024 Deep Learning Software Revenue by Industry World Markets: 2015-2024 $120,000 $100,000 Other ($ Millions) $80,000 $60,000 $40,000 Retail Manufacturing Ad Service Technology $20,000 Oil and Gas $- 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 Media Investment Source : Deep Learning for Enterprise Applications, 4Q 2015, Tractica 130
Question : sbyun@nvidia.com