PowerPoint 프레젠테이션

Similar documents
Ch 1 머신러닝 개요.pptx

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

歯한국전자통신연구원정교일.PDF

ÀüÀÚÇö¹Ì°æ-Áß±Þ

첨 부 1. 설문분석 결과 2. 교육과정 프로파일 169

SKT - 0.0% SKT 9, % 7, % 2, % 3, % 13, % 11,273 15,970

23

歯이시홍).PDF

Data Industry White Paper

PowerPoint 프레젠테이션

[NO_11] 의과대학 소식지_OK(P)

1. 연구 개요 q 2013년 연구목표 제2-1과제명 건축물의 건강친화형 관리 및 구법 기술 연구목표 건강건축 수명예측 Lifecycle Health Assessment (LHA) 모델 개발 건축물의 비용 기반 분석기술(Cost-based Lifecycle Health

기사스크랩 (160317).hwp

세션 Tutorial 1 강연 시간 5/11(수) 09:30-11:30 주 제 5G System: Vision & Enabling Technologies 성 명 강충구 소속기관명 고려대학교 부서/학과명 전기전자공학부 직 위 교수 5G 이동통신의 응용 분야에 따른 기술

PCServerMgmt7

Ch 8 딥강화학습

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

<23C0B1C1A4B9E65FC6EDC1FDBFCFBCBA E687770>

제1강 인공지능 개념과 역사

ecorp-프로젝트제안서작성실무(양식3)

Mstage.PDF

õ 1984년 대구 영신고 졸업 õ 1984년 서울대학교 법과대학 입학 õ 1988년 제30회 사법시험 합격(연수원 20기) õ 1991~1994 육군법무관 õ 1994년 ~ 2005년 대구지법, 고법 판사 õ 2006년 대구지법 부장판사 õ 2006년 일본 동경대학

레이아웃 1

제4차 산업혁명과 인공지능 차 례 제4차 산업혁명과 인공지능 2 제46회 다보스포럼이 2016년 1월 21일~24일 4차 산업혁명의 이해 라는 주제로 개최 되었습니다. 4차 산업혁명은 인공지능에 의해 자동화와 연결성이 극대화되는 단계 로서 오늘날 우리 곁에 모습을 드러

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

IPAK 윤리강령 나는 _ 한국IT전문가협회 회원으로서 긍지와 보람을 느끼며 정보시스템 활용하 자. 나는 _동료, 단체 및 국가 나아가 인류사회에 대하여 철저한 책임 의식을 가진 다. 나는 _ 활용자에 대하여 그 편익을 증진시키는데 최선을 다한다. 나는 _ 동료에 대해

이든샘 은 착하고 어진(옛말:이든) 마음이 샘처럼 솟으라는 뜻의 순우리말입니다. 한국원자력연구원은 어린이들이 착하고 어진 마음을 지키며 살아갈 수 있는 세상을 만들기 위해 노력하고 있습니다. 표지인물 가족 열수력안전연구부에서 근무하는 김종록 선임연구원의 아들 희태(6세

<C7D1B1B9C0FAC0DBB1C7C0A7BFF8C8B828C0FAC0DBB1C720B1E2BCFAC6F2B0A1B8A620C0A7C7D120B9FDC1A6B5B520B0B3BCB1B9E6BEC8BFACB1B8292E687770>

Microsoft PowerPoint - XP Style

UDP Flooding Attack 공격과 방어

PowerPoint 프레젠테이션

부산 IT 산업 발전 방향 연구 보고서_한국선박전자산업진흥협회.hwp

untitled

hw 2006 Tech guide 64p v5

......

untitled

2012¹æ¿ª 03¿ùÈ£ÃÖÁ¾1-8

미래인터넷과 창조경제에 관한 제언 65 초록 과학기술과의 융합을 통해 창조경제를 이루는 근간인 인터넷은 현재 새로운 혁신적 인터넷, 곧 미래인터넷으로 진화하는 길목에 있다. 창조와 창업 정신으로 무장하여 미래인터넷 실현에 범국가적으로 매진하는 것이 창조경제 구현의 지름

김기남_ATDC2016_160620_[키노트].key

11이정민

±èÇö¿í Ãâ·Â

I What is Syrup Store? 1. Syrup Store 2. Syrup Store Component 3.

제2강 생각하는 기계

?????????????????2009-????????

슬라이드 1

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

_KrlGF발표자료_AI

Yggdrash White Paper Kr_ver 0.18

DBPIA-NURIMEDIA

12-06.hwp

<443A5CB1E8BFC144425CBAB8B0EDBCAD5CB4EBC7D0C7F5BDC5B0FAB0E6C0EFB7C228C3D6C1BE295F E2E2E>

thesis

The Self-Managing Database : Automatic Health Monitoring and Alerting

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

264 축되어 있으나, 과거의 경우 결측치가 있거나 폐기물 발생 량 집계방법이 용적기준에서 중량기준으로 변경되어 자료 를 활용하는데 제한이 있었다. 또한 1995년부터 쓰레기 종 량제가 도입되어 생활폐기물 발생량이 이를 기점으로 크 게 줄어들었다. 그러므로 1996년부

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

강창훈

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

RNN & NLP Application

BSC Discussion 1

BH의 아이폰 추천 어플

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

기업은행현황-표지-5도

<32392D342D313020C0FCB0C7BFED2CC0CCC0B1C8F12E687770>

슬라이드 1

레이아웃 1

PowerPoint 프레젠테이션

160322_ADOP 상품 소개서_1.0

untitled

I

SchoolNet튜토리얼.PDF

빅데이터_DAY key

레이아웃 1

KDTÁ¾ÇÕ-2-07/03

보험판매와 고객보호의 원칙

TIMELINE 독창적인 아이템의 완성은, 아프리카TV BJ 활동에서 STATE 6월 팀 빌딩 2013년 10월 카이트창업가재단 투자 0.5억 원 엔젤투자매칭펀드 0.5억 원 노바토 설립 직원 5명 2013년 9명 2014년 1일 평균 메시지 발생 건수 2014년 10

산업백서2010표지

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: * Suggestions of Ways

남서울대(2006겨울)-PDF


서강대학교 기초과학연구소대학중점연구소 심포지엄기초과학연구소

Print

I. 2

??윕햳??

2007

<453A5C736F6E67616D656E675CBBE7BFEBBCB3B8EDBCAD26C4ABB4D9B7CF2E2E2E>


¸ðÅä·Î¶ó ÃÖÁ¾ÆÇ.PDF

R을 이용한 텍스트 감정분석

PowerPoint 프레젠테이션

아버지의 이름으로 고 정성철 소방령 자녀 예술경영전공 정비담 씨 소방공무원 국가직 촉구 1인 시위 지난 9월 27일 한 청년이 돌아가신 아버지의 정복을 입고 서울 광화문광 장에서 1인 시위를 벌였다. 이 청년은 지난 7월 광주에서 헬기 추락 사고로 순직한 고 정성철 소

1.,..,..,..,.,.,,.

2015

국토정책Brief_제238호_이동우_0730_02.hwp

Transcription:

ETRI, Kim Kwihoon (kwihooi@etri.re.kr)

1 RL overview & RL 에주목하는이유? 2 RL Tech. Tree 3 Model-based RL vs Model-free RL 4 몇가지사례들 5 Summary 2

AI Framework KSB AI Framework BeeAI,, Edge Computing EdgeX,, AI System Kim Kwihoon Data Scientist/AI Expert? Industrial Solution (DNA) AI Industrial Solution Smart Construction, Network Control, Traffic light Management, Building Energy Control, Plant Safety Control, Health Alarm prediction,,, Classical ML SVM, DT, Genetic ALG,, DL/RL MLP, CNN, LSTM, GAN, TL, DA, Deep RL,, AI Algorithm ETRI Researcher KAIST Ph.D (Major: AI) ITU-T SG11 Rapporteur AI 프렌즈 Operator Co-worker Major Co-worker 원자력연, 표준연, 에너지연 SKT 미래전략, 삼성전자, HECAS,FISYS, 씨엘, 엔비엘, 비젠트로, 여의시스템등 28 개업체 KAIST, 중앙대, 한기대 3

4

MDP 환경 environment partially observable state 상태 (state) observation 행동 (action) 에이전트 agent * 강화학습이란무엇인가? 이정원, 김승현 5

1. 진정한인공지능의가능성 강화학습은지도학습과는달리에이전트가존재합니다. 에이전트는주어진환경에서스스로행동을선택하며학습에필요한데이터를모읍니다. 학습을하기위해새로운정보가필요하다면에이전트는 exploration 을할것입니다. 이미충분히환경을탐험했다면주어진데이터에대해서 exploitation 을할것입니다. 사람도새로운환경에서무엇인가를배울때스스로데이터를수집하면서학습합니다. 따라서강화학습은지도학습보다는조금더사람의학습방법에가깝다고말할수있습니다. 강화학습의중요한특징중하나는경험을통해학습한다는것입니다. Trial & error 라고도부르는이방법은직접시도를한다는것이독특합니다. 강화학습에이전트가시도를통해혹은경험을통해학습하기때문에비효율적이라는단점이있습니다. 하지만이런특성은동물의자연스러운학습방법을닮아있습니다. 강화학습이현재는당장비효율적인면이많지만앞으로발전할수있는면도많습니다. RLKorea 운영진은미래에투자한다는개념으로강화학습을공부하고있습니다. * RLKorea 운영진의의견 6

2. 강화학습논문의양증가 딥러닝분야에서유명한국제학회는 ICLR, NIPS, ICML 이있습니다. 최근에 Harvard NLP 에서 2018 년, 2019 년 ICLR 에제출한논문을분석했습니다. 아래첫번째그림은 2018 년 ICLR 에제출된논문이고분야별로몇개의논문이제출되었는지를보여줍니다. 무수히많은논문이쏟아지는 GAN 보다도더많은논문이제출된것을볼수있습니다. 두번째그림은 2019 년 ICLR 에제출된논문을보여줍니다. 흥미로운점은 GAN 의논문수는줄어든반면강화학습의논문수는늘었다는것입니다. * RLKorea 운영진의의견 7

3. 인공지능선도기업의활발한연구 현재인공지능분야는거대한 IT 기업들이선도해가고있습니다. 구글, 페이스북, 마이크로소프트, OpenAI 에서많은딥러닝논문을출판하고있습니다. 특히 DeepMind 와 OpenAI 에서수많은강화학습논문을내고있습니다. FAIR(Facebook AI Research) 와 Microsoft Research 에서도꾸준히강화학습논문을내고있습니다. 학계가아닌기업에서활발히강화학습을한다는사실을보면강화학습은미래가밝은기술이라고생각할수있습니다. 또한점점다양한 application 에적용한논문이나오는것을보면강화학습이적용되는범위가넓어지고있다는것을알수있습니다. * RLKorea 운영진의의견 8

9

알파고의후예들 : 알파고 Fan, Lee, Master, Zero (2017.10.) 알파 Zero : 바둑말고다른게임에적용가능한알파 Zero (2018.01.) 알파 Fold : 단백질 3 차구조를예측하는알파폴드, 단백질구조예측학술대회 (CASP) 우승 (2018.12.) 알파스타 : 스타크래프트대결 10:1 승리 (2019.01.) 10

11

4. 각도메인의문제를풀기위해 딥러닝은크게 Vision, NLP, Sound 와같은도메인으로나눌수있습니다. 강화학습은게임, 제어, 자연어처리, 비전, 추천, 최적화로나눠볼수있습니다. 각도메인에속한엔지니어는그도메인의문제를풀기위해다양한기술을사용합니다. 1, 2, 3 에서말한이유가아닌현재직면하고있는문제를풀기위해강화학습을공부해야하는경우가있습니다. 각도메인별로간단히예시를들어보겠습니다. 1) 게임. 대전게임에서상대해주는에이전트. 게임레벨컨트롤 2) 제어. 차량의거동결정 ( 차선을바꾸고싶은지, 핸들을틀고싶은지 ). 공장로봇자동화. 사람의업무를보조하는로봇. 의수나근육보조로봇. 서비스로봇 3) 자연어처리. 챗봇의좀더자연스러운대화 4) 비전. Object tracking. Segmentation 보조하는에이전트 5) 추천. 실시간으로사용자의상황에따라추천 ( 피드추천, 광고추천 ) 6) 최적화. 데이터센터에너지최적화. 최적설계. Task scheduling. Neural Architecture Search * RLKorea 운영진의의견 12

https://planspace.org/20170830-berkeley_deep_rl_bootcamp/ 13

https://stevenschmatz.gitbooks.io/deep-reinforcement-learning/content/ 14

* OpenAI 의주요알고리즘여행및적용사례소개, 플랜아이차금강 15

What is the difference between model-based and model-free reinforcement learning? https://www.quora.com/what-is-the-difference-between-model-based-and-model-free-reinforcement-learning 16

https://www.quora.com/what-is-the-difference-between-model-based-and-model-free-reinforcement-learning 17

https://www.quora.com/what-is-the-difference-between-model-based-and-model-free-reinforcement-learning 18

Littman, MLSS 2009 19

Littman, MLSS 2009 20

Littman, MLSS 2009 21

22

NIPS2017, Tutorial 23

NIPS2017, Tutorial 24

David silver, lecture note 25

David silver, lecture note 26

David silver, lecture note 27

David silver, lecture note 28

David silver, lecture note 29

David silver, lecture note 30

David silver, lecture note 31

ICRA 2018 Spotlight Video https://www.youtube.com/watch?v=g7lxiuec8x0&feature=share 32

33

34

35

ICLR 2018 https://www.youtube.com/watch?v=j-3nukzmfa8&feature=share 36

37

38

39

40

41

Google DeepMind https://deepmind.com/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-40/ 42

ETRI KSB 융합연구단 + 한기대 43

44

NIPS2017, Tutorial 45

대덕연구단지를 AI 메카로 ~ 대한민국을 AI 메카로 ~ 46

ETRI, Kim Kwihoon (kwihooi@etri.re.kr) 47