슬라이드 1

Similar documents
BSC Discussion 1

CONTENTS

김기남_ATDC2016_160620_[키노트].key

전국시대, 위나라최고의소잡이포정의소를잡는솜씨가신의경지에다다름,. " ()., 3... (),. 1.,. 19..,. 19. < > 2

인디쓔피-IOM핸돜벁닄큐1014pdf, page Preflight ( IOM핸돜벁닄큐__1014 )

Additive Manufacturing (AM) & 3D Printing? 3D 프린팅시장개요 정의 3 차원데이터를활용하여소재의연속적인적층공정을통해 3 차원의입체물을제조하는기술로정의되며 ASTM 에서 Additive Manufacturing(AM) 용어로표준화됨 3D

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

PowerPoint 프레젠테이션

<FEFF E002D B E E FC816B CBDFC1B558B202E6559E830EB C28D9>

DW 개요.PDF

쿠폰형_상품소개서

공급 에는 3권역 내에 준공된 프라임 오피스가 없었다. 4분기에는 3개동의 프라임 오피스가 신규로 준공 될 예정이다.(사옥1개동, 임대용 오피스 2개동) 수요와 공실률 2014년 10월 한국은행이 발표한 자료에 따르면 한국의 2014년 경제성장률 예측치는 3.5%로 지

정보기술응용학회 발표

Yggdrash White Paper Kr_ver 0.18

ePapyrus PDF Document

PART

Part Part

½ºÅ丮ÅÚ¸µ3_³»Áö

272*406OSAKAÃÖÁ¾-¼öÁ¤b64ٽÚ

£01¦4Àå-2

006- 5¿ùc03ÖÁ¾T300çÃâ

170

텀블러514

소식지도 나름대로 정체성을 가지게 되는 시점이 된 거 같네요. 마흔 여덟번이나 계속된 회사 소식지를 가까이 하면서 소통의 좋은 점을 배우기도 했고 해상직원들의 소탈하고 소박한 목소리에 세속에 찌든 내 몸과 마음을 씻기도 했습니다. 참 고마운 일이지요 사람과 마찬가지로

Intra_DW_Ch4.PDF

WS2012_r2_À¥ÃÖÁ¾

<BACFC7D1B3F3BEF7B5BFC7E22D3133B1C733C8A BFEB2E687770>


13 Who am I? R&D, Product Development Manager / Smart Worker Visualization SW SW KAIST Software Engineering Computer Engineering 3

<30312DC1A4BAB8C5EBBDC5C7E0C1A4B9D7C1A4C3A52DC1A4BFB5C3B62E687770>

2

내지출력

(, sta*s*cal disclosure control) - (Risk) and (U*lity) (Synthe*c Data) 4. 5.

2

장기계획-내지4차


2

zb 2) zb3) 나 위 시와 보기의 공통적인 표현 방법이 아닌 것은? 뻐꾹새야 뻐꾹새야 뻐꾹뻐꾹 울어 주면 < 보기> 고개를 넘어서 마을로 뻐꾹새야 뻐꾹새야 뻐꾹뻐꾹 울어 주면 밭을 매는 우리 엄마 허리 허리 덜 아프고 ᄂ밭을 매는 우리 엄마 허리 허리 덜 아프고

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

공급 에는 권역에 두개의 프라임 오피스가 준공 되었다. 청진구역 2,3지구에는 광화문 D타워가 준공되어 대림에서 약 50%를 사용하며 나머지 50%는 임대마케팅을 진행 중이다. 메트로타워는 GS건설의 사옥에서 매각 이후 2013년 4분기에 리모델링을 시작하여, 에 완공

슬라이드 1

CSCP 국제공인자격증과정쿠폰제교육안내 SCM 센터 No part of this publication may be circulated, quoted, or reproduced for distribution outside the client organization wit

untitled


마리오와 소닉 리우 올림픽™

03-최신데이터

example code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for

2

DBPIA-NURIMEDIA

2

원거리 무역을 시행하는 데 성공했다. 영국은 이들 국가에 비해 상대 적으로 후발 주자였다. 문화적인 우월함으로 따진다면 당시 유럽 문 명의 중심이었던 프랑스에 앞서지 못했다. 영국의 귀족들도 상류 사 회의 교류를 위해서는 프랑스어를 사용할 정도였다. 그런데도 왜 우 울

피해자식별PDF용 0502

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

º¸µµ¿Â

DIY 챗봇 - LangCon

VOL /2 Technical SmartPlant Materials - Document Management SmartPlant Materials에서 기본적인 Document를 관리하고자 할 때 필요한 세팅, 파일 업로드 방법 그리고 Path Type인 Ph

환 경 시 스 템 팀 김 유 승 권 영 덕 선 진 양 돈 PM 박 종 문 보 람 농 업 회 사 법 인 류 제 선 단 양 GGP 선 진 브 릿 지 랩 고 상 억 선 진 식 육 유 통 BU 이 장 근

<4D F736F F D20C3A520BCD2B0B32DC0CCB7B2B0C5B8E9B3AAB6FBBFD6B0E1C8A5C7DFBEEE322E646F63>

Overview Ensemble Model Director of TEAMLAB Sungchul Choi

15_3oracle

OP_Journalism

thesis-shk

APICS 컨퍼런스 수정 2

목차 1. CSCP란? 2. CSCP의필요성 3. CSCP 시험개요 4. CSCP 교육과정 5. CSCP 교육상세프로그램 6. CSCP 8기과정안내

R을 이용한 텍스트 감정분석

Data Industry White Paper

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

NATE CP 컨텐츠 개발규격서_V4.4_1.doc

nTOP CP 컨텐츠 개발규격서_V4.1_.doc

( )실험계획법-머리말 ok

# KM

위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판

여행기

#KM-235(110222)

<B0A3C3DFB0E828C0DBBEF7292E687770>

2


여자.PDF

양파 공동체 中 이제 들여보내 다오. 나는 쪼개지고 부서지고 얇아지는 양파를 쥐고 기도했다. 도착하면 뒷문을 열어야지. 뒷문을 열면 비탈진 숲, 숲을 지나면 시냇물, 굴러 떨어진 양파는 첨벙첨벙 건너갈 것이다. 그러면 나는 사라질 수 있겠다. 나는 때때로 양파에 입을

- 1 -

´º½º·¹ÅÍ2¿ùÈ£

Macaron Cooker Manual 1.0.key

연구실안전사례집-내지

#KM-250š

PowerPoint 프레젠테이션

KM-380BL,BLB(100908)

[ 건강보험가입자소득재산상관성분석 ] 국외출장보고 최현수 ( 정보통계연구실사회보장통계센터 ) - 1 -

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a


PPT 문서 가로양식

2

02( ) SAV12-19.hwp

PowerPoint 프레젠테이션

대학교육151호-합침

untitled


PowerPoint 프레젠테이션

#KM-350AB..

1

Part.1 당뇨병 관리의 첫걸음, 당뇨병 알기 당뇨병이란? 당뇨병의 원인은 무엇일까? 당뇨병의 종류 당뇨병의 증상과 진단 당뇨병의 치료 12 Part.2 당뇨병과 식사관리 당뇨병과 올바른 식사 23 2.

Transcription:

Auto ML 과 XAI 를위한 H20 Driverless AI 소개 애자일소다컨설팅사업본부이동훈전무 2018.04

1. Intro 2. DAI 주요기능소개 & Demo 3. 결언

What are Auto ML & XAI?

데이타분석관련한기업의고민은 CIO 마케팅팀장 분석가 / 팀장 AI 나 ML 관련해서우리직원들의역량을어떻게끌어올려야할지? 이번에구축한시스템은우리직원들만의역량으로안정화와운영이가능할까? 매번똑같은변수말고새로운관점의변수를찾을방법은없을까? 그리고 time to market이중요한데좀더신속하게모델을 test 해볼수는없을까? 변수변환을해야하는데, 데이터항목만 300개가넘는다. 어떤변수를, 어떻게변환하는게효과적인가? 1차 filtering 만해줘도... 파생변수는어떡하지 DL 알고리즘을적용하여기존의캠페인타겟모델보다설명력이높은모델을 만들었다. 그런데개발한스코어에대한설명이어려워관련팀과바로실행에 옮기지못하고있다. 여러가지알고리즘 (Random forest, 의사결정나무, GBM 등 ) 의분석결과를 비교하면서볼수는없을까?

H2O Driverless AI Auto ML ( 자동화기계학습 ) explainable AI(XAI, 해석가능한 A1) : 2017 년 H2O 위치

DAI 의핵심기능 1. Automated data visualization 버튼한번 click 으로시각화자동화 2. Automated feature engineering 데이타변환및파생변수생성자동화 * 최적모델자동생성 (hyper-parameter 자동 tuning) Ensemble(super learner) 모델링 3. Interpretability Decision Tree 결과, random forest 변수영향도및시각화결과 * 결측치, 표준화, 변환등

1. Intro 2. DAI 주요기능소개 & Demo - Data loading & automatic visualization - 분석 setting & 모델학습 - 결과해석 3. 결언

Demo: Dataset Dataset 내용 : 종업원의직장이탈과관련영향변수 * 데이터사이즈 : 15,000( 行 )*10( 列 ) 훈련 / 테스트 dataset (7:3) 변수 설명변수 종속변수 Left ( 직장이탈 ) Satisfaction_level ( 직장만족도 ) Last_evalution ( 평가 ) Number_project ( 프로젝트수 ) Average_monthly_hours ( 근무시간 ) Time_spend_company ( 근속년수 ) Work_accident ( 직장사고발생율 ) Promotion_last_5 years (5 년간승진여부 ) Sales ( 근무부서 ) Salary ( 급여 ) 출처 : https://www.kaggle.com/lnvardanyan/hr-analytics/data

Demo 순서 Demo 순서 Data loading & automatic visualization 2 분석 setting & 모델학습 결과해석 훈련 / 테스트 dataset loading 데이타 type 에따른자동시각화 (14 종 ) 모델분석조건 setting Automated featuring engineering 학습진행경과모니터링 모델결과해석 ( 원데이타 vs. 파생변수데이타 ) 대체모델연계해석 ( 예 : 변수중요도, 의사결정나무등 )

Automatic visualization 별도의추가코드작성없이 dataset 을다양한형태의그래프와차트로표현 의미파악이가능한형태로 data 의특이치와 trend 정보제공 Data 유형별로적합한시각화자동제공 Visualize click 으로 14 종의그래프가자동생성

Demo 1

1. Intro 2. DAI 주요기능소개 & Demo - Data loading & automatic visualization - 분석 setting & 모델학습 - 결과해석 3. 결언

손쉬운분석 setting 모델의정확도 (accuracy), 계산시간 (time), 설명력 (interpretability) 를 1~10 사이의값으로설정 분석모형 ( 예 : 분류, 수치등 ) 별적합한비교지표선택 2 1

직관적인성능 monitoring 직관적이고일목요연한모델학습성능 monitoring 학습진행단계에따른성능지표, 변수중요도, 작업경과, log 등실시간모니터링정보제공 작업경과 실험조건 Iteration 에따른성능 Iteration 별변수중요도성능차트

Automated feature engineering (1/3) 주어진 dataset 에서자동으로변수를변환하고새로운변수생성 신규생성된변수에대한변수중요도차트제공 첫번째 iteration 수행후변수중요도 11 번째 iteration 수행후변수중요도 ( 파생변수포함 )

Automated feature engineering (2/3) H2O driverless AI 에서지원하는 data transformation 1. Variable Transformation Skewed 분포를가진종속, 설명변수변환 예 : log(x), log(x+1), sqrt(x) 등 2. Feature Encoding 범주형변수를수치형정보로변환 예 : Labelled encoding, one hot vector encoding 등 3. Feature Interaction 새로운변수생성 ( 예 : x1 + x2)

Automated feature engineering (3/3) 근무시간, 프로젝트수, 5 년간승진여부변수를조합한반응평균값 * 사고유무, 근무시간, 프로젝트수등의조합한변수의빈도값 (encoding 처리 ) 조합변수 (5 년간승진여부, 급여, 근속변수 ) 의 WOE** * Out of the mean response ** Weight of evidence

Automated model generation Iteration 별 hyper-parameter 와 ( 파생 ) 변수선택현황정보정보 Iteration 별 hyper-parameter & 파생변수

Demo 2

1. Intro 2. DAI 주요기능소개 & Demo - Data loading & automatic visualization - 분석 setting & 모델학습 - 결과해석 3. 결언

Local Interpretable Model-agnostic Explanations (LIME) Black box 에대한설명시도 부분영역 (local) 과 model-agnostic( 모델무관 ) Black box! 부분 (Local) Model-agnostic 부분영역에설명가능한모델 출처 : M. T. Ribeiro, S. Singh, and C. Guestrin, "Why should i trust you?: Explaining the predictions of any classifier," in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016, pp. 1135-1144: ACM.

대체 (surrogate) 모델 LIME 을활용한다양한설명가능한대체모델 출처 : Patrick Hall, Wen Phan, and Sri Satish Ambati. Ideas on interpreting machine learning. O'Reilly Ideas, 2017. URL https://www.oreilly.com/ideas/ideas-on-interpreting-machine-learning

Interpretability 모형학습결과및관련의사결정나무, 변수중요도정보, 변수별값에따른영향도정보제공 결과비교 : 전체데이타셋 Vs. K 군집데이타비교지원 원변수 (original variable) 와파생변수 (derived variable) 에대한분석결과각각제공 Global (K-LIME) 차트 변수중요도차트 Random forest 분석결과연계 Decision Tree 결과연계분석 Decision tree 모델 Partial dependency 차트

Demo 3

AI in a Month! 복잡한고민없이 바로내옆에 2 시간이내에 Kaggle Grandmaster 수준의분석수행결과획득

Thank you 애자일소다 www.agilesoda.ai Copyright c 2077 by AgileSoDA This report is soly for the use of client personnel. No part of it may be circulated, quoted, or reproduced for distribution outside the client organization without prior written approval from AgileSoDA. This document provides an outline of a presentation and is incomplete without the accompanying oral commentary and discussion.