Megazone-ML-v2

Similar documents
PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

김기남_ATDC2016_160620_[키노트].key

KAKAO AI REPORT Vol.01

PowerPoint Presentation

Ch 1 머신러닝 개요.pptx

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

빅데이터_DAY key

!K_InDesginCS_NFH

Slide 1

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

±èÇö¿í Ãâ·Â

기술통계


Microsoft Word - 3부A windows 환경 IVF + visual studio.doc

Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 11 년 10 월 26 일수요일

Cloudera Toolkit (Dark) 2018

**더모바일05호_N0.8

170918_hjk_datayanolja_v1.0.1.

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

PowerPoint 프레젠테이션

IPAK 윤리강령 나는 _ 한국IT전문가협회 회원으로서 긍지와 보람을 느끼며 정보시스템 활용하 자. 나는 _동료, 단체 및 국가 나아가 인류사회에 대하여 철저한 책임 의식을 가진 다. 나는 _ 활용자에 대하여 그 편익을 증진시키는데 최선을 다한다. 나는 _ 동료에 대해

레이아웃 1

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

PowerPoint 프레젠테이션

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

SOSCON-MXNET_1014

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

gcp


Poison null byte Excuse the ads! We need some help to keep our site up. List 1 Conditions 2 Exploit plan 2.1 chunksize(p)!= prev_size (next_chunk(p) 3

슬라이드 1

4. #include <stdio.h> #include <stdlib.h> int main() { functiona(); } void functiona() { printf("hihi\n"); } warning: conflicting types for functiona

[Brochure] KOR_TunA

Chap 6: Graphs

더모바일창간호_1

PowerPoint 프레젠테이션

Getting Started

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

**더모바일04호_N0.7

**더모바일03호_N0.6

Á¤º¸º¸È£Áöħ¼�³»ÁöÃÖÁ¾

목 차 Ⅰ. 일반사항 1 Ⅱ. 특기사항 3 Ⅲ. 물품내역 및 세부규격 8 Ⅳ. 주의사항

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx

Secure Programming Lecture1 : Introduction

딥러닝 첫걸음

유니티 변수-함수.key

..,. Job Flow,. PC,.., (Drag & Drop),.,. PC,, Windows PC Mac,.,.,. NAS(Network Attached Storage),,,., Amazon Web Services*.,, (redundancy), SSL.,. * A

설계란 무엇인가?

SW¹é¼Ł-³¯°³Æ÷ÇÔÇ¥Áö2013

**더모바일10월호_N0.13

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오.

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

01 AI Definition 02 Deep Learning Theory - Linear Regression - Cost Function - Gradient Descendent - Logistic Regression - Activation Function - Conce

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1

Microsoft Word - 김완석.doc

HTML5* Web Development to the next level HTML5 ~= HTML + CSS + JS API

PowerPoint Presentation

PowerPoint 프레젠테이션

1부

°í¼®ÁÖ Ãâ·Â

확률 및 분포

기술개요 NVIDIA GPU CLOUD 딥러닝프레임워크 NVIDIA GPU Cloud 의최적화된프레임워크컨테이너가이드

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

컴퓨터과학과 교육목표 컴퓨터과학과의 컴퓨터과학 프로그램은 해당분야 에서 학문적 기술을 창의적으로 연구하고 산업적 기술을 주도적으로 개발하는 우수한 인력을 양성 함과 동시에 직업적 도덕적 책임의식을 갖는 IT인 육성을 교육목표로 한다. 1. 전공 기본 지식을 체계적으로

PowerPoint 프레젠테이션

Microsoft PowerPoint - ch07 - 포인터 pm0415

Contributors: Myung Su Seok and SeokJae Yoo Last Update: 09/25/ Introduction 2015년 8월현재전자기학분야에서가장많이쓰이고있는 simulation software는다음과같은알고리즘을사용하고있다.

aws

KIDI_W_BRIEF(제1호)_본문.hwp

_KrlGF발표자료_AI

지난 10월 6일과 12일

SECTION TITLE A PURE PRIMER (AI), // 1

00-Intro

00-CourseSyllabus

학습목표 함수프로시저, 서브프로시저의의미를안다. 매개변수전달방식을학습한다. 함수를이용한프로그래밍한다. 2

을풀면된다. 2. JDK 설치 JDK 는 Sun Developer Network 의 Java( 혹은 에서 Download > JavaSE 에서 JDK 6 Update xx 를선택하면설치파일을

PowerPoint 프레젠테이션

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

**더모바일11월호_N0.14

Agenda

( )부록

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

AI/DL Program

e-spider_제품표준제안서_160516

1. 자바프로그램기초 및개발환경 2 장 & 3 장. 자바개발도구 충남대학교 컴퓨터공학과

OCW_C언어 기초

Microsoft PowerPoint - chap01-C언어개요.pptx

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx

Microsoft PowerPoint - additional01.ppt [호환 모드]

게시: SWD

Microsoft Word _mentor_conf_output5.docx

Copyright IBM Corporation 2017 한국아이비엠주식회사 (07326) 서울시영등포구국제금융로10 서울국제금융센터 (Three IFC) TEL : (02) 년 2 월 Printed in Korea

<C5EBB1C73331C8A32838BFF9C8A329B9AEC8ADBFCD20B1E2BCFAC0C720B8B8B3B22E687770>

solution map_....

슬라이드 1

Egretia_White_Paper_KR_V1.1.pages

45호_N스크린 추진과정과 주체별 서비스 전략 분석.hwp

Transcription:

활용장점 학습모델개발자관점및비지니스 Time-to-market Jaehoon Lee

목차 I. 머신러닝 à 개발자관점 기본개념 약간의수학 약간의데모 모델개발자들의작업 II. 모델개발자생산성과비교 No coding. Fast deployment 비즈니스영역 SageMaker 란? 마무리

머신러닝은수집 / 저장 / 처리 / 분석 / 배포 / 활용단계를거쳐프로덕션되어집니다. 기본개념 데이터생성 수집처리분석 저장 결과활용

기본개념 데이터엔지니어들의역할이주로수집 / 저장그리고처리일부분에해당되며, 데이터사이언티스트들의역할은처리일부분부터분석및예측을하는부분을담당합니다. 오늘은이중에서처리 / 분석부분에대해서개발자입장을알아볼예정입니다. 데이터생성 수집처리분석 저장 결과활용

모델개발자들의작업에는다음과같이 7 가지단계가있습니다. 기본개념

모델개발자들의작업에는다음과같이 7 가지단계가있습니다. 기본개념

Preparing Data 실생활예측에적용하기위해서는데이터의가공및분류가사전작업으로선행되어야합니다.

Preparing Data 실생활예측에적용하기위해서는데이터의가공및분류가사전작업으로선행되어야합니다.

Preparing Data 실생활예측에적용하기위해서는데이터의가공및분류가사전작업으로선행되어야합니다.

Preparing Data 데이터의수정뿐만아니라학습과검증그리고테스트를위한데이터분할작업도선행되어야합니다.

Preparing Data 실생활예측에적용하기위해서는데이터의가공및분류가사전작업으로선행되어야합니다.

모델개발자들의작업에는다음과같이 7 가지단계가있습니다. 기본개념

Choosing a Model - 머신러닝의종류 다음세가지머신러닝중오늘은지도학습분야의분류 (classification) 를이용한예측을간단한예로설명드릴예정입니다.

모델개발자들의작업에는다음과같이 7 가지단계가있습니다. 기본개념

Linear regression Training - 선형회귀

모든데이터는평균값으로회귀하는통계적경향이있습니다. Training - 선형회귀

일차원직선입니다. 이간단한수식이모든딥러닝 /AI 의기본이됩니다. Training - 약간의수학공식

일차원직선입니다. 이간단한수식이모든딥러닝 /AI 의기본이됩니다. 약간의수학공식

Cost Function ( 비용함수 ) 약간의수학공식

약간의수학공식 위의식은아래와같은 2 차방정식그래프가나옵니다. 이것을구하는목적은우리가찾고자하는 W(weight) 값을찾기위함이고 2 차곡선의각지점에서의기울기가 0 이되는순간의값이가장정확한값이되기때문입니다.

Cost function 데모... ^^ 약간의수학공식 def cost(w, X, Y, b): num = len(x) loss = 0 for i in range(num): hx = W * X[i] + b loss += (hx - Y[i])**2 return loss / num x = [1,2,3,4,5] y = [1,2,3,4,5] weights, costs = [], [] for i in range(-30,51): w = i / 10 b = 0 c = cost(w,x,y,b) weights.append(w) costs.append(c)

약간의수학공식 그래서위의 Cost 함수값을간단히미분하면아래의결과식이나오며원하는답인지아닌지를알기위해원래의값에서순간변화율을빼서원하는값을얻습니다.

GradientDescent 약간의수학공식

GradientDescent 약간의수학공식

GradientDescent 약간의수학공식

GradientDescent 데모... ^^ 약간의수학공식 def gradient_descent(w, X, Y, b): num1 = len(x) gd = 0 for i in range(num1): gd += (W*X[i] - Y[i]) * X[i] return gd / num1 x = [1,2,3,4,5] y = [1,2,3,4,5] w = 10 b = 0 grad = 0 for i in range(10): grad = gradient_descent(w,x,y,b) w = w - grad * 0.01 print(w) plt.plot((0, 5), (0, w)) plt.plot(x,y,'ro') plt.show()

GradientDescent 를이용한아주간단한예측모델데모... ^^ 약간의수학공식 def gradient_descent(x, y, W): grad = 0 for i in range(len(x)): grad += (W*x[i] - y[i]) * x[i] return grad / len(x) x = [1, 2, 3, 4, 5] y = [1, 2, 3, 4, 5] W = 100 for i in range(100): loss = cost(x, y, W) grad = gradient_descent(x, y, W) W -= grad*0.1 # early stop if loss < 1.0e-15: break print('{:2} : {:.6f} {:.15f}'.format(i, W, loss))

Deep Learning Framework 딥러닝프레이워크종류 F/W 주체플랫폼모바일언어인터페이스 OpenMP CUDA OpenCL 멀티 GPU 분산 Caffe Chainer CNTK DL4J Keras MXNet TensorFlow Theano Torch BAIR Preferred Networks Microsoft SkyMind François Chollet DMLC Google Université de Montréal Ronan, Clément, Koray, Soumith Linux, Mac - C++ Python, MATAB Linux - Python Python - Linux, Windows Crossplatform (JVM) Linux, Mac, Windows Linux, Mac, Windows, Javascript Linux, Mac, Windows Linux, Mac, Windows Linux, Mac, Windows Y Y Y - Y - Y Y - C++ Python, C++ Y Y - Y Y Android Java Java, Scala, Python - Python Python Android, ios Android, ios C++ C++, Python C++, Python, Julia, MATLAB, JavaScript, Go, R, Scala, Perl Python, C/C++, Java, Go - Python Python Android, ios C, Lua Lua Y 출처 : Comparison of deep learning software https://en.wikipedia.org/wiki/comparison_of_deep_learning_software#cite_note-29 Y Y(Theano) N(TF) Y N Y Y Y Y Y Y Y - Y - Y - Y Y - Y Y - Y Y Y Y (Spark) Not officiall y

Tensorflow 로예측모델작성데모... ^^ 약간의수학공식

구축모델선택 실생활예측에적용하기위해서는데이터의가공및분류가사전작업으로선행되어야합니다.

실생활에서가장많이사용되는알고리즘은로지스틱리그레션 ( 분류 ) 라고합니다. 구축모델선택

구축모델선택 로지스틱리그레션의핵심은 Linear 한숫자들을 0 ~ 1 사의값으로압축시켜주는 sigmoid 함수에있습니다.

0 과 1 사이의값이되어야하는 Sigmoid 에대한그래프는아래와같습니다. 구축모델선택

실생활에서가장많이사용되는알고리즘은로지스틱리그레션 ( 분류 ) 라고합니다. 구축모델선택

Iris data one-hot-encoding 데모... ^^ 붓꼿종류구별 ( 예측 ) 하기 데모

Iris data one-hot-encoding 데모... ^^ 붓꼿종류별데이터 데모

Iris data one-hot-encoding 데모... ^^ 데모

목차 I. 머신러닝 à 개발자관점 기본개념 약간의수학 약간의데모 모델개발자들의작업 II. 모델개발자생산성과비교 No coding. Fast deployment 비즈니스영역 SageMaker 란? 마무리

은이러한기본적인프로그래밍을하지않고도우리가실생활중예측하고자하는예측값을얻을수있게해줍니다. Amazon

모델개발생산성은?? 머신러닝모델개발생산성은.?

모델개발생산성은?? 머신러닝모델개발생산성은.?

데모... ^^

데모... ^^

데모... ^^

데모... ^^

데모... ^^

데모... ^^

데모... ^^

데모... ^^

데모... ^^

데모... ^^

직접코딩을하면아래 Optimization 중에자신의데이터및알고리즘에가장적합한것을골라랴합니다. 그러나 은이를자동으로도와줍니다. 경우에따라득이될수도있고해가될수도있지만초보자입장에서는매우유리한옵션입니다.

머신러닝모델이개발된후프로덕션까지의생산성은.? 모델개발생산성은?? SageMaker

AWS SageMaker High Level API 실제로알고리즘을개발하는데이타과학자가아니라, 머신러닝을활용만하는프랙티셔너입장이라면, 모델을개발하는것보다는있는모델을선택해서쉽게사용할수있는방법을찾으면된다. estimator = TensorFlow(entry_point='resnet_cifar_10.py', source_dir=source_dir, role=role, training_steps=1000, evaluation_steps=100, train_instance_count=2, train_instance_type='ml.c4.xlarge', base_job_name='tensorboard-example')estimator.fit(inputs, run_tensorboard_locally=true)

AWS SageMaker 가장최근까지일반적인모델개발자들은단일머신에서모델을학습시키며많은시간을소모하는경우가많았습니다. Until recently most of the machine learning is done on single computer (with lots of memory 1 00s of GBs) Most R/Python/Java libraries are single node based Now Big Data tools make it possible to run machine learning algorithms at massive scale distribu ted across a cluster

SageMaker 데모... ^^ AWS SageMaker

AWS SageMaker Jupyter Notebook 만들기.. ( 인스턴스타입선택가능 / CuDA framework 및각종딥러닝 framework 설치불필요 )

Jupyter Notebook 는작은 t2 급인스턴스에만들어사용하는것이유리합니다. AWS SageMaker

Jupyter Notebook 만들기.. AWS SageMaker

학습시 (Training) 인스턴스모델갯수및종류를따로지정할수있습니다. AWS SageMaker

Jupyter Notebook 을이요하여모델개발후모델학습단계 AWS SageMaker

외부에서만들어진모델도쉽게 import.. AWS SageMaker

외부에서만들어진모델도쉽게 import.. AWS SageMaker

EndPoint 생성.. AWS SageMaker

Deploy 를위한 Endpoint 생성.. AWS SageMaker

대쉬보드를이용하여한눈에모니터링가능 AWS SageMaker

Q & A