Kaggle 이란? 2010 년설립된빅데이터솔루션대회플랫폼회사 2017 년 3 월구글에인수 2

Similar documents
PowerPoint 프레젠테이션

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

<FEFF E002D B E E FC816B CBDFC1B558B202E6559E830EB C28D9>

WS12. Security

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

09 ½ÅÇù3¿ùb63»ÁöÃÖÁ¾FFš

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

Ch 1 머신러닝 개요.pptx

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

PowerPoint 프레젠테이션

KD hwp

슬라이드 0


빅데이터_DAY key

PowerPoint 프레젠테이션

untitled

BOK°æÁ¦¸®ºä-2-2È£

R을 이용한 텍스트 감정분석

KAKAO AI REPORT Vol.01

# E-....b61.)

PowerPoint Presentation

PowerPoint 프레젠테이션

본문-4도시작***

다중 곡면 검출 및 추적을 이용한 증강현실 책

(JBE Vol. 24, No. 1, January 2019) (Special Paper) 24 1, (JBE Vol. 24, No. 1, January 2019) ISSN 2287-

Megazone-ML-v2

4 : (Hyo-Jin Cho et al.: Audio High-Band Coding based on Autoencoder with Side Information) (Special Paper) 24 3, (JBE Vol. 24, No. 3, May 2019

09 ½ÅÇù2¿ùÈ£b63»ÁöÁ¤¸»ÃÖÁ¾š

<28C3D6C1BE3129C0DAC1D6C7D020C1F6B5B5BCAD28C3CAB5EEC7D0BBFDBFEB292E687770>

슬라이드 1

Delving Deeper into Convolutional Networks for Learning Video Representations - Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arXiv:

야쿠르트2010 9월재출

Disclaimer IPO Presentation,. Presentation...,,,,, E.,,., Presentation,., Representative...

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 29(7),

<C0CFBABBB0FCB1A4BCD2BAF1C0DAC1B6BBE7BAB8B0EDBCAD2E687770>

23_Time-Series-Prediction

4 : CNN (Sangwon Suh et al.: Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset) (Regular Paper) 23 6, (J

15_3oracle

야쿠르트2010 3월 - 최종

PowerPoint 프레젠테이션

김기남_ATDC2016_160620_[키노트].key

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

p. 10 Before You Read p. 26 Understanding the Story ( ).,.,..,,...,...

데이터 시각화

16회말하기

<35B9DAC1F6BCF62CC0CCBFECC8C62CB7F9B5BFBCAE2E687770>


.

Data Scientist Shortage

_KF_Bulletin webcopy


Page 2 of 5 아니다 means to not be, and is therefore the opposite of 이다. While English simply turns words like to be or to exist negative by adding not,

목차도비라

gcp

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

농심-내지


사무엘하 적용

untitled

PowerPoint 프레젠테이션

사회통계포럼

본문01

Data Industry White Paper

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

08년csr3호


Pattern Recognition

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

서현수


이베이를 활용한 B2C 마케팅_한국무역

<5BBEE7BDC42D315DC0DBC7B0B0B3BFE42DC3BBC1D6BDC35FB8B6C1F6B8B7BFACB8F82E687770>

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

Reinforcement Learning & AlphaGo

PowerPoint Presentation

대우증권인-08표지재출

[로플랫]표준상품소개서_(1.042)

untitled

PDF_Compass_32호-v3.pdf

ICT03_UX Guide DIP 1605

ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE (Online Upgrade) ORANGE CONFIGURATION ADMIN O

슬라이드 1

하반기_표지

PowerPoint 프레젠테이션

71816 감사해 복음성가 주여 이 죄인이 복음성가 감사함으로 그 문에 복음성가 파송의 노래 복음성가 괴로울 때 주님의 얼굴 보라 복음성가 하나님은 너를 지키시는 자 복음성가 고난의 길 복음성가 73370

는 우연히 안나를 알게 되고, 이후 두 사람은 서로 격렬한 사랑에 빠진다. 결국 안나가 브 론스키의 아이를 임신하게 되자, 브론스키는 안나가 카레닌과 이혼하고 자기와 함께 새로 운 생활을 하길 바라지만, 안나는 아들 때문에 망설인다. 한편, 카레닌은 브론스키를 사랑 한

PowerPoint 프레젠테이션

공연장

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

치밀한 시간 계산으로 한 치의 오차 없이 여행일정을 계획하지만, 상황이 항상 뜻대로 돌 아가지는 않는다. 인도에서는 철로가 끊겨 있기도 하고, 미국에서는 인디언의 공격을 받 기도 한다. 하지만 그는 항상 침착하고 냉정한 태도를 유지하며, 때로는 일정에 차질이 생 겨도

Stage 2 First Phonics

UDP Flooding Attack 공격과 방어

Artificial Intelligence: Assignment 3 Seung-Hoon Na November 30, Sarsa와 Q-learning Windy Gridworld Windy gridworld는 (Sutton 교재 연습문제 6.5) 다음

논문제출양식

PowerPoint 프레젠테이션

Microsoft Word - Automap3

2016년 트렌드 책목차를 활용한 시장 예측.numbers

Transcription:

Kaggle 에서얻을수있는건? 이유한 카이스트생명화학공학과 Prof. Jihan Kim 분자시뮬레이션실험실 (Molecular Simulation Laboratory) 1

Kaggle 이란? 2010 년설립된빅데이터솔루션대회플랫폼회사 2017 년 3 월구글에인수 2

Data Race for 데이터과학자! 기업, 정부기관, 단체, 연구소, 개인 Dataset With Prize Dataset & Prize 개발환경 (kernel) 커뮤니티 (follow, discussion) 전세계데이터사이언티스트 3

참가하려면? 4

Kaggle 에서 competition 을주최한단체, 기업들 5

여러 competition 들 $25,000 $25,000 $1,500,000 $30,000 6

여지껏다뤄본것이 IRIS dataset, MNIST 뿐인데 저런걸어떻게분석해야하나? 7

공부해서함께나누자! 고수의발자취를 따라가자 모방은창조의시작 8

공부해서함께나누자! 캐글속선순환 다른이의커널 ( 소스코드와상세 한설명이담긴데이터분석 보고서 ) 을공부한다 내커널을 수정한다 내커널을만든다 Discussion 참고한다 피드백 받는다 9

커널을살펴봅시다! 10

My kaggle story 작년 7 월부터시작 커널 3 번씩따라하기시작 필사 ( 必死 ) 적으로필사 ( 筆寫 ) 하자!! 11

Titanic competition Can you predict survival? 12

Titanic competition Study with voted kernels! 13

My 1 st kaggle race 추석연휴와바꾼컴퍼티션! 약 60 만명의정보를가지고머신러닝알고리즘을만들어, 40 만명의개인이향후에보험을계속사용할것인지예측하라 14

My 1 st kaggle race Learning the kernels 15

My 1 st kaggle race Making my own kernel 16

My 1 st kaggle race Congratulation! 17

My 1 st kaggle race 따뜻한스승님 18

My 1 st kaggle race 은하계고수의가르침 19

My 1 st kaggle race 은하계고수의가르침 20

My 1 st kaggle race 1 st rank grandmaster! 21

My 1 st kaggle race Comment to authors 22

My 1 st kaggle race 친절한올리비에아저씨 23

My 1 st kaggle race Get insight from discussion 24

My 1 st kaggle race Submission 25

My 1 st kaggle race After competition 26

My 1 st kaggle race 결과물 41 개주피터노트북생성!!!! 27

My 1 st kaggle race 배운것들 v 데이터분석에서머신러닝모델생성및예측까지이어지는프로세스경험 v 각종데이터분석라이브러리사용법습득 v Visualization v Matplotlib, seaborn, plotly v Data analysis v Pandas v Numpy v Machine learning v Sklearn v 머신러닝노하우 v 학습방법 v Stratified, shuffle v Ensembling v Voting, average v 모델평가방법 v Precision, recall, f1-score, accuracy, AUC v 영어공부 v 커널쓰기, 질문, 응답하며 writing 공부 v 머신러닝모델습득 v Sklearn 내장알고리즘들 v Randomforest v Xgboost v Lightgbm v Hyper parameter tunning 방법 v Gridsearch v Randomsearch v Baysian optimization 28

My 2 nd kaggle race Tensorflow competition Dataset: 65,000 개의 word audio file Prize : 1 st - $8,000 2 nd $6,000 3 rd $3,000 + spectial price $8,000 Yes, no, up, down, left, right, on, off, stop, go, silence, others 로이루어진단어들을구별하는 AI 를만들어달라! 29

My 2 nd kaggle race Money is good motivation! 국내모기업에서후원하여 + prize 추가됨 친한사람들 3 명과팀을맺고시작 30

My 2 nd kaggle race 딥러닝한번공부해보자!! 그외여러깃허브들! stackoverflow 31

My 2 nd kaggle race 캐글에서공부하자! 기본 3 번, 내것으로될때까지반복 32

My 2 nd kaggle race 배운것들 v v v v Audio processing v Spectogram Deep learning v Convolutional neural network(cnn) v 1D, 2D v Recurrent neural network v LSTM v GRU Deep learning tools v Tensorflow v Keras Deep learning technique v Data augmentation v Parameter tunning v tensorboard 33

My first research topic using deep learning - Time series data 에특정 signal(outlier) 를판별하는 neural net 을만들어보자! Tensorflow competition 에서배운 spectrogram + 2D CNN 을사용해보자! 34

My first research topic using deep learning 잘! 안! 됨! ^^( 정신승리..) 35

My first research topic using deep learning Anomaly detection 문제로끌어가볼까? Credit card transaction data 에있는 Fraud(outlier) detection Time series 에있는 Outlier detection 커널공부시작 36

My first research topic using deep learning Autoencoder 를활용한 비지도학습 정상데이터만 Autoencoder 에학습시킴 학습된 neural network 에비정상데이터를주기 Error(reconstruction error) 가나옴. - How far an abnormal is from the normal regions 정상데이터와비정상데이터가잘구분되는 threshold 선택 37

My first research topic using deep learning 잘! 됨! For now ^^( 졸업.. 각?? ㅠㅠ ) 38

캐글에서뭘얻을수있나? MNIST 해보셨나요? 다른데이터는요? MNIST 처럼다될거 같죠?? 후훗? 39

캐글에서뭘얻을수있나? Story with graph 3 10 2 4 9 멘탈 1 5 7 8 6 시간 1. 지식 데이터사이언스전반, 머신러닝, 딥러닝 2. 경험 수많은분야의잘정리된데이터 3. 희망 머신러닝, 딥러닝이짱이다. 상금으로소고기 + GPU! 40

캐글에서뭘얻을수있나? Story with graph 3 10 2 4 9 멘탈 1 5 7 8 6 시간 4. 좌절 왜내 leaderboard 는안오르지? 왜항상모르는것만? 5. 실패 하.. 왜잘안되지? 문제는모델인가나인가? 6. 절망 내가잘모르나..? 괜히.. 시작했나? 41

캐글에서뭘얻을수있나? - 공부, 공부, 공ㅂㅜ.. 공.. 부.. 3 10 멘탈 1 2 4 5 7 8 9 6 시간 7. 해탈 아! 원래쉬운게아닌거구나. Abnormal is normal! 8. 노력 부지런하고, 부지런하고, 부지런히공부하자 9. 실력 이제커널도만들고, 랭킹도올라가네? 10. 취직, 졸업, 논문, 성과 소고기사먹자, GPU 사자! 42

데이터가모두를부요케하리라 월드컵우승어느나라가할까요? 데이터사이언스, 머신러닝 ( 딥러닝 ) 으로우승국예측해봅시다. 어떤정보가필요할까요? 대표팀선수평균신장 우승횟수 16 강진출횟수 프리미어리그선수숫자 평균패스성공율 축구협회청렴도 대표팀선수들비빔면선호도 대표팀선수들출신지역 대표팀선수들출신지역의운동장수 43

문제를내봅시다. 문제정하기 데이터수집 Domain knowledge 가장중요!!!! 데이터존재 문제정하기 데이터분석 데이터분석 모델만들기 ( 예측, 군집, 강화학습 ) 모델만들기 ( 예측, 군집, 강화학습 ) 44

왜캐글해야하는가? 캐글에서다양한 데이터셋을경험하며 문제의식을키우자! 45

부지런하고, 부지런하고, 부지런히공부하자! 캐글코리아 Kaggle Korea 함께공부해서, 함께나눕시다 Study Together, Share Together http://kaggle-kr.tistory.com/ https://www.youtube.com/channel/uc-- LgKcZVgffjsxudoXg5pQ 46

캐글합시다! 47