분석주제및목적추진내용추진결과맺음말후기
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 1-3 사례조사및선행연구
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 인공지능 + 시뮬레이션 1-3 사례조사및선행연구 인공지능 다양한통계수치
분석주제및목적 1-1 선정배경및필요성 3 할 5 푼 7 리의평균타율을가진타자가이상황에서도저확률로안타를칠수있을까? 1-2 주요분석절차 1-3 사례조사및선행연구
분석주제및목적 1-1 선정배경및필요성 사용변수비교 1-2 주요분석절차 1-3 사례조사및선행연구 VS 다양한통계적변수들을사용지수나회귀식을구하는용도시뮬레이션시점수변화폭큼기계학습의경우 - 통계적변수만을활용 - 시뮬레이션에활용X 다양한상황별조건변수사용정적인통계수치가아닌매순간상황에따라변하는유동적수치사용가장현실에근접한시뮬레이션가능
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 1-3 사례조사및선행연구 4. 예측결과를토대로한경기시뮬레이션 3. 상황을학습할수있는분석체계마련 5. 최종결과도출및시각화
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 1-3 사례조사및선행연구 KBO 기록실 ( 선수기록 ) 출처 : https://www.koreabaseball.com/record/player/hitterbasic/basic1.aspx
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 1-3 사례조사및선행연구 선수기록출처 : http://www.kbreport.com/leader/main?rows=20&order=owar&ordertype=desc&teamid=&defense_no=&year_from=2017&year_to=2017&g ametype=&split01=&split02_1=&split02_2=&r_tpa_count=1000&tpa_count=1000#
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 시즌기록출처 : http://www.statiz.co.kr/stat.php 1-3 사례조사및선행연구
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 1-3 사례조사및선행연구 * 기존에국내야구데이터를기반한경기예측혹은시뮬레이션관련연구는활발히진행중. - 그러나팀별, 선수별요약된수치에기반 (KBO 기록실, SPORT2i) -> 경기의상황보다는선수나팀의지표 ( 계수개발 ) 에치중한기존선행연구 * 경기의상황을보고자한연구있었으나, 연구자가직접방송관전으로수기기록 / 수집 (253 건으로연구진행 ) -> 객관적인수집체계부족, 양적한계존재 경기자체를잘반영하는상황별데이터필요 + 일관된데이터기반연구필요
분석주제및목적 1-1 선정배경및필요성 1-2 주요분석절차 1-3 사례조사및선행연구 * 허준회, 정태충. (1998). 프로야구경기예측시뮬레이터에서의역전파알고리즘을이용한투수교체시기예측모듈개발. 한국정보과학회학술발표논문집, 25(1B), 237-239. -> 선수별통계 (1997 KBO) * 김지원, 박상현, 방성우, 김재광, 이지형. (2010). 의사결정트리를이용한야구경기라인업예측. 한국지능시스템학회학술발표논문집, 20(1), 93-95. -> 선수별통계 (2008 KBO) * 진승우, 김병철, 엄일규, 김영인. (2014). 데이터마이닝기법을이용한모바일야구투구예측게임프로토타입개발. 한국정보기술학회논문지, 12(2), 135-143. -> 사용 Data Set : 연구자방송관전기록 (253 건 ) * 오윤학, 김한, 윤재섭, 이종석. (2014). 데이터마이닝을활용한한국프로야구승패예측모형수립에관한연구. 대한산업공학회지, 40(1), 8-17. -> 선수별통계 (2013 KBO) * 신규식, 이홍철. (2014). R 프로그램을이용한한국프로야구의승리요인과패턴분석. 대한산업공학회춘계공동학술대회논문집,, 819-824. -> 선수별통계 (2013 KBO) * 김종훈, 김경태, 한종기. (2015). Deep Learning 기반기계학습알고리즘을이용한야구경기 Big Data 분석. 한국통신학회학술대회논문집,, 262-265. -> 팀별, 선수별기록 (1982-2015, K-ICT 빅데이터, KBO, SPORT2i) * 박대서, 김화종. (2016). 야구데이터분석을통한데이터축소방안연구. 한국통신학회학술대회논문집,, 244-245. -> 선수별기록 (2015 STATIZ) * 상의정, 정창권, 이하정, 한용구, 이영구. (2016). 야구기록과뉴스데이터를활용한타격예측모델. 한국정보과학회학술발표논문집,, 2020-2022. -> 선수별기록 (MLB 선수별종합 )
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과 타순 Home ( 삼성 ) 타순 Away ( 한화 ) 1 박해민 1 정근우 2 김상수 2 하주석 3 구자욱 3 송광민 4 러프 4 김태균 5 이승엽 5 로사리오 6 이정혁 6 이성열 7 김현곤 7 이동훈 8 정병곤 8 허도환 9 이지영 9 장민석
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과 타순 Home ( 삼성 ) 타순 Away ( 한화 ) 1 박해민 1 정근우 2 김상수 2 하주석 3 구자욱 3 송광민 4 러프 4 김태균 5 이승엽 5 로사리오 6 이정혁 6 이성열 7 김현곤 7 이동훈 8 정병곤 8 허도환 9 이지영 9 장민석
추진내용 2-1 목표및개념도 최적의변수를추출출루여부결정 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과 단두개의변수만사용 -> 데이터에따라주요변수추출불가선수마다출루여부를결정하기위한 Decision Tree를각각생성해야함
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 타자상대팀상대투수홈 / 어웨이선발타순이닝타순총투구수등 1 루타 2 루타 3 루타홈런볼넷아웃병살타 2-4 검증방법및결과 1 st layer Activation : Relu 1 st layer Dropout rate : 0.5 2 nd layer Activation : Relu 2 nd layer Dropout rate : 0.5 3 rd layer Activation : Relu 3 rd layer Dropout rate : 0.5 4 th layer Activation : softmax 실제상황 결과 타자 상대팀 상대투수 홈어웨이 선발타순 이닝타순 총투구수실제예측 민병헌한화배영수 Away 6 번타자 1 번타자 20 개미만아웃아웃 정수빈한화배영수 Away 5 번타자 2 번타자 20 개미만아웃아웃 김경언두산마야 Home 7 번타자 3 번타자 20 개미만볼넷 1 루타 주현상두산마야 Home 3 번타자 3 번타자 40 개미만 1 루타 1 루타 조인성두산마야 Home 2 번타자 4 번타자 40 개미만 1 루타 1 루타
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 Question Decision Tree N Deep Learning Y 2-4 검증방법및결과 N Y Y N N Y N Y N Y N Y
추진내용 사용데이터예시 (2015 년 03 월 12 일두산 vs 한화 1 회초두산공격 ) 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과
추진내용 사용데이터예시 (2015 년 03 월 12 일두산 vs 한화 1 회초두산공격 ) 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과 일자별저장 (YYYYMMDD_AWAY_HOME) TXT 파일 1 차테이블생성
추진내용 사용데이터예시 (2015 년 03 월 12 일두산 vs 한화 1 회초두산공격 ) 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 요청, 인정, 부정투구, 수비방해 등 2-4 검증방법및결과 2 차테이블생성 3 차테이블생성 ( 학습용 Data Set) 세부상황별분석용 Data Set 사용
추진내용 2-1 목표및개념도 사용변수 ( 상황 ) 설명 변수명변수한글명설명예시 PLAYER_NAME 타자명현재타석에선타자이름이용규 BATTING_HAND 타자구분타자의주사용타수구분좌 / 우타 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과 AGAINST_TEAM 상대팀명상대구단명칭한화 AGAINST_PITCHER 상대투수명상대구단의투수이름배영수 PITCHING_HAND 투수구분투수의주사용투수구분좌 / 우투 HOME_AWAY 홈 / 원정구분두산구단입장에서홈구장인지, 원정구장인지여부 AWAY/HOME PLAYER_ORDER 선발타순당일경기에서지명된타자의순서 1~9 번타자 INNING 이닝이닝상황 5 이닝 INNING_BATTING_ORDER 이닝별타순 1 이닝동안들어선타자의순번 1~10 번타자 OUT_CNT 아웃카운트현재아웃상황 0~2 아웃 DIFF_SCORE_GRP 점수차현재까지의경기의점수차 0,1/2,3/4,5/6,7/8 점차 (±) BAT_HIT 루타 1 개루상까지가기위해타격하는안타 0~15 CUM_PITCHING_CNT 투구수한투수가연속적으로던진공의수 20/40/60/80/100 HIT_OUT 출루구분 출루상황결과 1/2/3루타, 홈런, 볼넷, 아웃, 병살타아웃 예측할결과
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 Train on 44328 samples, validate on 18998 samples 2-3 사용데이터 2-4 검증방법및결과 0.8298 0.8638 69.41% 68.27%
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2 2-4 검증방법및결과 3 1 4 예측 : 출루 예측 : 아웃 9 회반복 실제결과와비교
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과
추진내용 2-1 목표및개념도 2-2 추천모형및변수선정 2-3 사용데이터 2-4 검증방법및결과
가상시나리오 1 < 실시간인공지능의사결정지원시스템 > 추진결과 3-1 활용시나리오 3-2 애로사항및한계점 3-3 향후개선사항 야구계의알파고를꿈꾼다!!
가상시나리오 2 < 스포츠토토추천시스템 > 추진결과 3-1 활용시나리오 3-2 애로사항및한계점 3-3 향후개선사항 토토를지배하라!!
가상시나리오 3 < 야구매니아층을위한족집게예언가 > 추진결과 3-1 활용시나리오 3-2 애로사항및한계점 3-3 향후개선사항 족집게예언가야스트라다무스!!
애로사항및한계점 추진결과 3-1 활용시나리오 3-2 애로사항및한계점 3-3 향후개선사항
향후개선사항 (1) 추진결과 변수의다양성 3-1 활용시나리오 3-2 애로사항및한계점 3-3 향후개선사항
향후개선사항 (2) 추진결과 3-1 활용시나리오 3-2 애로사항및한계점 3-3 향후개선사항
맺음말및후기 문어영표는예언자!? OR 분석가?