2015 가을학술대회 Society for Korean Baseball Studies 투수의 피로도가 피칭결과에 미치는 영향 (1/2) 신동윤 (야구학회 데이터분과 분과장) 공동작업 박두산 (야구학회 데이터분과)
개요 피로도가 피칭 퍼포먼스를 떨어뜨린다는 것에는 이론이 없다. 잘 쉰 투수는 연투에 지친 투수보다 더 잘던진다. 그럼에도 불구하고 리그에는 항상 혹사논란이 있다. 그런데 투수의 피로도가 선수보호 라 는 논제로 다루어질 경우, 팀의 성적과 선수의 미래라는 윤리적 차원의 갈등 또는 단기적 성과와 장기 적 성장 사이의 원론적 딜레마에 머물기 쉽다. 15시즌 준플레이오프 최종전, 넥센히어로즈는 9회 4점차 리드를 지키기 위해 조상우를 마운드로 올렸다 하지만 결과는 역전패였고 팀은 다음 시리즈 진출에 실패했다. 조상우는 팀의 불펜에이스였지만 동시 에 연투에 지친 투수였다. 벤치는 싱싱한 다른 대기투수가 아니라 지친 에이스를 선택했다. 그것이 더 나은 결과를 기대할 수 있다고 믿었기 때문이다. 우리는 투수의 피로도를 전략적 효율성 차원에서 다루고자 한다. 피로도가 높은 ERA 3.0 수준의 투수가 충분히 쉰 ERA 4.0 수준의 투수보다 더 나은 피칭을 할거라 기대하는 것은 합리적인가? 피로도 라는 조건을 고려했을 때 이 두 투수에게 기대할 수 있는 피칭 효율성이 역전되는 조건은 어디쯤인가? 우리는 다음과 같은 논제를 다룬다. 1. 투수의 피로도를 어떻게 측정하고 객관화할 수 있는가? 2. 투수의 피로도는 타석결과에 얼만큼의 영향을 미치는가? 얼마나 적은 실점 혹은 많은 실점을 초 래하는가? 3. 피로도가 높은 투수의 피칭에서는 메카니즘에 있어 어떤 변화와 차이가 관찰되는가? 이를 위해 2010-2015 6시즌 동안의 구원투수가 한 타석 이상 던진 3459경기 108615 타석 결과 데이터 와 2015년 트랙맨 시스템에 의해 측정된 152 경기 46268개 투구의 구종, 구속, 회전수, 피치밸류, 릴리 즈포인트, 무브먼트 등의 PitchFX 데이터를 검토한다.
이 문서는 11월16일 야구학회에서 발표했던 내용을 줄글로 정리한 것입니다. 발표는 크게 2010-2015 기간의 구원투수 등판 타석결과를 분석한 것과 2015년 5월 이후 잠실과 목동구장에서 열린 경 기에 대한 트랙맨 PitchFX 데이터를 분석한 것으로 구성되어 있는데 이를 둘로 나누어서 우선 피로도 조건에 따른 피칭결과 분석 부분 먼저 정리합니다. PitchFX 데이터를 분석한 부분은 2편에서 다시 정리할 계획이다. 다만 6시즌 타석결과의 분석에 비해 트랙맨 데이터의 분석은 다소 적은 갯수의 데이터만을 사용할 수 있었기 때문에 제약이 많이 있었고 명쾌한 시사점이나 결론까지 이르는데는 실패했음을 미리 자백해둡니다. 관심있는 분들의 자료요청에 대해 비공식적으로 정리한 문서라서 다소 섬세하지 못한 표현, 아마도 포함되어 있을 맞춤법 오류나 산수 레벨의 오표기 등에 대해서는 미리 앙해를 구합니다. * 트랙맨의 투구추적 데이터는 애슬릿미디어로부터 제공받았습니다. * 자료에 대한 다른 문의는 야구학회 데이터분과(분과장 신동윤 3onbase@gmail.com )으로 해주십시 요. * 분석결과의 공유를 가로막고 싶은 것은 아니지만, 혹시 발견될 오류의 정정 및 이후 추가 데이터를 이 용한 업데이트 버전의 유지를 위해 자료요청은 위에 밝힌 contact point를 통해주시길 부탁드립니다.
피로도의 기준은 무엇이 되어야 할까? 피로도의 기준이 될 만한 것들은 아마도 1)투구수 2)타석수 3)등판여부 셋 중 하나이다. 그리고 이 지 표들은 등판일에 따라 1일전 투구수/타석수/등판여부, 2일전 투구수/타석수/등판여부 와 같이 등판간격 차원으로 연장된다. 그런데 계량적인 측정을 목표로 할 경우 여기에 대한 판단은 좀 어렵다. 피로도의 측정기준으로 가장 널리 알려져있는 것은 빌제임스의 Closer Fatigue Index이다. 등판일 전 5 일 동안의 상대타석의 숫자를 이용하는 것이다. CFI = 1일전 타석수 *5 + 2일전 타석수*4 + 3일전 타석수*3 + 4일전 타석수*2 + 5일전 타석수*1 CFI는 다음과 같은 가정을 두고 있다. 1) 피로도는 타석수에 비례한다. 6명의 타자를 상대한 투수의 피로도는 3명의 타자를 상대한 피로 도보다 2배 높다. 2) 2일전 등판의 피로도는 1일전 등판의 피로도보다 5/4만큼 크다. 3일전 등판의 피로도 보다는 5/3만큼 크다. 그런데 이런 가정은 불확실하다. 6명의 타자를 상대한 피칭이 3명의 타자를 상대한 피칭보다 더 높은 피로도를 가지겠지만 그렇다고 2배만큼 큰 피로도라고 하기는 어렵다. 타석수가 아니라 투구수를 기준 으로 한다 해도 마찬가지이다. 전날 20개의 공을 던진 투수의 피로도가 10개를 던진 투수의 피로도보다 높긴 하겠지만 그렇다고 2배 만큼 높다고 말하긴 어렵다. 게다가 피로도를 가장 잘 설명하는 기준이 타석수인지 투구수인지 아니면 등판여부인지도 판단할 근거 는 아직 없다. 따라서 우리의 분석은 피로도의 정의를 명확히 하는 것에서 시작해야 한다. 타석수, 투구수, 등판여부 셋 중 어느 것이 피로도를 더 잘설명할 수 있다는 것을 판단하기 전에 --- 셋 중 어느 것이 당일 등판한 투수의 피칭결과에 어떤 영향을 미치는지 확인한 후 가장 분명한 상관관계를 가지는 것을 [피로도의 기 준]으로 삼는다.
피로도 측정기준의 결정 피칭결과에 미치는 영향이 가장 큰 것을 [피로도] 기준으로 삼는다고 할 경우. 무엇이 피칭결과인가? 라는 질문이 다시 생긴다. 우리는 [득점가치RunValue]를 기준으로 삼는다. 타율, 출루율, OPS 같은 것도 있겠지만 타석결과의 가치를 가장 객관적으로 표현하는 지표는 역시 RunValue이기 때문이다. 런밸류는 아웃, 볼넷, 몸맞공, 1루타, 2루타, 3루타, 홈런 각각의 상황중립적인 기대득점 증가 기여도로 계산한다. 아웃은 대략 -0.3점, 1루타는 +0.5점, 홈런은 +1.4점 정도인데 시즌의 득점환경에 따라 조금씩 달라진다. 톰탱고 에 의해 고안된 런밸류 by 기대득점 모델은 woba, WAR 등을 포함한 거의 모든 세이버메트릭스 평가지표의 기 준이 되고 있다. 이 분석에서는 위의 7종류 타격이벤트를 조금 더 세분화해서 모두 똑같은 득점가치로 계산하는 여러 종류의 아 웃을 범타아웃, 삼진아웃, 희생번트 3가지로 구분해서 계산할 것이다. [투구수, 타석수, 등판여부] by 등판간격[1일,2일,3일,4일,5일] 이 타석의 런밸류에 미치는 영향을 확인하 기 위해 다음의 회귀분석을 한다. 투구수/타석수/등판여부 각각에 대해 다음과 같다. y (타석결과의 가치) = a1x1 + a2x3 + a3x3 + a4x4 + a5x5 + c x1부터 x5까지는 1일전부터 5일전까지의 타석수 또는 투구수 또는 등판여부(0 or 1) (등판여부에 대한 회귀식일 경우는 a4x4 까지만) 회귀결과는 유효한 분석모델이 아니다 이다. 이것은 투구수, 타석수, 등판여부가 타석결과와 관련이 없다는 뜻은 물론 아니다. 분석모델이 적절하지 않다는 뜻이다. 이유는 1일전, 2일전 각각의 피로도 효 과가 서로 독립적이지 않기 때문으로 보이는데 이에 대한 해석은 뒤에서 다시 다룬다. 피로도 측정과 피로도 효과 분석모델 분석으로 위해 선택한 방법은, 가중치가 불분명한 투구수와 타석수를 고려하기 이전에 등판여부에 대한 가능한 경우의 수를 구분해서 해석하는 것이다. 다음과 같은 방법이다.
다섯자리의 0 또는 1로 구성된 스트링으로 최근 5일 동안의 등판여부를 표시한다. 첫자리가 전날 등판, 마지막 자리가 5일전의 등판이 되고 따라서 위와 같은 등판기록을 가진 투수의 5월19일 현재 등판조건 은 00101 (1이 등판, 0이 휴식)으로 표시한다. 최근 3 일 등판패턴에 따른 타석당 허용실점 변화 이렇게 하면 2010년부터 2015년까지 구원투수(2회 이후 등판한 투수)에게 기록된 10만 타석 정도의 타 석결과를 최근 3일 각 날짜의 등판여부 기준으로 8개의 그룹 또는 최근 5일 동안을 기준으로는 32개의 그룹으로 구분할 수 있다. 이들 각각의 타석당 득점가치는 다음과 같다. * 세로축은 등판조건에 따라 타석당 득점가치가 전체 평균에 비해 얼마나 크거나 작은지 나타낸다. 단 각 그룹 의 특성을 시각적으로 구분하기 쉽게 하기 위해 세로축을 avg(rva) 가 아 니라 avg(rva)-0.006 기준으로 변경 했다. 그래프 상에서 y=0 으로 표시 된 위치는 실제 값을 기준으로 하면 y = -0.006 에 해당하는 값이다.
왼쪽부터 D000 D001 이고 가장 오른족이 D111 이다. 즉 가장 왼쪽은 최근 3일동안 등판이 없었던 투 수, 두번째가 전날 등판했고 그 앞의 이틀동안 등판이 없었던 투수, 제일 오른쪽이 최근 3일동안 매일 등 판했고 당일 4연투째 등판이 투수이다. (이 값은 각 시즌의 9이닝당 평균득점을 5.0점으로 동일하게 조 정한 결과이다. * adjusted 타석당 득점가치 = 타석 당 득점가치 * (5.0 / 해당시즌 9이닝당 득점) 다만 4연투 케이스는 전체 10만개의 타석 중 매우 작은 비중인 269타석이기 때문에 그래프 상의 착시를 주의하기 위해 흐린 회색으로 표시했다. 이 그래프에서 y축의 최대값이 D111 의 값보다 작기 때문에 적확한 크기는 Bar 그래프에 붙은 데이터인덱스를 참조해서 확인하면 된다. 그래프의 크기는 타석에서 허용한 평균 런밸류를 뜻한다. 높은 것은 더 많은 실점을 허용한 것이고 낮 은 것은 반대다. 오른쪽이 더 높은 피로도로 예상하기 때문에 우상향하는 흐름은 직관적인 기대치와 비 슷하다. 하지만 명확하지 않다. 투수, 타자의 능력을 중립화시킨 순수 피로도 효과 추출 그런데 타석결과 즉 타석당 득점가치는 당연히 피로도 뿐 아니라 투수와 타자의 능력에 의해 휠씬 더 큰 영향을 받는다. 따라서 이를 제거해야 한다. 타석당 득점가치 RVA는 다음 3가 요인으로 설명된다. 타석당 득점가치 RVA = 타자의 능력 + 투수의 능력 + 피로도의 효과 타자의 능력과 투수의 능력을 타석당 득점가치와 같은 런밸류 스케일로 표시한 것이 각각 BRV 와 PRV 라고 할 경우 (여기서 PRV 는 상대 타자 매치업을 중립화한 조정 후의 값) 가 된다. RVA = BRV(타자의 시즌 타석당 RV) + PRV(투수의 시즌 타석당RV) + 피로도효과(최근 3일동안 등판패턴 8종류의 함수) BRV는 높을 수록 좋은 타자이고 PRV는 낮을수록 좋은 투수이다. BRV 0.2 인 타자는 타석당 0.2점의 득점생산 성을 가진다는 뜻인데, 이런 타자를 모든 타석에 내보낼 경우 9이닝당 타석수가 평균 40타석 정도이기 때문에 0.2 * 40 = 8점을 득점한다. BRV 에 9이닝당 타석수를 곱하면 RC나 XR, wrc에 해당하는 값이 된다는 뜻이다. 투수는 반대다.
RVA는 리그평균이 0이다. 평균RVA가 0인 경기는 리그평균득점 수준의 경기가 되며 분석에서는 이를 5.0 으로 조정했기 때문에 9이닝 동안 5점을 득점한 경기가 된다. 투수의 PRV가 -0.2 이고 타자의 BRV 가 +0.2 이면 경기 전체 누적 RVA = 0 이 되고 리그평균인 5.0점 득점한 경기가 된다는 뜻이다. 따라서 동등한 득점생산성(실점억제력)을 가진 타자와 투수가 9이닝을 맞설 경우 RVA 는 0 이 되고 9이닝당 득점은 리그평균수준이 된다. 하나의 타석에서 생긴 RVA에 대해 타자는 BRV가 +RVA 만큼 늘어나고 투수는 -RVA만큼 늘어난다. 그 리고 RVA는 리그평균값 수준에서 0이 되기 때문에, 전체 타석에 대해서 RVA = BRV + PRV 가 된다. 그런데 어떤 조건 에서 RVA=BRV+PRV 가 일치하지 않는다면, 어떤 조건 이 그 편차에 영향을 주고 있 다고 볼 수 있다. 따라서 최근 3일 등판패턴 8종류에 따라 구분된 split data에서는 RVA = BRV + PRV + [차이] 이 된다. 이 식은 투수와 타자의 능력이 조정된 조건에서 그에 일치하지 않는 나머지 효과가 얼마인지 측정하고 그것이 [피로도]와 어떻게 상관관계를 갖는지 파악할 수 있게 해준다. 이것을 전환하면 아래 와 같다. 피로도효과 = RVA - BRV - PRV + [최근 3일 동안의 8종류 등판패턴에 따른 영향] 그리고 피로도 효과가 중립일 때 (= 다른 요인이 영향을 주지 않았을 때) RVA = BRV + PRV RVA-BRV-PRV = 0 이다. 따라서 피로도 효과는 (8가치 피로도조건에서의 타석당 런밸류 전체 타석당 런밸류) 값으로 드 러나게 된다. 따라서 피로도 효과의 득점가치(RunValue) = f(d000에서 D111 에 따른 8가지 등판패턴) 이다.
이를 그래프로 표시하면 다음과 같다. * 이 그래프가 발표자료에서 오류가 있 었습니다. 그래프의 모양이 틀린 것은 아닌데, 그래프에 붙은 데이터인덱스가 (RVA-BRV-PRV) 로 갱신되지 않고, 앞의 RVA그래프에 붙어있던 값이 그대로 붙 어 있었습니다. 발표 후에 발견하고 정 정합니다. 왼쪽의 D000 부터 오른쪽의 D111 까지 비교적 매끈한 상승 추세를 볼 수 있다. 마지막으로 한가지 조 정을 더 거친다. 위의 값은 [타석당 득점] 스케일이다. 즉 각각의 최근3일 등판패턴이 타석당 득점을 몇 점 증가시키거나 혹은 하락시켰는지의 결과이다. D000은 -0.010점, D111은 +0.036점이다. 타석 당 허용실점효과를 9 이닝당 값으로 변환 그런데, 타석당 허용 득점가치가 높으면 9이닝당 더 많은 타석의 타자를 상대해야 한다. 반면 타석당 허 용 득점가치가 낮은 투수는 9이닝당 더 적은 타자만 상대한다. 27개의 아웃카운트를 잡는데 필요한 타 석이 달라지기 때문이다. 2010_2015 모든 투수의 시즌 타석당 허용RV와 27개의 아웃카운트를 잡는데 필요한 타석수를 회귀식으 로 추정하면 9이닝당 타석 = 41.3 + 84.76 *RVA 로 나온다. 그리고 투수의 9이닝당 허용실점 = 해당 RVA의 9이닝당 타석 * RVA 가 된다.
9이닝 당 득점값으로 바꾸고 나면, 우리에게 익숙한 ERA 스케일로 표시된다는 장점도 생긴다. 이에 따라 다시 그래프를 표시하면 다음과 같다. 왼쪽(피로도 낮은 조건)과 오른쪽(피로도 높은 조건) 의 차이가 조금 더 늘어난다. 타석 당 RVA가 리그 평균보다 좋거나 나쁠 경우 9이닝 당 타석수가 줄어들거나 늘어나기 때문에 타석 당 득점가치의 차이보 다, 9이닝 당 득점가치의 차이는 더 커진다. 8개 그룹이 통계적으로 유의미한 크기 차이를 가지고 있는지 검정하기 위해 Krunskal Wallis Test 를 해 보면 대체로 유의미한 차이가 있지만 D010 - D101 구간 안에는 그렇지 않는 부분이 있다. 왼쪽에서 오 른쪽으로 점점 더 높은 피로도를 나타낼 것이라는 선험적 기대와 다른 결과가 나온 구간 역시 비슷하다. 이 부분에 대한 해명은 약간 뒤에서 다시 다룬다. * 타석당RV값은 대칭형의 정규분포를 따르지 않는다. 한 시즌 동안의 투수, 타자들의 RVA는 샘플사이 즈가 충분히 크기 때문에 정규분포의 형태를 가지게 된다. 하지만 구원투수의 한경기 타석결과는 2개에 서 7개 사이이기 때문에 한 타석 뿐 아니라 한 경기 전체로 봐도 충분히 큰 사이즈의 샘플이 되지 못한 다. (Krunskal Wallis Test 로 검정한 이유)
분석모델의 검토와 개선 우리가 분석대상에 포함시킨 타석 데이터는 2010년부터 2015년까지 2회 이후 등판한 모든 투수의 투구 결과이다. 그런데 이 안에는 구원투수이긴 하지만 좀 다른 성향의 피칭결과가 포함되어 있다. 우선 원포인트 릴리프 투수인데, 이들의 이들의 타석결과는 피로도의 영향에서 다른 샘플과 이질적이다. 등판해서 1타석만 상대한 경우의 타석결과 피로도 영향은 다음과 같은 형태를 가진다. 2010-2015 기간 중 등판해서 1타석만 투구한 투수들 의 D000 - D111 조건에 따른 각각의 피로도 효과 등판해서 한 타석만 상대한 투수는 대부분이 피로도 조건에서 일정한 상관관계를 가지고 있지 않았다. 대체로 자신의 평균적인 능력보다 더 좋을 결과를 얻었다. 상성이 좋은 매치업의 유리함 때문이거나 또 는 한 타석의 전력투구 결과일 수 있다. 따라서 이들은 피로도 영향을 받는 경향이 다를 것으로 보고 제외한다. 그밖에 롱릴리프 케이스에 해당 하는 등판시 8타석 이상 41구 이상 투구한 경우의 타석결과 역시 제외한다. 이들은 일반적인 구원투수 들과 피칭조건이 다소 다르기 때문에 피로도의 영향을 다른 방식으로 받을 여지가 있기 때문이다. 특히 여기에는 스코어 차이가 크게 벌어진 경기에서 단순히 이닝이팅을 위한 긴 등판이 포함되어 있기 때문 에 분석결과를 왜곡시킬 여지가 많다.
이렇게 원포인트 릴리프 케이스와 롱릴리프 케이스를 제외할 경우 다음과 같은 결과를 얻는다. 2타석 이상 8타석 미만 투구수 41개 미만 5회 이후 등판 조건의 타석당 피로도 영향 D100 이 다소 다른 결과인 것에 대한 해석이 다시 필요하긴 하지만 앞의 결과보다 좀더 선험적으로 예 상하는 피로도 효과와 비슷한 결과를 얻을 수 있게 된다.
투수 수준에 따른 피로도 효과 차이 : 평균이상의 투수들은 피로도 영향을 더 강하게 받는다. 그밖에 한 가지 더 의미있는 관찰결과는 투구 수준에 따라 피로도의 영향이 다소 다르게 나타난다는 점 이다. 다음은 리그 평균 이상의 투수 (PRV<0) 와 리그평균 이하의 투수(PRV>0) 를 분리해서 이들의 피 로도조건(최근 3일 동안의 등판여부이력) 에 따른 평균 타석결과를 표시한 것이다. 위에 있는 것이 리그평균 이상의 투수 (PRV<0)이고 아래 있는 것이 리그평균 이하의 투수(PRV>0)이다. 리그평균 이 상의 투수 그룹이 반대에 비해 피로도 의 효과가 좀더 분명하고 격차도 더 크 다.
잠정적 의미해석 따라서 다음과 같은 잠정적 결론을 얻는다. 1. D000에서 D111 까지 최근 3일 동안의 등판여부이력으로 구분했을 경우 각 그룹은 (대체로) 유 의미한 타석결과 차이를 보인다. (등판경기의 타석이 2~7 이며 투구수 < 41 조건) 2. 1타석만 상대하는 원포인트 릴리프투수와 8타석 이상 또는 41구 이상 투구한 롱릴리프 투수는 다른 일반적인 구원투수 조건에 비해 피로도의 영향을 다르게 받는다. 3. 리그평균 이상의 투수는 그렇지 않는 경우보다 피로도의 영향을 좀더 분명하게 좀더 크게 받는 다. 투수의 수준을 구분하지 않았을 경우, D001과 D110 (샘플 사이즈 격차를 고려해서 최상위 값과 최하위 값을 제외하고 그 다음 순위의 값들끼리 비교) 9이닝당 실점효과가 -0.238 과 +0.972 의 차이를 보이는 것과 다르게 PRV<0 조건에서는 -0.513 과 +0.964 의 차이로 좀더 커진다. 피로도 효과가 불분명했던 조건에 대한 추가 분석 이제 앞에서 잠시 미뤄두었던 회색지대 즉 D010 D011 D100 근처에 대한 좀더 자세한 분석을 해야 한 다. 이 조건에서의 타석당 평균적 결과는 선험적으로 예상한 피로도 순위와 약간 다르며 그룹 간 차이 도 좀 덜 분명했다.
좀더 자세한 것을 알기 위해 최근 3일로 구분했던 각 그룹을 최근 5일 동안의 등판이력으로 확대해서 각 각의 피로도효과(RVA-BRV-PRV)를 구해보면 다음과 같다. 크게 왼쪽, 중앙, 오른쪽으로 구분된 섹션은 최근 3일 동안의 등판패턴은 같지만 그 이전의 2일 즉 4일전과 5일전의 등판패턴이 달랐던 그룹을 구분 한 것이다. D010(왼쪽) 은 좀 다르지만 D011(가운데)과 D100(오른쪽) 의 경우는 3일간 등판패턴에 따른 구분에서 는 드러나지 않았던 피로도 효과가 나타난다. 왼쪽에서 오른쪽으로 갈수록 (선험적으로 피로도가 더 높 을 것이라 예상하는 순서) 타석결과의 피로도 영향이 커진다. 4일전과 5일전의 등판여부에 당일 등판의 타석결과에 영향을 주고 있다는 뜻이다. 이를 D000-D111 8종류의 피로도 조건 전부에 대해 확대하면 다음과 같은 모습이 된다.
(최근 3일 동안이 피로도가 비교적 낮은 조건일 때) 3일 휴식 또는 2일 휴식 등 피로도가 낮은 조건에서는 4일전, 5일전의 효과가 뚜렷하게 드러나지 않는 다. 아마도 2일 이상의 휴식은 4일전과 5일 전의 피로도를 충분히 회복할 수 있는 기간이었기 때문이 라 추측할 수 있다. (최근 3일 동안이 피로도가 비교적 높은 조건일 때) 3연투 이상의 매우 높은 피로도 조건에서도 4일전과 5일전의 효과가 드러나지 않는데 이는 반대로 최근 3일 동안의 매우 높은 피로도가 미치는 영향이 휠씬 강하기 때문에 그 이전에 누적되어 있는 효과가 밖 으로 드러나지 않았기 때문이라 추측할 수 있다. (중간 정도의 피로도 조건일 때) 최근 3일 이외에 4일전과 5일전의 등판여부가 당일 투구에 중요한 영향을 미친다. 분석을 통해 확인된 사실의 요약과 해석 이상의 분석을 통해 피로도가 피칭결과에 미치는 영향은 다음과 같이 요약될 수 있다. 피로도의 누적효과 직전 2일 동안 같은 등판패턴이라 해도 D4 D5 의 등판여부의 영향을 받는다. 어떤 투수가 단순히 2연투 조건(D100, D101)에서 비교적 좋은 성적이 좋았다고 하더라도 그것만으로 이 투수는 연투 조건에 강하다거나 혹은 2연투는 피칭결과에 큰 영향을 주지 않는다고 말할 수 없다는 뜻 이다. 연투에 따른 영향은 최소 등판일 전 5일의 영향을 받고 있으며 1일 휴식이 있었다 해도 그 이전 등판횟수에 따라 충분한 회복이 되었다고 말하가 어렵다. 피로도 회복의 누적효과 또 2연투 후 하루 휴식 후 등판할 경우 (D011) 4일전과 5일전 휴식이 있었다면 (D01100) 비교적 좋은 피 칭을 하지만 그렇지 않고 4일전과 5일전 등판한 경우는 D01101 일 때 9이닝당 1.45점, D01110 일때 2.39점을 더 실점했다.
피로도 영향의 득점가치 크기 비교적 흔히 등장할 수 있는 피로도 조건 몇가지를 뽑아서 정리하면 다음과 같다. 당일 등판 전 피로도 조건 3일 휴식 (D000) 2일 휴식 (D001) 등판투수 특성 (타석 1-7. 투구수 <41 공통) 9이닝당 실점 증가 또는 감소효과 (샘플크 기) -0.471점 (n=26095) -0.238점 (n=10880) 2일 휴식 (D001) 리그평균 이상 투수 -0.513점 (n=6869) 1일 휴식 후 2연투(D101) +0.510점(n=3730) 1일 휴식 후 2연투(D101) 리그평균 이상 투수 +0.816점 (n=2615) 2연투 (D110) 전체 2연투 후 1일 휴식 3연투 후 1일 휴식 +0.972 (n=1810) +1.45 (n=850) +2.39 (n=529) 피로도 측정의 객관적 기준 - 피로도 인덱스 Fatigue Index 이상의 결과를 통해 최근 3일 동안의 등판패턴에 따른 피로도Index 값을 얻을 수 있다. 값은 득덤가치 스케일이며 9이닝 예상허용실점 스케일로 조정된 결과이다. 따라서 투수의 ERA 값 변화효과 정도로 해석할 수 있다.
2010-2015 기간 중 투수별, 팀별 피로도 Index 이를 바탕으로 2010년부터 2015년까지 피로도Index 상위 5명의 투수를 시즌별로 뽑으면 다음과 같다. 이 결과를 빌제임스 CloserFatigueIndex 기준의 결과와 비교해볼 수도 있다. 출처 - http://bizballproject.com/?p=181
비슷하긴 하지만 약간 차이도 있다. 그리고 빌제임스의 CFI가 단지 누가 더 피로도가 높았는지에 대한 서열을 정한 다소 추상적인 척도를 가진 것에 비하면 위의 피로도INDEX는 득점가치 즉 피로도의 영향 으로 만들어진 9이닝당 실점효과 척도로 표현될 수 있다는 점이 가장 큰 차이이다. 피로도익덱스를 2010년부터 2015년까지 팀별로 계산해보면 다음과 같다. 피로도 Index 의 의미와 활용방향 물론 피로도Index는 전체 투수들의 평균적인 값이기 때문에 개별적 투수의 피로도 조건에 따른 손실 혹 은 이득과 정확히 일치할 수는 없다. 어떤 투수들은 높은 피로도 조건에서도 좋은 피칭을 하고 또 어떤 투수들은 그렇지 않다. 피로도Index 와 거의 비례하는 피칭결과를 보이는 투수들도 있고 별다른 상관관계 없는 결과를 만드는 투수들도 있 다. 따라서 피로도Index라는 지표는 다음과 같은 방향으로 활용되는 것이 합리적이다. 1. 연투, 2연투 여부 또는 1일 휴식, 2일 휴식이라는 단순한 조건이 아니라 최소 5일 동안의 등판패 턴을 기준으로 이들의 피로도 영향을 고려해야 한다는 측정모델구축
2. 개별 투수 피로도 조건에 따른 피칭결과를 구했을 때, 그 정도의 피칭 퍼포먼스 하락이 평균과 비교해서 더 큰 것인지 작은 것인지 비교할 수 있는 기준 설정 3. 피칭결과가 피로도Index와 비교적 일치하는 투수들의 특성을 분석하는 것을 통해, 피로도에 상 대적으로 강한 유형의 투수와 약한 유형의 투수들이 어떤 특성을 가졌는지 찾아내는 것 다만 이런 것과 상관없이 어떤 투수가 예를 들어 2연투 째 조건에서 대체로 좋은 타석결과를 얻었다고 해서 이 투수가 피로도에 강하다 라고 결론짓는 것은 명백히 잘못된 것임은 확인된다. 같은 2연투 조 건이라도 그 전 4일 동안의 등판패턴은 당일 피칭결과에 영향을 미친다. 그 투수가 그 이전에 충분한 휴식을 취한 후의 2연투 조건에서라면 보통 좋은 퍼포먼스를 보일 수도 있 다. 따라서 이 투수는 피로도에 강하다라는 잘못된 결론을 얻을 수도 있다. 하지만 피로도는 누적되며 분석대상이었던 최소 5일 동안의 등판패턴에 대해서 누적영향을 받고 있다는 점은 명백하다. (발표 후반부에 대한 정리는, 발표 당시 분석에 고려하지 못했던 포스트시즌 데이터를 보충해서 업데이 트하려 합니다.)
첨부 1 - PitchFX 데이터와의 연관성 분석에 대한 한계 이 분석에 의해 디자인된 피로도Index는 그것이 설사 충분히 객관적인 정확도를 가진다고 하더라도 실 제 활용하는데 한계가 있다. 야구에서 타석의 결과는 악명높은 DIPS(또는 BABIP)의 우연성에 의해 왜 곡되고 교란된다. 어떤 투수의 피로도 관련 특성을 파악하기 위해 5년 이상의 누적된 데이터가 필요하 다면 그것은 실전적으로 무의미할 수도 있다. 따라서 좀더 실용적인 목표 즉 첫째, 서로 다른 피지컬, 메카닉 상의 특징을 고려해서 투수 개개인이 가진 피로도에 대한 민감도를 구 분해내고 둘째, 투수의 등판결과로부터 얻을 수 있는 데이터를 통해 그 선수의 피로도 상태를 추정해내 기 위해서는 한계가 있다. 여기에 도움이 될 수 있는 것이 투수의 릴리즈위치, 릴리즈 시점의 팔 각고, 구속의 변화, 익스텐션, 공의 무브먼트 변화를 도플러 레이더를 이용해서 측정한 트랙맨 데이터 같은 것들이다. 연결되는 분석은 그 것을 목표로 한다. 6시즌 동안의 타석결과분석을 바탕으로 하는 [피로도Index]를 기준으로, 피로도 레버리지가 좀더 높은 투수와 그렇지 않는 투수를 구분해서 이들 사이에 어떤 투구 메카닉 상의 차이가 있는지를 찾아낸다면 피로도에 영향을 더 많이 받는 투수들이 어떤 특성을 갖는지 알아낼 수 있을 것이다. 또 피로도가 높은 조건에서 생겨나는, 릴리즈 및 익스텐션 메카닉의 변화나 투구궤적 변화를 특정해낼 수 있다면 이것이 좀더 구체적인 피로도 감지 기준이 될 수 있다. 더 나아가, 피로의 누적이 부상의 가 장 결정적인 원인이 되는 야구의 특징을 염두에 둘 때, 선수의 부상징후를 감지하는 가장 효과적이고 강 력한 수단이 될 수 있다. 다만 앞에서 말한 것처럼 트랙맨 시스템이 설치된 것이 올해 5월 이후이며 데이터가 수집된 경기도 잠 실, 목동구장에 한정되어 있기 때문에 이를 통한 충분한 검토와 분석에 제약이 있었다. 발표내용 중 후 반부에 해당하는 PitchFX 데이터 관련 분석을 1편에서 일단 제외한 이유이며 좀더 보강분석을 한 후 그 에 대한 2편을 업데이트하려고 한다.
첨부 2 - 최근 3일 등판패턴에 따른 피로도효과 연도별 분포 등판패턴에 따른 피칭결과는 타석상황의 수많은 변수로 인해 매우 심하게 교란된다. 한 시즌은 대략 15000타석 정도(구원투수 등판타석)의 꽤 큰 샘플사이즈를 가지지만 이 정도 범위에서는 피로도 조건에 따른 일정한 상관관계를 관찰하기 어렵다. (아래 그림 - 각 연도별 D000 - D111 8종류 조건에 따른 피 로도효과) 따라서 어떤 투수가 이번 시즌 2연투 상황이나 3연투 상황에서 비교적 좋은 성적을 기록했다고 하더라 도 이를 근거로 그가 피로도 조건의 영향을 덜 받는다고 말하는 것은 부적절하다.