한국문화경제학회 문화경제연구 제15권 제2호, 2012년 8월, pp.33~56 확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 남영식 * 박호정 ** 장재열 *** 목 차 Ⅰ. 서 론 Ⅱ. 선행연구 Ⅲ. 분석방법 Ⅳ. 분석자료 Ⅴ. 실증분석결과 Ⅵ. 결 론 본 연구에서는 2007년부터 2010년까지의 한국 프로 야구 선수들의 기록자료를 바탕으로 혼합자료를 구축하여 개별 선수들의 효율성 분석을 진행하였다. 연구의 목적은 한국 프로 야구 선수들의 개별 효율성 도출 및 성과분석을 통하여 선수 및 구단 입장에서의 효율적인 가치평가가 이루어질 수 있는 객관적 자료를 제시하는데 있다. 분석기법으로는 확률프론티어 모형을 활용하였고, 선수들에 대한 구분은 타자와 투수로 구분하여 2가지 부문으로 나누어서 진행하였다. 타자와 투수의 경우, 각각의 성과지표로서 장타율과 출루율의 합인 OPS와 이닝당 출루 허용률인 WHIP을 활용하였다. 분석결과, 타자의 경우 연봉과 게임 참여수가 성과에 대해 (+)의 관계를 가졌지만, 투수 의 경우에는 연봉과 게임 참여수는 성과에 대해 (+)의 관계를 가지지만 나이는 성과에 대 해 (-)의 관계를 가졌다. 또한, 성과지표 및 연봉에 대한 구단별 분석을 통해, 구단별 평균 이상의 OPS와 WHIP를 기록한 선수들의 숫자 및 비율의 순위가 분석기간 동안의 구단성 적의 평균의 순위와 유사함을 확인할 수 있었다. 핵심주제어 : 프로야구 효율성, OPS, WHIP, 확률프론티어 * 고려대학교 대학원 식품자원경제학과 응용경제학전공 석박사 통합과정(제1저자), toju111@korea.ac.kr ** 고려대학교 식품자원경제학과 부교수 (교신저자), hjeongpark@korea.ac.kr *** 고려대학교 대학원 식품자원경제학과 응용경제학전공 박사과정(제2저자), jy0405@korea.ac.kr 논문제출일: 2012년 6월 16일, 논문 수정일: 2012년 8월 12일, 게재확정일: 2012년 8월 13일
34 남영식 박호정 장재열 Ⅰ. 서 론 국내 프로 스포츠는 1982년 프로 야구를 시작으로 1983년 프로 축구, 1997년 프로 농 구, 2005년 프로 배구에 이르기까지 출범 후, 발전을 거듭해오고 있다. 그 중 2002년 월 드컵을 계기로 범국민적인 축구 열풍으로 위축되었던 국내 프로 야구는 각종 세계대회 에서 그 위상을 펼치면서 현재 제2의 전성기를 맞이하고 있다. 하지만 현실에서는 한국 프로 야구를 구성하는 대부분의 구단이 적자 경영 되고 있는데, 이에 대한 원인으로는 기업위주의 구단 운영 방식과 비효율적인 성과분배방식 등을 생각할 수 있다. 이러한 문제들을 해결하기 위해서는 여러 가지 방안이 있을 수 있겠지만, 우선적으로 선수 역량에 대한 객관적인 기준 확립을 생각할 수 있다. 만일 이와 같은 기준이 확립된 다면 구단의 입장에서는 효율적인 선수확보의 가능성을 높여 한정된 재정 안에서 효율 적인 구단 경영이 가능하며, 선수들 역시 자신의 가치를 구단으로부터 인정받을 수 있는 윈-윈 효과를 가져 올 수 있을 것이다. 또한 프로 스포츠는 경기를 통해 관중 및 시청자를 만족시키는 동시에, 해당 경기에 대한 기록이 발생하는 특징을 가진다. 이러한 기록들의 시간에 따른 축적은 분석 가능한 데이터로 구성되며, 이는 정량적인 분석을 가능하게 한다. 이런 이유로 야구를 통계적 수 학적으로 분석하는 방법이 자연스럽게 개발되었는데 이를 세이버매트릭스(Sabermetirics)' 라 한다. 국내 프로 야구는 이와 같은 세이버매트릭스의 활용이 가능하여, 다른 프로 스 포츠에 비해 선수들의 성과 데이터가 체계적으로 구성되어 있다. 따라서 경기진행에 따 라 집계되는 선수들의 성과에 대한 데이터 활용이 다른 프로 스포츠보다 다양하며, 앞서 언급한 선수 역량에 대한 객관적인 기준의 확립이 가능함을 알 수 있다. 이로 인해 선수 들의 성과에 대한 다각적인 분석이 가능하므로, 국내의 여러 프로 스포츠 중에서 야구를 분석대상으로 선택하였다. 국내 프로 야구에 대한 분석에 앞서 우선 한국 프로 야구의 수익구조 및 선수 성과관 리의 중요성에 대해서 생각할 필요가 있다. 세계 최고 수준의 리그인 메이저 리그 야구 (Major League Baseball, MLB)에서 한국 선수들의 활약 소식을 쉽게 접할 정도로 한국 선수들의 기량이 발전하고 있음에도 불구하고, 국내 프로 야구에서는 선수들에 대한 객 관적인 평가가 제대로 이루어지지 않고 있는 실정이다. 그러므로 선수들의 역량에 따라 객관적이고 효율적인 방법으로 선수를 관리하여 야구가 주요 스포츠 산업으로 자리 잡 은 MLB와 같이, 한국 야구가 발전하기 위해서는 수익구조와 선수 관리 체계를 개선할 필요가 있다. MLB와 한국 프로 야구의 수익구조는 아래의 <표 1>과 같이 나타낼 수 있다.
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 35 <표 1>에서 보면 알 수 있겠지만 한국과 미국에서 선수들의 연봉이 다른 이유는 수 익구조 자체가 다르기 때문이다. MLB에서는 수익의 50% 이상을 관중참여에 의한 입장 료를 포함한 경기장 발생 수익으로 감당하고 있지만, 우리나라에서는 입장료를 포함한 경기장 발생 수익의 비율이 6% 정도에 불과하고, 나머지 모자란 부분에 대해서는 모기 업의 지원금 형식으로 받고 있다. 팀이 이룬 실적과 관련하여 기대이상의 효과를 내지 못한다면 73%를 차지하는 모기업의 지원금은 규모가 작아지고, 떨어진 관중들의 충성도 로 인해 6%에 불과한 경기장 발생수익마저도 줄어들게 된다. 그러므로 30년의 역사를 가진 프로 스포츠임에도 불구하고 대부분의 구단에서 적자경영이 이루어지고 있는 것이 다. 이런 문제점을 개선하기 위해서 구단의 효율적인 운영에 대한 고민이 필요하다. 구단의 효율적인 운영은 여러 가지 요소들의 종합적인 결과로 생각할 수 있다. 그 중 에서도 가장 중요한 것은 팀의 성과이다. 팀의 리그 순위가 구단의 이익과 반드시 직결 되는 것은 아니라 하더라도 지속적으로 좋은 결과를 내지 못하는 팀에 대해서는 관중의 충성도 하락에 따른 구단의 이미지 저평가가 발생할 수 있다. 현재 한국 프로 야구 구단 의 수익구조를 볼 때 저평가된 구단에 대해서는 기업의 투자가치가 떨어지기 때문에, 구 단의 효율적 운영을 위한 팀 성과 향상을 위해서 이것에 영향을 줄 수 있는 요소들에 대한 고려가 필요하다. <표 1> 메이저 리그 야구와 한국 프로 야구의 수익구조 구 분 메이저 리그 야구 (MLB) 한국 프로 야구 (KBL) 자료 : CK Sports Business 경기장 발생수익 (6%) 경기장 발생수익 (51%) 중계권료 (7%) 수익구조 중계권료 (23%) 모기업지원금 (73%) 스폰서쉽 (26%) 스폰서쉽 (14%) 팀의 성과에 영향을 줄 수 있는 요소는 다양하게 존재하지만 큰 맥락에서 가장 중요 한 요소는 선수 개개인의 역량과 성과라고 생각할 수 있다. 물론 이외에도 코칭스태프의 전략 및 선수지도 능력, 구단의 지원 등과 같은 여러 가지 요소들이 존재하지만 이 요소 들을 통해 궁극적으로 달성하고자 하는 것은 선수들의 역량 향상을 통한 더 나은 성과 의 도출이기 때문이다. 그래서 본 연구에서는 선수 개개인의 여러 가지 세이버매트릭스 정보를 활용하여 그 들의 성과와 성과에 영향을 주는 요인들에 대해서 알아보고자 한다. 그리고 선수들 연봉
36 남영식 박호정 장재열 의 분포 및 효율성 등을 알아보고 이를 통해 효율적인 선수 관리 시스템 구축에 기여할 수 있는 객관적인 자료를 제시하고자 한다. 본 연구 이외에도 구단의 합리적 경영을 위한 많은 연구들이 진행되어 왔으며, 본 연 구가 가지는 한계점이 있겠지만 이 연구가 한국 프로 야구의 체계적 선수 관리 시스템 구축에 있어서 기여할 수 있는 바가 있으리라 생각된다. 본 논문의 구성은 다음과 같다. 2장에서는 관련 선행 연구에 대해서 살펴본다. 그리고 3장에서는 분석방법과 모형에 대한 설명을 하고, 4장에서 분석에 활용된 데이터에 대한 설명을 간단히 한다. 그리고 5장에서는 추정 결과에 대해서 논의하며, 마지막으로 6장에 서는 결론 및 시사점을 도출하도록 한다. Ⅱ. 선행 연구 앞에서 기술한 것과 같이 야구는 세이버매트릭스를 바탕으로 풍부하고 체계적인 데이 터를 가진 스포츠라 할 수 있다. 그러므로 생산 효율성 측면에서 다양한 분석을 시행할 수 있는데, 집계된 선수들의 성과 데이터를 이용하여 주로 효율적인 연봉측정이나 구단 의 재정분포, 그리고 연봉과 팀 성과간의 관계에 대한 연구가 진행되어 왔다. Jacobs(2003)는 MLB에서의 연봉계약의 종료년도와 신규계약의 시작년도에서의 선수 들의 성과에 대해서 비교한 연구를 수행하였다. 연구결과 구계약과 신규계약사이의 연봉 상승 크기는 홈런의 개수와 RBI(Run Batted In) 수치에 대해서 역의 상관관계를 가짐을 밝혀냈다. 평균적으로 홈런의 개수는 22.72% 감소하였고, RBI 수치는 18.31% 감소한 것 으로 조사되었다. 이를 통해서 선수들이 이전보다 상승된 금액의 연봉계약을 체결 했음 에도 불구하고, 계약 체결 후 비효율적인 성과를 나타내는 경향이 있다는 사실을 확인할 수 있었다. 이것은 연봉상승이 선수들의 성과를 전적으로 향상시키지 않는다는 사실과 함께 팀 성과 향상에도 효율적인 수단이라 말할 수 없다는 사실을 나타내었다. Jewell and Molina(2004)는 MLB의 데이터를 활용하여 선수들의 연봉 불평등성과 생 산성 사이의 관계를 연구하였다. 패널 데이터를 활용한 이 연구는 선수들의 연봉 불평등 성이 팀의 승리에 부정적인 영향을 미친다는 결과를 나타내었으며, 팀의 승리와 연봉 불 평등성은 팀의 효율성과는 상관관계를 가지지 않는다는 결과를 제시하였다. Debrock et al.(2004)은 MLB에서 활동하는 선수들의 특성에 대한 정보를 활용하여 선 수들의 연봉분포에 대한 효율성과 형평성에 관한 연구를 수행하였다. 이 연구는 구단 입
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 37 장에서의 연봉수준과 분포, 그리고 각 선수들의 연봉수준과 성과에 대한 자료를 활용하 여 구단의 연봉책정 전략이 그들의 성과에 어떤 영향을 미치는지 알아보고자 실시되었 다. 연구결과, 다른 연구들과 마찬가지로 연봉분포에 대한 형평성이 팀 성과에 큰 영향 을 주는 것으로 확인할 수 있었다. 그리고 이 연구에서는 팀 성과에 큰 영향을 주는 요 소로서 선수들 연봉분포의 형평성 보다는 팀에 필요한 선수를 영입하는 효과가 더 중요 하다는 결과를 제시하였다. 이와 같은 선수들 연봉 차이에 따른 불평등성이 팀의 성과와 직결될 수 있다는 사실 을 확인하였는데, Scully(2004)는 MLB 선수들의 연봉분포의 차이에 관한 연구에서 연봉 분포의 다양성을 이루는 요소들을 둘로 나누어서 분포형성에 미치는 영향에 대해서 알 아보았다. 이 연구에서는 선수들 연봉에 있어서의 다양성을 분배효과와 한계수입생산효 과로 나누어서 1990년도와 1998년도의 경우를 비교하였는데 그 결과, 이 두 요소가 가 지는 효과가 모두 선수들 연봉의 다양성이 증가하는데 기여하는 것으로 나타났다. Kang et al.(2007)은 KBO산하의 프로 야구 구단의 경영 효율성을 자료 포락 분석 (Data Envelopment Analysis: DEA)기법을 통하여 알아보는 연구를 하였다. 여러 구단들 의 적자경영이 지속화되면서 경영효율성 분석 차원에서 이루어진 이 연구에서는 한국 프로 야구 2004년도 시즌에 대해 투입요소로 선수들의 연봉을 두고 산출요소로 팀 승률 과 총 관중수를 두어 분석을 진행하였는데 그 결과, 재정적으로 보통 수준의 구단이 재 정적인 여유가 충분한 구단보다 오히려 뛰어난 성과를 냈다는 사실을 확인할 수 있었다. 본 연구에서는 확률적 프론티어 기법(Stochastic Frontier Analysis)"을 활용하여 국내 야구선수들의 효율성을 분석하였다. 이 때 타자와 투수의 성과지표를 산출물로 두었고, 연봉, 지역연고, 나이 등을 투입요소들로 두었으며, 타자의 성과지표로는 OPS를, 투수의 성과지표로는 WHIP을 사용하였다. 또한, 구단별로 타자와 투수의 연봉분포와 성과지표 분포를 그래프로 나타내어 두 데이터를 비교, 확인할 수 있도록 하였으며 전체연봉자들 의 연봉에 따른 성과지표를 분포형 그래프로 나타내어 분석 대상 선수들의 연봉대비 성 과분포에 대해서 확인할 수 있도록 하였다. 이 연구가 가지는 기존 연구와의 차별성은 기존의 팀 단위 경영 효율성에 중점을 둔 분석이 아닌 개별 타자와 투수들에 대한 혼합자료(Pooling Data)에 SFA 기법을 적용하 여 투입요소에 대한 성과지표와의 관계와 선수들의 효율성을 알아본다는 것에 있다. 또한 전체 선수들의 연봉대비 성과지표에 대한 분포와 각 구단의 연봉대비 성과분포 를 알아봄으로써, 선수와 구단 입장에서 실적과 관련한 효율적인 연봉분포 및 체계에 대 해서 다시 한 번 생각할 수 있는 근거를 마련했다는데 의미가 있다. 특히, 성과에 영향 을 미치거나 예상되는 요소로서 연봉뿐만이 아니라, 자유계약, 해외경험, 지역연고 등의
38 남영식 박호정 장재열 효과를 살펴보는 것에도 목적을 두고 있다. 기존의 연구들은 상당수가 MLB 선수들의 생산효율성을 분석한 반면, 아직 국내에서는 국내 야구 선수에 대한 연구가 미흡한 실정 임을 감안할 때, 본 연구가 가지는 의미가 있다고 할 수 있다. Ⅲ. 분석 방법 특정 부문에 대한 효율성 측정의 기준은 크게 산출 지향형과 투입 지향형의 2가지로 나눌 수 있다. 투입 지향형 효율성은 산출을 일정하게 지정한 후 어느 정도 투입량 감소 가 가능한지를 측정하는 반면, 산출 지향형의 효율성은 투입수준을 일정하게 설정한 후 어느 정도 산출량을 증가시킬 수 있는지를 측정함으로서 도출된다. 효율성 측정에 대한 대표적인 초기 연구로는 Farrell(1957)의 연구를 언급할 수 있다. 효율성에 대한 연구는 Farrell이후 왕성히 진행되었으며, 방법론적인 측면에서 비모수적 관점의 자료 포락 분석(Data Envelopment Analysis, DEA)과 모수적 관점의 계량경제학 적 추정으로 나눌 수 있다. 선형계획법을 활용한 DEA 분석법은 생산 및 비용함수에 대 한 특정 분포를 가정하지 않은 상태에서 비교적 데이터 규모의 제약을 받지 않고, 분석 이 가능한 장점을 가지고 있다. 그러나 DEA는 확률적 측면에서의 접근이 아니기 때문에 추정결과의 통계적 신뢰도 검정이 불가한 문제점을 가지고 있으며, 이와 같은 문제를 해결하기 위해 최근에는 통계 적 분석의 활용이 가능한 모수적 분석법이 발전되고 있다. 모수적 접근법은 다시 2가지 의 형태로 나누어질 수 있는데, 분석대상을 확정적으로 또는 확률적으로 보느냐에 따라 서 나누어진다. 분석대상을 확정적으로 보는 방식은 Aigner and Chu(1968)의 연구에서 활용되기 시작 하였으며, 비용함수의 오차항을 활용하여 분석대상의 비용효율성을 측정하는 방식을 따 르고 있다. 하지만 이 경우 분석대상이 제어할 수 없는 요소들 또한 비효율성 요인으로 포함이 될 수 있으므로, 기술적 비효율성의 과다 추정이 발생할 수 있는 문제점을 가진다. 그러므로 본 연구에서는 분석방법으로 생산에 있어서의 비효율성이 확률적 분포를 가 지는 확률프론티어(stochastic frontier)기법을 활용하였다. 확률프론티어에 관한 로그생산 함수는 아래와 같이 표현할 수 있다.
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 39 (1) 식 (1)에서 는 투입요소 벡터를, 는 을 따르는 통제 불가능한 여러 확률적 요소를 의미하며, i번째 분석대상의 기술적 효율성(TE)은 잔차항 를 활용 하여 아래와 같이 나타낸다. (2) 일반적으로 와 는 상호 독립적이라고 가정하며, 의 분포는 반정규분포(Half-normal distribution)를 따르거나 또는 절단정규분포(truncated-normal distribution)를 따르는 것으 로 볼 수 있다. 반정규분포는 비효율성을 의미하는 가 가지는 분포 중의 하나를 의미하는 것으로서 의 경우, 0보다 큰 값을 가지기 때문에 평균이 0인 정규분포의 오른쪽에 해당되는 분 포를 의미한다 할 수 있다. 이 분포는 의 표준편차를 나타내는 단일 파라미터인 에 의해서 결정되기 때문에 그 형태 역시 의 값에 따라 달라지는데, 값이 커질수록 확률분포가 0근처에 몰려있는 형상을 보인다. 절단정규분포 역시 비효율성 가 가지는 분포 중의 하나로서 평균이 이고 표준편 차가 인 정규분포에서 양의 에 해당하는 분포를 의미한다. 이 분포는 뿐만 아니 라 의 값에 의해서도 영향을 받으며 자료의 분포가 한쪽으로 치우쳐 있는 경우를 표현 할 수 있으므로, 한 집단에 있어서의 소수의 지배구조에 대한 현상을 잘 설명할 수 있는 특징을 가진다. Ⅳ. 분석 자료 본 연구에서는 한국 야구 위원회(Korea Baseball Organization)에 나와 있는 2007년부 터 2010년까지의 각 선수들의 정보를 바탕으로 혼합자료를 구축하여 자료로 활용하였으 며, 원래 4개년도의 데이터를 활용할 예정이었으나 샘플수의 확보를 위해 3개년도 정보
40 남영식 박호정 장재열 까지 포함시킨 불균형혼합자료를 사용하였다. 데이터의 분류는 타자와 투수의 경우로 나 누어서 진행하였으며 성과지표로는 타자의 경우는 장타율과 출루율의 합(On-base Plus Slugging Percentage, OPS)과 이닝당 출루 허용률(Walks plus hits divided by Innings Pitched, WHIP)을 계산하여 사용하였다. OPS 나 WHIP는 앞서 언급한 야구통계에 대한 이론적 접근의 정확성을 더하기 위하여 만든 세이버매트릭스 데이터 분석법에 이용되는 수치이다. 성과지표로 활용된 세이버매트릭스는 빌 제임스에 의해서 창시된 것으로서 야구를 객 관적으로 이해하기 위한 노력의 일환이라고 볼 수 있다. 세이버매트릭스의 시작은 1970 년대 들어 등장한 빌 제임스의 Baseball Abstract 시리즈로 여기는데, 이것은 1980년대 부터 야구계에 영향을 미치기 시작하면서 1990년대 이후에는 야구의 통계적 분석 측면 에서 중요한 요소로 자리 잡기 시작하였다. 세이버매트릭스의 통계학적 접근 방식은 기존의 전문가들만이 이해하고 참여하던 분 석영역에 일반인들의 능동적 참여를 이끌어 냈다는 것에 의미를 가질 수 있다. 하지만 대중의 참여로 인한 저변확대와 동시에 날이 갈수록 정밀화되는 통계분석 기법으로 인 해 오히려 일반인들이 다가가기 힘든 영역으로 변환되는 문제점을 가지고 있다. 또한 통계적 수치에 매몰되어 실제 상황에서 일어날 수 있는 여러 변수들의 간과로 인한 선수에 대한 과대 혹은 과소평가가 이루어질 수 있다는 문제점 역시 가지고 있다. 그럼에도 불구하고 이러한 수치들은 선수들의 성과평가에 대한 객관적인 근거로 활용되 는 등 유용하게 사용되고 있다. 본 연구에서는 세이버매트릭스의 여러 가지 수치 중에서 타자와 투수의 성과지표로 중요하게 활용되고 있는 OPS와 WHIP 수치를 사용하고자 한다. 본 연구에서 이와 같은 지표들을 타자와 투수의 성과지표로서 활용한다고 해서 OPS 또는 WHIP에 의해서만 타 자와 투수의 절대적 좋고 나쁨이 결정되는 것은 아니다. 대중적으로는 오히려 타자의 경 우 타율이, 투수의 경우에는 방어율이 대표적인 성과지표로 널리 활용되고 있지만, 새로 운 관점에서 타자와 투수의 역량을 나타내는 지표를 활용하고자 OPS와 WHIP를 활용하 였다. 실제로 MLB와 국내 프로 야구에서도 타자 및 투수를 평가하는 지표로서 OPS와 WHIP를 활용하고 있다는 측면에서 지표의 신뢰성 역시 크게 문제가 되지는 않을 것으 로 판단된다. 타자의 성과지표를 나타내는 OPS는 On base percentage Plus Slugging percentage의 약어로 출루율과 장타율의 합을 의미한다. 여기서 출루율(On Base Percentage) = (출루 수)/(타수), 장타율(Average Slugging) = (루타수)/(타수) 로 나타내며 이를 조금 더 자세 하게 표현하면 출루율 = (안타 + 사사구)/(타수 + 사사구 + 희생플라이), 장타율 =
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 41 {(단타개수 x 1) + (2루타개수 x 2) + (3루타개수 x 3) + (홈런개수 x 4)}/(타수) 로 나 타낼 수 있다. 다시 말해서 출루율 은 출루 횟수만 고려하는 것이기 때문에 홈런을 치 는 경우나 단타를 치는 경우 모두 1회로 산정되지만 장타율 의 경우는 홈런을 치는 경 우와 단타를 치는 경우에 있어 가중치가 적용되어 홈런의 경우에는 4루타로, 단타의 경 우에는 1루타로 산정하게 되는 차이점을 가지게 된다. 투수의 성과지표를 나타내는 WHIP는 Walks plus Hits per Inning Pitched의 약어로 이닝당 출루 허용을 나타내는 지표이다. 이 수치는 WHIP = (사사구 + 안타수)/(이닝 수) 의 식으로 표현될 수 있으며 풀어서 표현하면 투수가 이닝 당 얼마나 많은 주자를 내보냈는가를 나타내는 수치라 할 수 있다. 위에서 설명한 성과지표 변수가 산출되기 위해 투입되는 변수들로는 선수들의 연봉 (Income), 지역연고 일치 여부(Link), 연령(Age), 해외리그 경험 여부(Oversea), 자유계약 (FA)여부, 경기 수(Gamenum) 등을 두었다. 투입변수 중 연봉은 각 선수의 연간 계약소 득을 의미하는 것으로서 원래 값에 자연 로그를 취해 주었으며, 지역연고 일치 여부는 졸업 고등학교가 위치한 지역과 소속 구단의 지역 일치 여부로 판단하였다. 즉, 8개 구 단의 연고지인 서울, 인천, 대전, 대구, 부산, 광주 지역에 위치한 고등학교 출신 선수가 동 지역 연고구단으로 갔을 경우 지역 연고 값으로 2를 부여하고, 이 지역에는 없지만 이 지역을 포함하는 도에 존재하는 고등학교 출신 선수가 해당 도의 연고 구단으로 갈 경우는 1의 값을 부여하였다. 예를 들어 A라는 선수가 마산 고등학교를 졸업하고 롯데 에 입단을 하였다면, 부산은 아니지만 경상도에 포함이 되므로 1의 값을 부여하여 연고 일치 여부에 대해 수치화를 시켰다. 연령은 2010년에서 각 선수들의 태어난 연도를 뺀 숫자에 자연 로그를 취하였다. 해외 리그 경험 여부는 경험이 있는 경우를 1, 없는 경우 는 0으로 지정하였고, 자유계약의 경우에는 해당년도에 자유계약을 맺은 선수들은 1을, 아닌 선수들은 2를 선택하였다.
42 남영식 박호정 장재열 구분 변수명 변수설명 성과 타자 OPS 출루율+장타율 지표 투수 WHIP 출루 허용율 투입변수 <표 2> 성과 지표와 투입 변수 설명 연봉(Income) 지역연고일치여부 (Link) 연령(Age) 해외리그경험여부 (Oversea) 자유계약(FA) 경기 수(Gamenum) 매년 소득 구단연고지(특별시,광역시)=출신고 지역 : 2 구단연고지(도) 출신고 지역 : 1 구단연고지 출신고 지역 : 0 2010 - 각 선수들의 출생연도 해외 리그 유경험 : 1 해외 리그 무경험 : 0 해당년도 자유계약 여부( 有 ) : 1 해당년도 자유계약 여부( 無 ) : 0 참여한 게임의 수 <표 3> 타자와 투수의 활용 성과지표 및 설명변수 기초통계량 타자(N=109) 변수 평균값 표준편차 최고값 중간값 최저값 OPS 0.696 0.174 1.111 0.704 0.000 income(만원) 13,585 14,679 70,000 7,400 2,000 link 0.646 0.906 2.000 0.000 0.000 age(세) 28 5 41 28 19 oversea 0.029 0.169 1.000 0.000 0.000 FA 0.027 0.162 1.000 0.000 0.000 gamenum(경기) 90 35 133 101 1 투수(N=85) 변수 평균값 표준편차 최고값 중간값 최저값 WHIP 1.604 0.524 6.429 1.515 0.000 income(만원) 10,128 10,013 63,000 6,900 2,000 link 0.937 0.954 2.000 1.000 0.000 age(세) 27 5 41 27 19 oversea 0.057 0.232 1.000 0.000 0.000 gamenum(경기) 31 20 85 28 1
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 43 Ⅴ. 실증 분석 결과 앞 장에서 설명한 분석 방법과 자료를 바탕으로 지정한 투입요소로 타자와 투수의 성 과를 추정하였다. 추정 시 비효율성의 분포가 반정규분포를 따르는 경우와 절단정규분포 를 따르는 경우로 나누어서 타자와 투수 각각 시행을 하였는데 그 결과는 <표 4>와 같다. <표 4>에 나타난 추정결과를 살펴보면 타자의 경우에는 성과 지표에 대한 각 투입 요 소 변수들의 관계가 직관적으로 판단되는 결과와 유사하게 나왔음을 알 수 있다. 연봉, 지 역 연고 일치 여부, 해외 리그 경험 여부, 경기 수 변수는 성과 지표와 양의 관계를, 연령 과 자유 계약 변수는 성과지표와 음의 관계를 가짐을 표를 통해 알 수 있다. 이 때 자유 계약 여부에 따른 변수가 성과지표와 음의 관계를 가진다는 사실이 직관적인 판단과 달랐 다. 하지만 각 변수들에 대한 유의성을 살펴보면 연봉과 경기 수 변수만이 1% 수준에서 유의함을 나타냈고 다른 변수들은 모두 유의하지 않음을 표를 통해서 알 수 있다. 이를 통해 제시된 투입요소들 중에 타자의 성과 향상에 효과적 인센티브로 작용할 수 있는 요인은 연봉이며 경기수를 거듭할수록 성과향상에 있어 긍정적인 효과를 가짐을 확인할 수 있다. <표 4> 타자의 성과지표에 대한 추정결과(관측치=413) 종속변수: OPS 설명변수 반정규분포 절단정규분포 t-값 (표준오차) (표준오차) t-값 constant 0.0352 0.0326 0.21157 (0.16626) (0.17049) 0.19138 연봉 0.0470*** 0.0470*** 4.54974 (0.01026) (0.01030) 4.56448 지역 연고 일치 여부 0.0102 0.0086 1.21306 (0.00839) (0.00874) 0.98340 연령 -0.0720-0.0607-1.17426 (0.06129) (0.06456) -0.93972 해외 리그 경험 여부 0.0196 0.0081 0.42457 (0.04616) (0.04875) 0.16589 자유계약 -0.0097-0.0085-0.26875 (0.03614) (0.03616) -0.23635 경기 수 0.1297*** 0.1299*** 14.49626 (0.00895) (0.00894) 14.53006 Loglikelihood 283.46889 284.11698 주 : *, **, *** : 각각 10%, 5%, 1% 내에서 유의함을 나타냄.
44 남영식 박호정 장재열 <표 5>를 보면 투수의 경우에도 타자의 경우처럼 성과 지표에 대한 각 투입 요소 변 수들의 관계가 직관적 판단과 유사하게 나왔음을 알 수 있다. 이 경우, 투수들의 성과로 사용된 WHIP는 낮을수록 뛰어남을 의미하기 때문에 이러한 성질을 반영하고자 분석대 상이 되는 선수들의 WHIP 중 가장 높은 값보다 큰 가장 낮은 정수가 7이므로 이 값에 서 각 선수들의 WHIP를 뺀 값을 효율성 분석에 있어서 WHIP의 의미로 사용하였다. 분 석을 한 결과, 연봉, 지역 연고 일치 여부, 해외 리그 경험 여부, 경기 수 변수는 성과지 표와 양의 상관관계를, 연령의 경우에는 음의 상관관계를 나타내는 것이 직관적인 판단 과 일치함을 알 수 있었다. 각 변수들에 대한 유의성을 살펴보면 타자의 경우와 마찬가 지로 연봉, 경기 수, 연령 변수가 각각 5%, 1%, 1% 수준에서 유의함을 확인할 수 있다. 이를 통해서 투수의 경우도 성과향상에 있어서 연봉이 효과적인 인센티브로 작용하며 경기수를 거듭할수록 성과향상에 긍정적인 효과를 미침을 알 수 있다. 또한 연령이 성과 에 미치는 영향에 있어서는 연령이 많을수록 경험적 노련함으로 인해 긍정적인 효과가 발생할 수 있지만, 투수의 경우에는 신체적 능력 퇴화에 따른 부정적 효과가 더 크게 작 용하여 성과지표와 음의 상관관계를 가진다고 생각할 수 있다. <표 5> 투수의 성과지표에 대한 추정결과 종속변수: 변형된 WHIP 설명변수 반정규분포 (표준오차) t-값 절단정규분포 (표준오차) t-값 constant 5.6702*** (0.57112628) 9.9280428 5.7271*** (0.55491124) 10.320697 연봉 0.0761** (0.043182557) 1.7632147 0.0735** (0.041643474) 1.7656271 지역 연고 일치 여부 0.0107 (0.03077343) 0.34717476 0.0070 (0.030572816) 0.22918219 연령 -0.4442*** (0.19013642) -2.336154-0.4601*** (0.18720516) -2.4575046 해외 리그 경험 여부 0.0618 (0.14012436) 0.44137945 0.0590 (0.13722507) 0.43005082 경기 수 0.2137*** (0.028962113) 7.3789003 0.2113*** (0.029155833) 7.248532 Loglikelihood -207.97281-206.87764 주 : *, **, *** : 각각 10%, 5%, 1% 내에서 유의함을 나타냄.
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 45 추정결과를 종합해 보면 타자와 투수의 성과지표에 연봉과 경기 수가 공통적으로 유 의한 투입변수임을 확인할 수 있다. 이와 더불어, 구단의 합리적 경영과 효율적 선수 관 리 시스템 구축에 기여할 수 있는 객관적인 자료를 제시하고자 하는 연구 목적에 따라, 구단의 재정부문에서 가장 큰 비중을 차지하면서 성과에도 유의한 영향을 미치는 선수 들의 연봉 분포 및 효율성에 대해서 확인할 필요가 있다. (2007년에서 2010년까지의 전체타자 대상): 횡축단위(만원), 종축단위(OPS) <그림 1> 연봉분포 대비 성과분포 (2007년에서 2010년까지의 전체투수 대상): 횡축단위(만원), 종축단위(WHIP) <그림 2> 연봉분포 대비 성과분포
46 남영식 박호정 장재열 2007년에서 2010년까지의 타자와 투수의 연봉에 대한 성과지표의 분포를 위의 그래프 로 나타내었다. 만일 2억 원을 고액연봉의 기준으로 정한다고 가정하면, 위 그래프를 통 해 타자와 투수 모두 2억 원 미만의 연봉을 받는 선수가 고액연봉자보다 훨씬 많음을 확인할 수 있다. 더불어, 연봉에 대비한 성과지표의 정도를 파악할 수 있는데 타자의 경우는 연봉 2억 원 이상의 고액연봉자들의 총 92건 중 72건이 평균 OPS수치인 0.696 이상의 성적을 내 고 있음을 확인할 수 있다. 하지만 고액의 연봉을 받고 있음에도 불구하고 나머지 20건 의 경우는 평균이하의 성과를 냈으며 2억 원 이하의 연봉을 받고 있음에도 평균이상의 성과를 내는 경우로는 총 321건 중 145건이 존재했다. 투수의 경우에도 연봉 2억 원 이 상의 고액연봉자들의 40건 중 31건이 평균 WHIP인 1.604 이하를 기록하고 있음을 확인 할 수 있다. 그러나 나머지 9건의 경우는 높은 연봉에도 불구하고 평균이하의 성과를 기 록하였으며 2억 원 이하의 연봉을 받고 있는 총 276건 중 157건의 경우에는 연봉대비 평균이상의 성과를 내고 있음을 알 수 있었다. <그림 3>은 2007년~2010년에 걸쳐 구단별 타자 연봉대비 성과지표의 분포를 나타낸 것이다. 8개 구단별 타자 연봉대비 성과분포는 앞서 타자 전체를 대상으로 도출한 결과와 마 찬가지로 고액연봉의 기준으로 정한 2억 원 미만의 연봉을 받는 선수들이 대부분이라는 사실을 보여준다. 그리고 타자들의 성과지표를 나타내는 종축의 OPS와 소득을 나타내는 횡축의 연봉과의 관계는 정의 관계를 가질수록 선수들의 성과에 대한 연봉수준이 적절 하게 평가되었다고 말할 수 있는데, 롯데를 제외한 대부분의 구단에서 2억 원 미만의 연 봉을 받는 선수들이 성과에 비해 저평가 되어 있다는 것을 확인할 수 있다. <그림 4>는 2007년~2010년에 걸쳐 구단별 투수들의 연봉대비 성과지표의 분포를 나 타낸 것이다. 8개 구단별 투수 연봉대비 성과분포를 살펴보면 <그림 3>의 결과와 마찬 가지로 고액연봉의 기준으로 정한 2억 원 미만의 연봉을 받는 투수들이 대부분인 것으 로 확인할 수 있다. 그리고 투수들의 성과지표를 나타내는 종축의 WHIP과 소득을 나타 내는 횡축의 연봉과의 관계는 역의 관계를 가질수록 선수들의 성과에 대한 연봉수준이 적절하게 평가되었다고 말할 수 있는데, 대부분의 구단에서 2억 원 미만의 연봉을 받는 선수들이 성과에 비해 저평가 되어 있음을 확인할 수 있다. 선수들의 연봉책정이 오로지 성과만을 보고 판단하는 것은 아니지만 선수의 가치를 판단하는 요소 중에 가장 중요한 부분이 성과창출 능력이라는 점에서 구단별 타자와 투 수의 연봉대비 성과분포를 종합적으로 살펴본 결과 대부분의 구단에서 상당수의 선수들 이 자신의 성과 대비 연봉이 적어 저평가 되어 있다고 생각할 수 있다. 그리고 대부분의
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 47 구단들이 투수보다는 더 많은 수의 타자에게 2억 원 이상의 고액연봉을 지급하고 있음 을 확인할 수 있다. (횡축단위(만원), 종축단위(OPS) <SK> <삼성> <두산> <롯데> <KIA> <LG> <넥센> <한화> <그림 3> 구단별 타자 연봉대비 성과분포 (2007~2010)
48 남영식 박호정 장재열 <SK> (횡축단위(만원), 종축단위(WHIP) <삼성> <두산> <롯데> <KIA> <LG> <넥센> <한화> <그림 4> 구단별 투수 연봉대비 성과분포 (2007~2010)
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 49 지금까지 구단별 타자와 투수에 대한 성과지표의 수치인 OPS와 WHIP를 사용하여 연 봉분포가 비효율적으로 분포되어 있는 것을 볼 수 있었는데, 이런 비효율성이 팀의 성적 과 어떤 관계가 있는지를 살펴볼 필요가 있다. 따라서 각 구단별 타자와 투수의 성과지표인 OPS 및 WHIP 수치의 평균이상 기록횟 수 비율과 팀 성적과의 관계를 살펴본 결과, 해당 수치가 도출된 기간인 2007년~2010년 사이의 평균 팀 성적을 계산해보면 SK(1.25), 두산(2.50), 삼성(3.75), 롯데(4.50), KIA(5.00), 한화(6.00), LG(6.50), 넥센(6.67)의 순서로 순위가 정해진다. 계산법은 2007년도부터 2010년까지의 팀 성적을 각각 더한 뒤 평균을 내었다. 이것과 같은 기간 동안의 각 팀 의 타자와 투수들의 평균이상 OPS 및 WHIP 기록횟수를 더한 값의 순위를 나타내면 <표 6>과 같이 SK(81), 두산(60), 삼성(54), 롯데(54), KIA(48), LG(44), 한화(34), 넥센(31)의 순위로 나타나며, 타자와 투수의 평균이상 OPS 및 WHIP 비율을 더한 값을 나타내면 SK(146), 삼성(127), KIA(124), 두산(123), 롯데(113), LG(96), 넥센(84), 한화(78) 의 순위 로 나타난다. 사용된 데이터가 각 시즌에 참여한 모든 선수들이 포함된 수치가 아니고, 4년간의 연 간성과에 있어서 평균이상을 기록한 횟수 또한 특정연도에 편중 되어있을 가능성이 있 기 때문에 4년에 걸쳐 도출된 수치들의 순위 및 평균 팀 성적의 순위가 정확히 일치하 지는 않는다. 하지만 이 결과에서 각 팀을 구성하는 구성원들의 OPS및 WHIP의 수치가 팀 성적과 대체적으로 연관되어 있다는 사실은 확인할 수 있다. <표 6> OPS 및 WHIP의 구단별 평균이상 기록횟수(2007~2010) 팀명 타자(평균 OPS : 0.696) 투수(평균 WHIP : 1,604) 전체수 평균이상횟수 비율 전체수 평균이상횟수 비율 SK 68 45 66% 45 36 80% 삼성 51 28 55% 36 26 72% 두산 59 34 58% 40 26 65% 롯데 50 30 60% 45 24 53% KIA 43 23 53% 35 25 71% LG 47 21 45% 45 23 51% 넥센 41 20 49% 31 11 35% 한화 42 12 29% 45 22 49% 주 : 넥센은 2008년~2010년 사이의 수치를 나타냄 (구단이 2008년에 창단됨)
50 남영식 박호정 장재열 덧붙여 각 팀의 2억 원 이상 고액 연봉자들의 수와 이들 가운데에 있는 평균이상기록 비율을 보면 <표 7>와 같다. <표 7> 2억 원 이상의 고액 연봉자 중 OPS 및 WHIP의 구단별 평균이상 기록횟수(2007~2010) 팀 명 타자(평균 OPS : 0.696) 투수(평균 WHIP : 1,604) 전체수 평균이상횟수 비율 전체수 평균이상횟수 비율 SK 20 16 80% 7 6 86% 삼성 16 10 63% 6 5 83% 두산 8 7 88% 4 4 100% 롯데 9 9 100% 0 0 0% KIA 13 9 69% 4 3 75% LG 10 8 80% 9 5 56% 넥센 8 7 88% 3 1 33% 한화 5 3 60% 7 6 86% 주 : 넥센은 2008년~2010년 사이의 수치를 나타냄 (구단이 2008년에 창단됨) 이 수치를 통해서 지난 4년간 각 팀의 타자 및 투수 고액 연봉자들이 경기에 참여했 을 때, 팀 성과에 어떤 영향을 미쳤는지 판단하는 동시에 높은 연봉에도 불구하고 평균 이하의 낮은 성과를 낸 선수들의 비율이 얼마나 되는지를 확인할 수 있다. 지금까지 타자와 투수들의 성과지표인 OPS와 WHIP의 수치와 연봉과의 관계를 분석 함으로서, 각 구단의 성과관리 효율성에 대해서 살펴보았다. 타자와 투수의 연봉에 대한 효율성을 SFA 기법을 적용하여 타자 및 투수 데이터에 대한 효율성 분석을 진행한 결 과 반정규분포와 절단정규분포의 경우에 각각 <그림 5>와 <그림 6>과 같은 분포를 가 지고 나왔다. 2가지 모두 분석기간인 2007년~2010년 사이의 각 선수의 평균연봉을 계 산하여 평균연봉에 따른 효율성 분포를 나타낸 것이다. 타자의 연봉대비 효율성 분포가 나타난 <그림 5>에서는 반정규분포일 때는 평균 효율 성이 0.881, 절단정규분포의 경우에는 0.842로 도출되었다. 투수의 경우에는 성과지표인 WHIP값이 낮을수록 효율적이기 때문에 원래 WHIP 값들 중 가장 높은 값보다 더 크면 서 차이가 가장 작은 7에서 나머지 값들을 뺀 것을 효율성 계산에 이용되는 WHIP 값으 로 설정하고 효율성을 도출하여 <그림 6>처럼 그래프에 나타내었다. 투수의 연봉대비 효율성 분포가 나타난 <그림 6>에서는 반정규분포일 때는 평균 효율성이 0.970, 절단정 규분포일 때는 0.974로 도출되었다.
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 51 타자의 대표적인 경우로 이대호 선수를 살펴보면 효율성이 반정규분포와 절단정규분 포일 경우에 각각 0.971, 0.952를 기록하여 한국을 대표하는 타자답게 높은 효율성을 나 타내었다. 투수의 경우에는 류현진 선수를 살펴보면 반정규분포와 절단정규분포일 경우 에 각각 0.979, 0.983을 기록하여 평균보다 높은 효율성을 나타내고 있음을 알 수 있다. 하지만 타자의 경우에는 2억 원 이상의 고액연봉자 23명 중에서 7명이 평균 효율성 이하의 효율성을 나타냈고, 투수의 경우에는 고액연봉자 9명중 2명이 평균 효율성 이하 의 효율성을 나타내고 있다. 그리고 타자보다 투수의 경우가 낮은 연봉선수들에 비교했 을 때 뛰어난 효율성을 나타내지 못하는 경우가 많음을 알 수 있었다. Half-distrbution Truncated-distribution <그림 5> 연봉대비 효율성분포(타자) : 횡축단위(만원), 종축단위(효율성) Half-distrbution Truncated-distribution <그림 6> 연봉대비 효율성분포(투수) : 횡축단위(만원), 종축단위(효율성)
52 남영식 박호정 장재열 <표 8> 연봉에 따른 성과지표의 분포(고액연봉기준: 2억원 이상) 구분 연봉 구분 (2007-2010) 평균성과이상 평균성과이하 타자 투수 고액연봉선수(92건) 72건/92건(78%) 20건/92건(22%) 일반연봉선수(321건) 145건/321건(45%) 176건/321건(55%) 고액연봉선수(40건) 31건/40건(77%) 9건/40건(23%) 일반연봉선수(276건) 157건/276건(57%) 119건/92건(43%) Ⅵ. 결 론 본 연구에서는 야구선수들의 정보를 통해 구축한 혼합자료를 활용하여 각 선수들의 성과를 산출요소로 두었을 때 투입요소들과의 관계에 대해서 살펴보았다. 위의 추정결과 를 통해 우리는 효율적 선수관리에 관한 몇 가지 결론을 내릴 수 있는데, 그 중 첫 번 째가 타자와 투수 모두 연봉이 성과창출에 있어 긍정적 유인 효과를 가진다는 사실이다. 이는 직관적으로 당연한 결과라고 생각할 수 있지만 통계적 수치를 이용해 변수 관계의 유의성을 보임으로써 자료에 객관성을 부여했다고 할 수 있다. 두 번째 결론은 경기수가 성과창출에 있어 긍정적인 효과를 가진다는 것이다. 이것을 다시 표현하면 경기에 대한 꾸준한 참여가 그 선수의 성과 향상으로 이어질 수 있다는 것이다. 이를 통해 선수관리의 측면에서 선수들이 자신의 역량을 100% 발휘하지 못하고 주춤할 때가 있더라도 관리자의 입장에서 일정수준 이상의 기회를 부여하는 것이 선수 들의 실력향상에 도움이 될 수 있다는 사실을 알 수 있다. 세 번째 결론은 나이는 선수들의 성과에 부정적인 영향을 미친다는 것이다. 이를 통 해, 야구가 다른 스포츠에 비해 비교적 전략적인 스포츠이기 때문에 나이가 많을 경우, 경험에서 얻어지는 노련함을 바탕으로 성과에 있어서 긍정적인 효과를 낼 수도 있지만 육체를 사용하는 일이기 때문에 나이가 듦에 따라 생기는 부정적인 효과가 더 커져 전 체적으로 나이와 성과 사이에 음의 상관관계를 가짐을 알 수 있다. 하지만 여기서 주의해야할 점은 나이가 투수의 경우에는 반정규분포모형과 절단정규 분포모형의 분석결과 모두 1% 수준에서 유의함이 드러났으나 타자의 경우는 모든 경우 에 유의하지 않은 결과가 나왔다는 점이다. 타자의 경우 나이변수에 대해 유의하지 않게
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 53 나온 이유가 다양할 수 있겠지만 어떠한 이유이든 결과적으로 투수에 비해서 성과창출 에 대한 나이 영향력이 작음을 알 수 있다. 이와 같은 성과지표와 투입요소에 관한 관계 의 고찰이 구단 입장에서 효율적인 선수관리체계를 구축하는데 있어 기준자료가 될 수 있을 것이다. 이와 더불어 선수들의 연봉에 대한 성과분포 분석을 통해서 2가지 사실을 확인할 수 있다. 첫 번째는 고액연봉자의 비효율성에 관한 것이고 두 번째는 일반선수들의 성과 저 평가에 대한 내용이다. 먼저 고액연봉자의 비효율성에 대해 알아보기 위해 연봉 2억 원 이상 받는 선수를 고 액연봉자라고 가정하였는데 타자와 투수 모두 여기에 해당되는 선수들 중 평균 OPS와 WHIP 이하의 성과를 낸 선수들을 비효율적인 고액연봉자로 보았다. 4년이라는 기간동 안의 분석결과, 타자는 92건의 고액연봉자 중에서 20건인 22%가 평균 OPS, 0.696 이하 를 기록하였고 투수의 경우에는 40건의 고액연봉자 중에서 9건인 23%가 평균 WHIP, 1.604 이상을 기록하여 비효율성을 나타내었다. 이를 통하여 고액연봉자의 경우는 타자 가 투수보다 많이 존재하나 비효율성을 가지는 비율은 비슷함을 알 수 있다. 반면에 2억 원 이하의 연봉을 받는 타자와 투수들 중 평균이상의 성과를 낸 선수들은 타자의 경우 321건 중 145건인 45%, 투수의 경우 276건 중 157건인 57%를 차지하여 성과에 비교해서 저평가된 경우의 비율이 고액연봉자들 중 비효율성을 가지는 비율보다 2배 이상 높음을 확인할 수 있다. 물론 이와 같은 결과의 도출에는 경기수를 얼마나 소 화했느냐에 따른 가치의 차이가 반영되지 않았다는 한계점이 존재한다. 하지만 이런 한 계를 가지고 있음에도 불구하고 이 결과를 통해서 구단 입장에서 고액 연봉자인 스타선 수의 영입에만 집중하는 것보다 좋은 성과를 기록하고 있지만 저평가된 선수들에 대한 트레이닝 및 보상을 시행하여 팀의 주축선수로 키워나갈 필요가 있음을 생각할 수 있다. 또한 구단별 연봉대비 성과분포 분석결과, 대부분의 구단에서 2억 원 이상의 고액연 봉을 받는 타자들이 2억 원 이상 받는 투수들에 비해 더 많은 것을 볼 수 있었다. 이는 구단이 한정된 재정규모 안에서 투수보다 타자에게 주는 연봉비중이 더 크다는 것으로 볼 수 있는데, 이런 정책이 팀의 성적에 직결되는지 분석한 결과, 실제로 상위에 랭크되 어 있는 구단의 경우 연봉분포가 타자에게 더 집중되어 있는 것을 확인할 수 있었다. 모기업의 지원금이 구단 재정의 70%이상을 차지하는 현 수익구조 안에서 한 번의 승 리라도 이뤄내야 하는 구단의 실정 상 앞서 분석한 결과처럼 경기의 승패를 좌우하는 타자에게 연봉이 집중되는 이 현상은 당연한 것이라고 생각할 수 있으며, 이런 비효율적 인 연봉분포의 해결을 위해서라도 기업에 대한 재정적 의존도를 낮추는데 노력이 필요 할 것이다.
54 남영식 박호정 장재열 구단별로 선수들의 연봉대비 성과분포를 분석해보면 타자와 투수의 경우 각각의 성과 지표에 있어서 평균이상 기록회수 합 및 비율의 순위가 팀의 4년간 평균적인 순위와 유 사하게 나타남을 확인할 수 있었다. 이를 통해서 각 팀 내에 평균이상의 성과를 기록하 는 선수들의 수가 팀 성과에 영향을 미칠 수 있다는 사실을 확인할 수 있었고 각 팀에 서 보유하고 있는 고액 연봉자들 중 평균이상의 성과를 내는 비율이 고르게 높은 경우 팀이 상위권에 머무는 경향이 있음을 또한 확인할 수 있었다. 마지막으로 SFA 기법을 적용하여 도출한 선수효율성의 연봉대비 분포를 분석한 결과, 타자의 경우 반정규분포와 절단정규분포일 때 0.881와 0.842의 평균값을, 투수의 경우 반정규분포와 절단정규분포일 때 각각 0.970과 0.974의 평균값을 가지는 것으로 나타났 다. 고액연봉을 받음에도 불구하고 평균효율성 이하의 값을 가지는 비효율적인 경우는 타자의 경우 23건 중에 7건인 30%, 투수의 경우에는 9건 중에 2건인 22%가 존재함을 확인할 수 있었다. 구단 입장에서는 본 연구에서 시행한 것과 같은 분석을 통하여 팀 내에 연봉대비 성 과지표나 효율성이 현저히 떨어지는 선수들에 대해서는 문제점을 파악하여 개선할 수 있는 시스템을 구축하는 것이 필요할 것으로 생각된다. 또한 연봉대비 성과지표나 효율 성이 탁월한 선수들에게는 경기에 참여할 수 있는 기회를 더 제공하고, 연봉 계약시 이 런 부분들을 잘 반영해 그들의 잠재력을 이끌어 낼 수 있도록 하여야 할 것이다. 이런 과정을 통해서 구단 입장에서의 효율적인 선수관리 시스템이 정착 될 때, 스포츠 산업 내에서 한국프로야구가 한 단계 더 도약할 수 있는 발판이 마련될 것이며 진정한 스포 테인먼트 산업으로 거듭날 수 있을 것이다. 연구에 있어서 조금 더 정교한 분석을 위해서 타자나 투수의 타석수나 이닝 수까지도 고려해서 데이터를 구축하였다면 좋았겠지만 그럴 경우 충분한 표본의 확보가 힘들어지 므로 이와 같이 시행하지 못하였다. 조금 더 세부적인 조건 제시가 가능하다면 추정결과 에 있어 더 큰 정확성을 부여할 수 있을 것이라 생각하며 이는 차후의 연구로 남겨두고 자 한다.
확률프론티어 기법을 활용한 한국 프로야구 선수들의 효율성 분석 55 참고 문헌 김용규 임창균 (2011). 세계 주요 지상파 방송사업자의 총요소생산성 비교. 문화경제연구, 제14권, 제1호. Aigner, D. J. S. F. Chu. (1968). On Estimating the industry Production Function. American Economic Review, Vol. 58, (pp. 826-839). David Jacobs. (2003) Major league baseball : a close look at employee performance and monetary compensation. New York University. Gerald W. Scully. (2004). Player salary share and the distribution of player earnings. Managerial and Decision Economics, Vol. 25, 77-86. Jahn K. Hakes Chad Turner. (2011). Pay, productivity and aging in major league baseball. Journal of Productivity Anlaysis, Vol 35. 61-74. Joonho Kang Younghan Lee Sihyeong Kwon. (2007). Evaluating Management Efficiency of Korean Professional Baseball Teams using Data Envelopment Analysis(DEA). International Journal of Sports and Health Science, Vol. 5, 125-134. Lawrence Debock Wallace Hendricks Roger Koenker. (2004). Pay and Performance : the impact of salary distribution on fir-level outcomes in baseball. Journal of Sports Economics, Vol. 5, No.3, 243-261. M. J. Farrell. (1957). The Measurement of Productive Efficiency, Journal of the Royal Statistical Society, series A. R. Todd Jewell David J. Molina. (2004). Productive efficiency and salary distribution : the case of US major league baseball. Scottish Journal of Political Economy, Vol. 51, No. 1.
56 남영식 박호정 장재열 [Abstract] Efficiency analysis of Korean baseball players using stochastic frontier analysis Youngsik Nam * Hojeong Park ** Jaeyeal Jang *** This paper studies with the efficiency analysis on the base of the unbalanced pooling data which is constructed by the records about Korean baseball players between 2007 and 2010. The purpose of this paper is to suggest the objective standard to evaluate the individual players efficiently in the aspect of team management. SFA is chosen as the method for analysis and the section of the analysis is divided as hitters and pitchers. The outcome variable in the case of hitters is used as OPS and in the case of pitchers is used as WHIP. The input components are used as wage, age, region, FA, abroad, the number of attending on the games, but FA is not used as the input variable in the case of pitchers due to data problem. As the estimation results, the performance in the hitters has the significantly positive relationship with wage and game numbers and in the pitchers has also the positive relationship with wage and game numbers but has the negative relationship with age significantly. Additionally, the results shows that there are many underestimated players and it needs to manage players efficiently in the aspect of team. Key Words : Baseball Efficiency, OPS, WHIP, SFA * Doctoral Student(First author), Dept. of Food and Resource Economics, Korea University, toju111@korea.ac.kr ** Professor(Corresponding author), Dept. of Food and Resource Economics, Korea University, hjeongpark@korea.ac.kr *** Doctoral Student(Second author), Dept. of Food and Resource Economics, Korea University, jy0405@korea.ac.kr