Journal of the Korean Data & Information Science Society 2017, 28(2), 한국데이터정보과학회지 한국프로야구에서투수연봉에영향

Similar documents
DBPIA-NURIMEDIA

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

DBPIA-NURIMEDIA

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a


286 Heebae Seung Kee-Hoon Kang 국 4억으로 협상을 보았다. 객관적인 성적이나 수치가 인상과 삭감을 결정하는 매우 중요한 열쇠이지 만, 그렇다고 기록만 가지고 연봉을 책정하지는 않는다. 각 구단은 선수가 팀에서 차지하는 비중, 인기, 경력, 입단


노동경제논집 38권 4호 (전체).hwp

65 Soon-Kwi Kim Young-Hoon Lee 한국프로야구의매시즌별팀당경기수가동일하지않으므로, 본연구에서는시즌별팀당경기수 G로나눈시즌별경기당득점수 rsg와경기당실점수 rag를변수 rs와 ra 대신사용하였다. 절에서승률을정의하고,.절에서 rsg rag와승률간의상

1478 Jangtaek Lee 큰경우가 6.24%, 가장작은경우가 0.03%, 평균 1.95% 로이정도의오차는일반적으로설명할수없는 랜덤오차로보기에충분하다고할수있겠다. 지금까지수행된야구의피타고라스정리에관한연구들은크게나누면세가지로대별된다. 첫째는 피타고라스정리에사용되는지

???? 1

- 1 -

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

제 4 장회귀분석

체육학석사학위논문 프로야구선수의가치평가요인탐색 : 한국프로야구리그와메이저리그의 연봉결정요인비교분석 2018 년 2 월 서울대학교대학원 체육교육과 황수웅

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

,,,.,,,, (, 2013).,.,, (,, 2011). (, 2007;, 2008), (, 2005;,, 2007).,, (,, 2010;, 2010), (2012),,,.. (, 2011:,, 2012). (2007) 26%., (,,, 2011;, 2006;

Analyses the Contents of Points per a Game and the Difference among Weight Categories after the Revision of Greco-Roman Style Wrestling Rules Han-bong

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

350 Jang Taek Lee 들의 평가가 서로 상이하게 될 수 있기 때문에 지표들에 대한 종합적인 판단을 할 필요가 있다. 따라서 변수 개수가 많을 때 변수의 성질에 따라 묶인 소수의 변수로 만들어 주는 주성분분석과 같은 분석이 필 요할 수 있으며, 따라서 본 연구

???? 1

DBPIA-NURIMEDIA

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

<34C2F7C0FC2E687770>

2. 세이버메트릭스에따른최적의경기력요인들을바탕으로상위권팀의평균을구하고한화이글스의평균과비교분석한다. 3. 다중회귀분석을통해구해낸승률에영향을미치는요인들중한화가가진단점을보완하기위한선수영입리스트를작성한다. 이논문은최하위한화이글스를한국시리즈진출팀으로도약시키는데필요한정보를제공하기

DBPIA-NURIMEDIA

1..

G Power

도비라

29-6(본문).pdf

에너지경제연구 Korean Energy Economic Review Volume 11, Number 2, September 2012 : pp. 1~26 실물옵션을이용한해상풍력실증단지 사업의경제성평가 1

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

1272 Jea-Young Lee, Hyeon-Gyu Kim KBO에서의 WAR은선수의공격능력 (batting runs) 과주루능력 (base running runs), 수비능력 (fielding runs), 포지션조정 (positional adjustment) 의합을


The characteristic analysis of winners and losers in curling: Focused on shot type, shot accuracy, blank end and average score SungGeon Park 1 & Soowo

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 4위 LWLWW 최근 5 경기 WLWWL 순위 : 2위 최근 경기 결과 및 일정 시

에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 1~18 가격비대칭성검정모형민감도분석 1

롯데여 영원하라

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 7위 LWLWL 최근 5 경기 WWLWW 순위 : 3위 최근 경기 결과 및 일정 시리

한국성인에서초기황반변성질환과 연관된위험요인연구

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 9.69 시즌전체 6.. 시즌상대. 순위 : 위 LWWWW 최근 경기 WWLWL 순위 : 위 최근 경기 결과 및 일정 시리즈 정보 NC 다이노스 對 롯데전 팀기록 일자 구장 상대 결과 구분 승 패


, ( ) * 1) *** *** (KCGS) 2003, 2004 (CGI),. (+),.,,,.,. (endogeneity) (reverse causality),.,,,. I ( ) *. ** ***

자연채무에대한재검토 1. 서론 2. 선행연구 9 Journal of Digital Convergence 214 May; 12(5): 89-99

simpro의 프로야구 이야기

DBPIA-NURIMEDIA

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

< C6AFC1FD28C3E0B1B8292E687770>

012임수진

<31342EBCBAC7FDBFB52E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

exp

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: 3 * The Effect of H

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

<C7D1B1B9B1B3C0B0B0B3B9DFBFF85FC7D1B1B9B1B3C0B05F3430B1C733C8A35FC5EBC7D5BABB28C3D6C1BE292DC7A5C1F6C6F7C7D42E687770>

인문사회과학기술융합학회

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<34C2F7C0FC2E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap

서론 34 2

Vol.259 C O N T E N T S M O N T H L Y P U B L I C F I N A N C E F O R U M

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLWWW 최근 5 경기 LWWLL 순위 : 7위 최근 경기 결과 및 일

슬라이드 1

PowerPoint 프레젠테이션

09권오설_ok.hwp

188 최 영 환 청률을 통한 가치측정을 통한 자기 권리를 주장할 수 있 는 근거 자료로 활용할 수 있다. 즉, 방송사가 주장하는 낮은 중계권료를 주장할때는 프로야구가 낮은 시청률을 기록했을 때만이 정당하다. 하지만, 프로야구의 뜨거운 열기만큼이나 시청률도 급 성장세를

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

09구자용(489~500)

DBPIA-NURIMEDIA

에너지경제연구 제13권 제1호

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LWWWW 최근 5 경기 LLWLL 순위 : 6위 최근 경기 결과 및 일

Microsoft PowerPoint - LM 2014s_Ch4.pptx

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLWWL 최근 5 경기 WLWLW 순위 : 3위 최근 경기 결과 및 일

#Ȳ¿ë¼®


04_이근원_21~27.hwp

2016 MLB 내셔널리그선발투수개인능력평가 강병우 1. 서론 1.1. 연구목적야구는전세계에서가장인기있는구기종목중하나이다. 축구는잉글랜드, 스페인, 독일, 이탈리아, 프랑스등유럽각지를중심으로전세계에퍼져있지만, 야구같은경우는미국의야구산업독점이라고해도과언이

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 95~118 학술 탄소은행제의가정용전력수요절감효과 분석 1) 2) 3) * ** *** 95

논총13집.PDF


공휴일 전력 수요에 관한 산업별 분석

<31372DB9DABAB4C8A32E687770>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

A Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul Ha Yeon Hong* Joo Hyung Lee** 요약 주제어 ABSTRACT:This study recognizes th

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

44-4대지.07이영희532~

14.531~539(08-037).fm

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2>

Æ÷Àå½Ã¼³94š

(JH)

유선종 문희명 정희남 - 베이비붐세대 소유 부동산의 강제매각 결정요인 분석.hwp

Transcription:

Journal of the Korean Data & Information Science Society 2017, 28(2), 317 326 http://dx.doi.org/10.7465/jkdi.2017.28.2.317 한국데이터정보과학회지 한국프로야구에서투수연봉에영향을주는요인 이장택 1 1 단국대학교응용통계학과 접수 2017 년 2 월 11 일, 수정 2017 년 3 월 19 일, 게재확정 2017 년 3 월 27 일 요약 한국프로야구에서투수들의연봉을결정하는중요한요인들을선형회귀모형을통해서살펴본다. 제안된모형을이용하여투수들의경기력과연봉간의패턴을분석할수있으며, 구단별로차이점도알수있다. 사용된데이터는 2010 년부터 2015 년까지의투수기록과다음해의연봉자료를이용하였으며, 고려된설명변수들은해당연도, 팀의종류, 게임수, 평균자책점, 수비무관평균자책점, 이닝당안타및볼넷허용률, 대체선수대비승리기여도, 선발출장게임의수, 승, 패, 세이브, 투구이닝수, 자유계약선수여부, 나이, 경험연수이며반응변수로는연봉에로그를취한로그연봉을사용하였다. 그결과선발투수이며경기수가많고승수가많은투수들에게많은연봉이지급되고있고투수의고유능력을평가할수있는기록들은반영이작게되고있음을확인할수있었으며연구의결과는연봉결정에중요한참고자료로활용될수있을것으로간주된다. 주요용어 : 경기력, 선발투수, 투수연봉, 한국프로야구, 회귀모형. 1. 서론프로야구에서투수가차지하는비중은날이갈수록높아지고있는것이오늘날의추세이다. 확실한투수가없는경우에한국시리즈에서우승할확률은거의없으며투수들은장기페넌트레이스를운영하는데있어서전력의핵심이다. 따라서매우중요한위치에있는투수들의연봉은반드시능력을제대로반영하여보다객관화해서정해야만한다. 프로야구구단에서연봉책정시에가장많은비중을차지하는부분은구단의고과평점으로알려져있다 (Seung과 Kang, 2012). 각구단마다약간의차이는있겠지만선수가팀에서차지하는비중, 기여도, 인기및경력등을종합적으로고려된고과평점을바탕으로연봉을정한다고한다. 그러나한국프로야구 (Korean Baseball Organization; KBO) 에도고과평점으로객관적인판단을한다지만연봉이많아질수록더욱연봉협상과관련된문제가많이발생하며미국이나일본에비해구단의경제적형편도썩좋은편이아니기때문에구단과선수들사이에서로가수긍하는객관적인수행능력평가는반드시필수적이라고할수있다. 이런이유로한국프로야구투수들의경기력결과와연봉간의패턴분석은중요한의의를가진다. KBO 투수들의경기력과연봉과의관계에대한선행연구들을살펴보면연봉에중요한영향을미치는여러가지독립변수를이용하여회귀분석을실시한 Lee와 Kang (2001), 방어율, 경기출장, 승리, 패전, 세이브, 투구이닝, 피안타, 볼넷, 삼진, 실점, 자책점을이용하여주성분회귀분석을실시한 Kim (2002), 신경망분석, 의사결정나무분석, 회귀분석에데이터마이닝기법을적용하여 KBO 선수들의연봉에관한분석을다룬 Oh와 Lee (2003), 세이버메트릭스수치들인 WHIP 및 FIP 등의기록을이용하여투수자신이통제할수있는기록과연봉과의관계를분석한 Kim (2013) 등이있다. 한편 KBO 타 1 (16890) 경기도용인시죽전동 126번지, 단국대학교응용통계학과, 교수. E-mail: jtlee@dankook.ac.kr

318 Jang Taek Lee 자들의경기력과연봉과의관계에대한선행연구들은야구를수리적으로분석하는방법론인세이버메트릭스지수를계산하고안타, 타점, 볼넷, 도루등을다시혼합하여연봉과의중회귀분석을실시하여유의한회귀계수를도출한 Lee (2006), KBO 타자들에대한세이버메트릭스지수값을이용하여경기력과연봉간의패턴을분석한 Seung과 Kang (2012) 등이있으며, KBO 리그에대한최신연구로는투수평가지표에대한 Lee (2014) 의연구, KBO에적당한타자력지수를제안한 Hong 등 (2016), 한국프로야구의승률을로지스틱모형과프로빗모형을통해서추정한 Kim 등 (2016), 한국시리즈와같은우승결정방식에서베르누이시행과독립성을가정하는경우에상위팀들이우승할확률을추정하는방법을제안한 Cho (2016) 등이있다. 한편미국프로야구 (Major League Baseball; MLB) 인경우는투수들의경기력과연봉과의관계에대한연구들을많이접할수있는데, 1990년대부터오늘날에이르기까지메이저리그의각팀이자유계약시대에사용했던연봉메커니즘에대한통찰력을제공하는연구들이많이개발되었다. 일련의연구들은종속변수로연봉이나로그를취한연봉을사용하고투수경기력으로판단되는다양한독립변수들을사용하여모형을만들었다 (Lackritz, 1990; Marburger, 1994; Hoaglin과 Velleman, 1995; Bollinger와 Hotchkiss, 2003; Hakes와 Sauer, 2006; Hills와 Gregory, 2014). 취급된 MLB 데이터는시기가다달라서 Lackritz (1990) 는 1985 및 1986 시즌자료, Marburger (1994) 는 1991 및 1992 시즌자료, Hoagin과 Velleman (1995) 은 1986년의연봉자료, Bollinger와 Hotchkiss (2003) 는 1987년부터 1993년시즌자료, Hakes와 Sauer (2006) 는 2000년부터 2004년시즌자료, Hills와 Gregory (2014) 는 2011년부터 2013년사이의시즌자료를각각사용하였다. 그런데지금까지수행된 MLB 리그연구는특정시점에서조사한횡단연구뿐만아니라시점을달리하여변화를조사한종단연구도병행되었지만 KBO 리그연구는횡단연구가대부분이다. 따라서당해연도의같은경기력에대해서도연봉은선수에따라많은차이가발생하는등설명하기가난감한경우들이많았다. 예를들면프로야구첫해인투수가 10승및방어율 2점을기록했다고 10년동안연평균 10승및방어율 2점투수와같은대접을받을수는없다. 아마도 KBO에서종단연구가힘들었던이유는연구시기가야구통계의접근성을높일수있는지속적인통계데이터베이스구축및업데이트가더디고충실한컨텐츠의제공이불가능한시기였던탓이라고간주되는데, 최근우리나라에서도아직 MLB 만큼은아니더라도빠르게프로야구에대한세밀한데이터까지제공하는사이트들이늘어나고있다. 이런이유로과거에는취급할수없었던연봉에관한투수들의경기력을살펴보면기존연구의한계점들을보완할수있고, 투수들의경기력과연봉의패턴분석에관한연구를좀더객관화할수있을것이라기대하며한층더나아가서구단이선수의연봉을결정하는데도움이될것으로간주된다. 따라서본연구와기존연구의차이는기존연구에서배제된여러가지종단연구의요소를가미하여투수의경기력과연봉과의관계를살펴보았다는점에있다고할수있다. 본논문은다음과같이구성되어있다. 2절에서는데이터의구성및본연구에서사용한여러가지투수평가지표에대한설명과기술통계값을살펴보았으며, 3절에서는제안된회귀모형과결과를설명하였다. 끝으로 4절에서는본연구의결론을제시하였다. 2. 연구방법 2.1. 데이터의구성데이터는한국프로야구사설기록사이트인스탯티즈 (http://www.statiz.co.kr) 에기록되어있는 2010년부터 2015년사이의연봉데이터와투수기록및 2016년연봉데이터를이용하였으며분석대상은모두 698명의경기결과이다. 데이터의출처가사설기록사이트인것은한국프로야구공식홈페이지에는연봉자료가없기때문이다. 데이터의가공및분석은 SAS university edition과 SPSS (ver. 23K) 를

Analysis of factors affecting Korean professional baseball pitcher salaries 319 사용하고그래프작성은 R 을이용하였으며통계분석기법으로는상관분석및회귀분석을활용하였다. 조사된선수들은 KIA 77 명, LG 87 명, NC 28 명, SK 83 명, 넥센 67 명, 두산 85 명, 롯데 79 명, 삼성 94 명, 한화 79 명, 그리고 KT 19 명으로삼성이가장많았으며, KT 가가장적었다. Table 2.1 Descriptive statistics for included variables MEAN STD MAX MIN G 26.28 20.196 80 1 ERA 5.8192 5.58340 81.00 0.00 FIP 5.2400 3.10291 36.86-2.81 WHIP 1.6754.90736 12.00 0.00 WAR.9014 1.74627 22.00-1.30 W 2.66 3.597 18 0 L 2.60 2.906 15 0 SV 1.31 4.722 47 0 IP 48.0699 44.41108 194.00 0.00 AGE 27.15 4.618 41 18 SALARY 11671.92 14570.976 125000 2400 서론에서언급한선행연구들을참조하여투수연봉에영향을줄것으로예상되어고려한설명변수들은해당연도 (YEAR), 팀의종류 (TEAM), 게임의수 (G), 평균자책점 (ERA), 수비무관평균자책점 (FIP), 이닝당안타및볼넷허용률 (WHIP), 대체선수대비승리기여도 (WAR), 선발출장게임수 (ST), 승 (W), 패 (L), 세이브 (SV), 투구이닝수 (IP), 자유계약선수여부 (FA), 출생년도 (BYEAR), 프로야구시작연도 (SYEAR), 나이 (AGE), 경험연수 (EXP) 이며반응변수로는선형회귀모형의정규성가정을위하여단위는만원을사용한연봉 (SALARY) 에로그를취한로그연봉 (LOGSALARY) 을사용하였다. Table 2.1은본연구에포함된대표적인투수통계량에대한기술통계값을보여준다. 평균게임수는 26.28, ERA와 FIP는평균값은비슷하나표준편차, 최댓값및최솟값모두 ERA의경우가 FIP보다약간크며, 1이닝당평균적으로 1.68명정도의주자를내보내며, 평균 WAR은 0.9, 승과패의평균은각각 2.66과 2.60, 평균세이브수는 1.31, 평균투구이닝수는 48.07, 평균나이는 27.15세, 평균연봉은 11,672 ( 만원 ) 으로나타났다. 2.2. 투수지표 다양한투수들의평가지표중본연구에서사용한보편화된지표들은다음과같으며, 사용된영어약자 는각각자책점 (ER), 투구이닝수 (IP), 삼진 (K), 볼넷 (BB), 피안타 (H), 피홈런 (HR) 과같다. 2.2.1. W-L 승리-패배 (win-loss record) 는투수를평가하는가장대표적이고오래된지표로많이이길수록, 적게질수록우수한투수가된다. KBO 리그에서도투수지표중가장오래되고많이사용하는평가기록이다. 투수다승은의미가매우큰지표였지만현대야구에서는선발투수가평균적으로책임지는투구이닝이점점더낮아지고있기때문에약간씩중요도가떨어지고있다고할수있다. Kim (2013) 에의하면 2012년투수의고과에바탕을둔 2013년 KBO 투수들의연봉에가장높은영향을미치는것은승 (W) 으로나타났을정도로여전히투수기록의핵심지표라고할수있다. 2.2.2. ERA (Earned runs average) 평균자책점 (ERA) 은 9 이닝당투수책임으로허용한점수인자책점 (earned run; ER) 의비율을의

320 Jang Taek Lee 미한다. ERA 는다승 (W) 과함께가장보편화된고전적인투수평가의기준이지만팀전체의책임인실 점을투수만의통계량으로취급하는모순이있다. ERA = 9(ER)/IP 2.2.3. WHIP (Walks plus hits divided by Innings pitched) 세이버메트리션들의가장대표적인투수지표로이닝당출루허용율을의미한다. 볼넷과안타를포함한수치를투구이닝으로나눈수치로 WHIP의값이적을수록좋은투수를의미한다. 하지만사구와장타의요소를완전히무시했다는점에서비판적인시각도많이있다. W HIP = (BB + H)/IP 2.2.4. FIP (Fielding independent pitching) ERA 대체통계로수비무관평균자책점이라는뜻으로실제로투수가통제할수있는영역인삼진, 볼넷, 홈런, 사구를갖고평균자책점의형태로나타낸 DIPS (defense independent pitching stats) 를기반으로좀더실용적으로사용할수있게개량한투수지표이다. 투수의미래성적을예측하는데유용하며평균자책점과같은형태로산출되기때문에비교해서살펴보기가편하다. 13(HR) + 3(BB) 2(K) F IP = + 3.20 IP 2.2.5. WAR (Wins above replacement) 대체선수대비승리기여도로설명되는통계량으로세이버메트릭스에서선수의가치를평가하는대표적인지표이다. WAR의값이 1인의미는대체선수에비해팀의 1승을더생산했다는뜻으로특정선수가보통선수에비해팀의승리에기여도를계산한값이다. 이밖에도투수의평가지표로는투수의 9이닝동안탈삼진개수를뜻하는 K/9, 9이닝동안허용한볼넷의개수를뜻하는 BB/9, 볼넷하나당몇개의삼진을잡았는지보여주는기록인 K/BB 등이있으나본연구에서는사용하지않았는데, 이들통계량은선행연구에서도연봉에기여한다는결과가없었으며, 이들통계량의결과는 FIP 또는 WAR에포함되었다고할수있기때문이다. 3. 분석및결과본연구에서는로그연봉값을종속변수로하였으며투수경기력지표로사용된독립변수로는특정연도의수행평가지표인 W, ERA, WHIP, FIP, WAR과세이브수 (SV) 와같은 6개의지표와비수행평가지표로는나이 (AGE), 경험 (EXP), 선발투수등판횟수 (ST), 자유계약해당여부 (FA), 팀의종류 (TEAM) 를사용하였다. 비수행평가지표로고려된변수들에대한배경설명은나이, 경험등은상식적으로연봉에효과를줄것으로간주되었고, 투수자원이한정되어있는 KBO의경우선발투수의평균소화이닝이중요하게인식되고, 국내 FA시장에서매년역대연봉협상최고액을갱신하는계약들이체결되는등 FA 여부, 그리고구단의종류에따라연봉지급예산규모가다르고연봉산출지표도다르기때문이다. 하지만외국인투수들은연봉산정에주관적인요소가가미된특수성이있는관계로분석에서제외하였다. Table 3.1은본연구에서사용한 24개의변수들과의미를보여준다. 변수의정의를좀더자세히설명하면연령 X 1 은해당연도 -출생연도로계산하고, 연령의제곱 X 2 는나이가많아지면전성기를지나게되기때문에그런가능성을대비하기위해사용하였으며, 각선수들의경험연수를의미하는

Analysis of factors affecting Korean professional baseball pitcher salaries 321 X 3 는현재연도 - 입단연도로계산하고, 해당연도 X 4 는간편계산을위하여해당연도 -2010 으로계산하였 다. 한편자유계약여부를설명하는 X 5 는해당연도자유계약건이있으면 1, 없으면 0 으로사용하였으 며, X 12 는참여한게임의수, X 13 은세이브수, X 14 는승률, X 15 는선발출장한게임의수를각각의미 하며, 변수 X 16 부터 X 24 까지는팀의종류를나타내는더미변수들이다. Table 3.1 Description of predictors for regression model Predictor Meaning Predictor Meaning X 1 age X 13 saves X 2 age 2 X 14 winning percentage X 3 experience X 15 games starting X 4 year X 16 team=n exen X 5 free agency eligible X 17 team=lotte X 6 W X 18 team=samsung X 7 ERA X 19 team=hanhwa X 8 WHIP X 20 team=kia X 9 FIP X 21 team=kt X 10 WAR X 22 team=lg X 11 IP X 23 team=nc X 12 G X 24 team=sk Table 3.2 Model summary for regression analysis R Square Adjusted R Square Std. Error of the Estimate 0.747 0.742 0.44982 Table 3.3 Estimated regression model coefficients Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. (Constant) 6.938.151 46.076.000 X1.036.007 0.186 5.392.000 X3.024.007 0.122 3.515.000 X4.050.009 0.108 5.396.000 X5.455.113 0.079 4.030.000 X6.068.010 0.275 6.867.000 X10.024.012 0.047 2.026.043 X12.014.001 0.312 12.271.000 X13.030.004 0.159 7.584.000 X15.028.004 0.263 7.541.000 X18.179.052 0.069 3.457.001 X19 -.204.055 -.073-3.679.000 X21 -.237.109 -.044-2.187.029 X22 -.116.053 -.043-2.180.030 회귀모형설정은단계선택법을이용하였으며그결과가 Table 3.2와 Table 3.3이다. 선택된회귀모형의결정계수는 0.747로나타났으며, 분산분석표는지면관계상생략되었지만 p값은 p < 0.001로회귀직선은유의수준 1% 에서매우유의한것으로나타났다. Table 3.3은추정된회귀식, 표준화회귀계수를보여주는데, 선택되어진변수들은모두유의수준 5% 에서유의하였다. 하지만 y-축에대한이상치가너무많았고따라서모형의개선은충분히가능하다고판단되었다. y-축에대한이상치가많은이유는대별해서대략 2가지로간주되는데, Figure 3.1과 Figure 3.2를보면알수있다.

322 Jang Taek Lee Figure 3.1 Histogram for salary Figure 3.2 Box plot with two FA groups for salary Figure 3.1은연봉에대한히스토그램을보여주는데, 대부분이저연봉으로판단되며또한정규분포가아닌왜도가매우큰값인분포임을알수있다. Figure 3.2는 FA 성사여부에따른연봉의차이를보여주는데, FA가있는그룹이없는그룹에비해월등하게연봉이많다. 따라서이런이유로 y-축에대한이상치를확인할수있는스튜던트제외잔차 (studentized deleted residual) r i 가매우크거나작은값이많이발생한다. 보통선형회귀분석에서는 r i > 2인경우에관측치를이상치로판단하는데, 본연구에서는절단점을 2로잡는경우에데이터의 1/3 이상을제거하여야했기때문에부득이하게 i번째관측치의 r i 가 2.5 미만인데이터만분석에서사용하였다. 그결과 64개의데이터가삭제되고 634개의자료를이용하여모형이완성되었는데그결과결정계수는 84.5% 로증가하고모형도변수 X 21 과 X 22 가제거된모형이선택되어졌으며자세한모형은 Table 3.4와같다. Table 3.4를살펴보면분산팽창요인 (VIF) 의최대값이 4.269이므로다중공선성문제는없다고볼수있으며, 유의한회귀계수로부터 KBO 투수들의연봉은매우간단한구조를가진다고설명할수있는데나이 (X 1) 가많고, 경험 (X 3) 이많고, 연도 (X 4) 가많고, 자유계약 (X 5) 이있고, 승리의수 (X 6) 가많고, WAR (X 10) 이높고, 게임수 (X 12) 가많고, 세이브수 (X 13) 가많고, 선발게임수 (X 15) 가많고, 팀이삼성 (X 18) 이면많고, 팀이한화 (X 19) 이면적다고해석되어진다. 물론위의결과중에팀의종류에종속되는결과는 2010년부터 2015년까지의결과이고향후에는어떤변화가있을지는각구단의경제적여건및입장에달렸을것이다. 그런데표준화회귀계수를살펴보면좀더중요도가높은변수가무엇인지알수있는데, 상위 1위부터 3위인 (X 12, X 6, X 15) 변수들은모두많은게임을치루고선발투수이며다승을하는요건으로서이사실은투수자원이부족한우리나라인경우가장뛰어난투수들이앞장

Analysis of factors affecting Korean professional baseball pitcher salaries 323 서서다른투수들이상으로이닝을더책임을져야운영이가능하고이런이유로선발투수는팀에서가 장중요한자산중하나라고간주하는것같다. Table 3.4 Estimated regression model coefficient for final model Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. VIF (Constant) 6.931.111 62.380.000 X1.035.005.205 7.187.000 3.259 X3.013.005.075 2.620.009 3.255 X4.040.007.095 5.903.000 1.043 X5.576.088.106 6.561.000 1.052 X6.071.007.322 9.893.000 4.269 X10.020.008.045 2.354.019 1.447 X12.013.001.328 15.634.000 1.766 X13.030.003.178 10.317.000 1.198 X15.027.003.276 9.772.000 3.215 X18.192.038.082 5.072.000 1.047 X19 -.169.040 -.068-4.223.000 1.029 Figure 3.3 Residuals versus fits plot 한편투수자체의능력이라고볼수있는 ERA, WHIP, FIP, WAR 중에서는 WAR 만이투수연봉에영향을주었다. 이사실은누락된통계량들이연봉에영향을주지않는다는뜻이아니라이들값들이서로상관관계가매우커서다중공선성문제로변수선택과정에서배제된것으로판단되며, 투수능력을판단하는여러가지통계량중에서한국프로야구에서는 WAR이가장연봉과크다고판단되지만선발투수에관한다른통계량보다현저하게표준화회귀계수가낮다. 즉, 투수자체의능력만으로연봉이결정되는강도는약하다고볼수밖에없다. (a) (b) Figure 3.4 Box plot and QQ plot for residuals

324 Jang Taek Lee Figure 3.5 Scatterplot of predicted vs. actual values Table 3.4의식을이용하여작성한잔차도표가 Figure 3.3인데패턴을보아등분산성을가정할수있고, Figure 3.4는잔차들에대한상자그림과정규확률지그림을보여주는데, 오차들의정규성을의심할필요가없다고판단되어진다. Figure 3.5는실제의로그연봉과추정된로그연봉의관계를보여주는산점도이다. 대체적으로실제로그연봉을추정된로그연봉으로잘예측하고있으며, 두변수의관계를가장잘설명하는회귀직선은 y를실제로그연봉, x를추정된로그연봉이라고할때그림에도나타나있지만 y=x로판명되었다. 4. 결론본연구에서는한국프로야구투수들의수행능력과비수행능력을조사하여연봉을설명하는선형회귀모형을제안하였다. 수행능력을평가하기위해사용한측도로는승리의수, 평균자책점, WHIP, FIP, WAR, 패배의수, 게임의수, 세이브수, 승률, 선발출장횟수를고려하였으며, 비수행능력을평가하기위해사용한측도로는나이, 경험, 연도, FA여부, 팀의종류였다. 그결과투수들의평가는대부분우수한선발투수를높게평가하는것으로나타났다. 이점은프로야구초창기때의평가와크게달라진점이없다는사실을시사하며논문내용에는생략되어있지만투수의경기력으로채택된유일한변수인 WAR의표준화회귀계수값도연도에따라뚜렷하게증가하는패턴도찾을수가없었다. 또한최종모형에서특이한것은투수가얼마나잘하는지알아볼수있는가장기본적이며대표적인기록이평균자책점 (ERA) 인데연봉에영향을주는요인에관한회귀모형의중요변수에서빠진다는점이다. 이점에대한논쟁은 MLB에서도마찬가지로발생하는데, Hills 등 (2014) 에의하면여러가지논쟁에서모두 ERA가빠지는사실을확인할수있다. 프로야구투수들은당연하게경기력이높은선수가더많은연봉을받는것이타당하기때문에앞으로의투수연봉산정은투수자체가통제할수있는기록들을중심으로이루어지는것이바람직하다. 왜냐하면투수에대한세이버메트릭스지수들은투수스스로통제할수있는기록을가지고뛰어난투수를과학적으로판별하여주기때문이다. 본연구의목적은우수한경기력을보였음에도불구하고불합리한대우를받는선수들이없기를바라는객관적인연봉을결정하는데도움을주고자하는데있으며나아가투수세이버메트릭스측도를좀더사용하여보다평가의타당성을갖춘연봉시스템이완비되었으면하는희망이다. 본연구에서는다룰수없었던구장효과, 투수들의인기도, 생활태도등다른요인들도투수들의가치를정하는데영향을미치기때문에선수에관련된다양한데이터를손쉽게구할수있다면좀더프로야구투수들의경기력과연봉의패턴을더욱정확한결과를얻을수있을것이며이부분은향후연구과제로남겨둔다.

Analysis of factors affecting Korean professional baseball pitcher salaries 325 References Bollinger, C. and Hotchkiss, J. (2003). The upside potential of hiring risky workers: Evidence from the baseball industry. Journal of Labor Economics, 21, 923-944. Cho, D. H. (2016). The winning probability in Korean series of Korean professional baseball. Journal of the Korean Data & Information Science Society, 27, 663-676. Hakes, J. and Sauer, R. (2006). An economic evaluation of the moneyball hypothesis. The Journal of Economic Perspectives, 20, 173-186. Hills, C. and and Gregory, M. (2014). Professional baseball pitchers performance and its effect on salary, https://www.overleaf.com/articles/professional-baseball-pitchers-performance-and-its-effect-on -salary/xndsqqqnrynm#share. Hoaglin, D. and Velleman, P. (1995). A critical look at some analyses of major league baseball salaries. The American Statistician, 49, 277-285. Hong, C. S., Kim, J. Y. and Shin, D. S. (2016). Alternative hitting ability index for KBO. Journal of the Korean Data & Information Science Society, 27, 677-687. Kim, E. S. (2002). The relationship of game performance and annual salary for korean professional baseball pitchers. Journal of Korean Sociology of Sport,15, 95-104. Kim, S. K. and Lee, Y. H. (2016). The estimation of winning rate in Korean professional baseball league. Journal of the Korean Data & Information Science Society, 27, 653-661. Kim, Y. H. (2013). A study of determinants of Korean baseball pitchers salary, Master Thesis, Sogang University, Seoul. Lackritz, J. (1990). Salary evaluation for professional baseball players. The American Statistician, 44, 4-8. Lee, M. G. (2006). Relationship between performance ability of professional baseball batters and annual salary based on sabermetrics, Master Thesis,, Kookmin University, Seoul. Lee, J. T. (2014). Pitching grade index in Korean pro-baseball. Journal of the Korean Data & Information Science Society, 25, 485-492. Lee, J. Y. and Kang, H. M. (2001). The relationship between annual salary and performance of korean professional baseball pitchers. Journal of Korean Sociology of Sport, 14, 115-124. Marburger, D. (1994). Bargaining power and the structure of salaries in major league baseball. Managerial and Decision Economics, 15, 433-441. Oh, K. M. and Lee, J. T. (2003). A model study on salaries of korean pro baseball players using data mining. Journal of Korean Sociology of Sport, 16, 295-309. Seung, H. B. and Kang, K. H. (2012). A study on relationship between the performance of professional baseball players and annual salary. Journal of the Korean Data & Information Science Society, 23, 285-298.

Journal of the Korean Data & Information Science Society 2017, 28(2), 317 326 http://dx.doi.org/10.7465/jkdi.2017.28.2.317 한국데이터정보과학회지 Analysis of factors affecting Korean professional baseball pitcher salaries Jang Taek Lee 1 1 Department of Applied Statistics, Dankook University Received 11 February 2017, revised 19 March 2017, accepted 27 March 2017 Abstract In this paper, we investigate the effects of performance and non-performance variables attributed to Korean professional baseball pitchers on annual salary by the records about pitchers between 2010 and 2016. We select the variables in reference to previous research related to this topic. The models are then estimated using linear regression model. For pitchers, age, experience in the league, year, eligibility for free agency, the number of wins, WAR, the number of innings pitched, the number of games, the number of saves, the number of games started, and type of baseball team have a statistically significant effect. Among the notable factors, affecting pitchers salaries are largely measure of starting pitchers. Pitcher sabermetrics indexes were poorly reflected on annual salary. The model presented here can be used to remove any unobjective salary differences for Korean professional baseball pitchers. Keywords: Korean professional baseball, pitcher salary, regression model, salary difference, starting pitcher. 1 Professor, Department of Applied Statistics, Dankook University, Gyeonggi-do 16890, Korea. E-mail: jtlee@dankook.ac.kr