286 Heebae Seung Kee-Hoon Kang 국 4억으로 협상을 보았다. 객관적인 성적이나 수치가 인상과 삭감을 결정하는 매우 중요한 열쇠이지 만, 그렇다고 기록만 가지고 연봉을 책정하지는 않는다. 각 구단은 선수가 팀에서 차지하는 비중, 인기, 경력, 입단



Similar documents
350 Jang Taek Lee 들의 평가가 서로 상이하게 될 수 있기 때문에 지표들에 대한 종합적인 판단을 할 필요가 있다. 따라서 변수 개수가 많을 때 변수의 성질에 따라 묶인 소수의 변수로 만들어 주는 주성분분석과 같은 분석이 필 요할 수 있으며, 따라서 본 연구

<34C2F7C0FC2E687770>

1272 Jea-Young Lee, Hyeon-Gyu Kim KBO에서의 WAR은선수의공격능력 (batting runs) 과주루능력 (base running runs), 수비능력 (fielding runs), 포지션조정 (positional adjustment) 의합을

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 7위 LWLWL 최근 5 경기 WWLWW 순위 : 3위 최근 경기 결과 및 일정 시리

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 4위 LWLWW 최근 5 경기 WLWWL 순위 : 2위 최근 경기 결과 및 일정 시

오늘의 매치업 양 팀 맞대결 정보 무 률.. 순위 : 위 최근 및 일정 상대 마산 마산 마산 문학 문학 수원 구장 / / / / / / VS 시즌전체 시즌상대 최근 LLWLL 무 률.. 시리즈 정보,,, 홈 성적 방문 성적 맞대결 성적 통산 홈 성적 통산 방문 성적 통

프로야구 선수들의 선수에이전트에 관한 인식조사 연구

<36C2F7C0FC2E687770>

- 2 -

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Microsoft Word - Market Issue 빅데이타 시대


체육학석사학위논문 프로야구선수의가치평가요인탐색 : 한국프로야구리그와메이저리그의 연봉결정요인비교분석 2018 년 2 월 서울대학교대학원 체육교육과 황수웅

exp

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLWWW 최근 5 경기 LWWLL 순위 : 7위 최근 경기 결과 및 일

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LWWWW 최근 5 경기 LLWLL 순위 : 6위 최근 경기 결과 및 일

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 9.69 시즌전체 6.. 시즌상대. 순위 : 위 LWWWW 최근 경기 WWLWL 순위 : 위 최근 경기 결과 및 일정 시리즈 정보 NC 다이노스 對 롯데전 팀기록 일자 구장 상대 결과 구분 승 패

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLWWL 최근 5 경기 WLWLW 순위 : 3위 최근 경기 결과 및 일

PowerPoint 프레젠테이션

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2>

춤추는시민을기록하다_최종본 웹용

Journal of the Korean Data & Information Science Society 2017, 28(2), 한국데이터정보과학회지 한국프로야구에서투수연봉에영향

A Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul Ha Yeon Hong* Joo Hyung Lee** 요약 주제어 ABSTRACT:This study recognizes th

2. 세이버메트릭스에따른최적의경기력요인들을바탕으로상위권팀의평균을구하고한화이글스의평균과비교분석한다. 3. 다중회귀분석을통해구해낸승률에영향을미치는요인들중한화가가진단점을보완하기위한선수영입리스트를작성한다. 이논문은최하위한화이글스를한국시리즈진출팀으로도약시키는데필요한정보를제공하기

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a


<32C2F7C0FC2E687770>

statistics

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WWWLW 최근 5 경기 LWLWL 순위 : 4위 최근 경기 결과 및 일정

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

노동경제논집 38권 4호 (전체).hwp

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 5위 WLWLW 최근 5 경기 WWLWW 순위 : 2위 최근경기결과및일정 시리즈정보 NC

회원번호 대표자 공동자 KR000****1 권 * 영 KR000****1 박 * 순 KR000****1 박 * 애 이 * 홍 KR000****2 김 * 근 하 * 희 KR000****2 박 * 순 KR000****3 최 * 정 KR000****4 박 * 희 조 * 제

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 WLWWW 최근 5 경기 LLLWL 순위 : 6위 최근경기결과및일정 시리즈정보

29-6(본문).pdf

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 4위 WL 최근 5 경기 WL 순위 : 4위 최근경기결과및일정 시리즈정보 NC 다이노스對두산

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LLLLD 최근 5 경기 WWLWW 순위 : 2위 최근 경기 결과 및

Jkafm093.hwp

Microsoft PowerPoint - chap04-연산자.pptx

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 LWWWL 최근 5 경기 LWWLW 순위 : 7위 최근경기결과및일정 시리즈정보

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLLLL 최근 5 경기 LLWWL 순위 : 7위 최근 경기 결과 및 일

= ``...(2011), , (.)''

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

<C1A63135B1C720C1A632C8A320B9AEC8ADB0E6C1A6BFACB1B C2F720BCF6C1A4BABB292E687770>

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LWWWL 최근 5 경기 WWLLW 순위 : 8위 최근 경기 결과 및 일

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLWWW 최근 5 경기 LLWLL 순위 : 5위 최근경기결과및일정 시리즈정보

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

GAME #72(원정 #35) 2019년 06월 19일 잠실야구장 시즌(vs 두산) 8차전 루친스키(5-3, 1.88) vs 이영하(8-1, 3.63) 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체

04 Çмú_±â¼ú±â»ç

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 LWWWL 최근 5 경기 WWWLW 순위 : 1위 최근경기결과및일정 시리즈정보

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

#Ȳ¿ë¼®

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 7위 LWWLL 최근 5 경기 LLWWL 순위 : 3위 최근경기결과및일정 시리즈정보 NC

PowerPoint 프레젠테이션

³»Áö_10-6

MLB 2K9_PS3_MN

<B3EDB9AEC0DBBCBAB9FD2E687770>


오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 4위 LLWWW 최근 5 경기 LLWLL 순위 : 8위 최근경기결과및일정 시리즈정보 NC 다

???? 1

1478 Jangtaek Lee 큰경우가 6.24%, 가장작은경우가 0.03%, 평균 1.95% 로이정도의오차는일반적으로설명할수없는 랜덤오차로보기에충분하다고할수있겠다. 지금까지수행된야구의피타고라스정리에관한연구들은크게나누면세가지로대별된다. 첫째는 피타고라스정리에사용되는지

60

歯111

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LLWLW 최근 5 경기 WWLWL 순위 : 2위 최근 경기 결과 및 일정 시리즈 정보 NC 다이노스

2014학년도 수시 면접 문항

서울도시연구_13권4호.hwp

GAME #67( 홈 #37) 2019 년 06 월 13 일 창원 NC 파크 시즌 (vs 넥센 ) 9 차전 루친스키 (4-3, 1.95) vs 브리검 (3-2, 3.39) 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체


Ⅰ. 서론 1982년처음출범한프로야구는해마다관중수가계속해서증가하고있다. 한국스포츠사상처음으로누적관중 1억명을돌파하였고, 2013년현재에도최고의인기를누리고있다. 각구단들은더많은관중을유치하기위해경기장시설을리모델링하고바베큐존, 그린존등의인프라를제공하여연인이나가족단위의나들이를

hwp

¹é¼Ł sm0229-1

152*220

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 WLLWL 최근 5 경기 LLWLW 순위 : 5위 최근 경기 결과 및 일

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 WLWWL 최근 5 경기 WLWLW 순위 : 8위 최근경기결과및일정 시리즈정보

<3130C7D1B0E6C0D32E687770>

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 2위 WLLWW 최근 5 경기 WWWLL 순위 : 5위 최근경기결과및일정 시리즈정보

65 Soon-Kwi Kim Young-Hoon Lee 한국프로야구의매시즌별팀당경기수가동일하지않으므로, 본연구에서는시즌별팀당경기수 G로나눈시즌별경기당득점수 rsg와경기당실점수 rag를변수 rs와 ra 대신사용하였다. 절에서승률을정의하고,.절에서 rsg rag와승률간의상

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LWWWW 최근 5 경기 LLLLL 순위 : 8위 최근경기결과및일정 시리즈정보

오늘의 매치업 양 팀 맞대결 정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 WWLLL 최근 5 경기 LLLLW 순위 : 6위 최근 경기 결과 및 일정 시리즈 정보 NC 다이노스 對

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 1위 LWWWL 최근 5 경기 WLLLW 순위 : 7위 최근경기결과및일정 시리즈정보 NC 다

~

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 9위 WLLLW 최근 5 경기 LWLLL 순위 : 8위 최근경기결과및일정 시리즈정보

368 배재영, 이진목, 이제영 수들을 표준화하여서 산술평균을 구해서 순위를 예측하고, 상관계수를 통해서 가중평균순위를 예측한 다. 하지만 산술평균은 유사한 능력이 있을 시, 동일한 가중치(1/n)를 주는 문제가 있으며, 가중평균은 많은 변수의 상관계수가 복잡하여서,

<B1DDC0B6B1E2B0FCB0FAC0CEC5CDB3DDB0B3C0CEC1A4BAB82E687770>

#유한표지F

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

Kor. J. Aesthet. Cosmetol., 라이프스타일은 개인 생활에 있어 심리적 문화적 사회적 모든 측면의 생활방식과 차이 전체를 말한다. 이러한 라이프스 타일은 사람의 내재된 가치관이나 욕구, 행동 변화를 파악하여 소비행동과 심리를 추측할 수 있고, 개인의

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

오늘의매치업 양팀맞대결정보 승 패 무 승률 VS 승 패 무 승률 시즌전체 시즌상대 순위 : 3위 LWWLL 최근 5 경기 LLWWW 순위 : 1위 최근경기결과및일정 시리즈정보 NC 다

열린포항 12월호


Microsoft PowerPoint - chap01-C언어개요.pptx

2013unihangulchar {45380} 2unihangulchar {54617}unihangulchar {44592} unihangulchar {49328}unihangulchar {50629}unihangulchar {51312}unihangulchar {51

???? 1

Transcription:

Journal of the Korean Data & Information Science Society 2012, 23(2), 285 298 한국데이터정보과학회지 한국 프로야구 선수들의 경기력과 연봉의 관계 분석 승희배 1 강기훈 2 12 한국외국어대학교 통계학과 접수 2012년 1월 19일, 수정 2012년 2월 12일, 게재확정 2012년 3월 7일 요 약 본 연구는 프로야구 선수들의 경기력을 세분화하고 섬세하게 측정 할 수 있는 세이버메트릭스 기 법을 적용하여 한국 프로야구 8개 구단의 타자들을 대상으로 세이버메트릭스 지수를 통해서 알아본 선수들의 경기력과 연봉간의 패턴을 분석하고자 한다. 연구 방법으로는 한국 프로야구 8개 구단의 2009년, 2010년도 타자들의 경기 기록과 차년도 연봉 자료를 수집한 후, 세이버메트릭스 지수를 계산 하여 연봉과의 관계를 주성분분석을 통해 살펴보았다. 각 구단별로 일부 상이한 결과도 있었지만 전 반적으로는 경기력이 높은 선수들에게 많은 연봉이 지급되고 있음을 확인하였다. 본 연구의 결과는 각 구단 및 타자들이 연봉협상에 임할 때 중요한 참고 자료가 될 수 있다고 판단된다. 주요용어: 고유값, 고유벡터, 세이버메트릭스, 주성분분석. 1. 서 론 1982년도 우리나라에서 프로야구가 출범한 이래 팀의 신설과 폐지 등을 거쳐 현재 는 8개의 프로야구 팀이 있다. 해마다 시즌이 종료되면 선수와 구단간의 연봉협상에 관한 줄다리기가 시작된다. 2010년도 4월 13일 동아일보에 따르면, 당시 우리나라 프로야구의 8개 구단 연봉을 다 합쳐봐야 344여억 원으로 미국 프로야구 양키스팀의 로드리게스 선수의 1/6도 안된다고 하였다. 참고로 2010년도와 2011년도 우 리나라 프로야구 선수들의 구단별로 평균연봉과 등록된 선수 수를 표 1.1에 제시하였다. 우리나라의 프 로야구의 실정상 제한된 자원으로 연봉을 효율적으로 분배해야 하는 일이 각 구단은 물론 개별 선수들의 주요 관심사로 대두되었다. 전영희 (2011)에 따르면 프로야구 구단에서 연봉 책정 시에 가장 많은 비중을 차지하는 부분은 구단 의 고과 평점이다. 이 고과 평점에는 각 선수의 역할 및 능력이 세부적으로 점수화되어 반영되게 된다. 구단 고과에는 각 구단마다 다소 차이는 있지만 단장을 위원장으로 운영팀장, 운영과장, 전력분석팀장, 스카우트팀장, 기록원 등이 참여하게 된다. 이들은 1년 동안 작성한 각종 데이터를 근거로 연봉의 인상 과 삭감을 결정한다. 고과 평점은 매우 중요한 항목이며, 공식기록에는 집계되지 않는 내용들도 기재되 어 있다. 2010 시즌 연봉산정을 앞두고 기아 타이거즈는 최희섭 선수에게 2억에서 3억 5천으로 연봉 인상을 제 시하였다. 하지만, 최희섭 선수는 자신의 2009년도 프로야구 성적을 언급하며 구단에게 2억에서 5억의 연봉인상을 요구하였다. 기아 타이거즈는 최희섭 선수의 공헌 정도는 인정했지만 상황이 곤란해져, 결 이 논문은 2011년도 한국외국어대학교 학술연구비 지원에 의해 수행되었음. 1 (449-791) 경기도 용인시 처인구 모현면 왕산리, 한국외국어대학교 통계학과, 학생. 2 교신저자: (449-791) 경기도 용인시 처인구 모현면 왕산리, 한국외국어대학교 통계학과, 교수. E-mail: khkang@hufs.ac.kr

286 Heebae Seung Kee-Hoon Kang 국 4억으로 협상을 보았다. 객관적인 성적이나 수치가 인상과 삭감을 결정하는 매우 중요한 열쇠이지 만, 그렇다고 기록만 가지고 연봉을 책정하지는 않는다. 각 구단은 선수가 팀에서 차지하는 비중, 인기, 경력, 입단 후 기여도 등을 종합적으로 고려해서 연봉을 정한다. 앞의 사례에서 본 것처럼 현재 우리나 라 프로야구에는 구단과 선수사이에 연봉 협상과 관련된 문제가 많이 발생한다. 외국에 비해 구단의 형 편도 많이 어려운 우리나라에서 연봉협상은 구단운영에 있어 아주 중요한 일이라고 할 수 있다. 그렇다 면 우리나라 프로야구 선수들이 시즌을 마친 후 선수의 기록과 다음 해의 연봉간에는 어떠한 패턴을 보 일까? 우리는 이 부분에 초점을 맞추어 경기력과 연봉의 패턴 분석에 관한 연구를 진행하기로 한다. 표 1.1 한국 프로야구 8개 구단의 평균 연봉 (단위:만원) 년도 SK 삼성 LG KIA 두산 롯데 넥센 한화 2010 11,422 10,214 10,325 8,936 8,442 8,552 6,177 5,200 (49) (49) (55) (50) (49) (48) (46) (51) 2011 11,402 9,598 9,437 9,094 9,477 9,163 6,142 5,376 (52) (48) (52) (51) (48) (52) (53) (50) 자료출처: 조선닷컴 인포그래픽스 (괄호 안은 선수 수) 일반적으로 사람들이 야구선수들의 경기력을 판단하는데 한국야구위원회 (KBO)에서 집계되는 공식 기록을 사용한다. 한국야구위원회에서는 현재 공격에 관한 통계로 타율, 안타, 홈런, 타점, 득점, 도루, 장타율, 출루율의 8가지를 제공하고 있다. 하지만, 이들 공식으로만 선수의 경기력을 판단하는 것은 다 음과 같은 한계점들이 존재한다. 첫째, 타율은 모든 안타를 똑같이 취급하는 것과 볼넷 같은 다른 공격 수단의 가치를 인정하지 않는 두 가지 통계적 문제점을 가지고 있다. 둘째, 타점은 타자 개인의 능력보 다는 상황에 많이 좌우되기 때문에, 타자의 능력을 보여주는 데 한계가 있다. 셋째, 홈런의 개수는 구장 크기, 타순에 따른 상대투수의 차이 등 미묘한 차이에 따라 변한다. 그래서 홈런 개수만으로 타자의 능 력을 평가하는 것은 부정확할 수 있다. 넷째, 도루 개수는 선수의 기동력을 제외하고는 아무런 공격 능 력도 설명해주지 못한다. 다섯째, 타자의 목표인 출루율과 장타율 두 가지는 공격의 중요한 두 측면을 각각 정확히 설명하는 장점을 갖지만 반대로 말하면, 나머지 한 측면에 대해서는 전혀 설명을 못한다는 약점이 있다. 이렇게 한계점을 지니고 있는 기본 수치들로만 선수의 경기력을 측정한다면 객관성과 정 확성이 현저하게 떨어지게 되는 오류를 범할 수 있다. 이런 문제점들을 보완하기 위해 선수들의 경기력을 좀 더 객관적으로 판단할 수 있는 것이 기본 수치 들을 조합하여 만든 세이버메트릭스 (Sabermetrics)이다. 야구의 역사가 깊고, 야구를 분석하는 여러 가지 기법이 발달된 미국에서는 세이버메트릭스를 사용하여 좀 더 객관적으로 선수의 경기력을 판단하 고 있다. 그러므로 세이버메트릭스를 적용하여 측정된 선수들의 경기력을 바탕으로 연구를 진행 한다면, 앞서 제시한 기존 공격 통계의 한계점들을 보완할 수 있고, 선수들의 경기력과 연봉의 패턴 분석에 관한 연구 를 좀 더 객관성 있게 진행 할 수 있을 것이라 기대한다. 더 나아가서 우리가 연구할 패턴분석을 통하여 구단이 선수의 연봉을 결정하는데 도움이 될 것이라는데 본 연구의 필요성이 있다. 다른 스포츠에서 경 기력의 패턴 또는 영향에 관한 최근 연구로는 이장택 (2010), 민대기 (2011) 등이 있다. 흔히 야구는 기록 경기라고 하며, 수집된 기록을 분석하는 데에는 통계의 역할이 매우 중요하다고 할 수 있다. 어떤 감독은 데이터 야구를 구사한다고 하기도 하며, 이러한 노력이 좋은 결실을 맺기도 한다. 우리나라 프로야구와 관련된 데이터를 분석한 연구로는 데이터마이닝 기법을 적용하여 프로야구 선수들 의 연봉에 관한 분석을 다룬 오광모와 이장택 (2003), 본 연구와 같은 세이버메트릭스를 적용한 이만규 (2006), 관중 수 예측을 다룬 이장택과 방소영 (2010) 등이 있다. 오광모와 이장택 (2003)은 2000년 투수와 타자들의 자료로 2001년 연봉과의 관계를 살펴보았다. 제

A study on relationship between the performance of professional baseball players and annual salary 287 시된 여러 변수들의 평균, 분위수 등 기술통계량을 조사하였고, 연봉과의 몇몇 변수들의 상관관계를 파 악하였다. 또한, 연봉을 로그변환하여 이를 종속변수로 하고 여러 변수들과 중회귀분석을 시행하였다. 데이터마이닝 기법 중에서는 타자의 연봉 설명은 신경망분석이, 투수의 연봉은 의사결정나무분석이 좋 은 성능을 보인다고 했다. 하지만, 추정된 회귀모형의 계수를 보면 타당하지 않은 측면이 있고, 데이터 마이닝 기법을 적용하기 위한 조건의 변화에 따라 상반된 결과가 나올 수 있음을 제시하고 있다. 이만규 (2006)는 2002년부터 2004년 타자들의 자료에 대해 경기수, 타수, 득점, 안타, 홈런, 볼넷 등 17개의 변수와 이로부터 계산된 세이버메트릭스 지표 6개 등 총 23개 변수에 대해 각각 연봉과의 단순 회귀분석을 실시하였다. 이로부터 표준화계수가 크다고 보이는 7개의 변수를 선택하여 이 변수들을 독 립변수로 한 중회귀분석을 시행하여 두 개의 회귀계수가 유의함을 제시하였다. 이만규 (2006)의 결과는 우선 여러 변수들을 모형에 중복하여 사용함으로써 모형의 타당성과 유의성에 대한 한계가 있고, 모든 구단의 타자 전체를 함께 분석함으로써 연봉지급에 있어 각 구단의 특성을 잘 반영하지 못하였다고 할 수 있다. 본 연구에서는 기초 자료로부터 세이버메트릭스 지수를 계산하고, 계산된 지수들 간에 상관관계가 존 재함을 고려하여 이로부터 유도된 주성분으로 경기력을 확인하고 각 구단별로 연봉과의 관계를 살펴보 았다는 점이 선행연구와의 차이점이다. 이 주성분들을 이용하여 구단별로 회귀모형도 추정해 볼 수 있 다. 본 논문은 다음과 같이 구성되어 있다. 2절에서는 세이버메트릭스의 유래 및 구성 지수들에 대해 소 개한다. 3절에서는 한국 프로야구 각 구단별로 세이버메트릭스 지수를 계산하고 연봉과의 관계를 살펴 본다. 4절에서는 본 연구의 주요 결과를 제시하고 추가 연구의 필요성을 제시한다. 2. 이론적 배경 2.1. 세이버메트릭스 (Sabermetrics)의 개념과 유래 세이버메트릭스는 통계학자 출신인 Bill James가 창시한 SABR (Society for American Baseball Research)에서 만들어진 단어로 야구에 관한 수치를 통계학적이고 객관적인 방법으로 분석하는 기법을 말한다. James (1982)는 타율에 비해 저평가되었던 출루율을 중요한 척도라고 주장하며, 출루율과 장 타율의 개념을 합친 OPS 개념을 만들었고, 이를 통하여 야구 통계인 세이버메트릭스를 알렸다. 그 후, 1982년부터 1988년까지 야구 팬들은 독자적으로 경기 통계를 기록하고 분석하여 의견을 교환하는 네트 워크를 구성하였다. 이들은 당시, 야구에 관한 기록을 제시하는 엘 리아스 스포츠 사무국 의 야구 기록 지의 한계를 느끼고 팬들이 직접 경기 기록을 작성하여 공유하자는 운동을 전개하였다. 이후 SABR과 야구 통계의 역사가 학문적 연구의 대상이 되어야 한다는데 동의하고 함께 세이버메트릭스를 만들게 된 다. 이후 세이버메트릭스의 요인들은 Furtado와 Palmer (2000) 등에 의해 2000년도부터 2012년 현재 까지도 수정 및 보완되어 오고 있다. 2.2. 용어의 정의 세이버메트릭스는 공격력을 평가하는 득점공헌 도구에 기본을 두고 있으며, 공격의 두 가지 능력인 베 이스를 얻는 능력 (아웃당하지 않는 능력)과 더 많은 베이스를 전진하는 능력 (루타+도루+희생타)을 측정하는 것에 바탕을 두고 있다. James (1982)와 SABR에 따르면 세이버메트릭스와 관련된 지표들은 다음과 같이 정의된다.

288 Heebae Seung Kee-Hoon Kang (1) Runs Created (RC) 타자의 생산력을 평가하는 득점 창조력 (공헌도)에 관한 지수로 팀에 베이스를 추가시키는 공격 행위 는 양의 값을, 베이스나 공격 기회를 날리는 행위는 음의 값을 가진다. 출루 =안타 + 볼넷 + 사구 도루실패 병살 전진 =루타 + 0.26 (볼넷 + 사구) + 0.53 (희생번트 + 희생플라이) + 0.64 도루 0.03 삼진 RC =(출루 + 2.4 타석) (전진 + 3 타석) (9 타석) (0.9 타석) (2.1) (2) Extrapolated Runs (XR) 타자의 진루 및 주루와 관련된 사항을 선형 가중식으로 구한 득점 공헌도이다. RC와 비슷한 개념이 지만, 정확도 면에서는 낫다고 알려져 있다. XR =1루타 0.5 + 2루타 0.72 + 3루타 1.04 + 홈런 1.44 + (사구 + 볼넷 고의사구) 0.34 + 고의사구 0.25 + 도루 0.18 도루실패 0.32 (타수 안타 삼진)0.09 삼진 0.098 병살타 0.37 + 희생플라이 0.37 + 희생번트 0.04 (2.2) (3) Onbase Percentage Plus Slugging Percentage (OPS) 타자의 출루율과 장타율의 합으로 구성되어 있는 지수로 타자의 주루능력, 병살타 생산과 희생타 생산 능력 등이 반영되지 않는다는 점에서 타자평가에 있어서의 다소 한계가 있는 지표이다. 하지만 손쉽고 편하기에 가장 널리 쓰이는 타자의 공격력에 대한 평가 지표이다. OPS = 1.5 출루율 + 장타율 (2.3) (4) Secondary Average (SECA) 안타를 타수로 나누는 타율 공식이 갖는 가장 큰 맹점은 장타와 단타의 가치를 동일시하면서 볼넷은 인정하지 않는다는데 있다. SECA는 장타율의 가중치에 볼넷과 도루의 가치를 고려해 만든 수정타율이 다. 이는 일반적인 타율의 허상을 보완한 개념이라 볼 수 있다. SECA = (2루타 + 2 3루타 + 3 홈런 + 볼넷 + 도루 도루실패) 타수 (2.4) (5) Isolated Power (ISO) 장타율에서 단타를 제외한 타자의 순수한 파워 배팅 (power batting) 능력을 측정하는 지표이다. ISO = 장타율 타율 or ISO = (2루타 + 2 3루타 + 3홈런) 타수 (2.5) (6) BR (Batting Runs) 리그 평균적인 공격력을 가진 타자보다 팀 득점에 공헌한 정도를 측정하는 선형가중식이다. BR =0.47 1루타 + 0.78 2루타 + 1.09 3루타 + 1.40 홈런 + 0.33 (볼넷 + 사구) + 0.30 도루 0.60 도루실패 0.25 (타수 안타) 0.50 주루사 (2.6)

A study on relationship between the performance of professional baseball players and annual salary 289 3. 분석방법 및 결과 3.1. 분석방법 본 연구는 한국 프로야구 8개 구단 (KIA 타이거즈, SK 와이번스, 두산 베어스, 롯데 자이언츠, 삼성 라이온즈, 넥센 히어로즈, LG 트윈스, 한화 이글스)의 타자들의 경기력과 연봉을 대상으로 한다. 각 구 단마다 연봉지급 규모가 다를 뿐만 아니라, 상대하는 팀이 다르고 이에 따라 산출되는 세이버메트릭스 지표도 다르기 때문에 선수 전체를 통합하지 않고 구단별로 나누어 분석한다. 다만, 분석 대상인 타자 중에 연봉산정에 특수성이 있는 외국인 선수와 타율이 0인 선수는 제외하기로 한다. 프로야구 8개 구단의 2009년, 2010년도 타자들의 경기 기록을 수집하여 식 (2.1)부터 (2.6)까지 의 세이버메트릭스 지수를 계산한다. 당해년도 경기 기록이 다음년도 연봉산정에 영향을 주기 때문 에 2009년도 경기 자료는 2010년 연봉과, 2010년 경기 기록은 2011년 연봉과의 관련성을 파악한다. 2009년과 2010년 프로야구 시즌에서 최고의 경기력을 보인 SK 구단과 삼성 구단을 중점 분석하고 기타 구단은 2010년의 분석결과만 수록하기로 한다. 모든 분석은 SAS 9.1을 사용하였고, 그림은 엑셀로 그 렸다. 3.2. 분석결과 1) SK 구단 한국야구위원회 (2009)에서 얻은 SK 선수 중 타자들의 경기 기록으로부터 계산한 세이버메트릭스 지 수와 2010년 시즌에 지급된 연봉은 표 3.1과 같다. 계산된 세이버메트릭스 지수들과 2010년도 연봉과 의 상관계수를 구하여 표 3.2에 제시하였다. OPS를 제외하고는 상관계수가 유의수준 5%에서 모두 유 의한 것으로 파악되나 실제 상관계수는 0.5 전후로 변수간의 선형관계가 강하다고 볼 수는 없다. 표 3.1 SK 타자들의 2009년 세이버메트릭스 지수 (2009)와 연봉 (2010) 이름 RC XR SECA ISO BR OPS 연봉(만원) 김강민 57.31 63.37 0.26 0.18 22.75 0.93 12,000 김연훈 24.31 25.96 0.17 0.09 8.87 0.94 5,000 김재현 71.63 74.81 0.41 0.17 42.67 1.12 50,000 나주환 71.60 77.43 0.29 0.15 31.58 0.99 17,000 모창민 15.05 17.70 0.25 0.18 3.22 0.87 4,200 박경완 44.57 48.89 0.41 0.23 25.11 1.06 50,000 박재상 110.30 118.10 0.34 0.16 57.95 1.03 16,000 박재홍 60.37 65.57 0.33 0.15 28.20 0.98 40,000 박정권 94.18 103.20 0.35 0.23 50.37 1.04 12,500 박정환 9.08 9.64 0.22 0.12 4.85 0.99 5,500 안경현 4.17 4.89 0.10 0.09-2.24 0.64 7,000 이명기 -0.25-0.20-0.20 0.00-1.13 0.50 2,500 이재원 7.03 7.03 0.25 0.06 3.79 1.10 5,000 이호준 63.82 69.62 0.33 0.21 35.62 1.07 50,000 정근우 121.18 124.26 0.36 0.13 74.38 1.14 24,000 정상호 51.74 57.72 0.29 0.19 26.37 1.03 11,000 조동화 9.78 11.84 0.13 0.06-10.33 0.58 9,000 최 정 75.65 82.43 0.36 0.21 42.11 1.04 16,000 하지호 0.45 0.40 0.00 0.00 0.22 1.25 2,400 자료출처: 한국야구위원회 (2009)

290 Heebae Seung Kee-Hoon Kang 표 3.2 SK 타자들의 2009년 세이버메트릭스 지수와 연봉간의 상관계수 RC XR SECA ISO BR OPS 0.4663 0.4655 0.6303 0.5606 0.4929 0.3592 연봉 (0.0442) (0.0446) (0.0038) (0.0125) (0.0320) (0.1309) 괄호 안은 유의확률임 식 (2.1)-(2.6)의 세이버메트릭스 지수들 간에는 공통되는 점들도 있기 때문에 상관관계가 존재할 것 으로 판단되며, 다중공선성이 의심 되는 자료이다. 실제로 상관계수들을 구해본 결과 몇몇 항목은 매우 큰 값을 가짐을 확인하였고, 다중공선성의 존재여부를 분산확대요인 (variance inflation factor; VIF)을 통해 알아본 결과를 VIF 값이 상당히 커서 10이상인 것이 여러 개 있으며 다중공선성이 존재한다고 판 단한다. 따라서, 연봉과 세이버메트릭스 지수 간의 관계를 설명하기 위해서는 주성분분석을 실시하였고 그 결과를 표 3.3과 표 3.4에 제시하였다. 표 3.3 SK 타자들의 세이버메트릭스 지수에 대한 고유값 (2009년) Eigenvalue Difference Proportion Cumulative 1 4.5158 3.7836 0.7526 0.7526 2 0.7322 0.1076 0.1220 0.8747 3 0.6246 0.5183 0.1041 0.9788 4 0.1063 0.0852 0.0177 0.9965 5 0.0211 0.0209 0.0035 1.0000 6 0.0001 0.0000 1.0000 표 3.4 SK 타자들의 세이버메트릭스 지수에 대한 고유벡터 (2009년) Eigenvectors Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 RC 0.4450-0.3372 0.1788-0.0525 0.3206 0.7421 XR 0.4463-0.3359 0.1454 0.0023 0.4785-0.6617 SECA 0.4149 0.3244-0.3663-0.7617-0.0857-0.0299 ISO 0.3782 0.1177-0.7006 0.5921-0.0053 0.0396 BR 0.4443-0.2486 0.2797 0.0956-0.8029-0.0931 OPS 0.3004 0.7698 0.4935 0.2393 0.1269 0.0128 사용할 주성분의 개수를 정하기 위해서는 스크리 플롯 (scree plot)을 이용할 수도 있지만, 표 3.3에 나오는 고유값들 중에 한 개의 고유값이 1보다 크며, 이에 대응하는 주성분으로 전체 변동의 75.26%를 설명함을 알 수 있으므로 하나의 주성분을 선택하기로 한다. 표 3.4를 보면, 제 1 주성분에 대응되는 고 유벡터는 6개의 세이버메트릭스 지수에 대해 모두 양수임을 볼 수 있다. 즉, 제 1 주성분은 전반적인 선 수의 경기력을 나타내는 성분으로 이해할 수 있다. 각 선수별로 계산된 제 1 주성분과 연봉간의 관계를 나타낸 그래프를 그림 3.1에 제시하였다. 그림 3.1에 의하면 2009년도 SK의 경기력과 연봉과의 관계는 전체적으로는 선형 혹은 지수적인 패턴을 보이고 있어 대체로 경기력이 높은 선수들에게 높은 연봉을 주 는 것으로 보인다. 하지만, 경기력이 우수한 정근우, 박재상, 박정권 선수 등에 비해 상대적으로 경기력 이 낮은 박경완, 이호준, 김재현 선수가 더 연봉이 높음을 알 수 있다. 이는 본 연구에서 고려하지 않은 다른 연봉 산정요인 (구단고과, 선수들의 훈련태도, 경력 등)의 영향에 기인한 현상이라고 설명할 수 있 다. 2010년도 SK 타자들의 세이버메트릭스 지수와 연봉으로 2009년과 비슷한 분석을 하였다. 계산된 세이버메트릭스 지수들과 2010년 말에 산정된 연봉과 관련성을 유의한 상관계수로 파악하였고, 세이버 메트릭스 지수들 간의 다중공선성이 존재함을 확인하였다. 2010년도 SK 타자들의 세이버메트릭스 지 수에 대해 주성분 분석을 한 결과 두 개의 고유값 4.3117과 1.2760이 1보다 크며, 두 개의 주성분으로

A study on relationship between the performance of professional baseball players and annual salary 291 그림 3.1 2009년 SK 타자들의 경기력과 연봉의 분산형 그래프 전체 변동의 93.13%를 설명하는 것으로 확인되었다. 이에 따른 두 개의 고유벡터를 구한 것을 표 3.5에 나타내었다. 표 3.5 SK 타자들의 세이버메트릭스 지수에 대한 고유벡터 (2010년) RC XR SECA ISO BR OPS Prin1 0.4209 0.4225 0.3986 0.3384 0.4569 0.4025 Prin2-0.4256-0.4195 0.3624 0.5874-0.2530 0.3199 첫번째 주성분에 대응되는 고유벡터는 6개의 세이버메트릭스 변수에 모두 양수임을 볼 수 있다. 즉, 첫 주성분은 전체적인 선수의 경기력을 나타내는 성분으로 이해할 수 있다. 이에 대하여 두 번째 주성분 에 대응되는 고유벡터는 득점에 대한 팀내 공헌도에 관련된 RC, XR과 BR에는 음수 값이, 타율에 관련 된 SECA, ISO와 OPS에는 양수 값이 대응됨을 볼 수 있다. 즉, 두 번째 주성분은 팀 내 공헌도와 타율 을 나타내는 성분으로 이해할 수 있다. 두 번째 주성분이 양의 값으로 큰 경우에는 타율에 기여 비중이 더 크다는 뜻이며, 음의 값으로 작은 경우에는 팀 공헌도에 더 비중이 주어졌다고 볼 수 있다. 두 번째 주성분이 0에 가까운 경우에는 두 가지 해석이 가능한데 경기력이 높은 경우에는 타율과 팀 내 공헌도가 비슷하게 높게 반영되었다고 볼 수 있고, 경기력이 낮은 경우에는 둘 다 약한 경우라고 해석할 수 있을 것으로 판단된다. 이와 같이 계산된 두 개의 주성분 축과 연봉을 그림 3.2에 거품형으로 나타내었다. 그림 3.2에서 x축 은 선수의 경기력을, y축은 양의 방향이면 선수의 타율 쪽으로, 음의 방향이면 팀내 공헌도 쪽으로 기 여한다고 보면 된다. 또한, 거품에 해당되는 원의 크기는 연봉 액수에 비례하는 것으로 보면 된다. 2010년도 SK는 선수들이 전체적으로 타율과 팀 내 공헌도의 비중이 어느 한 쪽으로 심하게 치우치지 않는 패턴을 보이지만, 그 중에서 경기력이 0이상인 선수들은 타율보다는 팀 내 공헌도의 비중이 약간 더 높고, 경기력이 0 이하인 선수들은 팀 내 공헌도 보다는 타율의 비중이 약간 더 높다. 경기력이 제 일 높은 최정, 박정권 선수에 비해 경기력이 낮은 박경완, 이호준 선수가 원의 크기 (연봉)가 더 크게 나 타나는 것은 2009년도의 연봉 패턴과 비슷하다. 또한, 두번째 주성분점수의 크기에 따라 배열된 결과는 정상호, 박재홍 선수 등에게 타율에 관한 점수가 높게 나타나며, 정근우, 김강민 선수 등에게 팀 내 득점 공헌도에 관한 비중이 높게 나타남을 알 수 있다.

292 Heebae Seung Kee-Hoon Kang 그림 3.2 2010년 SK 타자들의 경기력, 타율-팀내 공헌도, 연봉의 거품형 그래프 2) 삼성 구단 2009년도 삼성의 타자 선수들에 대해서도 SK와 같은 분석을 실시하였다. 각 세이버메트릭스 지수들 을 구하였고, 상관관계를 살펴보아 다중공선성이 있음을 확인하였다. 주성분 분석을 통해 파악한 고유 값 중 한 개가 5.502로 1보다 크고 전체 변동의 91.7%를 설명하므로 하나의 주성분 벡터를 구하였고 표 3.6과 같다. 표 3.6을 보면, 제 1 주성분에 대응되는 고유벡터는 6개의 세이버메트릭스 지수에 모두 양 의 비중을 두고 있음을 알 수 있다. 즉, SK의 경우와 마찬가지로 제 1 주성분은 전체적인 선수의 경기 력을 나타내는 성분으로 이해할 수 있다. 이 경기력을 나타내는 성분과 연봉간의 산점도를 그림 3.3에 나타내었다. 표 3.6 삼성 타자들의 세이버메트릭스 지수에 대한 고유벡터 (2009년) RC XR SECA ISO BR OPS Prin1 0.4124 0.4132 0.4028 0.4028 0.4133 0.4048 그림 3.3 2009년 삼성 타자들의 경기력과 연봉의 분산형 그래프

A study on relationship between the performance of professional baseball players and annual salary 293 그림 3.3에 의하면 2009년도 삼성에서는 박석민, 강봉규 선수는 경기력이 높지만 2010년도에 지급된 연봉은 상대적으로 낮은 것으로 확인되었다. 반면, 박진만, 진갑용 선수는 경기력이 낮게 나타났는데도 연봉은 높다. 이를 보면 2009년도 삼성은 경기력이 높을수록 연봉을 많이 지급하였다고 할 수는 없을 것으로 보인다. 2010년도 삼성의 경우도 역시 한 개의 고유값이 1이상이고 제 1 주성분은 경기력으로 확인되었다. 경 기력과 연봉의 패턴은 그림 3.4에제시하였다. 이 그림에 의하면 2010년도 삼성은 진갑용 선수를 제외하 고는 전반적으로 경기력에 따라 연봉이 증가하는 경향을 보이고 있다. 다만, 최형우, 박석민 선수는 경 기력에 비해 연봉이 조금 낮은 것으로 생각된다. 두 해의 결과를 보면 삼성의 경우는 연봉의 결정에 세 이버메트릭스 지수들보다 다른 외적인 요소가 더욱 강하게 영향을 미친 것으로 판단된다. 타 구단에 비 해 연봉과 세이버메트릭스 지수들 간의 상관관계가 상대적으로 높지 않는 것 또한 이를 뒷받침한다. 그림 3.4 2010년 삼성 타자들의 경기력과 연봉의 분산형 그래프 3) 기타 구단 SK, 삼성 외 나머지 여섯 개의 구단들도 앞에서와 같은 방법으로 분석하였다. 2009년도와 2010년도 모두 분산확대요인을 통해서 다중공선성의 존재를 확인하였고, 주성분분석을 통해서 제 1 주성분 및 제 2 주성분을 확인할 수 있었다. 각 구단의 주성분분석에서 고유값을 대한 표 3.7에 정리하였다. 모든 팀 의 2009년, 2010년의 결과를 분석하였지만 지면관계상 연봉과의 관련성에서 2009년의 결과는 생략하고 일부 구단의 2010년에 관한 것만 제시하기로 하며, 필요시 추가로 제공할 수 있다. 그림 3.5에 제시된 2010년도 기아는 두 개의 주성분인 선수의 경기력과 타율-팀내공헌도가 각각 연봉 과의 관계에서 설명력을 가진다. 2010년 기아는 선수들 개개인의 타율과 팀내 공헌도의 비중이 균형을 이루고 연봉 또한 경기력과 비례한 패턴처럼 보이나 김상훈, 이종범 선수의 경우 경기력이 높지 않음에 도 원의 크기 (연봉)가 큼을 확인할 수 있다. 2010년도 두산 자료는 그림 3.6에 거품형으로 나타내었다. 2010년도 두산은 경기력이 0이상인 선수 들은 대부분 타율 보다 팀내 공헌도에 비중이 더 크고 원의 크기 (연봉)가 큰 선수들도 역시 팀 내 공헌 도의 비중이 큼을 확인할 수 있다. 두산은 연봉 산정 시에 선수들의 경기력 팀내 공헌도에 비중을 두어 판단하는 것으로 보인다.

294 Heebae Seung Kee-Hoon Kang 표 3.7 기타 구단 주성분분석의 고유값에 대한 정리표 구단 년도 고유값 구단 년도 고유값 LG 1 3.8290 1 5.2696 2009 2009 2 1.2377 2 0.4575 기아 1 4.3946 1 4.3819 2010 2010 2 0.9080 2 1.0803 두산 1 5.2419 1 4.6578 2009 2009 2 0.5713 2 0.7151 넥센 1 3.4562 1 5.0722 2010 2010 2 2.3233 2 0.6611 롯데 1 4.9001 1 4.6773 2009 2009 2 0.7280 2 0.6448 한화 1 5.5712 1 4.3516 2010 2010 2 0.1866 2 0.6845 그림 3.5 2010년 기아 타자들의 경기력, 타율-팀내공헌도와 연봉의 거품형 그래프 그림 3.6 2010년 두산 타자들의 경기력, 타율-팀내공헌도와 연봉의 거품형 그래프

A study on relationship between the performance of professional baseball players and annual salary 295 그림 3.7에 나타낸 2010년 넥센의 결과는 경기력이 높은 선수가 연봉이 높은 패턴을 보이며, 전체적 으로는 선형의 비례 패턴을 보이고 있다. 김정호 선수의 경우 2009년에 비해 연봉이 올랐으며, 송지만 선수의 경우 2009년에 비해 연봉이 떨어진 점으로 보아 선수들의 당해년도 경기력 뿐만 아니라 이전 년 도들의 경기력이 쌓여서 현재의 연봉이 산정되고 있음을 짐작할 수 있다. 그림 3.7 2009년 넥센 타자들의 경기력과 연봉의 분산형 그래프 2010년도 롯데의 결과는 그림 3.8에 나타냈는데 타 구단에 비해 전체적으로 선수들의 경기력이 높을 수록 연봉이 높은 가장 뚜렷한 패턴을 보이고 있다. 가장 경기력이 뛰어난 이대호 선수가 가장 높은 연 봉을 받았다는 점도 타 구단과 대비되는 점이라 할 수 있다. 그림 3.8 2010년 롯데 타자들의 경기력과 연봉의 분산형 그래프 4. 결론 및 제언 본 연구에서는 한국 프로야구 선수들의 경기력을 측정하기 위해 정교하고 세분화된 세이버메트릭스

296 Heebae Seung Kee-Hoon Kang 지수 여섯 개로 경기력과 연봉의 관계를 분석해 보았다. 이를 통하여 각 구단에서 선수와의 연봉을 협상 하는데 도움을 주고자 하는 데 목적이 있다. 전반적으로는 경기력이 높은 선수에게 더 많은 연봉을 지급 하는 패턴을 보이고 있기는 하지만 각 구단별로 세이버메트릭스 지수와 연봉과의 관련성 정도에 차이가 있는 것으로 파악되었다. 3절의 분석결과로만 볼 때 특이할만한 점은 롯데 구단의 2010년 세이버메트릭스 지수에 기초한 경기 력과 2011년도 연봉이 가장 밀접한 관련이 있는 것으로 보인다. 반면, 삼성의 경우는 2009년, 2010년 경기력이 모두 차년도 연봉 책정과의 관련성이 크지 않은 것으로 판단된다. 두산의 경우는 경기력이 0이상인 선수들은 대부분 타율 보다 팀내 공헌도에 비중이 더 크고 원의 크기 (연봉)가 큰 선수들도 역 시 팀 내 공헌도의 비중이 큼을 확인할 수 있었다. 세이버메트릭스를 통하여 타자들의 역량과 책정된 연봉 간의 관계를 정확히 설명하기에는 한계가 있 는 것으로 보인다. 하지만, 타자의 능력을 현재의 단순한 타율 또는 홈런 수에 집중하는 수치보다 선수 들의 경기력과 공헌도를 섬세하게 판단할 수 있는 세이버메트릭스 지수를 적극 활용한다면, 연봉 협상 시에 구단과 선수들 간의 의견 충돌을 줄이고 선수의 팀 공헌도와 타율에 따른 적절한 연봉 책정을 위한 기준 마련에 기틀을 제공할 것이라고 생각된다. 세이버메트릭스 지수는 타자의 공격력만을 고려하기 때문에 합당한 연봉을 책정하기 위해서는 타자의 수비 능력 또한 고려해야 한다. 수비력을 측정하는 측도로 메이저리그에서 많이 사용되는 것으로는 궁 극적 영역 평가 (Ultimate Zone Rating; UZR)라는 것이 있다. UZR은 메이저리그 평균 수비수의 수비 능력을 기준으로 한 선수가 수비로 얼마나 많은 실점을 줄여주었는지를 보여주는 기록이다. 이를 함께 사용한다면 보다 객관적이고 타당한 연봉 책정의 도구가 되리라 여겨진다. 본 연구를 수행하는 과정에서 몇 가지 한계점과 보완해야 할 부분을 지적하면 다음과 같다. 첫째, 이미 앞에서 언급한대로 선수의 연봉은 경기력 이외에 경력, 인기도, 수비 포지션, 생활태도 등 다른 요인들도 영향을 미치기 때문에 선수에 관련된 다양한 자료 수집과 분석이 이루어져야 할 것이다. 이러한 요인들도 고려해서 함께 연구하면 프로야구 선수들의 경기력과 연봉의 패턴을 더욱 정확한 결과 를 얻을 수 있을 것이다. 둘째, 세이버메트릭스 지수에서 사용된 계수들은 미국 프로야구에서 사용되는 것인 만큼 우리나라의 실정에 맞게 계수를 조정한다거나 아예 새로운 지수를 개발할 필요성이 있다고 본다. 이는 또 하나의 광 범위한 연구 주제로 한국 프로야구 각 구단에서 사용되는 연봉 책정 기준에 대한 광범위한 조사와 협의 를 통해 구단 및 선수들의 공감대를 형성해야 할 것이다. 셋째, 3절에서 찾은 주성분들을 독립변수로 하고 연봉을 종속변수로 하여 모수적 및 비모수적 회귀분 석을 통해 적합 가능한 모형을 찾는 것도 가능하겠으나 본 연구에서는 다루지 않았다. 이는 각 구단마다 특수성을 고려하여 선택된 모형이 다를 수 있기 때문에 큰 의미를 두지 않았기 때문이다. 참고문헌 민대기 (2011). 2010 미국프로골프협회 자료를 활용한 경로분석을 통한 경기력의 평균타수에 미치는 영향력 비교. <한국데이터정보과학회지>, 22, 65-71. 오광모, 이장택 (2003). 데이터마이닝을 이용한 한국프로야구 선수들의 연봉에 관한 모형 연구. <한국스포츠사회 학회지>, 16, 295-309. 이만규 (2006). <세이버매트릭스를 적용한 프로야구 타자의 경기력과 연봉과의 관계>, 석사학위논문, 국민대 스 포츠산업대학원, 서울. 이장택, 방소영 (2010). 일반화 자기회귀 조건부 이분산 모형을 이용한 한국프로야구 관중수의 예측. <한국데이터 정보과학회지>, 21, 1041-1049. 이장택 (2010). 엘리트 10종경기 선수들의 경기력 패턴에 관한 연구. <한국데이터정보과학회지>, 21, 1071-1079.

A study on relationship between the performance of professional baseball players and annual salary 297 전영희 (2011). 프로야구 선수 연봉 고과평점은 어떻게 매기나? <동아일보>, 2011/01/15. 조선닷컴 인포그래픽스 (2011). <알고 보면 더 재미있는 2011 프로야구>. http://inside.chosun.com/site/ data/html{\_}dir/2011/04/25/2011042501001.html 한국야구위원회 (2009). http://www.koreabaseball.com/record/hitterrecord.aspx Furtado, J. and Palmer, P. (2000). Baseball think factory. http://www.baseballthinkfactory.org/ forums/viewforum/19/ James, B. (1982). The Bill James baseball abstract, Ballantine Books, New York.

Journal of the Korean Data & Information Science Society 2012, 23(2), 285 298 한국데이터정보과학회지 A study on relationship between the performance of professional baseball players and annual salary Heebae Seung 1 Kee-Hoon Kang 2 12 Department of Statistics, Hankuk University of Foreign Studies Received 19 January 2012, revised 12 February 2012, accepted 7 March 2012 Abstract This research deals with a relationship between the performance of Korean professional baseball players and their annual salaries. It is based on the sabermetrics, which measures the performance of baseball batters in a refined way. We collect the records of batters of eight professional baseball clubs during the season 2009 and 2010. Then, we calculate every index of the sabermetrics. Principal component analysis is used for examining the relationship between those indexes of sabermetrics and annual salary for the next year. In general, batters who show higher performance get more salary. The result of this research can be useful in order to reach an agreement on salary between a player and his club partner. Keywords: Eigenvalue, eigenvector, principal component analysis, sabermetrics. This research was supported by the research fund of Hankuk University of Foreign Studies, 2011. 1 Student, Department of Statistics, Hankuk University of Foreign Studies, Mohyeon, Cheoin-goo, Yongin 449-791, Korea. 2 Corresponding author: Professor, Department of Statistics, Hankuk University of Foreign Studies, Mohyeon, Cheoin-goo, Yongin 449-791, Korea. E-mail: khkang@hufs.ac.kr