678 Chong Sun Hong Jae Young Kim Dong Sik Shin 여 분석하였다. 또한, Yang 등 (2015)은 Lee (2014c)의 연구를 확장하여 타고투저 현상의 발생 원인을 분석에 포함하였다. WAR은 야구선수의 모든 요소를 계산해서 종합한



Similar documents
350 Jang Taek Lee 들의 평가가 서로 상이하게 될 수 있기 때문에 지표들에 대한 종합적인 판단을 할 필요가 있다. 따라서 변수 개수가 많을 때 변수의 성질에 따라 묶인 소수의 변수로 만들어 주는 주성분분석과 같은 분석이 필 요할 수 있으며, 따라서 본 연구

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>


1272 Jea-Young Lee, Hyeon-Gyu Kim KBO에서의 WAR은선수의공격능력 (batting runs) 과주루능력 (base running runs), 수비능력 (fielding runs), 포지션조정 (positional adjustment) 의합을

286 Heebae Seung Kee-Hoon Kang 국 4억으로 협상을 보았다. 객관적인 성적이나 수치가 인상과 삭감을 결정하는 매우 중요한 열쇠이지 만, 그렇다고 기록만 가지고 연봉을 책정하지는 않는다. 각 구단은 선수가 팀에서 차지하는 비중, 인기, 경력, 입단

March 2, 2019 Box score Trinity Baptist vs. Cornerstone 3/2/2019 at Lake Myrtle, Fla. (Lake Myrtle #3) Trinity Baptist 3 (3-17) PLAYER AB R H RBI BB S

DBPIA-NURIMEDIA


DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

도비라

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

???? 1

The characteristic analysis of winners and losers in curling: Focused on shot type, shot accuracy, blank end and average score SungGeon Park 1 & Soowo

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Hilbert College Baseball All-Time Lists

<31372DB9DABAB4C8A32E687770>

27 2, 17-31, , * ** ***,. K 1 2 2,.,,,.,.,.,,.,. :,,, : 2009/08/19 : 2009/09/09 : 2009/09/30 * 2007 ** *** ( :

Lumbar spine

Kor. J. Aesthet. Cosmetol., 라이프스타일은 개인 생활에 있어 심리적 문화적 사회적 모든 측면의 생활방식과 차이 전체를 말한다. 이러한 라이프스 타일은 사람의 내재된 가치관이나 욕구, 행동 변화를 파악하여 소비행동과 심리를 추측할 수 있고, 개인의

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

14.531~539(08-037).fm

Analyses the Contents of Points per a Game and the Difference among Weight Categories after the Revision of Greco-Roman Style Wrestling Rules Han-bong

UVa-Wise Baseball Records Individual Season Records Highest batting avg. (min. 50 AB) Brad Robbins (56-117) Mike White (48-10

09구자용(489~500)

Team Season Year-by-Year Year avg gp-gs ab r h 2b 3b hr rbi tb slg% bb hbp so gdp ob% sf sh sb-att po a e fld%

???? 1

한국성인에서초기황반변성질환과 연관된위험요인연구

노동경제논집 38권 4호 (전체).hwp

인문사회과학기술융합학회

012임수진

DBPIA-NURIMEDIA

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

한국체육학회지.hwp


Frank Landrey Invitational Dates: 10/05-10/06, 2009 Round: 3 FINAL RESULTS * Individual Par-Yardage: Fin. Top 20 Teams Scores 1 Richmond, Univ

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap



Journal of the Korean Data & Information Science Society 2017, 28(2), 한국데이터정보과학회지 한국프로야구에서투수연봉에영향

188 최 영 환 청률을 통한 가치측정을 통한 자기 권리를 주장할 수 있 는 근거 자료로 활용할 수 있다. 즉, 방송사가 주장하는 낮은 중계권료를 주장할때는 프로야구가 낮은 시청률을 기록했을 때만이 정당하다. 하지만, 프로야구의 뜨거운 열기만큼이나 시청률도 급 성장세를

03-서연옥.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

,,,.,,,, (, 2013).,.,, (,, 2011). (, 2007;, 2008), (, 2005;,, 2007).,, (,, 2010;, 2010), (2012),,,.. (, 2011:,, 2012). (2007) 26%., (,,, 2011;, 2006;

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2>


#Ȳ¿ë¼®

03이경미(237~248)ok

< C6AFC1FD28C3E0B1B8292E687770>

패션 전문가 293명 대상 앙케트+전문기자단 선정 Fashionbiz CEO Managing Director Creative Director Independent Designer

44-4대지.07이영희532~

hwp

ePapyrus PDF Document

(JH)

20, 41..,..,.,.,....,.,, (relevant).,.,..??.,


체육학석사학위논문 프로야구선수의가치평가요인탐색 : 한국프로야구리그와메이저리그의 연봉결정요인비교분석 2018 년 2 월 서울대학교대학원 체육교육과 황수웅


에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Study on the Pe

DBPIA-NURIMEDIA

(001~006)개념RPM3-2(부속)

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

DBPIA-NURIMEDIA

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

Microsoft PowerPoint - ch03ysk2012.ppt [호환 모드]

12È«±â¼±¿Ü339~370

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of

목원 한국화- 북경전을 준비하며 지난해부터 시작 된 한국의 목원대학교 한국화 전공의 해외미술체험은 제자와 스승의 동행 속에서 미술가로 성장하는 학생들의 지식에 샘을 채워주는 장학사업으로 진행되고 있으며, 한국의 우수한 창작인력 양성을 위해, 배움을 서로 나누는 스승들의

서론 34 2

상담학연구,, SPSS 21.0., t,.,,,..,.,.. (Corresponding Author): / / / Tel: /

목 차 전반 기 5 시간 이상 경기 8 9 회 최장 시간 경기 9 2 시간 이하 경기 회 이상 연장전 경기 11 연속경기 연장전 12 무득점 무승부 (0-0) 경기 13 최다 득점 무승부 경기 14 동일대진 연속 무승부 경기 경기 15 몰수 경기

65 Soon-Kwi Kim Young-Hoon Lee 한국프로야구의매시즌별팀당경기수가동일하지않으므로, 본연구에서는시즌별팀당경기수 G로나눈시즌별경기당득점수 rsg와경기당실점수 rag를변수 rs와 ra 대신사용하였다. 절에서승률을정의하고,.절에서 rsg rag와승률간의상

jaeryomading review.pdf

DBPIA-NURIMEDIA

8 두산 ( 對 삼성 )~4. 13( 對 SK) 7 청보 ( 對 삼성 )~4. 5( 對 빙그레 ) NC ( 對 롯데 )~4. 10( 對 LG) 팀별 연패 기록 삼 미 18 연패 ( ~4. 29) 쌍방울 17

01이정훈(113~127)ok

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

???춍??숏

<C7A5C1F620BEE7BDC4>

09권오설_ok.hwp

서울도시연구_13권4호.hwp

에너지경제연구 Korean Energy Economic Review Volume 11, Number 2, September 2012 : pp. 1~26 실물옵션을이용한해상풍력실증단지 사업의경제성평가 1

433대지05박창용

139~144 ¿À°ø¾àħ

Àå¾Ö¿Í°í¿ë ³»Áö

제19권 제3호 Ⅰ. 문제제기 온라인을 활용한 뉴스 서비스 이용은 이제 더 이 상 새로운 일이 아니다. 뉴스 서비스는 이미 기존의 언론사들이 개설한 웹사이트를 통해 이루어지고 있으 며 기존의 종이신문과 방송을 제작하는 언론사들 외 에 온라인을 기반으로 하는 신생 언론사

<34C2F7C0FC2E687770>

Research subject change trend analysis of Journal of Educational Information and Media Studies : Network text analysis of the last 20 years * The obje

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

09È«¼®¿µ 5~152s

03±èÀçÈÖ¾ÈÁ¤ÅÂ

- 1 -

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

DBPIA-NURIMEDIA

Vol.259 C O N T E N T S M O N T H L Y P U B L I C F I N A N C E F O R U M

Transcription:

Journal of the Korean Data & Information Science Society 2016, 27(3), 677 687 http://dx.doi.org/10.7465/jkdi.2016.27.3.677 한국데이터정보과학회지 한국프로야구에서 타자력 지수 제안 홍종선 1 김재영 2 신동식 3 123 성균관대학교 통계학과 접수 2016년 4월 15일, 수정 2016년 5월 13일, 게재확정 2016년 5월 17일 요 약 야구 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 WAR은 미국프로야구에서 가장 많이 사용하는 통계량이다. 그러나 한국프로야구 자료에는 수비에 관련된 변수에 포함된 야구장 요인, 포지션조정 그리고 리그 조정 통계량들이 존재하지 않으므로 WAR을 한국프로야구에 적용하는 데에는 문제가 있다. 본 연구에서는 타자의 능력을 측정하는 대안적인 세이버메트릭스 통계량을 제안 하여 미국프로야구 뿐만 아니라 한국프로야구에서도 동시에 사용할 수 있도록 한다. 본 연구에서 제 안한 타자력 지수 모형은 한국프로야구와 미국프로야구 타자들에 대한 다섯 종류의 통계량을 사용하 여 개발한다. 우선 2015년도 최소 규정 타석을 만족한 미국프로야구 타자들의 자료를 바탕으로 타자 력 지수 모형을 개발한다. 미국프로야구 타자들의 WAR과 비교하면서 본 연구에서 제안한 타자력 지 수의 능력의 타당성을 검토한다. 다음으로 이 모형을 2015년도 한국프로야구 자료에 적용하여 한국 형 타자력 지수를 제안한다. 한국프로야구 타자력 지수를 서로 다른 팀별, 나이별, 포지션별로 통계적 으로 분석하고, 타자력 지수와 그들의 연봉과의 선형관계성을 토론한다. 연봉에 관한 회귀모형의 신 뢰영역을 바탕으로 연봉책정의 적절함에 따라 46명의 타자를 세 그룹으로 할당하고, 세 그룹에 속한 연봉을 다양한 인자에 대하여 통계적으로 탐색한다. 주요용어: 세이버메트릭스, 주성분, 타자능력, 회귀모형. 1. 서론 야구에서 타자의 공격능력을 쉽게 계산하면서 평가할 수 있는 통계량을 개발하기 위한 연구는 세이버 메트릭스 (sabermetrics)를 중심으로 계속해서 진행되고 있다. 세이버메트릭스는 누적된 자료를 이용하 여 통계적인 관점에서 야구에 관한 분석을 하는 연구 분야이며, 세이버메트릭스 방법으로 자료 분석하는 사람을 세이버메트리션 (sabermetrician)이라고 부른다. 미국 프로야구 (Major League Baseball; MLB)에서 세이버메트리션인 James (1982)를 필두로 통계 적인 연구가 진행 중이며 한국 프로야구 (Korean Baseball Organization; KBO)에서 타자 능력에 관 한 연구는 Cho 등 (2003, 2004, 2005), Lee와 Kim (2005, 2006a, 2006b), Lee와 Cho (2009), Choi와 Kim (2011) Kim (2012) Lee (2014a, 2014b) 등이 있다. 타자에 관한 많은 연구 중에서 Lee (2014c)는 2000년 부터 2013년의 자료를 바탕으로 BGI (batting grade index)를 제안하였다. BGI는 타자의 능력 을 측정하는 세이버메트릭스 통계량들을 주성분분석을 이용하여 8개의 인자를 추출하여 타자의 능력을 비교하는 통계량이다. 그리고 BGI를 기반으로 군집분석을 실시하여 선수들을 네 개의 군집으로 분할하 1 교신저자: (03063) 서울특별시 종로구 성균관로 25-2, 성균관대학교 통계학과, 교수. E-mail: cshong@skku.edu 2 (03063) 서울특별시 종로구 성균관로 25-2, 성균관대학교 통계학과, 대학원생. 3 (03063) 서울특별시 종로구 성균관로 25-2, 성균관대학교 통계학과, 대학원생.

678 Chong Sun Hong Jae Young Kim Dong Sik Shin 여 분석하였다. 또한, Yang 등 (2015)은 Lee (2014c)의 연구를 확장하여 타고투저 현상의 발생 원인을 분석에 포함하였다. WAR은 야구선수의 모든 요소를 계산해서 종합한 통계량이기 때문에 계산하기가 상당히 까다롭지만 기본 정의는 다음과 같다. W AR = (Batting Runs + Base Running Runs + F ielding Runs + P ositional Adjustment + League Adjustment + Replacement Runs) / (Runs P er W in). WAR 계산에 쓰이는 각 변수를 구하는 식이 복잡하며 여러 방법이 존재하기 때문에 세이버메트릭션 마다 해석을 다르게 할 수 있다 (2.1절에서 언급한 bwar과 fwar). 그러나 선수의 가치를 하나로 표 현하는 방법이란 공통된 점에서 매우 큰 장점을 가지고 있다. MLB에서 사용하는 WAR식을 KBO에 적용하기에는 한계가 있다. MLB에서는 우익수와 좌익수에 대한 포지션 조정 (position adjustments)변수, 리그 조정 (league adjustment)변수 그리고 서로 다 른 야구장의 크기를 조정하기 위한 야구장 요인 (park factor)이 포함된 수비에 관련된 변수 (fielding runs)를 사용하는데, KBO에는 이러한 세 종류의 변수계산에 필요한 충분한 자료가 존재하지 않는다. 한국 야구장은 지역별 구장의 편차가 크고 잦은 개보수로 인해 야구장 요인 변수를 계산하기에 어려움 이 많으며 MLB 선수와 KBO 선수의 신체 조건이 서로 다르기 때문에 이런 변수를 KBO 자료에 포함 시키는데 많은 문제점이 존재한다. 따라서 본 연구에서는 타자의 능력을 측정하는 대안적인 세이버메트 릭스 통계 모형을 개발하여, 미국프로야구 뿐만 아니라 한국프로야구에서도 동시에 사용하면서 비교 분 석할 수 있는 타자력 지수를 개발한다. KBO와 동일한 방식으로 측정되는 MLB의 자료를 바탕으로 타 자력 지수를 개발하고 이 자료를 MLB 선수들의 WAR과 비교 분석하여 타당성을 검정한 후에 KBO의 자료에 대하여 한국형 타자력 지수를 제안한다. 그리고 한국형 타자력 지수를 바탕으로 KBO에서 활동 하는 타자들에 대한 다양한 통계분석을 실시하고자 한다. 우선 본 논문에서 제안한 타자력 지수와 연봉 과의 관계를 심도있게 분석하기 위하여 책정된 연봉은 2016년도를 기반으로 하였고, 2016년 연봉책정에 영향을 주는 타자력 지수 모형을 개발하기 위하여 2015년도의 KBO 자료를 이용하였다. 따라서 한국형 타자력 지수를 제안하고, 2015년도의 타자력 지수와 책정된 2016년의 연봉과의 관계를 연구하는 것이 본 논문의 연구 목적이다. 그리고 이 관계를 통하여 연봉책정의 적절성에 따라 선수들을 군집화하여 다 양한 인자에 대하여 분석하면서 토론한다. 본 연구의 구성은 다음과 같다. 2절에서는 타자에 관한 통계량 중에서 다섯 가지의 통계량을 소개하 면서 2015년도 MLB 자료를 바탕으로 다섯 가지의 통계량을 이용한 타자력 지수 모형을 개발하고, 미 국 프로선수들의 WAR 과 비교하여 적절한 지수임을 보인다. 개발한 모형을 이용하여 2015년 KBO에 서 프로야구 선수 379명 중 규정타석 (446타석)을 만족한 타자 46명 (총 51명 중 KBO를 떠난 5명은 제외)의 자료를 바탕으로 한국형 타자력 지수를 제안한다. 3절에서는 한국형 타자력 지수를 적용한 선 수들의 자료를 바탕으로 10개 프로팀과 선수들의 나이 그리고 포지션별로 통계분석을 실시하여 설명한 다. 4절에서는 2015년도의 타자력 지수와 책정된 2016년의 연봉과의 관계를 회귀분석을 이용하여 모형 을 설정한다. 이 모형을 바탕으로 연봉 책정의 적절성에 따라 선수들을 세 그룹으로 나누어 다양한 분석 을 실시하여 탐색한다. 팀, 나이, 내 외국인, 포지션 그리고 연봉변동에 따라서 분석하고 설명한다. 마 지막 5절에서는 결론을 유도한다. 2.1. MLB에서의 HAI 설정 2. 타자력 지수 제안 기존의 연구 문헌에서는 타자들의 능력을 평가하는 80여 개의 세이버메트릭스 통계량 중에서 주성분

Alternative hitting ability index for KBO 679 분석 (principal component analysis)을 이용하여 각각 8개와 13개의 통계량을 선정하여 인자를 설정하 였는데, 선정된 통계량의 계산식에 중복되어 정의되는 통계량들이 존재하며 나아가 통계량들 사이에 매 우 유의한 상관관계가 존재하기 때문에 통계적인 분석이지만 선정된 통계량들을 설명하고 이해하기에는 문제점이 존재한다. 이를 극복하기 위하여 본 연구에서는 타자들의 능력을 평가하는 통계량들 중에서 가장 핵심인 출루와 득점에 연관된 중요한 통계량만을 선정하여 사용하고자 한다. 선정 조건으로는 첫 번째로 타자의 경기력을 잘 설명해야 하고, 두 번째로는 편의 (bias)가 작아야 하며, 세 번째로 MLB의 세이버메트릭스 통계량이 KBO에서도 제공하는 통계량으로 구성할 수 있어야 한다. 네 번째로는 선정 된 통계량이 역사적으로 좋은 평가를 받아온 통계량이라는 조건 하에서 선정된 다섯 가지 통계량만을 사 용한다. 각 통계량들에 대한 설명과 계산식은 다음과 같다. GPA (Gross Production Average): 가장 보편화된 타격 퍼포먼스를 평가하는 지수인 OPS (출 루율과 장타율)를 보완하기 위해서 개발된 통계량이다. OPS의 장점인 계산의 편의성과 타자의 출루율 (OBP)과 장타율 (SLG)을 함께 평가하는 점은 그대로 살리고, 단점인 장타율을 과대평가하는 부분을 개선한 통계량이다. GP A = (1.8OBP + SLG) / 4. BB/K (Base on Balls / strike out): 타자가 얻은 볼넷의 수를 삼진 수로 나눈 값으로, 타자의 출 루능력을 평가하는 통계량이다. BB/K = Base on Balls / Strike Out. wrc+ (weighted Runs Created+): woba (weight On Base Average, 가중출루율)를 바탕으로 타자의 득점창출력을 측정하는 통계량으로 타자가 타석에 들어섰을 때 일어나는 각각의 사건의 가치를 분리하여 생각해 각기 다른 가중치를 적용하여 계산하는 통계량이다. wrc+ = ( (woba league woba) / wobascale League R/League P A + 1 ) 100, 여기서 woba = (0.72NIBB + 0.75HBP + 0.90(1B) + 0.92ROBE + 1.24(2B) + 1.56(3B) + 1.95HR)/P A, league woba= 리그 평균 woba, woba scale= 해당연도 woba 조정지수, League R= 리그 전체 득점, League P A= 리그 전체 타석, P A= 타자의 총 타석. RC27 (Runs Created 27): Bill James가 고안한 통계량으로, 특정 한 선수가 한 경기 모든 타석에 설 경우 팀이 몇 점을 득점할 것인가를 평가하는 통계량이다. RC27 = 여기서 RC = (2.4C + A)(3C + B)/9C 0.9C, A = H + BB CS + HBP GIDP, RC P A H + SH + SF + CS + GIDP 27, C = AB + BB + HBP + SH + SF, B = 1.125(1B) +1.69(2B) +3.02(3B) +3.73HR+0.29(BB IBB +HBP ) +0.492(SH +SF +SB) 0.04K. XR27 (extrapolated Runs 27): 선수 혼자 만들어낸 안타, 홈런, 번트등과 같은 기본 통계량을 이 용하여, 그 선수의 득점생산성을 측정하기 위한 세이버메트릭스 타격 통계량이다. XR27 = XR P A H + SH + SF + CS + GIDP 27, 여기서 XR = 0.50(1B) + 0.72(2B)+1.04(3B)+1.44HR+0.34(HBP +T BB IBB)+0.25IBB+0.18SB 0.32CS 0.09(AB H K) 0.098K 0.37GIDP + 0.37SF + 0.04SH.

680 Chong Sun Hong Jae Young Kim Dong Sik Shin 본 연구에서는 2015년도 MLB의 타자에 관한 자료를 가장 잘 설명하는 위에서 선정한 다섯 개의 통 계량들의 선형 결합으로 나타나는 첫 번째 주성분 (principal component)으로 타자력 지수를 설정하고 자 한다. 우선 2015년 MLB에서 규정타석 조건을 만족한 142명의 타자의 통계자료를 가지 주성분분석 을 이용하여 타자력 지수를 개발한다 (MLB 2015년 자료 참조). 주성분분석의 기본 가정을 만족하는 방법으로 KMO와 Bartlett 검정을 사용하였다. 표본적합도 KMO는 0.806으로 비교적 큰 값으로 나타 났으며, Bartlett 검정통계량값은 1041.062 (p-값< 0.0001)이므로 변수들 간의 상관관계가 존재한다고 판단되어 주성분분석에 적합한 가정을 만족한다고 확인할 수 있다. 각각의 표준화된 통계량들의 선형 결합으로 나타나는 첫 번째 주성분인 MLB의 타자력 지수 (Hitting Ability Index; HAI)는 다음과 같 이 설정한다. 앞으로, KBO에 대한 타자력 지수와 구별하기 위하여 MLB와 KBO의 타자력 지수를 각 각 HAI M와 HAI K로 표기한다. HAI M = 0.248Z GP A + 0.163Z BB/K + 0.245Z wrc+ + 0.215Z RC27 + 0.242Z XR27. (2.1) 이 지수는 전체변동의 79.148%를 설명하며, 다섯 개 통계량에 대한 신뢰도 cronbach s α값은 0.926이다. 본 연구에서 설정한HAI M의 신뢰성을 살펴보기 위하여 bwar, fwar과 상관분석을 실 시하였다. bwar은 베이스볼레퍼런스 (www.baseball-reference.com)에서 기존의 고전적인 통계량 을 기반으로 계산한 WAR이고, fwar은 팬그래프 (www.fangraphs.com)에서 세이버메트릭스 통계량 을 기반으로 계산한 WAR이다. 상관분석 결과, HAI M와 bwar의 상관계수는 0.758 그리고 HAI M와 fwar과는 0.771로 둘 다 매우 유의한 상관관계를 갖는다. 따라서 (2.1)식에서 설정한 타자력 지수 HAI M는 두 종류의 bwar, fwar과의 관계분석을 통하여 MLB에서의 타자력 지수로서 타당하다고 평가할 수 있다. 2.2. KBO에서의 HAI 설정 MLB 자료를 바탕으로 타자력 지수를 설정하는 방법을 KBO에 적용해 본다. 2015년 규정타석을 만 족하고, 2016년 재계약을 마친 타자 46명에 대한 자료를 분석한다 (KBO, http://www.koreabaseball. com/record/player/hitterbasic/basicold.aspx). 우선, KBO 타자력 지수에 포함된 변수들의 기 초 통계량은 Table 2.1과 같다. Table 2.1 Simple statistics for 5 variables N MIN MAX MEAN STD GPA 46.227.421.29.035 BB/K 46.25 1.51.65.257 wrc+ 46 64.9 222.4 119.40 28.399 RC27 46 3.367 17.331 7.74 2.354 XR27 46 3.998 22.118 7.99 3.030 이 변수들에 대한 KMO 검정값은 0.802으로 적합하고, Bartlett 검정통계량값이 331.147 (p-값< 0.0001)이므로 주성분분석의 가정을 만족한다. 표준화된 통계량들의 선형 결합으로 나타나는 첫 번째 주성분인 KBO의 타자력 지수 HAI K는 다음과 같다. HAI K = 0.249Z GP A + 0.147Z BB/K + 0.246Z wrc+ + 0.225Z RC27 + 0.250Z XR27. (2.2) 이 지수는 전체변동의 77.759%를 설명하며, 다섯 개 통계량에 대한 신뢰도인 크론바 알파 (cronbach s α)값은 0.878로 HAI M보다 조금 작지만 여전히 매우 높은 신뢰성을 갖는다. 그러므로 2.1절에서 논의한 방법으로 개발한 MLB의 타자력지수 HAI M (2.1)식은 WAR을 대 체할 수 있는 타당성 있는 적절한 방법임을 보였다. 그리고 이 모형을 KBO 자료에 적용하여 구

Alternative hitting ability index for KBO 681 한 KBO의 타자력지수 HAI K (2.2)식도 HAI M와 유사하게 높은 신뢰성을 갖고 있음을 탐색하였다. 2016년 KBO타자 46명의 HAI와 2016년 MLB타자 중 상위 46명에 대한 HAI는 부록의 Table A.1과 A.2에 각각 정리하였다. 3.1. 팀별 HAI 3. HAI의 자료 분석 KBO 자료를 바탕으로 제안한 타자의 경기력을 나타내는 HAI K를 이용하여 다양한 분석결과를 살펴 본다. 여기부터는 KBO의 HAI에 대하여만 분석하므로HAI K를 HAI로 표기한다. 우선 10개의 프로야 구 소속팀에 따른 HAI의 평균분석은 Table 3.1과 같다. Levene 통계량값이 1.263 (p-값=0.290)으로 등분산을 가정하여 진행한 ANOVA 분석에서의 F 통계량값이 0.738 (p-값=0.0672)로 유의수준 5%하 에서 유의하지 않다. 즉 소속팀별 간에 HAI는 통계적으로 차이가 없다고 판단할 수 있다. Table 3.1 Means of HAI with respect to teams Doosan Hanwha KIA KT LG Lotte NC Nexen Samsung SK N 6 3 2 5 2 6 9 3 6 4 MEAN -0.28 0.91-0.06-0.21-0.2 0.37-0.15 0.17 0.33-0.7 STD 0.46 0.657 0.005 0.771 0.242 0.705 1.785 0.968 0.864 0.129 3.2. 나이별 HAI 20대 선수와 30대 초반 그리고 그 이후의 선수 나이로 집단화하여 선수 나이에 따른 HAI의 평균분석 은 Table 3.2에 정리하였다. Levene 통계량값이 2.375 (p-값=0.105)로 등분산을 가정한 ANOVA 분석 에서의 F 통계량값이 5.719 (p-값=0.010)로 유의수준 1%에서도 유의하다. 즉 나이별 HAI는 차이가 있으며 특히 20명의 30대 전반의 선수들이 매우 큰 HAI값을 갖고 있음을 탐색할 수 있다. Table 3.2 Means of HAI with respect to age age N MEAN STD 20-29 20 -.379.618 30-34 20.497 1.192 35-6 -.393.26 3.3. 포지션별 HAI 9개의 포지션에 따른 HAI의 평균분석은 Table 3.3에 요약하였다. Levene 통계량 값이 1.998 (p- 값=0.074)로 등분산을 가정한 ANOVA 분석에서의 F 통계량값이 1.182 (p-값=0.0336)로 유의수준 5%하에서 유의하지 않다. 따라서 포지션별 간에 HAI는 통계적으로 유의한 차이가 없다고 판단된다. Table 3.3 Means of HAI with respect to positions 1B 2B 3B C CF DH LF RF SS N 6 5 7 5 6 3 4 4 6 MEAN.92 -.10 -.14 -.29 -.27.45 -.12.37 -.55 STD 1.811.439.936 1.230.813.501.616.663.470

682 Chong Sun Hong Jae Young Kim Dong Sik Shin 4. HAI와 연봉 분석 2015년 규정타석을 만족하고, 2016년 재계약을 마친 타자 46명의 HAI 값과 2016 연봉 (salary)과의 관계를 살펴보기 위하여 회귀분석을 하였다. 2016년에 책정된 연봉은 KBO 보도자료 (http://www. koreabaseball.com/news/notice/view.aspx?bdse=6181)를 참조하였으며, 1억원 미만의 타자의 연 봉은 각 구단 홈페이지 자료를 사용하였다. 회귀모형의 기본 가정인 잔차의 독립성, 동집성 그리고 정규 성을 검토한 결과 회귀모형의 가정이 적절하고, 이를 바탕으로 분석한 HAI와 2016 KBO 책정된 연봉 (단위: 억원)과의 회귀모형식은 (4.1)과 같으며, 이를 Figure 4.1에 구현하였다. SALARY = 4.81 + 2.21 HAI. (4.1) 회귀모형식에서 기울기는 2.21이므로 HAI가 1.0 증가할 때 연봉은 약 2억2천만원 이상 증가한다고 예측할 수 있다. 이 자료에 대하여 Pearson 상관계수는 0.652로 유의한 값이며, 회귀모형에 대한 F 통 계량값은 32.568 (p-값< 0.0001)이므로 회귀모형은 유의하다. 그리고 결정계수와 수정된 결정계수는 각각 0.652와 0.425이다. Figure 4.1 Relation between HAI and annual salary 본 연구의 분석 대상인 타자 46명의 2016년도 책정된 연봉이 적절한지를 파악하기 위하여 세 집단 으로 나누어 보았다. 세 집단에 적절한 표본수를 할당시키기 위하여, 회귀모형의 신뢰구간 40%를 기 준으로 하여 상한과 하한을 설정하였다. 이 상한선을 넘어있는 13명의 선수는 타자의 경기력이 고평가 (over evaluated)되어 2016년 선수의 실적보다 높은 연봉을 받았으며, 하한 아래에에 위치한 15명의 선 수는 타자의 경기력이 저평가 (under evaluated)되어 낮은 연봉을 받았다고 판단하고, 회귀직선의 신뢰 구간 40% 안에 분포되어있는 18명의 선수는 HAI에 비교하여 2016년 연봉책정이 적절하게 평가 (fully evaluated)되었다고 할 수 있다 (Table 4.1 참조). 예를 들어 회귀직선의 99% 신뢰구간 밖에 위치한 김 태균 선수는 구단 내 간판스타로서 외적인 요소가 포함돼 연봉책정이 매우 잘 되었으며, 반면에 구자욱 선수는 회귀직선의 95% 신뢰구간 아래에 위치하고 있는데 데뷔 1년 차 신인으로서 자신의 경기력보다 현저히 못 미치는 연봉으로 책정되었다고 설명할 수 있다. 회귀모형 분석을 바탕으로 책정된 연봉의 적

Alternative hitting ability index for KBO 683 절성에 따라 세 그룹으로 선수들을 나누어 팀별, 나이별, 내 외국인별, 연봉변동별, 포지션별로 연봉에 대하여 분석한다. Over evaluated Fully evaluated Under evaluated Table 4.1 Evaluated batters list Andy Manuel Marte, Brett Michael Pill, James Charles Adduci, Jeong Keun-woo, Kang Min-ho, Kim Tae-kyun, Lee Bum-ho, Lee Ho-jun, Lee Jong-wook, Lee Seung-yuop, Oh Jae-won, Park Yong-taik, Son Si-heon Choi Hyung-woo, Chung Soo-bin, Hwang Jae-kyun, Ji Seok-hun, Kim Jae-ho, Kim Min-seong, Kim Sang-hyeon, Kim Sang-soo, Kim Seong-hyeon, Kim Tae-gun,Lee Dae-hyeong, Lee Jae-won, Lee Myoung-ki, Lee Yong-gyu, Min Byeong-heon, Park Jeong-kwon, Park Sok-min, Son Ah-seop Chang Seong-woo, Choi Jun-seok, Eric Allyn Thames, Hur Kyeong-min, Jung Hoon, Kim Ha-seong, Kim Jong-ho, Koo Ja-wook, Na Sung-bum, Oh Ji-hwan, Park Hae-min, Park Kyung-soo, Park Min-woo, Yang Eui-ji, Yoo Han-jun 13 18 15 4.1. 팀별과 나이별 연봉 분석 소속팀별과 나이별로 살펴본 연봉과의 관계는 Table 4.2에 정리하였다. 여기서 주목할 점은 NC는 모 든 주전 선수가 규정타석을 만족하였다. 그리고 SK의 경우 모두 타자의 경기력을 정평가하여 연봉책정 을 했다고 확인할 수 있다. 그러나 평가된 연봉책정의 적절성과 소속팀별간의 HAI의 평균차이는 통계 적으로 유의하지 않다 (F 통계량값=1.789, p-값= 0.105). 연차가 높은 나이일수록 고평가의 비율이 높아지는 것으로 판단할 수 있다. 따라서 한국프로야구의 연봉은 현재의 타자 실력보다는 누적된 선수 경력 등이 중요하다는 것을 인지할 수 있다 (F 통계량 값=11.778, p-값< 0.0001). Table 4.2 Evaluated batters with respect to teams and ages team age Doosan Hanwha KIA KT LG Lotte NC Nexen Samsung SK 20-29 30-34 35- sum batters 6 3 2 5 2 6 9 3 6 4 20 20 6 46 Over evaluated 1 2 2 1 1 2 3-1 - - 8 5 13 Fully evaluated 3 1-2 - 2 2 1 3 4 10 7 1 18 Under evaluated 2 - - 2 1 2 4 2 2-10 5-15 4.2. 내 외국인별, 포지션별 그리고 연봉변동별 연봉 분석 국내 외의 선수들의 KBO 연봉과의 관계 그리고 포지션별과 연봉변동별과의 연봉책정과의 관계에 대 한 결과를 Table 4.3에 정리하였다. 외국인 선수는 연봉에 대해서 고평가되는 경향이 있다는 것을 파 악할 수 있지만 외국인 선수의 수가 국내 선수의 수에 비하여 매우 적기 때문이라고 판단된다. 그리고 KBO의 연봉책정에서 대부분의 선수들은 9개의 포지션별에 큰 영향을 받지 않는다고 탐색할 수 있다. 또한 규정타석을 만족한 타자의 경우에는 연봉은 대부분이 증가한 것으로 분석된다. 따라서 4.2절에서 논의한 분석에서 내 외국인간의 평균차이에 대한 분석 (t 통계량값=3.666, p-값< 0.0001), 포지션간의 평균차이에 대한 분석 (F 통계량값=1.07, p-값=0.400), 연봉변동간의 평균차이에 대한 분석 (F 통계 량값=0.139, p-값=0.871) 모두 통계적으로 유의하지는 않다고 결론내릴 수 있다.

684 Chong Sun Hong Jae Young Kim Dong Sik Shin Table 4.3 Evaluated batters with respect to teams and ages team age Doosan Hanwha KIA KT LG Lotte NC Nexen Samsung SK 20-29 30-34 35- sum batters 6 3 2 5 2 6 9 3 6 4 20 20 6 46 Over evaluated 1 2 2 1 1 2 3-1 - - 8 5 13 Fully evaluated 3 1-2 - 2 2 1 3 4 10 7 1 18 Under evaluated 2 - - 2 1 2 4 2 2-10 5-15 5. 결론 본 연구는 2015년 KBO에서 규정타석 (446타석)을 만족한 타자 46명 (총 51명 중 KBO를 떠난 5명 은 제외)을 대상으로 KBO에서 제공하는 타자의 모든 기록 통계량 중 타자의 능력을 가장 잘 나타내는 다섯 개의 세이버메트릭스 통계량을 이용하여 새로운 세이버메트릭스 통계량인 타자력 지수 (HAI)를 제안하였다. 그리고 2015년 KBO선수들의 경기력을 바탕으로 산출된 2016년 연봉책정과 관련하여 HAI와 2016년 연봉책정과의 관계 속에서 팀별, 나이별, 국내 외별, 연봉변동별, 포지션별로 통계분석 을 실시하였다. 나이별 HAI의 평균을 살펴보면 유의한 차이가 있으며, 특히 20명의 30대 전반의 선수 들이 매우 큰 HAI값을 갖고 있음을 발견하였다. 그리고 소속팀에 따른 HAI의 평균은 유의한 차이가 없으며 또한 선수의 포지션별에도 유의한 차이가 없다. 본 연구의 분석 대상인 타자 46명을 회귀직선의 신뢰구간을 바탕으로 연봉책정의 고평가, 정평가, 저 평가인 세 그룹으로 할당하여 팀별, 나이별, 내 외국인별, 연봉변동별, 포지션별로 연봉에 대하여 분석 하였다. 우선 소속팀과 연봉과 관계를 살펴보면, NC는 모든 주전 선수가 규정타석을 만족하였으며 SK의 경 우 모두 타자의 경기력을 정평가하여 연봉책정을 했다고 확인할 수 있다. 그리고 선수들의 나이가 많을 수록 고평가의 비율이 높아지므로 KBO의 연봉은 현재의 타자 실력보다는 누적된 선수 경력 등이 중요 하다는 것을 인지할 수 있다. 외국인 선수와 연봉과의 관계는 외국인선수의 수가 매우 적지만 국내 선 수보다 고평가하는 경향이 있다는 것을 파악할 수 있다. 그리고 KBO의 연봉책정에 포지션의 난이도는 반영되지 않는다고 탐색한다. 그러나 이와 같은 분석은 나이를 제외하고 나머지는 통계적으로 유의하지 는 않다고 결론내릴 수 있다. MLB 야구 통계자료를 세이버메트릭스 방법으로 분석하는 데 있어 가장 널리 알려졌고 공신력 있다 고 판단하는 WAR 통계량을 KBO에서도 사용하여야 하는데 1절에서 언급한 바와 같이 이를 사용하기 에는 극복해야할 많은 어려움이 있다. 한국에서도 사용할 수 있는 여러 가지 지수들을 개발하는 것도 중 요하지만, MLB와 KBO를 비교 분석하기 위해서는 MLB에서 사용하는 WAR 통계량을 사용할 수 있 도록 KBO의 노력이 필요하다고 제안한다. 즉 KBO의 발전이 한 걸음 더 나아가기 위해서는 KBO와 각 구단에서 MLB의 WAR 통계량을 사용하기 위한 노력이 필요하다고 제안한다. 야구를 통계학을 비롯한 과학적인 방법으로 접근한다 하더라도 2015년 KBO 깜짝 우승팀인 두산의 경우처럼 승패를 예측하는 것은 어렵다. 예측이 다양하고 변수가 많은 야구에서 여느 세이버메트릭스 통계량과도 마찬가지로 본 연구에서 제안한 HAI도 승패를 가르기 위함이 아닌 선수들의 활약 정도에 따른 평가 측도로만 인지하고 선수들의 발전에 기여를 하는 정도로 판단하여 사용하여야 하겠다.

Alternative hitting ability index for KBO 685 부록 Appendix A: Betters and HAI for KBO and MLB in 2015 Table A.1 HAI for KBO (46 people) Table A.2 HAI for MLB (Top 46 people) name KHAI name MHAI Eric Allyn Thames 4.17827 Bryce Harper 3.901445 Kim Tae-kyun 1.50242 Paul Goldschmidt 2.678461 Kang Min-ho 1.29866 Miguel Cabrera 2.534051 Park Sok-min 1.276 Joey Votto 2.410598 Yoo Han-jun 1.25274 Mike Trout 2.36835 Koo Ja-wook 1.03303 Nelson Cruz 1.752319 Lee Yong-gyu 1.01529 Michael Brantley 1.612309 Choi Jun-seok 0.95503 Andrew McCutchen 1.608335 Andy Manuel Marte 0.86228 Anthony Rizzo 1.598884 Choi Hyung-woo 0.68129 Edwin Encarnacion 1.579276 Yang Eui-ji 0.53273 Josh Donaldson 1.505694 James Charles Adduci 0.48059 Buster Posey 1.458279 Lee Seung-yuop 0.44825 Jose Bautista 1.331017 Park Kyung-soo 0.33509 David Peralta 1.268521 Son Ah-seop 0.3071 A.J. Pollock 1.138084 Na Sung-bum 0.28728 Yunel Escobar 1.055289 Jeong Keun-woo 0.20266 David Ortiz 1.030714 Park Min-woo 0.10506 Manny Machado 0.995963 Park Yong-taik -0.0294 Chris Davis 0.937327 Lee Ho-jun -0.04676 Kris Bryant 0.933862 Kim Jae-ho -0.04824 Matt Carpenter 0.933369 Lee Bum-ho -0.05506 Prince Fielder 0.906865 Brett Michael Pill -0.06218 J.D. Martinez 0.893169 Kim Ha-seong -0.1191 Ben Zobrist 0.890335 Min Byeong-heon -0.35665 Eric Hosmer 0.868144 Oh Ji-hwan -0.37165 Adam Lind 0.846854 Kim Jong-ho -0.37249 Brandon Belt 0.776349 Hwang Jae-kyun -0.39819 Ryan Braun 0.731705 Jung Hoon -0.4501 Kendrys Morales 0.718014 Kim Sang-hyeon -0.56301 Shin-Soo Choo 0.716752 Chung Soo-bin -0.57552 Yoenis Cespedes 0.708969 Park Jeong-kwon -0.58347 Lorenzo Cain 0.695518 Hur Kyeong-min -0.59008 Nolan Arenado 0.676959 Lee Jae-won -0.61032 Mookie Betts 0.663637 Kim Min-seong -0.61603 Josh Reddick 0.632314 Kim Sang-soo -0.63841 Curtis Granderson 0.609443 Oh Jae-won -0.67201 Alex Rodriguez 0.604482 Lee Myoung-ki -0.77258 Jose Abreu 0.580795 Park Hae-min -0.79607 Adrian Gonzalez 0.56981 Chang Seong-woo -0.83912 Jason Heyward 0.553523 Kim Seong-hyeon -0.85193 Carlos Gonzalez 0.538178 Lee Dae-hyeong -0.8529 Jason Kipnis 0.526586 Lee Jong-wook -0.88577 Mike Moustakas 0.511623 Son Si-heon -1.28332 Carlos Beltran 0.507541 Ji Seok-hun -1.45974 Logan Forsythe 0.471444 Kim Tae-gun -1.85368 Jose Altuve 0.467148 Appendix B: Statistic List in sabermetrics abbreviation 1B 2B 3B AB BB CS GIDP H HBP HR IBB K NIBB OBP PA R RC ROBE SB SF SH SLG TBB woba position 1B 2B 3B C CF DH LF RF SS Table B.1 Selected statistic List meaning Single Base Double Base Triple base At bat Base on balls (also called a Walks ) Caught stealing Ground into double play (also called a GDP ) Hit Hit by pitch Home runs Intentional base on balls Strike out (also abbreviated SO) Not intentional base on balls On-base percentage Plate appearances Runs scored Runs created Reached base on error Stolen base Sacrifice fly Sacrifice hit Slugging average Total base on balls weight on base average First baseman Second baseman Third Baseman Catcher Center Fielder Designated Hitter Left Fielder Right Fielder Short Stop

686 Chong Sun Hong Jae Young Kim Dong Sik Shin References Cho, Y. S. and Cho, Y. J. (2003). The research regarding a Beane Count application from Korean baseball league. Journal of the Korean Data Analysis Society, 5, 649-658. Cho, Y. S. and Cho, Y. J. (2004). Study about the influence that WHIP has on ERA in 2003 season Korean professional baseball. Journal of the Korean Data Analysis Society, 6, 1415-1424. Cho, Y. S. and Cho, Y. J. (2005). A study on OPS and runs from Korean baseball league. Journal of the Korean Data Analysis Society, 7, 221-231. Choi, Y. G. and Kim, H. M. (2011). A statistical study on Korean baseball league games. The Korean Journal of Applied Statistics, 24, 915-930. James, B. (1982). The Bill James Baseball Abstract. Ballantine Books, New York. Kim, H. J. (2012). Effects of on-base and slugging ability on run productivity in Korean professional baseball. Journal of the Korean Data & Information Science Society, 23, 1065-1074. Korea Baseball Organization (2015). http://www.koreabaseball.com/record/player/hitterbasic/basic Old.aspx. Lee, J. T. (2014a). Estimation of OBP coefficient in Korean professional baseball. Journal of the Korean Data & Information Science Society, 25, 357-363. Lee, J. T. (2014b). Pitching grade index in Korean pro-baseball. Journal of the Korean Data & Information Science Society, 25, 485-492. Lee, J. T. (2014c). Measurements for hitting ability in the Korean pro-baseball. Journal of the Korean Data & Information Science Society, 25, 349-356. Lee, J. T. and Cho, H. S. (2009). Win-lose models when two teams meet using data mining in the Korean pro-baseball. Journal of the Korean Data Analysis Society, 11, 3417-3426. Lee, J. T. and Kim, Y. T. (2005). A study on runs evaluation measure for Korean pro-baseball players. Journal of the Korean Data Analysis Society, 7, 2289-2302. Lee, J. T. and Kim, Y. T. (2006a). A study on the estimation of winning percentage in Korean pro-baseball. Journal of the Korean Data Analysis Society, 8, 857-869. Lee, J. T. and Kim, Y. T. (2006b). Estimation of winning percentage in Korean pro-sports. Journal of the Korean Data Analysis Society, 8, 2105-2116. Major League Baseball (2015). http://mlb.mlb.com/stats. Yang, D. E., Cho, E. H., Bae, S. W. and Jung, S. W. (2015). Analysis of professional korean baseball batter s performances factors. Journal of Sport and Leisure Studies, 60, 305-313.

Journal of the Korean Data & Information Science Society 2016, 27(3), 677 687 http://dx.doi.org/10.7465/jkdi.2016.27.3.677 한국데이터정보과학회지 Alternative hitting ability index for KBO Chong Sun Hong 1 Jae Young Kim 2 Dong Sik Shin 3 123 Department of Statistics, Sungkyunkwan University Received 15 April 2016, revised 13 May 2016, accepted 17 May 2016 Abstract Among lots of sabermetric statistics for baseball batters ability, the wins above replacement (WAR) is the most popular statistic in MLB. However, there exists a difficulty applying WAR to KBO, since KBO data do not have position adjustment, league adjustment and park factor which are essential in calculating WAR. In this paper, using five statistics for both KBO and MLB qualified batters, we propose hitting ability index (HAI), an alternative sabermetric indices to represent batters ability. Comparing HAI with WAR of MLB batters, we evaluate the validity of HAI and then applied HAI to 2015 KBO data in which HAI is analyzed statistically with respect to different teams, ages, and positions. Moreover, the linear relationship between KBO batter s HAI and their annual salary is discussed. Grouping 46 KBO batters based on confidence region of the regression model for annual salary, we also statistically investigate batter s annual salary in these groups with respect to several factors. Keywords: Hitting ability, principal component, regression model, sabermetrics. 1 Corresponding author: Professor, Department of Statistics, Sungkyunkwan University, Seoul 03063, Korea. E-mail: cshong@skku.edu 2 Graduate student, Department of Statistics, Sungkyunkwan University, Seoul 03063, Korea. 3 Graduate student, Department of Statistics, Sungkyunkwan University, Seoul 03063, Korea.