야구의 기록 계산법

야구의 각종 기록(stat)들. KBO에서 공식기록으로 다루는 항목은 굵게 표시했다.

1 투수

  • WHIP(이닝당 안타, 볼넷 허용률, Walks plus Hits divided by Innings Pitched)
이닝 당 출루허용률로 많이 알려져 있으나 이는 틀린 말이다. 이것이 혼동을 줘서 이닝당 출루허용률이라는 WHIP에 왜 몸에 맞는 공은 들어가지 않느냐는 질문이 간간히 올라오곤 한다.
  • K/BB(탈삼진/볼넷)
삼진 개수를 볼넷 개수를 나눈다. 2.0 이상이면 준수한 투수로 판단하고 3.0 이상이면 에이스급 투수로 본다.
  • pFIP(RA9 버전 FIP)
공식은 '(17.5*HR + 7*BB - 9*K)/PA + Constant'이다. The Hardball Times의 Glenn DuPaul이 만들었다. 투수의 실제 기량을 예측하기 위하여 홈런의 가치를 조정하였다. 공식이며, RA9방식이 ERA보다 투수 본연의 능력에 더 가깝기 때문에 만든 것이다. 팬그래프서 안 사용하는 이유는 ERA 스케일을 사람들이 좋아하기 때문이다. 홈런, 볼넷, 삼진만 가지고 RA9 방식으로 표현하기 떄문에 FIP보다 투수의 순수한 능력을 더 잘 표현한다고 볼 수 있다. 심지어 100이닝이상에서는 SIERA와 MARCEL Pojection, ZIPS Projection보다 RA9에 대한 예측력이 뛰어나다. ERA버전은 'pFIP = (20*HR + 10*BB ? 10*K)/TBF + 4.60(상수)'이다. 이것 역시 FIP, xFIP, KwERA보다 정확하며, SIERA와 엇비슷한 예측력을 보인다.
  • kwERA
kwERA는 위의 FIP와 탈삼진/볼넷 단순 비율에서 더욱 진화하여 홈런마저 배제한 채 탈삼진/볼넷 비율만을 가지고 성적을 예측하는 시스템이다. 당연히 탈삼진이 많고 볼넷이 적으면서 많은 타자를 상대할수록 kwERA는 낮아진다. 톰 탱고가 개발하였으며, 계산법은 '5.40-12×(탈삼진-볼넷)/(상대한 타자 수)'이다. 여기서 5.40은 FIP의 3.2처럼 ERA 스케일로 나타내기 위한 상수값이다. 다음 시즌의 성적을 예측하는데에 있어 FIP보다 편리하다고 알려져 있다. 다만 피네스 피쳐들의 경우는 통산 상대한 타자들의 수가 많을 경우 영 좋지 않은 결과가 나오는 경우가 왕왕 있는데, 현대야구에서 보기드문 통산 5000이닝을 달성한 2차대전 이래 최강의 에이스 그렉 매덕스가 통산 3.26 FIP를 기록하고도 4.01이라는 충공깽한 kwERA를 기록한 것이 한 사례라 할 수 있다.
  • SIERA(Skill-Interactive ERA)
비교적 최근인 2010년 소개된 스탯. BP SIERA는 기본적으로 특정 시즌의 그라운드볼과 플라이볼 비율, 탈삼진 비율을 가지고 투수의 당해 시즌 퍼포먼스를 표현하기 위한 스탯이다.
팬그래프 New Siera는 올시즌의 퍼포먼스를 파크 팩터를 중립화하여 보여준다. 내야 플라이볼, 플라이볼, 그라운드 볼, 탈삼진, 볼넷을 가지고 계산한다. New Siera는 파워 피처의 BABIP가 그 투수의 xBABIP보다 낮게 나오는 것을 잡아내주며, 또한 파워 피처의 HR/FB가 리그 평균보다 낮게 나오는 것을 잡아준다.
40이닝 이상 피처를 대상으로 최고의 비율 스탯이다. 볼넷이 적은그라운드 볼러의 비자책 실점을 잘못 찾지만, 이거는 ERA 스케일이라 그런 것이며, 오히려 WAR 계산을 위한 RA9 방식으로 변환시는 더 정확이다. SIRA라고 하는 RA9 버전으로 계산하면 이것도 FIP보다 정확하다. 게다가 우리 흔히 사용하는 Projection 시스템보다 SIERA Projection이라는 다음 시즌의 퍼포먼스를 예상하기 위한 방식을 쓰면 현존하는 대부분의 Projection 시스템보다 정확하다. SIERA Projection의 2011년 버전은 'SIERA_proj = .59*SIERA(’10) + .26*SIERA(’09) + 0.47'이다.
자세한 내용은 비즈볼, 베이스볼 프로스펙터스의 #1, #2, #3, #4, #5, #Fangraphs SIERA, #Fangraphs SIRA, #Fangraphs SIERA Projection, 공식은 여기 글 참조.

2 타자

  • 타율(BA or AVG, Batting Average)
  • OPS+(조정 OPS)
(출루율/리그출루율 + 장타율/리그장타율 - 1)×100×파크팩터(BPF). 리그에서 해당 타자의 위치를 알아보기 쉽게 만듬과 동시에, 몇 시즌 타고투저로 인해 통산기록이 상승하였거나 또는 그 반대로 손해를 본 선수들을 일괄비교할 수 있다. 파크팩터가 개입하므로 투수친화적이거나 타자친화적인 구장에 따른 기록 상승/저하도 계산 가능.[1]
  • BB/K(볼넷/삼진)
말 그대로 볼넷 개수를 삼진 개수로 나누면 됨. 이것과 출루율이 높으면 선구안이 우수한 타자로 여긴다.
  • RC(득점 생산, Runs Created)
일단 계산 방법이 매우 복잡하다.

A = 안타+볼넷-도루실패+사구-병살타

B = 0.24×(볼넷-고의4구+사구)+0.62×도루+0.5×(희생번트+희생플라이)-0.03×삼진
C = 타수+볼넷+사구+희생번트+희생플라이로 정의할 때,
RC = {(2.4C+A)×(3C+B)/(9×C)}-0.9×C이다.

빌 제임스가 고안한 한 타자가 (어떤 방식으로든) 만들어낸 득점 생산력. 당연히 높을수록 팀의 승리에 기여하는 바가 크다. 각 숫자들은 득점에 각 항목이 어느 정도 기여했는지를 알려주는 것이라 이해하면 된다. 예를 들면 도루가 0.62라는 것은 도루 한 개가 0.62점에 해당한다는 뜻.[2]

다만 밑의 XR에 대항하여 새로운 공식이 나왔으니...

A: 안타 + 볼넷 ? 도루실패 + 몸에맞는공 ? 병살타

B: (1.125×단타) + (1.69 x 2루타) + (3.02×3루타) + (3.73×홈런) + .29×(BB-IBB+HBP) + .492×(SH+SF+SB) - (0.4×K)
C: 타수 + 볼넷 + 몸에맞는 공 + 희생번트 + 희생플라이

3c6c63e3b6593f333f75fe535d16b25f.png

위에처럼 계산한다.

참고로 영양가 있는 안타의 계산 법은 다음과 같다.

02fe528468ac8b784cdb220a21d024e7.png

  • RC27
27아웃당(27타석이 아니다) RC. 27아웃은 한 경기를 가리킨다.[3] 즉, 한 타자를 8명 더 복제해서 1번부터 9번까지 전부 그 타자로만 채웠을 때, 그 팀이 몇 점을 얻을 수 있느냐-라고 이해하면 된다. 단, 선수 개인의 성향 차이(스위치히터라든가 주자가 없을때만 잘치는 타자, 또는 점수차에 따라 성적이 다른 경우등)는 반영할 수 없기 때문에 실제로 그 선수로 9명을 채웠다고 해도 똑같은 수치가 나올 가능성은 높지 않다. 계산은 복잡하지만 일단 계산만 되어있으면 선수간 기량을 비교하기에 가장 편한 지표. 기본적으로 RC 같은 누적통계가 아니라 OPS, GPA 같은 비율통계의 부류이고, 실제에 적용할 경우 출루율이 매우 높으면 출루의 가치가 과대평가되는 경향이 있다.
  • IsoP(Isolated Power, 절대 장타율)
장타율 - 타율. 장타율 중에 단타가 포함되어 있으므로, 단타를 제외한 2루타 이상만을 계산하고자 하는 기록. 타자의 성향을 나타내는 스탯으로 높을 수록 강타자공갈포라고 판단할 수 있다. 다만 이 스탯 자체가 생산성과는 별 상관이 없는 스탯이므로 이게 높다고 좋은 타자라고는 말할 수 없다. 장타율이 같은 수준이라면 절대 장타율은 낮을수록 좋은 타자이다. 일발장타를 통해 만든 장타율보다 단타 여러개로 만든 장타율이 더 가치가 높기 때문이다.
  • IsoD(Isolated Discipline, 절대 출루율)
출루율 - 타율. 출루율에서 안타를 제외하고 4사구를 통한 출루율을 계산하고자 하는 기록. 절대 장타율과 마찬가지로 타자의 성향을 알아보는 용도로 사용되는 스탯. 역시 출루율이 같은 경우라면 낮을수록 생산성이 높게 나오므로 우열판단의 기준으로는 사용할 수 없다.
  • XR(Extrapolated Runs, 추정 득점)
Jim Furtado#가 고안한 통계. 계산법은 1루타×0.5 + 2루타×0.72 + 3루타×1.04 + 홈런×1.44 + (몸에 맞는 볼 + 볼넷 - 고의4구)×0.34 + 고의4구×0.25 + 도루×0.18 - 도루실패×0.32 - (타수 - 안타 - 삼진)×0.09 - 삼진×0.098 - 병살타×0.37 + 희생플라이×0.37 + 희생번트×0.04.
RC와 마찬가지로 저 정도의 공헌도를 지닌다는 계산에서 나온 기록. RC와 계산 방법만 다를 뿐이지 거의 같은 의미의 스탯이라고 여기면 된다.[4] RC보다 복잡하지만 좀 더 정확한 스탯으로 알려져 있다.
  • wOBA(weighted On Base Average, 가중 출루율)
(0.72×고의4구 제외 볼넷 + 0.75×몸에맞는 볼 + 0.90×1루타 + 0.92×실책에 의한 출루 + 1.24×2루타 + 1.56×3루타 + 1.95×홈런) / (타석-고의4구)...는 톰 탱고의 The Book에 나온 오리지날 버전이고, 팬그래프에서는 실책에 의한 출루를 제외한 버전을 따로 개발하여 시즌단위로 계수들을 조금씩 바꿔가며 계산하고 있다. 매시즌 각 이벤트의 런밸류 값이 조금씩 달라지는 것은 선형분석에 기반한 공식의 숙명이기 때문.
2012 시즌의 공식은 (0.691×(볼넷-고의4구) + 0.722×몸에 맞는 볼 + 0.884×1루타 + 1.257×2루타 + 1.593×3루타 + 2.058×홈런) / (타수 + 볼넷 - 고의4구 + 희생플라이 + 몸에 맞는 볼).[5]
매시즌 계산공식이 바뀌기 때문에 가끔 상식밖의 결과가 나오는데, 대표적으로 배리 본즈의 경우 2004년보다 2002년이 wOBA가 높다. 왜냐하면 2004년엔 홈런에 1.983을 곱하지만 2002년엔 2.021을 곱하기 때문. 기본적으로 출루율 스케일로 나타내되 1955년부터 집계되기 시작한 고의4구는 계산 과정에서 제외하기 때문에 1955년부터의 wOBA는 실제 리그 출루율과는 소수점 셋째 자리 수준에서 살짝 오차가 있다. 계산하기가 RC나 XR, EqA보다 훨씬 간편했으나 이렇듯 유동적인 런밸류값을 계수로 놓게 되면서 오히려 RC나 XR에 비해서 일반인이 구하기에는 좀 노가다가 필요한 스탯이 되어 버렸다. 최근 세이버메트리션들 사이에서 가장 각광받는 스탯 중 하나.
사실 wOBA보다 EQA가 더 정확한 스탯이다. 톰 탱고도 인정한 바이다. 국내에서는 PBP 데이터를 이용하는 kbreport.com의 wOBA만 정확하다. 톰 탱고 간이식(진짜가 아닌 추정 런 밸류 사용하는) wOBA를 사용하는 방식은 OPS보다도 Correlation이 낮다. 그렇다고 OPS가 더 좋은 것은 아니지만, 적어도 문제는 뭐인지 확실한 것 아닌가? 그리고 KBO에서는 wOBA보다 UEQR이 더 정확하다.
  • wRAA(weighted Runs Above Average)
타자가 메이저리그 평균 타자에 비해 얼마나 득점에 기여했는지 점수를 통해 나타낸다. 공식은 ((wOBA - 리그 평균 wOBA) / wOBA스케일[6])×타석.
  • wRC+(weighted Run Created+)
얼핏 보면 위의 RC와 착각할지도 모르나 실은 완전히 다른 스탯으로, 이건 wOBA기반 스탯이다. 계산 방법은 (((wRAA / 타석) / (리그 득점 / 리그 타석)) + 1)×100×파크팩터. 조정 OPS와 마찬가지로 리그 평균 타자의 wRC+를 100으로 상정하여 해당 타자의 전반적인 위치를 쉽게 알아볼 수 있다.
  • GPA(Gleeman Production Average)[7]
약자 그대로 글리만이 만든 통계다. 기존의 OPS는 출루율 + 장타율이라는 단순 계산으로 "출루율 .350에 장타율 .450의 타자"와 "출루율 .280에 장타율 .520"의 타자가 OPS상으론 .800으로 동급으로 취급을 받는 문제가 발생한다. 이런 OPS의 문제점을 보완하고자 출루율의 비중을 높이는 통계를 만들었는데 이것이 Tangotiger(Tom Tango)가 만들어낸 ((출루율×1.8) + 장타율)이다. 하지만 일반인들이 느끼기 힘들다는 것으로 판단하고 글리만이 여기서 나누기 4를 하는 방법을 생각해냈다. 그리고 일반 타율에 가까운 수치가 나오도록 1.7대신 1.8을 곱해서 만들어 진것이 바로 GPA이다.

계산법은 f2e4f0291d5c046d0a9ea87646140d26.png

  • EqA(Equivalent Average, 등가타율)
수비 관련되어서 가장 유명한 계산법. 아직 한국에서는 관련 자료들이 미비해서 구하기가 어려우나 여러가지 시도가 이루어지고는 있다.

3 종합

  • WAR(Wins Above Replacement, 대체 수준 선수 대비 승리 기여도) : 자세한 것은 항목 참조.
  • WPA(Winning Percentage Added, 승리 확률 기여도) : 팀의 승리 확률에 얼마나 기여했는지를 나타낸다.
  • BABIP(Batting Average on Balls In Play) : 피칭과 공·수 등 여러가지 면에서 특정 선수나 팀의 실력과 운의 요소 등을 평가하는데 사용된다.

이 외에도 Win shares, VORP(Value Over Replacement Player) 등 세이버메트리션들이 고안해놓은 온갖 복잡하고 수많은 기록(stat)들이 있다.

이 문서의 2011년부터의 저작자는 이 링크에서 확인할 수 있습니다.
  1. 단 우리나라에서는 파크 팩터가 큰 의미가 없다는 계산 결과가 있다. 홈런, 3루타는 꽤 차이가 나지만 종합적으로는 크게 영향을 끼치지 않는다.
  2. 물론 뒤에 복잡한 과정을 거치므로 1점대 0.62점에 대응하는 것은 아니지만...
  3. 실제로는 1경기에서 27아웃을 채우지 않는 경우도 꽤 많기 때문에 27 대신 25를 쓰기도 한다.
  4. RC는 후에 이런저런 가중치와 추가요소가 덧붙여져 복잡해졌지만 기본적으로 출루율×루타의 개념이다. 경험적으로 실제 득점에 매우 가까운 수치가 나오지만 '왜 그렇게 되는지'를 구체적으로 설명할 수 없는 게 RC의 단점이다. 한편 XR는 실제 자료의 회귀분석을 통해 얻은 가중치를 사용한 선형공식이다.
  5. 이게 완전히 정확하지는 않은게, 실제로 직접 구해보면 팬그래프에 표기되어있는것과 대략 0.001~0.002사이의 자잘한 오차가 발생하는 것을 알수있다. 즉 실제 계수는 소수점 셋째 자리에서 끝나지 않는다.
  6. wOBA를 출루율 스케일로 나타내기 위해 각 이벤트(볼넷, HBP, 1루타, 2루타, 3루타, 홈런)에 곱하는 값. 이 역시 매 시즌 값이 변경되며 2012시즌 wOBA스케일은 1.245다. wOBA를 구할때 인위적으로 곱했기 때문에 다시 나누는 것. 참고로 이것도 톰 탱고의 The Book에 나온 오리지날 수치가 있는데 바로 1.15다.
  7. 영어 위키백과에서는 Gross Production Average로 소개되어 있다. 어차피 약자는 같기 때문에 GPA로 부른다.