DIPS

  • 이 항목은 FIP로 검색해도 들어올 수 있다.

1 개요

"이것은 철저하게 수비의 영향을 받지 않는 기록에 기반해 투수를 평가합니다."

by 보로스 맥크라켄#

'DIPS'는 'Defense Independent Pitching Statistics (수비 무관 투구 기록)'의 약자로, 보로스 맥크라켄이란 사람이 만든 투수 평가를 위한 세이버메트릭스 기록의 하나다. 이것은 수비수들의 수비와 무관하다 볼 수 있는 기록인, 삼진, 사사구, 홈런만을 통해 투수의 기록을 재구성한 것이다. 또한 수비를 완전히 배제한다는 이 개념을 공유하는 모든 지표들에 대한 통칭이기도 하다.

비교적 익숙한 'FIP'이란 지표는 톰 탱고에 의해 고안된 DIPS 기반 평균자책점의 한 종류로, 'Fielding Independent Pitching(수비 무관 투구)'의 약자다.

2 배경

투수의 승패와 평균자책점은 매우 오래 전부터 투수를 평가하는 대표적인 지표로 자리잡아왔으며, 현재까지도 그 위상을 (과거만큼 절대적이지는 않으나) 유지하고 있다.

하지만 동시에, 일찍부터 눈썰미 있던 일부 사람들은 해당 기록이 가지는 단점을 알아채고 비판해왔는데, 특히, 승패는 투수의 기량과 상관없는 팀 타선의 득점력이 큰 요인으로 작용한다는 명확한 단점을 가지고 있는만큼, 오랜 기간 동안 강한 비판의 대상이 되어왔다. 그 결과, 최근에 접어들어선 평가 지표로서의 가치는 거의 상실해 그 상징성만 유지하고 있는 상태라고 할 수 있다.

그렇지만 평균자책점만은 여전히 강한 영향력을 유지하고 있는데, 평균자책점 역시 큰 문제를 내포하고 있다는 점은 승패와 마찬가지다. 실점의 경우 실점을 많고 적게 하는 것은 투수의 책임이 크긴 하다. 하지만 이걸 투수 혼자만의 책임으로 볼 순 없다. 수비는 투수와 동료 수비수들이 함께 하는 것이기 때문이다. 그렇기에 온전한 투수의 능력을 평가하기 위해선 동료 수비수들의 영향을 배제할 필요가 생긴다.

바로 이를 해결하기 위해 도입된 개념이 자책점이다. 자책점은 수비수들이 평균 이하의 플레이, 즉, 실책을 저질렀을 때 해당 상황을 재구성해 투수에게 타당하다 여겨지는 점수를 부여한다. 언뜻 생각해보면 합리적으로 보이지만 실상은 그렇지 않다. 문제는 바로 그 실책이 기록자의 주관에 의해 결정된다는 것이다. 이건 기록관을 무시하려는 게 아니라 수비수의 수비를 평가하는 일은 매우 어려운 일로, 이것이 이런 식으로 이뤄질 수 있었다면 수많은 사람들이 오랜기간 고민해올 필요가 없었을 것이다. 기록관이 판단하는 것은 그저 수비수가 공을 제대로 포구했는가, 송구와 그에 대한 포구가 제대로 이뤄졌는가 정도에 그친다. 수비 범위가 좁아서 자연스럽게 무수한 안타를 허용하는 것이나, 중견수가 외야를 휘저으며 타자의 안타를 막는 것들은 고려하지 않는다.

그리고 2아웃 이후 실책이 나왔을 경우, 이후 투수가 해당 이닝에 몇 점을 더 내주건 그건 투수의 자책점이 아니게 된다는 점도 지적받는다. 실책이 없었다는 가정 상 해당 이닝은 이미 종료됐으므로 이후에 준 점수는 투수의 책임이 아닌 것으로 계산되는 것이다. 이런 방식은 엄연한 투수의 투구 내용을 표본에서 배제하는 것으로 적절하다고 보기 어렵다. 또한 주자를 남겨놓고 마운드에서 내려갔을 경우, 투수 본인과 상관이 없는 후속 투수의 능력에 의해 자책점이 달라질 수 있다는 점 또한 문제로 지적되고 있다.[1]

이렇듯 투수를 평가하기 위한 기존 지표들의 한계는 명확했고, 이를 극복하기 위한 많은 시도들이 있어왔다. 하지만 그럼에도 불구하고 '투수의 투구'와 '수비수의 수비'를 분리하는 일만큼은 난제에 가까웠는데, 이 둘은 매우 밀접하게 관련돼 있었기 때문이다.

3 등장

그러던 1999년 11월 18일, 세이버메트리션들의 오랜 숙원이었던 투구와 수비의 분리에 대한 하나의 답이 세상이 나왔다. 보로스 맥크라켄이 당시 유즈넷 커뮤니티를 통해 DIPS를 발표했던 것이다.

이때 맥크라켄이 내놓은 답은 아예 무시하라는 것이었다. 그는 볼 인 플레이 상황이 됐을 때 그것이 안타가 되는 비율, 즉, 'BABIP(Batting Average on Ball In Play)'[2]는 투수의 능력과 무관하다. 그러므로 투수의 능력을 평가함에 있어 이를 배제해야한다는 주장을 폈다.

이 내용은 당시로선 말도 안 되는 이야기처럼 여겨졌다. 이때까지만 해도 야구계 전반은 물론, 세이버메트리션들 사이에서도 인플레이된 공이 범타가 되느냐 안타가 되느냐의 여부는, 투수의 기량이 크게 영향을 미친다는 것이 상식이었으니 당연한 일이었다. 이후 맥크라켄은 빌 제임스를 비롯한 많은 세이버메트리션들의 반발을 겪었고, 심지어 일부로부터는 조롱까지 받기도 했다.

4 근거

하지만 맥크라켄이 그런 황당해보이던 주장을 한 것은 근거가 있었다. 맥크라켄의 연구 결과에 따르면, 삼진, 사사구, 홈런은 매년 투수 나름의 고유한 값을 유지하는 경향이 있었던 반면, BABIP는 그렇다고 볼 수 없었다. 투수의 BABIP는 매년 크게 변동했고, 투수 고유의 값을 가지기 보단 리그 평균에 근처에서 머무르는 경향을 보였다. 그리고 투수의 BABIP가 높거나 낮은 경우는 팀 동료들의 기록 역시 비슷한 양상을 보였다. 또한 DIPS에 기반해 투수의 미래를 예측하는 편이 평균자책점을 이용하는 것보다 훨씬 정확했다.

바로 이런 결과를 통해 맥크라켄은 투수의 BABIP에는 투수 기량 외적 요인, 즉 팀의 수비력과 구장, 그리고 운이 매우 큰 영향을 미친다는 결론에 도달했던 것이다.

왜 이런 결과가 나오는지 정확히 설명할 순 없었지만, 이런 결과가 나온다는 것만은 사실이었다. 처음 이 의견에 반대했던 세이버메트리션들도 시간이 흐를수록 맥크라켄의 주장에 동의하는 입장으로 변해갔다. 빌 제임스 역시 이후 이것을 일찍 깨닫지 못한 자신이 어리석었다며 입장을 철회했다.

결국 랜디 존슨이 안타를 적게 맞은 것은, 그가 허용했던 타구들이 약해서라기보단 애초에 그가 볼 인 플레이 상황을 적게 만들었기 때문이었던 것이다.

5 의문과 설명

5.1 뛰어난 투수들은 BABIP를 낮출 수 있다.

삼진 능력이 뛰어난 투수의 BABIP가 낮은 경향이 있긴 하다. 하지만 이는 무시할만한 수준이다.

스트라이크 존 가장자리로 잘 제구된 공의 BABIP가 낮은 것도 사실이다. 하지만 이것 또한 유의미한 차이를 낸다고 보긴 어렵다.

무엇보다 리그의 규격을 초월한 것처럼 보여지던 전설적인 투수들이 좋은 반례다. 이들은 대부분은 거의 매년 훌륭한 DIPS를 꾸준히 유지한 반면, BABIP에서만큼은 꾸준하지 못했고, 특별하지 못했다.

5.2 맞혀잡는 유형의 투수를 저평가한다.

삼진은 적지만 좋은 성적을 내는, 소위 '맞혀잡는 투수'들을 저평가한다는 의문을 가지는 사람이 많다. 하지만 DIPS는 단순히 삼진을 최고로 여기는 게 아니다. 볼넷과 함께 홈런도 평가에 포함된다. DIPS는 삼진을 많이 잡지 못하더라도 볼넷과 홈런을 억제할 수 있다면 훌륭한 투수가 될 수 있다는 것을 보여준다.

'FIP가 땅볼투수를 저평가한다'고 말하고 싶다면, 땅볼 비율이 높은 투수들이 BABIP가 낮은 경향이 있다(또는 ERA가 FIP보다 낮은 경향이 있다)는 걸 보여줘야 하는데, 당연히 그런 결과는 안 나온다.

대체로 그런 주장을 하는 사람들은, 땅볼 비율이 높으면서 BABIP가 유독 낮았던 케이스를 몇 개 들고와 이야기하는 게 전부다. 찾자면 삼진을 많이 잡으면서 BABIP가 낮았던 경우도 찾을 수 있고, 같은 방식으로 'FIP는 삼진을 많이 잡는 투수를 저평가 한다'고 주장할 수도 있을 것이다. 물론 어느 쪽이든 제대로 조사하면 유의미한 경향은 안 나온다.

덧붙이자면, 땅볼투수들에게선 ERA가 낮아보이는 '착시현상'을 포착할 수 있는데, 이 부분이 저러한 통념에 기여했을 수도 있다. 똑같은 수비지원 하에서 똑같은 이닝, 똑같은 실점을 기록한 땅볼투수와 뜬공투수가 각각 있을 경우, 자책점이 더 적은 쪽은 땅볼투수일 공산이 크다. 땅볼투수들은 속된말로 자책점을 '세탁'해 비자책점으로 만드는 일이 다른 투수들에 비해 잦기 때문이다. 뜬공에 비해 땅볼 에러가 많은 건 수비의 능력과 별개로 당연한 현상이다. 보통 리그 평균의 자책점/실점 비율은 0.93 정도지만, 땅볼투수들의 평균은 그보다 더 낮다.

다만 1사 1, 3루 등 어떤 상황에서는 삼진보다 땅볼유도가 병살을 만들어내기에 좋기 때문에 일부러 땅볼을 유도하는 경우가 많은데, 이런 것은 FIP가 반영하지 못하는 부분이다. 또한 이렇게 땅볼유도를 하는 상황들은 보통 투수에겐 위기상황인 경우가 많기 때문에 바로 아래의 항목과도 연관이 있다.

5.3 위기 관리 능력을 무시한다.

DIPS도 각각의 이벤트들의 가치를 종합한 컴포넌트 ERA로 볼 수 있으므로 이 말은 맞는 말이다. 세이버메트릭스 스탯에서는 위기관리 능력을 평가하는 것에 대해 비관적인 입장이다. 이는 클러치 히터 논쟁이 좋은 참고가 될 것이다.

5.4 DIPS는 결국 ERA를 예측하기 위한 종속적인 보조 지표일 뿐이다.

DIPS의 미래 예측력이 뛰어나다는 점을 잘못받아들여, DIPS가 미래를 예측하기 위해 설계됐다고 생각하는 사람들이 종종 있다. 하지만 DIPS의 목적은 미래 예측이 아니라 이미 일어난 일에 대한 평가다. DIPS가 예측력이 뛰어난 건 그저 기량 외적 노이즈를 제거해서 투수의 기량을 더 잘 파악한 결과일뿐, 그걸 위해 설계됐기 때문이 아니다.

DIPS는 '무엇이 일어날까?'에 대한 답이 아니라 '무엇이 일어났어야 했는가?'에 대한 답이라고 볼 수 있다.

5.5 통계적 아웃라이어가 존재할 수 있다.

당연하다. DIPS 역시 완벽할 순 없다. 실제 후속 연구에 의해 BABIP에 투수가 전혀 영향을 줄 수 없는 것은 아니라는 결론이 나온 바 있다.#

타구 종류타자투수수비리그 평균
땅볼47%29%13%11%
플라이볼39%26%21%13%
라인드라이브46%28%13%13%

대부분 아웃으로 연결되는 내야뜬공을 많이 양산한다던가, 투수 본인의 수비력이 뛰어나다던가, 투수 역시 BABIP에 영향을 줄 수 있다. 앞서 언급했듯이 위기 관리 능력을 아예 무시한다는 점 또한 아웃라이어를 만드는 요인으로 작용한다.

명예의 전당에 입성한 300승 투수 톰 글래빈이 대표적인 예라고 할 수 있다. 그는 극단적인 경계선 투구와 자기 자신의 뛰어난 수비력, 그리고 위기 관리 능력을 통해 DIPS에 비해 더 좋은 결과를 낸 대표적인 투수였다. 또한 맷 케인제러드 위버, 그리고 크리스 영도 DIPS의 아웃라이어로 꼽힌다. 이 투수들은 내야뜬공을 많이 양산함으로써 오랜 기간 평균에 비해 BABIP를 낮게 유지해왔다. 그리고 필 니크로, 찰리 허프, 팀 웨이크필드 같은 너클볼러들도 빼놓을 수 없다.

이렇듯 DIPS 역시 완전할 순 없고, DIPS가 놓치는 부분에서 뛰어난 모습을 보이는 투수들이 종종 있는 것이 사실이다. 하지만 주의해야할 점은, 근래의 세이버메트리션들이 DIPS 외에 우리가 놓칠 수 있는 부분을 무시하자는 입장인 것은 결코 아니란 점이다. 팬그래프에서 제공하는 투수 WAR이 철저하게 DIPS에만 기반해 투수를 평가하는 것을 두고, 세이버메트릭스는 DIPS 외의 부분을 완전히 무시한다고 생각하는 것은 착각이다.[3] 그럼에도 투수를 평가함에 있어 DIPS만 보는 것은 한 두 시즌 단위의 표본에서 DIPS가 훨씬 우수하면서도, 커리어 전체의 관점에서의 정보 손실도 크지 않기 때문이라고 할 수 있다.

실제로 글래빈, 케인, 위버 등 아웃라이어라고 불리는 투수들 대부분이 커리어 fWAR과 rWAR에서 큰 차이가 없다. 그리고 팬그래프의 WAR은 하나의 기준일 뿐이지 그들이 주장하는 절대적인 가치가 아니다. 기록을 활용해 가치 판단을 내리는 건 결국 보는 사람에 달려있다. 실제 팬그래프는 기본 DIPS 기반 WAR과 함께 BIP-Wins와 LOB-Wins라는 DIPS 외의 요소를 설명하는 지표를 함께 제공함으로써 이용자들의 판단을 돕고 있다.

6 보완

당연히 DIPS 또한 부족한 부분을 보완하기 위한 여러 노력이 있어왔다. 내야 뜬공을 양산하는 투수들은 평가하기 위해 그것을 계산에 포함한 'IFFIP(In Field Fly Fielding Independent Pitching)'란 지표가 소개되기도 했고, 아예 타구의 유형을 반영한 'tRA(True Runs Average)' 같은 지표도 있다.

그러나 이런 지표들 역시 DIPS의 또 다른 갈래일 뿐으로, DIPS의 불완전함을 극복했다고 보긴 어렵다. IFFIP은 특정 유형을 표적으로 삼은 지표에 가깝고, tERA는 타구 분류가 완벽하지 않을 뿐더러 라인드라이브 비율은 투수의 능력이라고 보기 애매한 구석이 있다.

결국 가지고 있는 정보가 거기서 거기라면, 앞서 언급했던 표본에 따라 DIPS 외의 영역을 적절히 섞어보는 것이 좋은 선택이 될 것이다. 캐머런 외에도 톰 탱고는 7-8년 정도의 장기간의 투수들을 대상으로 기량을 평가하기에는 DIPS보다 실점이 더 좋다는 취지의 말을 했고, ZiPS 프로젝션의 개발자인 Dan Szymborski 또한 자기는 투수를 평가함에 있어 3200타석(이닝으로 대략 800이닝)을 기준으로 DIPS와 수비를 보정한 실점를 50%씩 보는 것을 선호한다고 한 바 있다.

7 평가

패러다임을 바꾼 위대한 발견으로 평가되고 있다.

이미 DIPS는 세이버메트릭스의 핵심으로 자리잡은 상태다. 이를 통해 야구를 DIPS와 DIPS 외의 영역으로 분리해 분석하는 접근법이 정립됐다고 할 수 있다.

이제 세이버메트릭스에서 단순한 평균자책점은 큰 의미를 갖지 못하며, 또한 투수의 승패가 그랬던 것처럼 야구계 전반에서도 평균자책점에 대한 인식이 점점 예전만은 못해져 가는 중이라고 볼 수도 있다. 선수들 중에서도 맥스 슈어저, 잭 그레인키처럼 해당 지표에 호의적인 선수들이 존재하며, 2010년 무렵부터는 사이 영 상 투표에서 DIPS를 근거로 표를 던지는 기자들이 늘어나기 시작했다. 특히 2014년 AL 사이 영 상 투표에선 코리 클루버펠릭스 에르난데스를 제치고 수상할 수 있었던 원동력 중 하나로 작용했다고 볼 수 있다.

8 계산 방법

8.1 보로스 맥크라켄의 DIPS

보통 DIPS라 하면 수비와 무관하게 계산된 평균자책점을 떠올리지만, 아주 엄밀히 따졌을 때, 이는 DIPS의 속해있을 뿐 DIPS 그 자체는 아니다. 삼진, 사사구, 홈런을 통해 계산된 투수의 이닝, 피안타, 심지어 승패까지도 모두 DIPS라고 할 수 있다.

맥크라켄이 설명한 DIPS를 계산하는 과정은 대략적으로 이렇다.

1. 파크팩터를 이용해 볼넷, 삼진, 홈런을 보정.

2. 보정된 기본 스탯들을 바탕으로 DIPS 피안타, DIPS 이닝을 계산.
3. 계산된 스탯들을 XR에 적용해 투수의 DIPS ER을 계산.
4. DIPS 이닝과 DIPS ER을 이용하여 DIPS ERA 계산.
5. 피타고리안 승률을 이용하여 투수의 DIPS 승률을 계산.[4]
6. 해당 시즌 리그 전체의 이닝과 디시전의 비율을 계산 후, 이를 투수의 DIPS 이닝에 적용, DIPS 디시전을 계산.
7. DIPS 디시전에 5번에서 구한 DIPS 승률을 계산하여 승패 계산.

참 쉽죠?

8.2 톰 탱고의 FIP

위의 과정을 보면 알 수 있듯이 계산 과정이 꽤 번거로운 편이라 일반 팬들 사이에서 널리 쓰이기엔 한계가 있었다. 이에, 톰 탱고가 간단한 계산으로 'DIPS ERA'를 계산할 수 있는 식을 만들어 소개했는데 이것이 바로 FIP다.

FIP의 식은 아래와 같다.

(-2×삼진 +3×(볼넷 +몸에 맞는 볼) +13×홈런)/이닝 +C
  • 볼넷에서 고의사구를 제외하기도 하는데 FIP을 취급하는 커뮤니티 중 가장 널리 알려진 팬그래프에서는 IBB를 제외하지 않는다.
  • C는 Constant의 머릿글자로, FIP을 ERA 스케일로 맞추기 위한 상수다. 현대 야구[5]에서는 보통 3.00~3.20 정도의 값을 지니며, 이로 인해 리그 ERA와 리그 FIP은 같은 값을 가지게 된다. 참고로 평균자책점이 아닌 9이닝 당 실점을 기준으로 맞춘다면 FIP기반의 9이닝 당 실점이 된다.
  • -2, 3, 13이란 각 계수는 '상황별 기대 득점(Run Expectancy)'에 기반해 계산된, 이벤트별 '득점 가치(Run Value)'를 통해 구해진 값이다. C값을 제외한 식이 의미하는 바는 즉, '9이닝당 수비 무관 득점 가치'로 볼 수 있다. -2, 3, 13 각 숫자를 9로 나눠주고, 인플레이 상황의 득점 가치를 더해주면 그것이 삼진, 사사구, 홈런의 득점 가치가 된다.
  • 또한 'xFIP(Expected Fielding Independent Pitching)'라고 하여 홈런마저도 제외하고 이를 기대 홈런으로 대체한 스탯도 존재한다. 기대 홈런은 선수의 플라이볼에 리그 평균 플라이볼 대비 홈런 비율을 곱함으로써 계산된다.

9 관련 문서

  1. 후속 투수에 의한 추가 실점은 비자책점 역시 동일하게 적용된다.
  2. 맥크라켄은 Hits per ball in play란 표현을 사용했다.
  3. 그곳의 운영진인 데이브 캐머런은 2013년 사이영 상을 예상하면 실점 3할, DIPS 7할 정도가 적절할것 같다는 의견을 내비친 적이 있다.
  4. 득점엔 당시즌 리그의 평균자책점을, 실점엔 투수의 DIPS ERA를 적용한다.
  5. 팬그래프를 참고하면 저 3.00~3.20 이라는 수치로 어느정도 유지되기 시작한건 1993년부터다.