Player Impact Plus/Minus (PIPM)에 관하여 2) 적용편 (feat. 불운했던 16-17 카와이 레너드)
PIPM에서 말하는 "운"에 대한 여러 칼럼을 취합-전달하는 것이 목적이었던 1편과는 달리 이번 글은 좀더 단순 번역에 가깝습니다. 매끄러운 전달을 위해 어느 정도의 의역이 들어가있을 수 있으므로 보다 정확한 내용을 원하시는 분은 아래 링크의 글을 참조하시길 바랍니다.
https://fansided.com/2018/01/08/nylon-calculus-calculating-luck-adjusted-ratings/
칼럼 글쓴이이자 PIPM의 개발자이기도한 Jacob Goldstein는 놀랍게도 아직 학생입니다.
Lehigh University에서 Mechanical Engineering을 전공하고 있다고 하네요.
2019 클래스라는데.. 신임 교수님 아닙니다.
-----------------------------------------------
Defining & Calculating luck-adjusted ratings for the NBA
온/오프코트 마진 데이터는 특정 선수가 코트에서 미치는 영향력을 추적하기에 가장 기초가 되는 자료입니다. NBA에서 이 데이터는 선수가 뛰고있을 때와 벤치에 있을때 팀의 net rating (100포제션당 득점과 실점차)을 비교하여 구해집니다.
불행히도, 이 마진 데이터는 놀랄만큼 노이즈가 심한데요, 팀 레이팅에서 "운"을 보정하는 것은 이런 노이즈를 제거하여 보다 깔끔한 팀 퍼포먼스를 볼 수 있도록 도와줍니다.
좋은 예시로 16-17 시즌 카와이 레너드의 수비 온/오프코트 마진 기록이 있습니다. 수비왕 2회를 수상한 레너드의 수비력을 의심하는 사람은 아무도 없을 것입니다. 하지만 16-17 시즌 스퍼스의 수비는 오히려 카와이가 벤치에 있을 때 100포제션당 8.6점이나 더 좋았습니다. 이게 정말 팀이 카와이 없이 훨씬 좋은 수비를 보여서 일까요? 아니면 데이터에 뭔가 잘못된 게 섞인 것일까요?
데이터를 면밀히 들여다본 결과, 레너드가 코트에 있을 때 상대팀이 3점을 훨씬 높은 성공률로 메이드했다는 사실을 발견할 수 있었습니다. 상대팀은 레너드가 온코트 시 37.6%의 3점 성공률을 보였는데 오프코트시에는 29.2%에 그쳤습니다.
1편에서 소개한 내용처럼, 수비하는 팀은 상대 3점 성공률을 믿기 어려울 정도로 제어하지 못합니다. 동일한 논리로, 수비자 개인은 사실상 그들 자신의 힘만으로는 상대의 3점슛%를 거의 제어할 수 없습니다. 이는 상대 자유투 성공률에서도 마찬가지이며 카와이 defensive rating은 이부분에서 상당히 운이 없었던 것이죠.
이런 상대의 운수좋은 3점 성공률이 카와이의 "공격" 레이팅까지 해치진 않겠지만, 비슷한 일은 일어날 수 있습니다. 예를 들어, 공격자 개인은 팀메이트가 자유투를 성공시키도록 또는 놓치도록 제어할 수 없습니다. 또한 공격자 개인이 팀메이트의 3점 성공률에 미치는 영향은 일정부분 존재하나 꽤나 제한적이기 때문에 특정 선수의 온/오프 상태에서의 팀 3점 성공률 관점에서도 상당한 수치의 통계적 노이즈가 섞여있을 수밖에 없습니다.
해결방법은 이런 사건들의 좋은/나쁜 운을 보정하여 보다 안정적인 온/오프 레이팅을 구하는 것이라고 할 수 있겠습니다.
운을 보정한 "공격"
지난 16-17 정규시즌에서 스퍼스는 총 7742번의 공격 포제션을 가져갔고, 레너드는 이중 62.1% 상황에서 코트에 있었습니다. 카와이가 온코트 일때 스퍼스는 5550점을 기록했죠.
운을 보정하는 첫번째 단계는 먼저 팀원의 자유투를 보정하는 것입니다.
카와이 온코트시, 팀메이트들은 642개의 자유투를 쐈고 75.1%의 성공률을 보였습니다. 하지만 스퍼스 팀원들의 평균 자유투 성공률은 76.3%입니다. 즉, 카와이의 팀원들은 그가 뛰고 있을때 실제로는 482개의 자유투를 성공하였으나 운을 보정할 경우 642개의 76.3%에 해당하는 489.7개의 자유투를 성공할 것입니다. 따라서 16-17 시즌 팀원의 자유투 갯수 보정치는 +7.7이 되겠죠. (489.7-482)
다음은 3점슛%입니다. 이는 쪼끔 더 복잡한데요, 앞서 잠깐 언급한 대로, 선수는 개인의 수비 인력이나 플레이메이킹을 통해 팀원의 3점%에 분명 영향을 미치게 됩니다. 이런 효과를 노이즈에서 구별해내기 위해, Jacob은 온코트 시 팀원의 3점%을 시즌의 팀원 3점 성공률로 회귀시켰습니다.
레너드가 코트에 있을때 팀원의 3점슛 성공률은 41.8% 였지만 (780개 시도), 시즌 동안 카와이 부재시엔 1533개의 3점을 39.5%의 성공률로 메이드했습니다.
즉, [(780*41.8%)+(1533*39.5%)]/(780+1533)=40.3%, 이러한 방법으로 운이 보정된 카와이의 팀원 3점%를 구할 수 있습니다.
실제로 카와이의 팀원은 카와이가 코트에 있을때 326개의 3점을 성공했으나, 운을 보정할 경우 314.3개로 다소 떨어지며 이는 -35.1점의 3점에 의한 득점 조정이 되게 되죠.
전체적으로, 공격에서 카와이의 행운/불운을 보정한 득점은 5550점 (실제 온코트 팀득점) + 7.7 (자유투 보정) -35.1 (3점슛 보정) = 5522.6점이 됩니다. 샌안의 총 득점이 8637득점이므로 카와이 온코트시 5522.6점 오프코트시 3114.4점이라는 보정치가 나오게 되고, 온/오프코트에서의 포제션 숫자를 알고 있으므로 보정된 100포제션당 득점, 즉 공격 레이팅을 얻게 되죠.
보정 후, 16-17 카와이의 ORTG (offensive rating, 100포제션당 팀득점)는 114.86이며, 그가 벤치로 들어가면 8.71점이 떨어진 106.15점이 됩니다. 바로 이 8.71점이 운을 보정한 카와이의 16-17 정규시즌 온/오프 공격 레이팅입니다.
운을 보정한 "수비"
(완전히 동일한 논리로 계산이 진행되기 때문에 자세한 내용은 생략하고 정리하여 전달하도록 하겠습니다.)
... 카와이는 상대 3점슛%와 자유투% 모두에서 운이 상당히 없었습니다.
운을 보정할 경우, 3점슛에 의한 실점은 115.6점이나 감소하며, 자유투에 의한 실점은 18.1점이 줄어듭니다. 결과적으로 카와이의 온코트 DRTG는 104.11이고 벤치에 있을때 팀의 DRTG는 102.79입니다. 이는 비록 여전히 샌안이 카와이가 오프코트시에 더 좋은 수비퍼포먼스를 보였다는 말이 되지만, 운을 보정하기 전 -8.8이라는 최악의 온/오프 수비 레이팅에 비하면 상당히 많은 변화가 일어난 수치입니다.
2017-18 시즌 레이팅에 운 보정하기
17-18 시즌 (* 칼럼 작성 당시 시즌 초중반) 1000포제션 이상 가져간 선수 340명 중 가장 운이 좋았던 선수는 유럽 GOAT 테오도시치 였습니다. 클리퍼스에서 그의 실제 넷 레이팅은 +13.6이었으나 보정 후 +3.0으로 떨어졌습니다.
반대로 가장 더럽게 운이 나빴던 선수는 디안젤로 러셀이었는데, 러셀이 코트에 있을때 네츠는 부재시보다 100포제션당 9.3점을 뒤쳐졌지만 보정 넷 레이팅은 +0.8로 좋아졌습니다. (*무려 10.1점이 좋아진 수치네요)
아래 히스토그램은 17-18시즌 초중반 까지 운 보정으로 변화한 수치가 어떻게 분포하는지 보여줍니다.
적은 샘플 사이즈일텐데도 좌우 대칭의 정규분포에 근사한 형태를 보이네요.
공수에서 나눠서 운이 좋았던 선수와 나빴던 선수를 보면,
공격에서 가장 운이 좋았던 선수는 자자 파출리아로 +7.6점의 행운이 있었으나 반대로 가장 운이 없던 선수는 TJ 리프로 보정값보다 실제가 6.5점이나 나빴습니다.
수비에서는 에릭고든이 무려 10.1점이나 기대치보다 좋은 값을 보인 억세게 운 좋은 수비 토템이었고, 반대로 엘프레드 페이튼은 8.5점의 수비 불운을 가진 선수였네요.
이렇듯 운을 보정하는 것은 특정 선수의 온코트 오프코트시 팀이 어떤 퍼포먼스를 보이는지 더 명확하게 보여줍니다. 특히 적은 샘플 사이즈의 경우에, 실제 "진실"의 값과는 동떨어진 무작위적 변동을 고려하는 것이 팀의 퍼포먼스를 이해하는데 매우 중요하게 작용합니다.
--------------------------------------
2편을 마칩니다. 번역체로 쓰고싶지 않아서 이래저래 의역이 좀 들어가기도 했고, 반복되는 논리에선 정리하는 식으로 단순화해서 쓴 면이 있는데, 전체적인 흐름과 논지를 변형시키지 않는 범위에서 했다고 생각은 합니다만 여전히 부족한 점이 있을 수 있으니 부디 양해 부탁드립니다.
3편에선 PIPM이라는 용어를 처음 등장시킨 칼럼인데, 사실상 내용은 크게 다르지 않습니다.
1편에선 핵심 원리를 설명하고, 2편에선 실험적용을 해보았다면 진짜 전체에, 여러 시대에 걸쳐 적용하는게 3편이라고 할수 있겠죠. (그런 면에서 각자 읽어보시는 것도..)
여튼 이글이 PIPM이라고 하는 스탯에 대한 이해와 흥미증진에 조금이나마 도움이 되었다면 성공이라고 생각합니다. 글감은 많은데 시간이 적네요. 다음에 또 다른 주제로 찾아 뵙도록 할게요.
아 정말... 읽다보니 개념이 확실하게 잡힙니다~ 감사합니다