마진 스탯으로 수비 평가하기
마진 스탯의 강점은 수비를 보다 잘 평가하는 점에 있습니다.
DIFF%와 같은 상대 야투율 억제력이라든지, 야투 "시도" 억제와 같은 1차원적이고 직접적인 스탯은 직관적이고 수치 자체의 오차가 (거의) 없다는 강점이 있지만, 반대로 로테이션 수비 구멍을 메꾸기 위해 달려간 선수에게 실점의 귀책이 잡히든지 하는, 수치 자체의 문제가 아닌 수치 할당의 문제가 생길 수 있습니다.
공격보다 귀책을 따지기 어려운 수비 특성상,
지극히 결과론적인 마진 스탯은 태생적인 장점이 있죠.
니가 스틸을 하든 블락을 하든, 팀 실점이 줄지 않으면 좋은 수비가 아니다.
반대로 니가 가만히 서있든 기도를 하든, 팀 실점이 줄면 좋은 수비다.
단순하지만 꽤 강력하고 합리적인 기준입니다.
오프코트 대비, 온코트에서의 수비포제션, 이때의 팀실점은 매우 정확한 스탯입니다.
말그대로 선수 A 있을때 실점 10점, 없을때 실점 9점이면 (동일포제션 가정)
-1점의 수비마진! 이런건 간단한 산수죠.
하지만 이런 스탯은 당연히 상대 선수, 우리 선수 라인업에 지대한 영향을 받으므로 이를 보정해주는 작업을 거친게, 우리가 알고있는 마진 스탯들의 기초가 되는 RAPM입니다. 현존 모든 마진스탯은 RAPM을 기반으로 구해집니다.
결국 PIPM, RPM, BPM, PTPM을 보든..
RAPM이 나쁘면 어떤 계수를 구하더라도 절대적으로 좋은 수치가 나오긴 매우 어렵습니다.
RAPM에 대한 추가적인 정보를 원하시는 분들은 밑에 링크를 참조하세요
pbp에서 제공하는 defensive rating은 RAPM보다도 이전, 라인업이 고려되기 전에 순수한, 단위 포제션당 마진이라고 보시면 되는데, 우리가 잘 알고 있는 뛰어난 수비수인 카와이 레너드의 defensive rating을 보면,
카와이 온코트시 109.4
오프코트시 106.51
낮을 수록 좋은 수치기에... 카와이 온코트시 팀 수비 마진이 더 나쁘다는 것을 알 수 있습니다.
이건 주작이나 수비스탯의 맹점이 아니고 그냥 순수한 팀 수비 마진이거든요.
담백하게 말하면 카와이가 온코트 시에는 팀 실점이 오히려 조금 많아진다. 이것입니다.
여기에 라인업을 고려한 스탯이 D-RAPM이며, 18-19 정규시즌 카와이의 D-RAPM은 -0.8329입니다.
애초에 순수한 마진에서 마이너스이기 때문에, 라인업에서 막대한 손해를 받고 있는게 아니었다면 보정하더라도 엄청나게 좋아지지는 않습니다.
여기에 추가적으로 luck을 보정한 스탯이 PIPM인데, 카와이의 D-PIPM은 18-19시즌 0.1정도네요
카와이 온코트시에 기록된 수비마진 손해에 비하면 + 수치로 전환된 것이 오히려 카와이의 위엄이랄까요.
마진 스탯을 산출하기 위해 사용되는 회귀분석은 수비 마진값을 설명하기 위해, 선수 수비 퍼모먼스를 계수화하여 선수들이ㅡ 온/오프 코트 여부에 따라 마진들을 가장 잘 설명해내는 계수(=선수의 수비 퍼포먼스)를 찾아내는 방법입니다.
즉, 100% 설명해내는 것도 아닐뿐더러 (그걸 좋은 방법이라고 하지도 않습니다. overfitting이라고 하죠)
그게 진실이라고 말할수도 없습니다. 다만 가장 설명력이 좋은 "추세"를 찾아내죠.
그러므로 0.1-0.2 정도의 차이를 가지고 누가 누구보다 수비가 좋다는거냐?! 그러니 마진 수비스탯은 신뢰도가 낮다.. 이렇게 말할 수는 없습니다.
하지만, 코트에서 보여진 모든 라인업에 의한 모든 포제션에서의 모든 실점 패턴에 대한 추세를 가장 잘 설명하는 계수를 찾아낸 것이니, 몇명의 선수에게서는 오차가 좀 나타날 수도 있지만 "전반적"으로는 정확하다고 봅니다.
RPM이나, PIPM은 RAPM에 대해 조금씩 다른 보정이 들어갑니다.
BPM이나 PTPM (Player tracking +/-) 은 그 선수가 실제 기록한 스탯들, 박스스코어 스탯이나 트랙킹 스탯으로 RAPM을 잘 설명하는 요인과 각 요인에 대한 계수를 찾아내서 좀더 명확한, 선수에 의한 공헌을 추출하기 위한 시도입니다.
덕분에 BPM과 PTPM이 RPM과 PIPM을 보완해줄 수 있는데, 아무래도 그 선수가 직접 기록한 스탯은 그 선수가 뛸때 팀이 기록한 스탯보다 보다 직접적이죠.
그래서 각 선수의 계수값을 찾는게 아니라, 일단 전체 추세를 가장 잘 설명하는 스탯들을 찾고 그 스탯의 weight (계수)를 계산해서 공식을 만듭니다. 그리고 각자 선수가 기록한 값을 집어넣어서, RAPM이라는 마진 스탯, 팀수비 공헌을 본인이 기록한 수치로 재현하려는 시도입니다.
이 때문에 저는 이런 다양한 접근의 마진스탯에서 일관된 수치를 보이다면, 이는 상당히 높은 신뢰도를 가지고 있다고 생각합니다.
다만 이런 마진 스탯은 뛰어난 원온원 디펜더의 역량을 다소 저평가할 가능성이 있습니다.
(물론 이 선수가 뛰어난 팀디펜더로서의 퍼포먼스는 아니었다는 전제하에)
특정 클러치 포제션에서 상대 에이스를 틀어막는게 매우 중요할 수 있지만 이건 시즌 전체 포제션에서 매우 미미한 영향이거든요. AV같은 선수가 대표적이라고 봐야곘죠, 좋은 원온원 디펜더이지만 15-16 시즌 즈음부터는 수비 마진스탯에서 좋은 수치를 보인적이 없습니다.
또 이건 제가 마진 스탯을 유심히 오래 관찰하고 분석 해보면서 느낀 것인데 혹 도움이 되실까봐 말씀드리면, 마진 스탯이란건 분명히 팀의 영향을 지대하게 받습니다.
라인업 보정을 했는데 이게 무신 소리고? 하실수 있지만, 놀랍게도.. Win added (PIPM 누적) 변화를 살펴보면, 특정 선수의 합류 혹은 어떤 이벤트 이전이후로 Win added의 기울기 (미분값) 즉 PIPM은 매우 드라마틱하게 변합니다.
예를 들면, 시몬스를 3점슈터 하나없이 다 볼핸들러만 있는 라인업에 넣어놨을때보다 슈터 한 3명에 엠비드랑 같이 뛰는게 PIPM이 더 좋게 나온다는 것입니다. 아무리 보정을 한다해도, 결국 그 보정을 하는 raw data는 그 라인업으로 뛰었을때의 마진이기 때문입니다.
시몬스가 스페이싱 제로의 올볼핸들러 라인업보다 본인에게 최적의 라인업에서 뛰는게 그 선수의 퍼포먼스와 팀 전체 마진을 향상시키고, 이건 보정만으로는 알수 없는 효과입니다.
다른 예로, 하든이 오클에 있을 때와 휴스턴에 있을 때, 휴스턴에 있더라도 터커랑 뛸 때, 따로 뛸 때에 그 선수의 D-PIPM은 차이가 날 수 있습니다. 이건 라인업에 의해 그 선수의 퍼포먼스 자체가 변하는 것이기 때문입니다.
이러한 점들을 같이 고려하시어, 스탯을 보고 해석하시면 더 도움이 될 것으로 생각합니다.
마진 스탯에 대해 더 궁금하실 분들을 위해 논문 링크를 하나 첨부합니다.
https://basketball-analytics.gitlab.io/rapm-data/open-source-data-nba.pdf
글쓰기 |
슬램덩크에서도 그런말이 있었죠 채치수는 골밑에 있기만해도 수비적으로 위압감을준다고. 꼭 블락 클로즈아웃을 안해도 상대슛에 영향을 주는 요인들이 있을거기때문에 마진스텟을 보는게 가장 합리적이라고 봅니다.
수비를잘하는사람이어도 상대방이 라이벌의식을 느끼고 더 잘넣을수도있고요 멜로같이