PER vs. BPM vs. WS/48
편히 2차스탯이라고 불리는 advanced stat(심화 스탯)은 크게 2가지로 나뉩니다.
1. 박스스코어에 본인이 직접 기록한 스탯을 이런 저런 가중치가 포함된 수식을 통해 한 가지의 숫자로 통합하여 보여주는 스탯
2. 선수의 온코트/오프코트 상황에서 선수 조합을 고려하여 팀마진을 회귀분석하여 구한 마진스탯
1에는 PER, WS/48, BPM, PIE 이 있고, 2에는 RAPM, RPM, PIPM이 있습니다
1번은 앞으로 박스스코어 2차스탯, 2번은 마진스탯이라고 부르겠습니다.
기본적으로 마진스탯은 RAPM을 바탕으로 만들어집니다, 약간의 추가 변인을 어떻게 잡느냐에 따라 RPM이 되기도 하고 PIPM이 되기도 하죠.
이것에 대한 설명은 지난 글을 참고해주시기 바랍니다.
1) RPM 및 마진스탯의 역사에 대한 글
https://nbamania.com/g2/bbs/board.php?bo_table=maniazine&wr_id=183723
2) PIPM의 기본 개념에 대한 글
https://nbamania.com/g2/bbs/board.php?bo_table=maniazine&wr_id=190319
가장 오래된 심화스탯은 역시 PER입니다. 홀린저가 거의 15년 전에 만든 스탯인데 아직도 쓰이고있죠.
WS (win share) 같은 경우 본래 야구에서 만들어진 것인데 농구에도 적용되어 쓰이는 케이스고 마찬가지로 꽤 전통적인 박스스코어 스탯이라고 할 수 있습니다. WS/48은 48분당 win share를 의미하는 비율 스탯이라고 볼 수 있죠.
BPM은 사실 박스스코어 스탯이지만 마진스탯이고 싶은 스탯인데요.
순수한 마진스탯인 RAPM을 가장 잘 설명하는 박스스코어 스탯 조합을 공식화해놓고, 여기에 각 선수의 스탯을 집어넣는 방식입니다. 기본적으로 스탯 점유율 (특히 어시스트와 리바운드)이 높은 선수가 높은 값을 보입니다.
각 스탯은 모두 박스스코어 스탯을 기반으로 만들어졌지만 보는 관점이 조금 달라서 더 크게 반영되는 가치가 다릅니다.
가장 단순하게 각 박스스코어 스탯의 주안점을 설명하자면,
PER은 생산성, WS/48은 효율성, BPM은 영향력이라고 할수 있습니다.
PER은 분명 이름은 Player Efficiency Rating임에도 다른 advanced stat에서 가장 스탯 "볼륨"을 잘 반영하는 편입니다. 원래 의도하였는 지는 모르겠으나, 낮은 야투율이라도 슛을 많이 쏠경우 PER이 상승하는 특성이 있기에 항상 효율적이기만한 공격을 할 수 없고 팀 공격 볼륨을 책임져야하는 선수들을 높게 평가해주는 좋은 역효과가 있습니다.
WS/48은 효율성에 직결되어있어서, 조금만 슈팅효율이 떨어지면 와장창 떨어지는 스탯입니다.
그렇다보니 WS/48이 좋은 선수중에 효율이 떨어진다는 느낌이 드는 선수는 아예 없습니다. 사실 PER 같은 경우는 웨스트브룩 처럼 슈팅효율이 리그 평균 이하일 때도 높게 나오는 선수가 존재하는데 말이죠.
BPM은 기본적으로 스탯 공식에서 AST% (팀내 어시스트비율)이 차지하는 비중이 매우 크다보니 패서에게 높은 가중치가 주어집니다. 그떄문에 PER이나 WS/48같은 경우 받아먹기 전문 센터들이 상위권을 차지하는 경우가 꽤 있음에도 BPM은 낮은 선수들이 꽤 많습니다. 또한 BPM 상위 선수들 면면을 보면 팀내 영향력이 떨어지는 선수는 없다시피 하죠.
최근들어서 현지에서 최고라고 평가받는 스탯은 마진스탯인 RPM입니다만, RPM을 비롯한 마진스탯 계열은 태생적인 문제점이 있습니다.
선수 집단에서 보이는 "추세"를 통해 선수 개인의 영향력을 "회귀"하여 추론하는 방식임으로, 대개 비슷하더라도 몇몇 선수에게선 튀는 값들이 나올수밖에 없는 한계가 있거든요.
저만해도 RPM을 처음 접했을 때 느낀 괴리감은 상당했습니다,
최근의 예를 들면, 17-18 시즌 오토포터 주니어 (RPM 4.96)가 훌륭한 선수이긴 해도 케빈 듀란트 (RPM 3.61)나 르브론 제임스급 (RPM 4.96) 선수라고 느끼기는 어려우니까요.
박스스코어 스탯은 결과적으로 어떻게든 자기가 직접 생산한 스탯을 통해 평가받기 때문에 좀더 순수한 개인퍼포먼스를 반영합니다. 마진스탯은 팀 퍼포먼스에 집중하는 것이지만요.
최근에는 사실 PER이 의미가 없다.. 라고 보시는 분들도 계시고 왜 그렇게 말씀하시는 지도 이해가 갑니다. 특히 최근 PER은 센터 역할이 한정되면서 빅맨이 전반적으로 높게 나오는 경향성이 뚜렷해다보니 더욱 좋은 선수를 구별해내는 구분력이 떨어진 느낌이 납니다.
하지만 역사적으로 PER이 내포하고 있는 중요도는 분명 존재한다고 보며, 이에 대한 분석을 조금 공유해보고자 합니다.
* 분석 흐름
1. PER, BPM, WS/48 역대 250위에 모두 들어간 선수의 각 박스스코어 심화스탯 정보 --> 134명
2. 이중 MVP share가 0보다 큰 선수들만 sorting --> 총 91 명의 선수
3. Normalization
4. 91명 중 normalized stat의 총합이 -1 이상인 선수 sorting --> 51명 생존
- 스탯이 너무 낮은 선수들은 제외하기 위해서입니다.
5. Final MVP 숫자, Season MVP 숫자, MVP share 숫자에 대한 회귀분석
이런 과정을 통해 역대 가장 좋은 스탯을 기록해왔던 선수들 상위 50여명의 커리어와 스탯간의 상관관계를 비교해보았습니다.
전체 선수 51명의 데이터를 모두 사용하였을 때,
1. MVPshare를 가장 잘 설명해주는 스탯은 매우 큰 차이로 PER이었습니다. 그다음이 BPM이었으며, WS/48은 큰 영향력이 없어보였네요.
2. 그리고 실제 시즌 MVP를 수상한 숫자와의 연관성을 보면 재밌게도 여전히 PER이 제일 높긴 했으나 전반적으로 비슷비슷한 수준을 보였습니다. WS/48이 여기에선 좀 높게 나오는게 재밌습니다.
3. 그런데 결정적으로 정말 역대 순위에 이름을 올리는 선수사이에서 중요한 파엠 숫자에 대한 설명력을 보면, PER이 매우 큰 차이로 가장 설명력이 높은 스탯으로 나옵니다.
혹 몇 명의 아웃라이어급 선수(조던이라든가.. MJ이라든가..)가 지대한 영향을 미쳤을 것을 감안하여, 51명중 30명만 1000번 무작위 추출해서 회귀분석 계수의 분포를 살펴보면,
1) 시즌 MVP와 박스스코어 2차스탯
2) MVP share와 박스스코어 2차스탯
시즌 MVP 수상여부와, MVP share에 대해 높은 Coefficient를 갖는 스탯은 PER과 BPM이었습니다.
공통적으로 WS/48의 영향이 매우 낮게 나왔고요. MVP share에선 PER이 조금 더 높고, 실제 MVP 수상은 BPM이 나아보이네요
3) 파이널 MVP
그런데 파이널 MVP의 설명력을 보면, PER이 BPM에게 눈으로 보기에도 유의미하게 높은 Coefficient 분포를 보여줍니다. 조금 확대하면, 생산성, 효율성, 경기내 영향력을 대표하는 스탯 중 가장 우승에 대한 설명력이 높은 것은 생산성이라고 볼 수 있다라고도 할 수 있습니다.
다음으로, 저는 선수 개개인이 normalized PER, WS/48, BPM 에서 어떤 스탯에 특히 강점을 보이고 있는지를 항목별 차를 통해 계산하고, 이 차를 clustering하였습니다. (k-mean clustering, k=8)
총 8개의 cluster를 찾도록 설정했는데요,
PER, WS/48, BPM 각각에 강점이 있는 유형, 2개의 조합에서 강점이 있고 하나는 부족한 유형, 고루 비슷한 유형 총 7개에 추가로 하나 정도의 유형이 더 있을 가능성을 보고 설정하였습니다.
이렇게 해서 나온 cluster의 면면을 보면 아래와 같습니다
Type은 제가 따로 명명한 건데, PER, WS/48, BPM이 가진 특성을 반영하여 지은 것입니다.
7번 클러스터는 Perfection으로 표기하긴 하였으나, 포함되는 모든 선수가 완벽하다고 해석하기 보단, 3가지 이차스탯에서 균형잡힌 분포를 보인다고 해석하시는게 좋겠습니다.
이 클러스터 사이에서 어느 정도의 실적 차이가 발생했을까요?
즉, 어떤 스탯을 잘찍는 선수들이 더 커리어가 좋았을까요
2번째 열에 해당하는 Sum of 3stat은 말그대로 normalized PER, WS/48, BPM의 합입니다. 높을 수록 스탯이 전반적으로 좋다는 말입니다.
Perfection 그룹이었던 7번 클러스터는 말그대로 GOAT 그룹입니다.
스탯도 제일 좋고, MVP share도 가장 높고, 파엠, 시엠 모조리 1등입니다.
정말 재미있는 부분은 스탯으로는 이 7번 클러스터에 못지않은 2번 클러스터..
Type으로 Pure efficiency (WS/48>PER=BPM)에 해당했던 이 그룹은 놀랍게도 평균 파엠 수상이 0.43으로 꼴찌에서 2번째입니다. 시엠 수상기록으론 위에서 2번째인 그룹, 평균적으로 한개의 시엠을 가지고 있는 선수들인데 파엠에서는 매우 고전을 면치 못하고 있습니다.
이보다 더 재밌는 선수그룹은 1번이겠죠,
Sum of 3stat 항목에서 6위, 전반적인 스탯으론 좋다고 볼수 없는 선수들이고 실제 시엠 수상도 6위인 그룹인데, 이들의 평균 파엠 수는 0.83개로 전체 그룹에서 2번째로 높습니다.
이 그룹, Productive facilitator 로 구분된 1번 클러스터에 들어가있는 6명은,
하킴 올라주원, 코비 브라이언트, 드웨인 웨이드, 크리스 웨버, 트레이시 맥그레이디, 그리고 러셀 웨스트브룩입니다.
하킴과 웨이드는 둘다 명성에 비해 높지 않은 WS/48를 기록하고 있지만 역대 가장 위대한 플옵 또는 파이널 퍼포먼스를 보여준 선수이기도 하죠. 코비또한 온갖 2차스탯에서 역대 탑10이라기엔 좀 의문스러운 수준임에도 5번의 우승과 2번의 파엠을 가지고 있고요. 1번 클러스터에 포함된 선수중에서도 저 세명은 베스트 스탯이 PER인 선수들입니다.
그렇다면 2번 클러스터에 포함된 선수는 누구일까요
2차스탯 계열에선 신급인 2명, CP3와 데이빗 로빈슨.. 이 둘이 2번 클러스터에 들어갑니다.
거기에 카림 압둘자바도 있네요.
CP3 또는 제독 한 명의 Sum of 3 stat 수치가 웨이드, 하킴, 코비의 해당 수치를 다 더한것보다 높죠. 하지만 파엠 갯수는.... 카림은 MVP 갯수에 비하면 파엠이 아쉬운 편이기도 하고요.
3번 클러스터는 그냥 PER만 유독 좋은 선수집단이었는데, 파엠 숫자도 이 그룹이 7번, 1번에 이은 세번째입니다. 샤킬 오닐과 모제스 말론, AD가 여기에 포함되네요.
이 글의 주제가 PER이 짱짱 스탯이다라고 말하려는건 아닙니다.
시즌 퍼포먼스에는 BPM이 더 뛰어난 설명력을 보이기도 하고, 7번 그룹은 사실 모든 스탯이 다 좋은 그룹이니까요.
다만, 농구라는 스포츠, 효율성에 너무 집착하는 것이 우승을 향한 가장 좋은 길은 아닐 수도 있다는 생각이 드네요.
마지막으로, 전체 51명에 대한 클러스터 결과를 보여드리고 마치고자합니다.
재밌게 읽으셨기를 바랍니다.
좋은 글 잘 봤습니다. PER이 공을 많이 쥘수록 유리한 단점은 있긴 해도 영향력이 크고 직관적임은 부정할 수 없는 것 같네요. 마음에 드는 스탯입니다.