Xp
자동
NBA Maniazine
/ / / /
Xpert

PER vs. BPM vs. WS/48

 
22
  4210
Updated at 2019-04-25 21:42:57

편히 2차스탯이라고 불리는 advanced stat(심화 스탯)은 크게 2가지로 나뉩니다.

1. 박스스코어에 본인이 직접 기록한 스탯을 이런 저런 가중치가 포함된 수식을 통해 한 가지의 숫자로 통합하여 보여주는 스탯

2. 선수의 온코트/오프코트 상황에서 선수 조합을 고려하여 팀마진을 회귀분석하여 구한 마진스탯

 

1에는 PER, WS/48, BPM, PIE 이 있고, 2에는 RAPM, RPM, PIPM이 있습니다

1번은 앞으로 박스스코어 2차스탯, 2번은 마진스탯이라고 부르겠습니다.

 

기본적으로 마진스탯은 RAPM을 바탕으로 만들어집니다, 약간의 추가 변인을 어떻게 잡느냐에 따라 RPM이 되기도 하고 PIPM이 되기도 하죠.

 

이것에 대한 설명은 지난 글을 참고해주시기 바랍니다. 

1) RPM 및 마진스탯의 역사에 대한 글

https://nbamania.com/g2/bbs/board.php?bo_table=maniazine&wr_id=183723

2) PIPM의 기본 개념에 대한 글

https://nbamania.com/g2/bbs/board.php?bo_table=maniazine&wr_id=190319

 

 

가장 오래된 심화스탯은 역시 PER입니다. 홀린저가 거의 15년 전에 만든 스탯인데 아직도 쓰이고있죠.

WS (win share) 같은 경우 본래 야구에서 만들어진 것인데 농구에도 적용되어 쓰이는 케이스고 마찬가지로 꽤 전통적인 박스스코어 스탯이라고 할 수 있습니다. WS/48은 48분당 win share를 의미하는 비율 스탯이라고 볼 수 있죠.

 

BPM은 사실 박스스코어 스탯이지만 마진스탯이고 싶은 스탯인데요.

순수한 마진스탯인 RAPM을 가장 잘 설명하는 박스스코어 스탯 조합을 공식화해놓고, 여기에 각 선수의 스탯을 집어넣는 방식입니다. 기본적으로 스탯 점유율 (특히 어시스트와 리바운드)이 높은 선수가 높은 값을 보입니다. 

 

각 스탯은 모두 박스스코어 스탯을 기반으로 만들어졌지만 보는 관점이 조금 달라서 더 크게 반영되는 가치가 다릅니다.

 

가장 단순하게 각 박스스코어 스탯의 주안점을 설명하자면,

PER은 생산성, WS/48은 효율성, BPM은 영향력이라고 할수 있습니다. 

 

PER은 분명 이름은 Player Efficiency Rating임에도 다른 advanced stat에서 가장 스탯 "볼륨"을 잘 반영하는 편입니다. 원래 의도하였는 지는 모르겠으나, 낮은 야투율이라도 슛을 많이 쏠경우 PER이 상승하는 특성이 있기에 항상 효율적이기만한 공격을 할 수 없고 팀 공격 볼륨을 책임져야하는 선수들을 높게 평가해주는 좋은 역효과가 있습니다. 

 

WS/48은 효율성에 직결되어있어서, 조금만 슈팅효율이 떨어지면 와장창 떨어지는 스탯입니다.

그렇다보니 WS/48이 좋은 선수중에 효율이 떨어진다는 느낌이 드는 선수는 아예 없습니다. 사실 PER 같은 경우는 웨스트브룩 처럼 슈팅효율이 리그 평균 이하일 때도 높게 나오는 선수가 존재하는데 말이죠.

 

 

BPM은 기본적으로 스탯 공식에서 AST% (팀내 어시스트비율)이 차지하는 비중이 매우 크다보니 패서에게 높은 가중치가 주어집니다. 그떄문에 PER이나 WS/48같은 경우 받아먹기 전문 센터들이 상위권을 차지하는 경우가 꽤 있음에도 BPM은 낮은 선수들이 꽤 많습니다. 또한 BPM 상위 선수들 면면을 보면 팀내 영향력이 떨어지는 선수는 없다시피 하죠. 

 

 

최근들어서 현지에서 최고라고 평가받는 스탯은 마진스탯인 RPM입니다만, RPM을 비롯한 마진스탯 계열은 태생적인 문제점이 있습니다.

 

선수 집단에서 보이는 "추세"를 통해 선수 개인의 영향력을 "회귀"하여 추론하는 방식임으로, 대개 비슷하더라도 몇몇 선수에게선 튀는 값들이 나올수밖에 없는 한계가 있거든요.

 

저만해도 RPM을 처음 접했을 때 느낀 괴리감은 상당했습니다, 

최근의 예를 들면, 17-18 시즌 오토포터 주니어 (RPM 4.96)가 훌륭한 선수이긴 해도 케빈 듀란트 (RPM 3.61)나 르브론 제임스급 (RPM 4.96) 선수라고 느끼기는 어려우니까요.

 

 

박스스코어 스탯은 결과적으로 어떻게든 자기가 직접 생산한 스탯을 통해 평가받기 때문에 좀더 순수한 개인퍼포먼스를 반영합니다. 마진스탯은 팀 퍼포먼스에 집중하는 것이지만요.

 

 

최근에는 사실 PER이 의미가 없다.. 라고 보시는 분들도 계시고 왜 그렇게 말씀하시는 지도 이해가 갑니다. 특히 최근 PER은 센터 역할이 한정되면서 빅맨이 전반적으로 높게 나오는 경향성이 뚜렷해다보니 더욱 좋은 선수를 구별해내는 구분력이 떨어진 느낌이 납니다.

 

 

하지만 역사적으로 PER이 내포하고 있는 중요도는 분명 존재한다고 보며, 이에 대한 분석을 조금 공유해보고자 합니다.

 

 

* 분석 흐름

1. PER, BPM, WS/48 역대 250위에 모두 들어간 선수의 각 박스스코어 심화스탯 정보 --> 134명

2. 이중 MVP share가 0보다 큰 선수들만 sorting --> 총 91 명의 선수

3. Normalization

4. 91명 중 normalized stat의 총합이 -1 이상인 선수 sorting --> 51명 생존

- 스탯이 너무 낮은 선수들은 제외하기 위해서입니다.

5. Final MVP 숫자, Season MVP 숫자, MVP share 숫자에 대한 회귀분석

 

이런 과정을 통해 역대 가장 좋은 스탯을 기록해왔던 선수들 상위 50여명의 커리어와 스탯간의 상관관계를 비교해보았습니다.

 

전체 선수 51명의 데이터를 모두 사용하였을 때,


1. MVPshare를 가장 잘 설명해주는 스탯은 매우 큰 차이로 PER이었습니다. 그다음이 BPM이었으며, WS/48은 큰 영향력이 없어보였네요.

 

2. 그리고 실제 시즌 MVP를 수상한 숫자와의 연관성을 보면 재밌게도 여전히 PER이 제일 높긴 했으나 전반적으로 비슷비슷한 수준을 보였습니다. WS/48이 여기에선 좀 높게 나오는게 재밌습니다. 

 

3. 그런데 결정적으로 정말 역대 순위에 이름을 올리는 선수사이에서 중요한 파엠 숫자에 대한 설명력을 보면, PER이 매우 큰 차이로 가장 설명력이 높은 스탯으로 나옵니다.

 

혹 몇 명의 아웃라이어급 선수(조던이라든가.. MJ이라든가..)가 지대한 영향을 미쳤을 것을 감안하여, 51명중 30명만 1000번 무작위 추출해서 회귀분석 계수의 분포를 살펴보면,

 

 

1) 시즌 MVP와 박스스코어 2차스탯 

 

 

2) MVP share와 박스스코어 2차스탯 

 

시즌 MVP 수상여부와, MVP share에 대해 높은 Coefficient를 갖는 스탯은 PER과 BPM이었습니다. 

공통적으로 WS/48의 영향이 매우 낮게 나왔고요. MVP share에선 PER이 조금 더 높고, 실제 MVP 수상은 BPM이 나아보이네요

 

3) 파이널 MVP

그런데 파이널 MVP의 설명력을 보면, PER이 BPM에게 눈으로 보기에도 유의미하게 높은 Coefficient 분포를 보여줍니다. 조금 확대하면, 생산성, 효율성, 경기내 영향력을 대표하는 스탯 중 가장 우승에 대한 설명력이 높은 것은 생산성이라고 볼 수 있다라고도 할 수 있습니다.

 

 

 

다음으로, 저는 선수 개개인이 normalized PER, WS/48, BPM 에서 어떤 스탯에 특히 강점을 보이고 있는지를 항목별 차를 통해 계산하고, 이 차를 clustering하였습니다. (k-mean clustering, k=8)

 

총 8개의 cluster를 찾도록 설정했는데요, 

PER, WS/48, BPM 각각에 강점이 있는 유형, 2개의 조합에서 강점이 있고 하나는 부족한 유형, 고루 비슷한 유형 총 7개에 추가로 하나 정도의 유형이 더 있을 가능성을 보고 설정하였습니다.

 

이렇게 해서 나온 cluster의 면면을 보면 아래와 같습니다

 

 

Type은 제가 따로 명명한 건데, PER, WS/48, BPM이 가진 특성을 반영하여 지은 것입니다.

7번 클러스터는 Perfection으로 표기하긴 하였으나, 포함되는 모든 선수가 완벽하다고 해석하기 보단, 3가지 이차스탯에서 균형잡힌 분포를 보인다고 해석하시는게 좋겠습니다.

 

이 클러스터 사이에서 어느 정도의 실적 차이가 발생했을까요?

즉, 어떤 스탯을 잘찍는 선수들이 더 커리어가 좋았을까요


2번째 열에 해당하는 Sum of 3stat은 말그대로 normalized PER, WS/48, BPM의 합입니다. 높을 수록 스탯이 전반적으로 좋다는 말입니다.

 

Perfection 그룹이었던 7번 클러스터는 말그대로 GOAT 그룹입니다. 

스탯도 제일 좋고, MVP share도 가장 높고, 파엠, 시엠 모조리 1등입니다.

 

정말 재미있는 부분은 스탯으로는 이 7번 클러스터에 못지않은 2번 클러스터..

Type으로 Pure efficiency (WS/48>PER=BPM)에 해당했던 이 그룹은 놀랍게도 평균 파엠 수상이 0.43으로 꼴찌에서 2번째입니다. 시엠 수상기록으론 위에서 2번째인 그룹, 평균적으로 한개의 시엠을 가지고 있는 선수들인데 파엠에서는 매우 고전을 면치 못하고 있습니다.

 

이보다 더 재밌는 선수그룹은 1번이겠죠,

Sum of 3stat 항목에서 6위, 전반적인 스탯으론 좋다고 볼수 없는 선수들이고 실제 시엠 수상도 6위인 그룹인데, 이들의 평균 파엠 수는 0.83개로 전체 그룹에서 2번째로 높습니다.

 

이 그룹, Productive facilitator 로 구분된 1번 클러스터에 들어가있는 6명은,

하킴 올라주원, 코비 브라이언트, 드웨인 웨이드, 크리스 웨버, 트레이시 맥그레이디, 그리고 러셀 웨스트브룩입니다.  

 


하킴과 웨이드는 둘다 명성에 비해 높지 않은 WS/48를 기록하고 있지만 역대 가장 위대한 플옵 또는 파이널 퍼포먼스를 보여준 선수이기도 하죠. 코비또한 온갖 2차스탯에서 역대 탑10이라기엔 좀 의문스러운 수준임에도 5번의 우승과 2번의 파엠을 가지고 있고요. 1번 클러스터에 포함된 선수중에서도 저 세명은 베스트 스탯이 PER인 선수들입니다. 

 

그렇다면 2번 클러스터에 포함된 선수는 누구일까요

 

2차스탯 계열에선 신급인 2명, CP3와 데이빗 로빈슨.. 이 둘이 2번 클러스터에 들어갑니다.

거기에 카림 압둘자바도 있네요.

  

CP3 또는 제독 한 명의 Sum of 3 stat 수치가 웨이드, 하킴, 코비의 해당 수치를 다 더한것보다 높죠. 하지만 파엠 갯수는.... 카림은 MVP 갯수에 비하면 파엠이 아쉬운 편이기도 하고요. 

 

 

3번 클러스터는 그냥 PER만 유독 좋은 선수집단이었는데, 파엠 숫자도 이 그룹이 7번, 1번에 이은 세번째입니다. 샤킬 오닐과 모제스 말론, AD가 여기에 포함되네요.

 

 

 

이 글의 주제가 PER이 짱짱 스탯이다라고 말하려는건 아닙니다.

시즌 퍼포먼스에는 BPM이 더 뛰어난 설명력을 보이기도 하고, 7번 그룹은 사실 모든 스탯이 다 좋은 그룹이니까요. 

 

다만, 농구라는 스포츠, 효율성에 너무 집착하는 것이 우승을 향한 가장 좋은 길은 아닐 수도 있다는 생각이 드네요. 

 

마지막으로, 전체 51명에 대한 클러스터 결과를 보여드리고 마치고자합니다.

재밌게 읽으셨기를 바랍니다.

 

 

 

 

 

14
Comments
1
Updated at 2019-03-18 14:42:06

좋은 글 잘 봤습니다. PER이 공을 많이 쥘수록 유리한 단점은 있긴 해도 영향력이 크고 직관적임은 부정할 수 없는 것 같네요. 마음에 드는 스탯입니다.

WR
1
Updated at 2019-03-18 17:15:29

저도 PER의 단점이 USG%에 너무 종속적이라고 생각했는데, 이게 장점으로 작용할 수도 있다라는 생각도 들더군요. USG% 역대 1위가 조던이기도 하죠. 커리 같은 경우도 USG%가 제일 높은 시즌이 커리어하이 시즌이기도 하고요. 

 

 

많이 쏠수 있는 것도 능력이라고 봐야할 것 같습니다. 그런 선수 중에 특히 팀버프를 잘 하는 유형의 선수들이 우승을 더 잘 하는 경향성도 있고요. 

 

특히 베스트스탯이 PER인 선수들의 총 파엠 갯수는 무려 17개네요.

BPM 타입은 10개, WS/48 타입은 7개에 불과합니다. 

PER 타입의 최고인 조던을 제외해도 11개로 1위이니.. 시사하는 바가 있다고 보입니다.

1
Updated at 2019-03-18 15:00:50

저는 농구는 잘 모르지만....

선수 역량을 판단할때

 

1. 출전경기/경기당 시간

2. 1차 스탯 : 득점>스틸=턴오버>리바>블록.어시 순으로 대략 보고

3. 2차 스탯 : PER > WS >BPM 순으로 봅니다.

 

이렇게 보고 나면 주관적인 제 느낌과 실제 실력이 비슷하더라구요 

좋은 글 잘 봤습니다.

 

감사합니다.

WR
Updated at 2019-03-18 16:48:28

저는 17년까지만 해도 WS/48이 최고로 정확한 스탯이고, BPM은 의미없는 스탯이라고 생각한 적도 있었는데 생각이 조금씩 바뀌고 있습니다. 

 

WS/48은 false-positive인 선수들이 거의 없다는 면에서 여전히 훌륭하지만 다른 타입에 비해 결정적인 캐리력이 부족해보인다는 느낌을 지울 수가 없더라고요. PER 유형은 어떨때 보면 자기 스탯만 쌓는 스탯패더같아 보이더라도 조건이 맞을 때는 누구보다 강력한 포스를 보이는 것 같고요. 

2019-03-18 16:55:08

조금 덧붙이면

저는 스탯을 매우 신뢰하는 편입니다. 하지만 맹신을 하면 안 되겠죠!

내쉬나 로즈같이 팀성적이 대폭 오르게했던 특이 케이스를 제외하면

대부분의 시즌 MVP들이 각종 2차 스탯을 1위 or 2위를 차지하는 경우가 많은 것을 봐도

1~2차 여러가지 스탯을 전반적으로 보면 상당히 신뢰할 만하다고 생각하네요!

 

2019-03-18 15:42:05

Cp3 윈셰어는 진짜..

2
Updated at 2019-03-18 16:40:37

멋진 글 감사히 보고 갑니다. 이렇게 통계학적으로 스탯을 분석하실 수 있다는 것이 참 놀랍고 부럽습니다.

 

개인적으로 PER 을 신뢰하지 않는 편이었는데 파엠 수상과의 높은 관련성을 보인다는 게 의외였고 신선하게 다가오네요. 확실히 플레이오프 같은 무대에선 효율성만으로는 되지 않는 진흙탕 경기가 자주 나오는데 그런 경기에선 볼륨을 어떻게든 뽑아내는 선수들이 큰 가치를 가진다고 생각합니다.

 

본문에도 언급하셨지만 PER 이 아쉬운 것은 포지션 또는 역할군에 따른 수치 배분이 너무 비정상적이라는 점인데, 이런 All in one 스탯은 등수대로 쫙 나열했을 때 서열이 어느 정도 아이테스트와 일치해야 된다고 보는데 그런 점에서 좀 아쉽다고 느낍니다. 말씀하신, 빅맨들은 너무 높은 수치가 나온다던가 하는 부분이 문제죠.

WR
1
Updated at 2019-03-18 17:16:41

PER은 특히 최근에 와서 그런 문제가 더 심해지는 것 같습니다. 

최근 5년 정도를 보면 특히 센터 포지션의 PER이 유독 높아진 것으로 보입니다 (느낌적으론..) 

 

이전 글에서 말씀해주셨던 것처럼 센터의 역할이 개인 공격력을 많이 활용하기보단 야투율이 더 높은 받아먹기에 한정되면서 스탯은 올랐음에도 영향은 평준화된 것이, PER 에선 보정되지 않은 채 나타나면서 결과적으로 PER의 신뢰도가 떨어지는 느낌입니다. 

 

파엠에 대한 각 스탯의 설명력 결과는 저도 좀 의외였습니다. 

마음속으로는 말씀하신 것과 비슷한 결론을 내리기도 했고요. 일례로 마이애미 시절까지의 르브론의 플옵 퍼포먼스가 훌륭하긴 해도 시즌에 보여준 만큼 그렇게까지 훌륭하진 않다. 그렇게까지 캐리를 하진 못하는 것 같다고 느꼈었는데요, 클블에 돌아온 첫해 플옵을 보고 생각이 바뀌더라고요.

 

효율을 내려놓은 르브론의 모습이라고 보였는데, 지금까지 봤던 모습들보다 더 위협적이라고 느꼈습니다. 근데 그 플옵에서 르브론 WS/48이 0.173밖에 안되더군요. 또한 역시나 말도안되는 플옵 퍼포먼스로 동부 8연패를 했던 17-18 시즌 플옵도 WS/48로는 0.269로 15-16, 16-17 보다도 (작긴하지만) 낮았거든요. 근데 정작 퍼포먼스는 직전 두 해보다 낫다고 느껴졌고요. 근데 실제 르브론이 20경기 이상 뛴 플옵시즌 중 PER이랑 BPM이 가장 높은 시즌이 17-18이더라고요.

 

효율은 조금 내려놓더라도, 볼륨을 뽑아내는게 큰 무대에선 꼭 필요한 것이구나라고 새삼 느끼게 됐었습니다. 또 코비가 난사라고 그렇게 까이면서도 우승으로 증명해낼수 있었던 것도 같은 이유가 아닌가 싶어요. 어차피 어느 정도의 효율만 낼수 있다면 볼륨이 중요하다고 할까요. 하킴도 그렇고..

 

처음 농구 스탯을 봤을땐 효율이 짱이라는 생각으로 PER을 좋아했는데, 지금은 볼륨이 중요하다는 생각때문에 다시 PER로 돌아온 느낌이네요-_-a

WR
Updated at 2019-03-19 17:19:40

말씀하신 수준 만큼의 순수한 마진은 아니더라도, 추가 변인없이 선수 조합까지만 고려한 마진스탯은 제공되고 있습니다. 

https://basketball-analytics.gitlab.io/rapm-data/

개인적으론 조금 당황스러운 선수들도 있더라고요

2019-03-19 12:16:36

혹시 실례가 안된다면 시즌별로 표준화된 TS를 알 수 있을까요?? 과거에 비해 리그 평균 TS가 높아졌다는 얘기를 들었는데 그러면 효율성이 높은 선수들은 실제로 얼마나 아웃라이어였는지 궁금하네요.

WR
Updated at 2019-03-19 13:27:47

제가 따로 계산해놓은 건 없습니다만, 

https://www.basketball-reference.com/leagues/NBA_stats_totals.html

바스켓볼 레퍼런스에서 시즌별 리그 평균 eFG%를 제공하고 있습니다. TS%는 없는데, 저기 있는 FG, PTS, FTA 가지고 쉽게 계산할 수 있기도 하고요. 저걸 가지고 원하는 시즌에 대해 normalization하면 될 것 같습니다. 

 

근데 오래전 글 중에 말씀하신 부분에 대한 글이 있었습니다. 거의 2012년인가 11년인가에 쓰여진 글인데 리그 평균대비 야투율을 각 레전드들에 대해 구한 게 있었죠. 꽤 유명한 글인데 아마 남아있을겁니다. 

1
2019-03-19 21:26:32

8개의 클러스터에 대한 분석이 되게 좋네요. 아직까지 저는 시엠/파엠 수상 등이 너무 소형 샘플이라고 느껴져서 많은 의미가 부여된다고 생각은 하지 않지만, 세 가지 스탯으로 클러스터를 나누는 시도는 정말 신박하고 선수 타입에 대한 / 어떤 스탯을 이끌어내는 선수인지에 대한 설명으로 참 좋아보입니다.

WR
Updated at 2019-03-19 22:34:25

맞습니다.
그래서 우승숫자나 플옵 승수 혹은 파엠쉐어같이 보다 많은 샘플을 확보할수 있는 것을 찾아볼까 하다가 충분히 정리된 데이터베이스를 찾지못해서 그만두었네요..ㅜㅜ 직접 노가다를 하면되긴한데.. 역대 우승횟수는 레퍼런스에선 3회이상만 정리해놨더라고요.

말씀하신대로 현재 응원하는 선수가 잘찍는 스탯 유형이 뭔지 구분하는것도 소소한 목적이었습니다. 또한 해당선수가 이전에 어떤 선수와 유사할지를 예상해볼수 있지않을까라는 기대도 해보았고요!

좋아해주셔서 저도 기분이 좋네요~

2019-03-20 04:46:12

다른 것도 대단하시지만, 클러스터를 이용해서 PER/BPM/WS48 을 분석하신게 가장 인상깊네요! 개인적으로 PER -> WS/48 -> BPM 으로 선수를 판단하고 세부적으로는 TS%와 따로 FT%를 보는 편인데 (자유투 능력을 슈팅능력에 기본이라고 생각해서, 신인들을 볼 때는 자유투를 중점으로 봅니다), 클러스터를 통해 분류해본다는 생각은 한 번도 못해봤네요. 그리고 그 결과가 특히나 흥미롭네요..
다시금 스탯 하나는 절대적일 수가 없고, 모든 스텟들을 고려하는게 가장 중요한 것 같다는 생각이 들었습니다!
(ps. PER는 뭔가 현대농구 플레이 스타일 변화에 많이 불안정해진게 아닐까란 생각을 하는 편이라, 개인적으로 최근 10년 정도로 기간을 좁혀서 보면 어떤 결과가 나올까 궁금하네요.)

minphx
33
3387
24-04-25
nyk
64
5350
24-04-23
nykphi
32
3673
24-04-21
miaphi
42
7682
24-04-18
bos
79
10150
24-04-16
min
84
15235
24-04-16
atlbkn
41
6782
24-04-13
por
69
16666
24-04-12
hou
33
12190
24-04-08
orl
43
8120
24-04-10
dalsac
48
8535
24-04-05
dal
57
20309
24-04-04
gswind
89
11392
24-04-02
hou
62
11165
24-03-23
bos
126
31454
24-03-18
atlgsw
91
23095
24-03-18
bosden
59
7857
24-03-16
den
125
26225
24-03-14
lal
44
8912
24-02-24
검색 대상
띄어쓰기 시 조건









SERVER HEALTH CHECK: OK