2차 스탯 중 BPM이란?
현재 농구에는 다양한 2차 스탯들이 쓰이고 있습니다. PER, Win Share 등 일반적으로 통용되는 기록들도 있고, Win Produced와 같이 사실상 사장된 기록들도 있고 합니다. 이 외에도 Basketball Reference에서 제공하며 선수 비교에 자주 사용되는 또 하나의 2차 스탯이 BPM인데, 뭔가 그럴듯해 보이기도 하고, OBPM/DBPM으로 나뉘어서 공격 수비를 나눠볼 수 있는 것도 하고.. 흥미로워 보이는 스탯입니다. 그렇다면 이 BPM은 어떻게 만들어지며, 어떤 의미를 갖는지 알아보겠습니다.
BPM은 100포제션당 해당 선수가 팀에 미친 기여를 공격, 수비로 나누어 표현하려 노력하는 스탯입니다. 계산 방식은 PER, Win Share와 같이 박스 스코어 기반이지만, 그 기저에는 Play By Play 스탯이 있다는 데서 차이를 갖습니다.
Play By Play 스탯은 박스 스코어와 달리, 한 플레이어의 온오프 마진을 기반으로 계산된 기록입니다. 가장 기본적인 단순 +-에서 시작하여 그를 보정한 값인 APM, RPM, RAPM, xRAPM 등이 존재합니다. +-는 한 플레이어가 필드에 있을 때, 필드에 없을 때 팀이 100포제션당 앞섰거나 뒤쳐진 점수 등을 활용해 간단히 구해집니다. 이제 여기서 진화한 스탯인 APM의 경우 해당 상황에서 함께 뛴 선수들의 수준을 보정하여 +-를 조정해 준 것입니다. 예를 들면, 커리가 +10의 APM을 지닌 급의 플레이어이고 능력이 그다지 뛰어나지 않은 멤버가 커리와 함께 대부분의 시간을 뛴다면 해당 선수는 커리의 덕으로 더 높은 +-를 얻게 될 것입니다. 그런 수치를 보정한 것이 APM이고, RAPM은 더 정확한 결과를 얻기 위해 통계적인 보정이 들어간 수치입니다. xRAPM은 RAPM에서 단순 Play By Play 마진이 아닌, 박스 스코어를 함께 고려하여 Play By Play 스탯에 낄 수 있는 노이즈를 제거한 스탯이라고 볼 수 있으며, RPM은 xRAPM 기반으로 ESPN에서 만든 스탯입니다.
위에서 언급했던 Play By Play 스탯은 박스 스코어에 잡히지 않는, 한 플레이어가 보이지 않게 기여한 부분을 어느 정도 잡아낼 수 있다는 장점이 있습니다. 그러나 몇 가지 단점이 있습니다. 먼저 Play By Play 스탯이 제대로 기록된 세월이 길지 않기 때문에, 과거 선수들과의 비교 등이 불가능합니다. 또 하나는 통계적 보정을 거친다 하더라도 특정 선수들의 기여를 필드에서 완벽히 분배하기란 불가능한 일이기도 하고, 표본이 충분하지 않으면 여전히 노이즈가 낄 여지가 있다는 것입니다. Play By Play 스탯 중 가장 최신 스탯인 ESPN RPM을 보아도, 2015-16 시즌 기준 꽤나 많이 비판받던 케빈 러브의 RPM이 5.3으로 리그 10위, 루비오의 RPM은 4.14로 리그 17위이며 드로잔의 RPM은 –0.14에 불과해 아직까지는 한 시즌의 RPM으로 선수의 능력을 완벽하게 재단한다고 보긴 힘들 수 있습니다.
BPM은 저런 Play By Play 스탯을 박스 스코어 기반 스탯으로 변환하여 표현하는 기능을 합니다. 단순한 FGA, AST, TRB 등의 기록보다는 TS%, TRB%, AST%, BLK% 등의 팀 상황을 표현할 수 있는 기록을 사용하였고, 2000~2014 14년간의 RAPM을 기준으로 삼아 박스 스코어 기반 스탯으로 회귀분석을 진행해 RAPM에 가까운 기록을 만든 것이죠. RAPM이 Offensive, Defensive로 분리되듯이 BPM도 회귀분석을 통해 Offensive RAPM에 근사하도록 OBPM을 만들고, BPM에서 OBPM을 빼 DBPM을 만들게 되었습니다. 이와 같은 과정으로 만들어진 BPM은, RAPM 등의 Play By Play 스탯의 문제를 어느 정도 해결할 수 있습니다. 개인의 모든 기록이 트래킹되기 시작한 1978시즌 이후의 선수들간의 비교는 자유롭게 가능하고, 박스 스코어 기반이기 때문에 눈에 보이는 스탯이 좋아야 좋은 BPM이 나온다는 점에서 Play By Play 스탯에 수반되는 노이즈나 신뢰성 문제를 어느 정도 제거할 수 있습니다. 이러한 과정으로 구해진 Raw BPM의 공식은 다음과 같습니다.
Raw BPM = a*ReMPG + b*ORB% + c*DRB% + d*STL% + e*BLK% + f*AST% - g*USG%*TO% +
h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr - Lg3PAr) - k] + l*sqrt(AST%*TRB%)입니다. 뭐 보시면 대부분의 기록이 어느정도는 직관적입니다. TS% 높고 USG%나 TO%는 낮으며, 어시, 스틸 등의 긍정적 기록이 높은 선수가 일반적으로 더 높은 BPM을 가져가게 됩니다. OBPM의 경우 같은 식에 상수만 다른 값을 취하게 되며, DBPM은 BPM – OBPM입니다. RAPM과의 근사로 만들어진 BPM과 OBPM 상수는 다음과 같습니다.
위의 각 항목은 BasketBall Reference의 Advanced 탭에서 얻을 수 있는 기록들입니다. TRB%, STL%와 같은 % 기록들은 대부분 필드에서 가능한 리바운드 중 해당 선수가 잡아낸 비중을 표현한다고 보시면 됩니다. ReMPG의 경우 MP/(G+4) 로, 적은 경기를 뛴 선수들의 BPM 값을 보정하기 위해 게임 수에 4를 더해줍니다. 저 Raw BPM 값을 이용해 선수들의 BPM을 구하게 되는데, 여기서 리그 평균에 맞춰 조정해 주는 것 때문에 저 같은 일반인이 BPM을 구하기가 힘들어지게 됩니다. BPM은 리그 평균이 0으로 되게 세팅하는 과정이 존재해서, 리그 모든 선수들의 Raw BPM을 구한 뒤 총 BPM이 0이 되도록 특정 값을 제거해 줍니다. 2015-16 시즌의 경우, 리그 평균 Raw BPM이 6.1정도 되어, 모든 선수는 본인의 Raw BPM에서 저 값을 제거하게 됩니다. 그리고 팀의 강력함을 고려하여 개인별 BPM을 조정하는 과정이 들어가기 때문에 굉장히 복잡해집니다. 그래서 제가 BPM 계산기는 만들려다 포기했..죠.또 플레이오프에서 BPM을 구할 때도 상대 팀의 수준을 고려해서 BPM에 더해주는 값이 있어서 정말 복잡합니다. 저는 그래서 그냥 레퍼런스에서 구해주는 값을 보는 편입니다..
이렇게 BPM에 대해 간단히 소개드려 봤습니다. 어떤 이유로 만들어졌고, 어떤 의미를 내포하는 스탯인지 정도만 알고 계시면 될 것 같습니다. 계산해볼 일은 없는 스탯일 거에요..
추천 드립니다. 물론 이해는 못했습니다(?).