18-19 마진스탯으로 보는 선수순위시리즈 여는글 - 왜 PER이 아니라 마진스탯을 주목해야하는가?
좀 도발적인 얘기로 시작하자면, 개인적으로는 널리 통용되는 농구관련 세이버매트릭스 가운데 가장 낡은 스탯이 PER이라고 생각합니다.
PER이 처음 만들어질 당시만 해도 홀린저가 만든 기준은 나름대로 '혁신'적이었습니다. 하지만 처음 이 스탯이 만들어질 때와 비교해보면 리그의 패러다임은 크게 변했습니다. 리그는 훨씬 빠른 페이스의 게임을 치르고 있고, 선수들의 역할을 훨씬 분업화되었으며, 선수들은 훨씬 더 많은 출장시간 관리를 받으며 리그를 치릅니다.
지금으로부터 정확히 10년전인 08-09시즌과 이번시즌만 비교해봐도 어느 정도 다르냐면 당시 리그출장시간 1위 안드레 이궈달라는 39.9분을 출장했고 20위인 테이션프린스는 37.3분을 뛰었습니다. 지금은요? 리그 출장시간 1위였던 브래들리빌이 36.9분을 뛰고, 20위인 클레이탐슨이 34.0분을 뜁니다. 톰 티보듀는 버틀러를 36.7분, 타운스를 35.6분 뛰게 한것만으로도 인간백정 소리를 듣다가 짤렸구요.
이런 출전시간의 조절은 곧 뛰는 시간 동안의 효율성 증대를 불렀다는 사실이 PER에서도 적나라하게 드러나는데, 08-09시즌 PER 20위였던 앤트완 재이미슨의 수치가 20.9인 반면, 올시즌 20위인 폴조지는 23.3을 기록했습니다.
10년전 PER 25를 넘었던 선수는 단 4명(르브론, 웨이드, 폴, 하워드)이었던 반면 올시즌 25를 넘긴 선수는 9명이나 됩니다. 홀린저 자신이 PER을 만들면서 도입한 기준에 따르면 PER 25 이상이면 당해 mvp 경쟁자의 수준에 해당합니다. 하지만 올시즌 per 25.9를 기록한 부세비치나 26.3을 기록한 타운스가 엠비피 레벨의 플레이어인가?에 동의하는 사람은 거의 없을 것입니다. 홀린저가 기준을 만들었을때의 기준이 지금은 더이상 통용되지 않는다는 얘기죠. 마찬가지로 PER이 23.3밖에 안되는 폴조지가 왜 올시즌 mvp후보였는지도 1차스탯기반 가공스탯으로는 설명이 불가능합니다. (참고로 폴조지는 올시즌 rpm 1위, pipm4위입니다. 쿰보는 rpm4위, pipm1위구요.)
선수들은 더 짧은 시간을 더 효율적으로 뛰기 위해 팀의 매니징을 받고 있고, 각 팀들은 저마다 세이버 매트리션들을 고용해서 어떻게 자신들의 경기력을 올려야할지를 고민합니다. 홀린저가 처음 PER을 들고 왔을때만 해도 바스켓은 산수가 아니라며 많은 반발들이 있었지만, 지금 그런 올드스쿨한 마인드로만 팀을 운영하는 경우는 없다고 봐도 무방할 겁니다.
매스미디어가 10년동안 겨우 PER이나 TS%같은 직관성 높은 스탯을 이야기하고 팬들이 거기에 친숙해진 정도로 발전한 동안, 이미 각 팀의 전문가들은 1차스탯에는 잡히지 않는 경기력을 측정해내기 위한 수많은 방법들을 고안해내고 있습니다. 하지만 아쉽게도 이런 방법들의 대부분은 그들 나름의 필요로 만들어지는 것이지, 대중들을 위해만들어진 것이 아니기에 널리 알려지지 않곤 합니다. 당장 얼마전 불꽃앤써님 같은 분이 소개해준 그래비티 그래프같은것만 해도 곧 유료화될 예정이라고 하죠.
사실 엄밀히 따지면, 미디어에서도 세이버매트릭스를 선도하는 그룹은 이미 트래킹 스탯이나 마진스탯을 중요한 지표로 간주하고 있습니다. 오늘의 NBA 칼럼을 쓰는 염용근 기자의 글만 봐도 알 수 있죠.
PER, WS, BPM, VORP같은 스탯들은 결국 1차스탯에 잡히는 것들밖에 측정할 수 없습니다. 1차스탯 기반 2차스탯만으로는 로버슨이나 터커같은 PER이 10 언저리인 선수들이 왜 천만불의 가치가 있는 훌륭한 선수인지를 설명할수 없습니다. 폴조지가 수시로 만들어내는 디플렉션이 얼마나 상대 패서들에게 압박감을 주는지, 코빙턴이나 잉글스류의 소위 '낄끼빠빠'를 잘하는 선수들이 상대를 리커버리하는 능력이나 트랩에 빠뜨리는 능력이 얼마나 팀 수비에 도움을 주는지, 고베어가 존재만으로도 상대의 림접근을 억제하고 외곽슛을 유도하는 능력이 팀에 어떤 도움을 주는지, 카일라우리의 오펜스차징 유도가 얼마나 모멘텀을 바꿀수 있는지를 PER은 절대로 설명할 수 없습니다.
반대로 수비인지도나 적극성이 떨어지는 선수들의 아쉬움도 PER로는 측정불가능하죠. 예를 들어 자베일 맥기는 작년 리그 25위의 PER을 기록하고 임팩트있는 블락을 여러번 보여줬지만, 실상을 보면 그는 심각한 수비구멍으로, 레이커스 센터 3인 가운데 유일하게 마이너스 마진을 보인 선수였습니다. 맥기의 팬들에겐 죄송한 얘기지만, 저는 내년시즌에도 맥기가 20분 이상을 출장해야한다면 레이커스는 좋은 팀이 될 수 없을거라는데 500원 걸겠습니다.
심지어 이런 1차스탯에 기반한 2차스탯의 한계는 공격쪽에서조차 명확합니다. 단단한 스크린이 핸들러에게 얼마나 도움을 주고 롤러가 얼마나 그래비티를 가지는가, 혹은 스크리너가 미드레인지공략이 가능해서 롤인지 팝인지로 상대를 헷갈리게 만들수 있는가를 1차스탯이 표현하는데는 한계가 분명합니다. 스테판커리가 가지는 3점 그래비티가 얼마나 팀원들의 오픈찬스를 만드는 가치가 있는지도 PER류의 가공스탯은 측정할수 없습니다. 그나마 그래도 최근에 만들어진 VORP 같은 스탯들이 PER보다는 낫긴 한데.. 결국 이들도 PER이 가진 근본적인 한계는 극복할 수 없습니다.
PER이 수비를 반영하지 못하는 비판을 받듯이 DWS나 DBPM류의 스탯들이 신뢰도가 떨어지는 이유도 결국 마찬가지입니다. 저는 앞으로도 클래시컬한 1차스탯을 기반으로 수비에 미치는 영향력을 추출해내는 방법은 결코 나오지 않을 것이라고 단언할 수 있습니다. 결국 수비적 영향력을 측정하기 위한 접근법은 단 두가지 뿐입니다. 하나는 play by play로 포제션 하나하나를 트래킹해 스탯으로 만드는 것이고, 나머지 하나는 그 선수가 코트에 있는 동안 팀이 실점하는 점수가 평소보다 높은가 낮은가의 마진을 통해 추측해내는 방법입니다.
전자가 연역추리로 접근하는 방법이라면 후자는 귀납추리로 접근하는 방법이겠죠.
하지만 전자의 트래킹스탯들은 이를 가공해 올인원 스탯으로 만들어 야구의 WAR와 같이 직관적으로 보여주기 힘들다는 근본적인 문제가 있습니다. 하지만 마진스탯은 '직관성' 이라는 점에서 사람들에게 충분히 어필할수 있죠.
제가 지금까지 이렇게 PER의 한계를 지적했음에도 PER이 널리 통용되는 이유는 결국 사람들은 선수들을 줄세우기 좋아하고, 이를 위해서 직관성있는 기준이 필요하기 때문이라고 생각합니다. 때문에 PER이 가장 낡았음에도 불구하고 오랫동안 사람들에게 통용되어왔다는 이유로 그 신뢰를 얻은 것이죠. 악화가 양화를 구축했다고나 할까요.
반면 마진기반 스탯은 상대적으로 통용된 시간이 짧았습니다. 특히 가장 먼저 만들어진 대표적 마진기반스탯인 rpm의 경우 그 공식이 비공개로 되어있다는 이유로 사람들의 신뢰를 더욱 받기 어려웠죠. 때문에 사람들은 득실점 마진을 보면서도 어 이선수 오늘 잘한것같은데 마진은 별로네? 이 선수 한거 없는데 마진은 좋네? 같은 생각을 하며 마진기반 스탯을 신뢰하기 쉽지 않았습니다.
실제로 마진스탯은 아직까지 많은 약점들을 분명히 가지고 있습니다. 하지만 적어도 '큰수의 법칙'에 따르면경기의 표본이 늘어나면 늘어날수록 마진이 가지는 신뢰성은 증대됩니다. 다만 큰 표본을 가져도 그 선수의 퍼포먼스 이외의 변수들은 존재합니다. 전성기 내내 rpm 1,2위를 다투던 르브론이 17018시즌 좋아진 벤치경기력 때문에 갑자기 rpm 10위까지 밀렸다던가, 스테판커리가 일신의 수비과 별개로 백업인 퀸쿡의 수비가 너무 허접한 덕에 5.4점의 수비마진을 기록한다던가.. 하는 변수들 말이죠.
그래서 가공을 거치기 이전인 raw data 상태인 RAPM을 보면 정말 의외의 선수들이 최상위권의 마진을 보이는 경우를 흔히 볼 수 있습니다. 야구에서 파크팩터나 수비의 도움등을 계량해 ERA대신 FIP와 투수 WAR를 만들어낸 것처럼, 농구에서도 이런 변수들을 계량해 만들어낸 결과물이 RPM이나 PIPM과 같은 스탯입니다.
다만 이런 종류의 계량을 거친다해도 한계는 분명히 존재합니다. 때문에 마진기반 스탯을 볼때는, 그 선수의 백업을 담당하는 선수가 어느 정도의 능력을 지녔느냐를 감안할 필요가 있습니다.
또한 마진기반 스탯은 큰 표본을 필요로 하는 만큼, 플레이오프와 같은 단기시리즈에서 공신력이 떨어진다는 아쉬움도 가지고 있습니다. 앞으로 이런 단점이 어떤 식으로 보완될지는 모르겠습니다만, 현재로서는 플레이오프의 마진스탯에 대한 신뢰도는 정규시즌의 그것에 비해서는 떨어질 수 밖에 없습니다. 다만 이런 한계는 사실 기존의 클래식스탯 기반 2차스탯들도 공유하고 있는 문제겠죠.
이런 약점들에도 불구하고, 저는 어떤 선수의 경기력을 측정하는데 있어서 마진기반 스탯이 1차스탯기반 스탯보다는 분명히 진보적인 시도라고 보고, 앞으로도 rpm, rapm. pipm, on-off rtg와 같은 마진스탯이 미디어에서 조명되는 빈도가 증가할 거라고 생각합니다. 물론 트래킹기반 스탯이 지속적인 발전을 통해 직관성을 확보할수 있다면 그게 더 좋은 방향이겠지만, 어느 정도 시간이 걸릴지 모르는 일입니다. 아무래도 앞으로 최소한 몇년간은 마진기반 스탯들의 발전이 농구 세이버매트릭스에서 중요한 이슈가 될거라고 봅니다.
제가 이번에 마진스탯으로 순위를 정하면서 고민을 했던것은 마진스탯 가운데 어떤 것을 이용해 순위를 짜야하는가 였습니다. 고민의 결과, 좀 조악하다 싶지만 가장 널리 알려진 RPM수치와 PIPM수치를 더한 값으로 순위를 매기기로 했습니다. 처음에는 출장시간을 고려한 RPM wins, PIPM wins를 사용할까 했지만, 부상으로 결장이 많은 선수들의 공백이 지나치게 이들을 과소평가하게 될 가능성이 커서 포기했습니다. 마진스탯에 관심이 많은 분들 가운데 좀더 좋은 순위 산정 방법이 있으신분이 있다면 적극 반영해서 랭킹을 수정할 생각도 있으니 피드백해주시면 감사하겠습니다.
순위를 산정하면서 1819 시즌 가운데 총 40% 미만을 출전한 선수는 표본이 충분하지 않은 것으로 간주하고 순위에서 제외했습니다. 그 결과 지난시즌 RPM+PIPM의 값이 3을 넘는 선수는 총 62명이 있었습니다. 앞으로 시리즈글을 통해 62명의 순위를 공개할 것이고, 또 번외로 62명에 들지 않은 스타플레이어들에 대한 얘기들도 하게 될 것 같습니다.
아마 시리즈를 진행하면서 좋아하는 선수의 마진스탯이 좋지 않아 속상한 분들도 있으실텐데, 이런 분들을 위해 먼저 말씀드리자면 이 순위는 어디까지나 18-19시즌 '어떤 선수가 올시즌 얼마나 그 팀에서 대체불가였는가' 를 수치화해서 과소평가받는 선수들을 조명하고자 하는 의도가 가장 큰 목적이라는 점을 밝힙니다. 물론 (오늘의 희생양 맥기처럼) 간간히 어떤 선수는 마진으로 보았을때 과대평가되었다는 얘기들도 하겠지만 그런 비판이 결코 그 선수의 팬들을 까내린다거나 하려는 의도는 없으니 노여워하지는 않으셨으면 좋겠습니다.
저는 그럼 다음 글을 통해 51~62위까지의 선수들을 소개하러 돌아오겠습니다. 다들 더운 여름 건강히 보내시길 바랍니다.
글쓰기 |
RPM은 공식 궁금해서 좀 까줬으면 좋겠는데 공개를 안하더라구요