요즘 트위터에서 나름 핫 한 선수 분석 방법 [DARKO]
다들 잘 아시는 BBall Index에서 새롭게 개발한 모델입니다.
https://apanalytics.shinyapps.io/DARKO/
이번 오프시즌부터 선수 성장 예측 모델을 만들던 분이 DARKO라는 분석기법을 개발해 냈습니다.
DARKO는 Daily Adjusted and Regressed Kalman Optimized Projection의 약자로, 일반적인 회기 분석에다 칼만필터를 같이 적용하는데, 선수 데뷔 일부터 매일매일의 경기 스탯을 긁어와서 Weighted Regression을 수행하고, 그 과정에서 칼만필터로 최적화를 넣는 기법으로 보입니다.
DARKO는 선수가 뛴 모든 경기의 스탯을 반영하는데, 매일매일마다 컨디션에 따라서 오락가락하는 퍼포먼스와 시즌초 적응으로 인한 퍼포먼스 변동을 필터링해서 선수의 [실제 능력] (True Talent)를 추정하는데 그 목적이 있습니다.
DARKO는 결과적으로 선수의 올해 퍼포먼스를 예측하며 이를 통해 선수가 얼마나 발전하는지를 분석할수 있습니다.
트위터에서 핫했던건 Comparison 탭입니다.
역시 어디서든 비교가 가장 재미있죠.
몇몇 예를 보여주자면... 최근 핫했던 유망주 세명, 시몬스 - 미첼 -테이텀을 비교해보죠.
먼저 Daily Plust Minus를 비교해 보면..
이런식으로 시몬스가 공수 양면에서 팀을 앞서나가게 하는데 도움이 되었던 것이 확연하게 드러납니다. 반면 테이텀과 미첼은 루키시즌 초반에 힘겨워 했던것이 확연히 드러나죠.
반면 3점을 보면 아래와 같습니다.
테이텀이 받아먹기 3점을 커리어 초반부터 장착했던것이 스탯으로 보이고, 작년 초반에 코비놀이하다 까먹은것도 보입니다. 미첼도 작년 중반에 3점슛 30 초반 찍는거 아니냐고 유타팬들이 걱정했던 구간이 보이지요.
엠비드가 AD와 KAT에 비교하면 상대적으로 커리어가 짧은것이 보입니다.
그리고 실제로 많은 유저분들이 용호상박으로 봤던 KAT - AD 대결은DPM 상으로도 용호상박인것이 보입니다. 물론 KAT이 더 커리어가 짧은것이 눈에 들어오고, 엠비드가 커리어가 짧음에도 불구하고 어릴적 AD / KAT보다 더 좋은 활약을 보이는것도 볼 수 있습니다.
다만 엠비드 끄트머리가 왜 내려오고 있는지는 잘 모르겠습니다. 올해 엠비드가 활약이 크게 떨어지는건 아닌것 같습니다만...
다음은 좀 더 거물급으로 가보겠습니다. MVP를 두고 다투던 커리 - 듀란트 - 르브론을 보겠습니다.
정확하게 어떤 시점에서 서로 경쟁하고 있는지가 보정되지 않아 바로 비교하기가 힘듭니다.
하지만 "전성기 커리"의 전설적인 위용이 확실하게 드러납니다. 그리고 그와중에 미쳐 날뛰는 듀란트도 보이고... X축 길이가 1200까지 가는데 내려올줄 모르는 르브론의 괴수 스러움도 보이네요.
이번에는 올시즌 MVP를 두고 경쟁중인 세명 (하든 - 쿰포 - AD)를 비교해보겠습니다.
AD와 하든도 뛰어나지만 천장을 향해 전진하는 쿰포가 보이네요. 거기에 하든이 슬슬 기어를 올리고 있는 느낌이구요. (물론 하든의 곡선 끄트머리에는 분산값이 상당히 커 보이는 구간이 보입니다 크크)
여튼 정리하자면, 지금까지 비교하기 힘들었던 시간에 따른 퍼포먼스 변화를 한눈에 볼 수 있는 비교 툴이 생겨났다고 이해하시면 될 것 같습니다.
글쓰기 |
와 이 자료 재밌네요.