Xp
NBA Maniazine
/ / /
Xpert

DARKO 스탯 생성과정에서 고려된 재미있는 사실들

 
23
  3822
Updated at 2019-12-09 20:08:09

 

https://nbamania.com/g2/bbs/board.php?bo_table=nbatalk&wr_id=6983079

빠른거북이님의 좋은 소개글에서 설명하는 DARKO는,

"매경기 박스스코어" 스탯으로 업데이트하는 BPM의 개념입니다.

(정확히는 그 안에 DPM이 그렇습니다) 

 

 

이전에 몇번 말씀드린대로, 

BPM이란 RAPM이라는 순수한 마진스탯을 박스스코어 스탯으로 가상 유사하게 "재현"하는 계산식을 먼저 구하고, 그 계산식에 각 선수들의 실제 박스스코어 스탯을 집어넣어 계산됩니다.

 

마진스탯이 가진 결과론의 장점을 포함하면서, 박스스코어 스탯의 장점인 실제 생산성, 퍼포먼스의 귀책을 반영하는 방법이며, 최근 전통적 박스스코어 스탯 이외에 트랙킹 스탯이 발전하면서 BPM을 업데이트하는 시도들이 있어왔습니다. (PTPM, box RAPTOR, 그리고 DARKO도 그러합니다.)

 

 

사실 DARKO는 굉장히 신생 스탯이고, 개발자가 언급한대로 아직 보완해야할 점이 있어보이긴 합니다만, DARKO에서 도입한 개념이 눈에 띄는게 있어 이부분을 같이 나누기 위해 글을 따로 팠습니다.

 

DARKO의 차별화된 특징들을 보면,

 

1. Daily updating & Recency weighting

매일 매일의 박스스코어 스탯으로 DPM을 업데이트 하는 것과, "Recency", 최근 퍼포먼스에 가중치를 준다는 것입니다. 

 

여기에서 스탯의 창시자인 Kostya Medvedosky가 100일전 데이터에 주는 가중치를 제공하는데,

가중치를 적게 줄수록 개인의 fluctuation이 큰 스탯이라고 볼 수 있고, 높게 준다는 것은 과거 데이터로도 미래를 설명하기 쉬운 스탯이라고 볼 수 있습니다. 

 

 

기본적으로 3점슛 성공률은 가장 안정된 스탯이라는 것을 알 수 있고, 스틸, 2점슛 성공률, 자유투 성공률, 턴오버, 오펜리바, 자유투 시도 비율, 블락 비율 순으로 가중치가 낮아집니다.

 

즉 이 순서대로 소위 "안정된" 스탯이라는 것입니다. 

시간에 따라 고, 저의 차이가 적은.. 과거 데이터로 미래스탯 양상을 예측가능한 스탯이라는 말이됩니다.

 

일반적으로 슛 시도가 슛 성공률보다 더 예측하기 어렵습니다.


 

2. Seasonality

이부분이 특히 재미있었는데, 개발자가 daily update를 진행하면서 발견하게된 사실 중에 하나가  "공격 효율은 시즌이 지날수록 좋아진다"는 것입니다,

 

2점슛 성공률

시즌을 치르면서 상승하다가, 시즌 끝나고 뚝 떨어진후 다시 상승하는 양상이 반복되어 보입니다. 

심지어 중간에 공통되게 급격한 drop이 있는 것도 동일한데 이것은 전부 올스타 브레이크 이후입니다.

놀라울 정도로 일관된 양상이죠.

 

이런 양상은 다른 공격효율 지표에서도 나타나는데,

 

턴오버 (시즌을 치를수록 낮아짐) 

 

 

개인 파울 개수

 

100포제션당 어시스트 개수,

 

모두 시즌을 치를 수록 좋아지고, 이후 다시 떨어지는 반복된 사이클을 나타냅니다. 

 

 

 

3. 팀 영향

선수가 팀을 바꿨을 때에는 당연히 퍼포먼스 차이가 크게 나타날 수 있겠죠.

그때 특히 어떤 스탯이 팀에 영향을 많이 받는지를 가중치를 통해 알아보면,

 

페이스는 완전히 팀에 종속적인 펙터입니다. 

그리고 100포제션당 마진도 그렇습니다.. 일반적인 선수 한명으로 어떻게 되는게 아니라는 말이겠죠.

출전시간, USG%, 야투시도 또한 팀이 변했을 때 많은 영향을 받는 스탯이며

 

반대로 3점 성공률, 스틸, 자유투 성공률, 블락은 팀에 의해 "전혀" 영향을 받지 않습니다.

다른 팀에 간다고 해서 해당 스탯에 영향을 받지 않는 다는 말이죠.

 

또한 리바운드 수치 역시 전통적인 박스스코어 스탯 중에선 상당히 낮은 수치를 보입니다. 

쪼개보면 공격리바보단 수비리바가 좀더 영향을 받는 편이긴 합니다.

 

 ------------------------------------------

DARKO Daily Plus/Minus 수치의 신뢰도는 아직 개선할 여지가 남아있어보입니다.

아직은 선수비교보단 한 선수의 커리어를 쭉 따라가보면서 성장 or 퇴보한 시점을 알아보는데 적합해보이고 개발자도 이 부분에 더 집중해줄 것을 당부하긴 하네요.

 

 

그런면에서 보면, 벤 시몬스는 초반 1시즌의 급격한 성장이후 다소 정체된 모습을 보이는 반면,

잉그램은 첫 시즌은 오히려 퇴보했다가 160경기 정도가 지난 시점.. 즉 랄에서의 3번째 시즌 마지막 30경기쯤 부터 "폭발적"으로 성장한 것을 볼 수 있습니다. 

 

제일런 브라운도 대략 120경기 시점 정도를 기점으로 뚜렷한 상승세를 대략 50경기 이상 이어가고 있네요.

4
Comments
3
2019-12-09 20:12:37

Seasonality부분이 진짜 신기하고, 그 부분을 고려해서 스탯을 개발한 개발자의 직관이 참 대단한것같습니다.
손발을 맞춰간다. 어쩌면 당연한건데요. 어떻게보면 오프시즌 중 잘 정비된 팀이 시즌 초중반 이 어수선함에서 크게 어드밴티지를 얻어 시즌순위가 높아졌더라도 최종 플레이오프에서는 약할수도 있다.라는 생각도 해볼수있겠네요. 그런면에서 elo 같이 최근 승패에 가중을 두는 실시간 업데이트 레이팅의 중요성도 더 크다고 보이구요.
트위터 글은 정리가 안되고 하나하나 열어야해서(트알못) 따라가기 어려웠는데, 이렇게 정리해주신걸보네 더 재미있는 내용들이 많이 있었네요.

WR
2019-12-09 20:14:27

개발자 분이 디조던 자유투 성장을 보고 약간 즉흥적으로 시작한 프로젝트 같더라고요.(양덕 클라스..)

처음엔 "왜 시즌초는 노이즈고 시즌 말이 중요한건데?" 라고 의문을 품었다가 저 데이터 보고 조용해졌습니다

WR
2019-12-11 10:16:03

스탯의 목적이 선수의 True talent를 가늠하기 위한 것이고, 시즌 초반에는 리그 전반적으로 새로운 구성원, 전략, 휴식 후의 정상 컨디션까지 올라오는 시간, 연습이 실제 경기에 적용될 때까지의 시간.. 이런 외부 요인이선수 퍼포먼스 영향을 미친다고 여기는 듯 합니다.

 

노이즈라고 표현했으나 시즌 초가 "전부" 노이즈라는 것이 아니고, 노이즈가 포함되어 있다고 보면 될 것 같습니다. 

2019-12-17 13:48:25

와, 엄청 재밌습니다. 시즌 진행에 따른 변화에 팀별 차이는 없을까요? 팀별 차이가 있다면 시즌 최종 순위와의 상관관계도 궁금합니다. 결국 재능의 총합 순으로 순위가 매겨질지, 팀별 훈련 효율의 차이로 순위가 매겨질지 궁금합니다. 흥미로운 자료 감사합니다!

hou
52
8487
24-03-23
bos
122
27409
24-03-18
atlgsw
85
19820
24-03-18
bosden
57
7023
24-03-16
den
122
23963
24-03-14
lal
44
8552
24-02-24
den
92
18732
24-02-20
dal
80
16234
24-02-17
dal
79
8863
24-02-06
bos
54
6241
24-02-15
dal
72
11533
24-02-14
cha
69
21203
24-02-14
orl
36
6245
24-02-09
phi
42
6871
24-02-10
indphi
60
6385
24-02-08
atlbkn
45
10623
24-02-08
sas
50
16920
24-02-05
phi
46
11123
24-02-04
cle
40
12453
24-02-04
검색 대상
띄어쓰기 시 조건









SERVER HEALTH CHECK: OK