Xp
자동
NBA Maniazine
/ / / /
Xpert

골스는 커리의 팀이 아닌가?

 
20
  4746
Updated at 2016-01-10 09:34:30

1. Prologue

처음에 알아보고 싶었던 것은, 더 맨이라 불리던 선수들의 각종 스탯 중 팀의 경기력 향상을 위해  어느 요소가 중요하느냐는 것이었습니다. 그런데 원했던 답이 아닌 엉뚱한 다른 곳에서 재미있는 사실 하나를 발견했습니다.


저는 코트 위에서의 한 선수의 생산성을 가장 잘 나타내는 지표는 온코트 마진이라고 생각합니다. 하지만 온코트 마진은 자신 이외의 4명의 선수에게도 영향을 받기 때문에 불완전한 지표입니다. 그럼에도  온코트 마진이 한 선수의 활약상에 의해 크게 좌우된다면 그 한 명은 분명히 코트위에서의 영향력이 큰 선수라고 할 수 있지 않을까, 온 코트 마진의 상당부분을 책임질 수 있는 선수가 아닐까 하는 가정으로 시작하게 되었습니다. 사실은 엄밀히 말해 가정을 먼저하게 된 것이 아니라 우연히 분석하다보니 가정을 세우게 되고 결과물을 얻게 되었습니다.


이 분석은, 엔톡에서 커리앤메시 님이 커리에 대한 분석을 해달라고 하셨고 그 결과 얻게 된 산출물입니다. 커리앤메시님께 감사의 말씀을 드립니다.






2. 간단 설명

일단 단순하게 설명부터 해보겠습니다. 어떤 선수의 슛성공률, 리바운드, 어시스트, 턴오버 등 농구에 있어 매우 중요한 수치가 있습니다. 이러한 요소들의 기복과 편차에 따라 온 코트 마진이 달라집니다. 이를테면 커리의 같은 경우 당연히 3점슛감이 좋으면 온코트 마진도 당연히 좋을 것입니다. 하지만 안 좋은 날에는 심하게 떨어질 수도 있겠죠. 3점슛뿐만 아니라 몇 가지 중요한 요소만 추려서 이러한 부분을 알기 위해 회귀분석을 사용해 봤습니다.


<14-15시즌 커리의 활약도에 따른 온코트마진>


 여기서 Y축은 온코트 마진을 의미하고 X축은 커리의 활약도를 의미합니다. 1이면 삽을 푸는 날이고 5이면 그분이 오신 날인거죠. 기본적으로 14-15시즌 골스는 67승의 강팀이었고, 커리의 경기당 평균 온코트 마진은 11.4나 될정도로 높습니다. 기본적으로 골스라는 팀이 커리가 없어도 강팀이라는 걸 의미하는 것일수도 있지만 그렇다고 커리의 영향력이 작다는 뜻은 절대 아닙니다. 바로 회귀분석을 통해 본 결과 위의 그래프처럼 커리의 활약도에 따른 상하편차가 51.8이나 되기 때문이죠. (모형에 따른 가정이기 때문에 실제로 1이나 5단계와 같은 상황이 많이 발생하는 것은 아니고 실제로는 2~4단계에서 많이 발생할 것입니다)


그럼 표본 수가 적지만 올시즌 부상당하기 직전까지의 30경기를 분석해봤습니다.

<15-16시즌 커리의 활약도에 따른 온코트마진>

이 그래프에서 눈에 띄는게 커리가 삽을 푸더라도 최저점이 -10정도 밖에 안 될 정도로 골스가 강해졌다는 것과 상하편차는 53.8로 근소하게나마 증가했습니다.


비교를 위해 탐슨과 그린도 조사를 해봤습니다. 14~15 탐슨의 경우 온코트마진이 10.1로 커리와 비슷하지만 상하편차가 48.1로 근소하게나마 커리만큼의 영향력을 보여주지는 못합니다. 또한 15~16시즌의 경우 마찬가지로 그 표본 수가 적지만 상하편차가 44.1로 커리와는 9정도의 차이가 납니다.


그린의 경우 14~15시즌의 상하편차는 21.18로 커탐에비하면 많이 작습니다. 재미있는 건 눈부신 활약을 보여주는 올해에는 오히려 더 상하편차가 줄어 16.46에 불과합니다.


결국 팀 동료들과의 비교를 통해서만 봐도 커리의 영향력이 큼을 알 수 있는 대목입니다.


3. 몇 가지 의문점

혹시나 몇 가지 의문이 들었습니다.

이 모형이 빅맨에게 불리하고 슈터유형에게만 유리한 것이 아닐까? 아님 3점슛을 많이 던지는 선수에게만 유리하게 나오는 것이 아닐까 하는 것입니다.


그런데 아니었습니다. 01-02시즌 샼과 코비를 동시에 분석해봤는데 샼은 무려 상하편차가 58.2로 MDE 다운 모습을 보여줍니다. 반면 같은 시즌 코비는 33.68입니다.


3점슈터에게 유리한 것이 아닐까하는 의문에 대해서도 분석을 해봤습니다. 32%의 슈팅성공률로 580개가 넘는 3점슛을 던져댔던 앤투완 워커의 02-03시즌의 상하편차는  39.6정도가 나옵니다. 레이 앨런이 3점슛 기록을 세웠던 05-06시애틀 시절을 살펴봐도 44.2정도가 나옵니다.


참고로 07-08시즌의 르브론이 상하편차 48.8이고, 87-88시즌의 조던이 상하편차가 59.1로 나옵니다. 조던의 87-88시즌의 경우 당시에는 온코트마진 데이터가 없었기때문에 팀의 최종경기결과 득실로 따져서 나온 값입니다. 따라서 다른 선수들의 데이터보다는 신빙성이 떨어집니다.



<내가 설마 여기에서 빠질거라 생각했어? 흠>


특이한 것은 팀 던컨이 커리어에서 가장 높은 스탯을 쌓은 01-02시즌 상하편차가 7에 불과합니다. 이건 너무 괴랄한데요, 샌안의 시스템 농구의 위력인가 아니면 극단적인 케이스에 불과한 것인지 모르겠습니다.


4. 결론

일단 몇몇 선수들을 살펴본 결과 대체로 팀내에서 영향력이 큰 선수일수록 회귀모형에서 제가 임의적으로 구한 상하편차가 높게 나옵니다. 그리고 특히나 50이 넘어가는 경우는 역대급 시즌의 반열에 있다고봐도 무방할 것 같습니다. 일단 저 모형이 확실한 것은 아니지만 골스가 커리의 팀이 아니라는 주장에 대한 반증의 사례로 보기에 충분할 것 같습니다.

'골스는 커리가 없어도 강하지만, 골스는 분명히 커리의 팀이다.'


PS. 위 회귀분석은 선수별로 몇몇 중요한 스탯 7~8가지를 독립변수로, 온코트마진을 종속변수로 돌린 것입니다. 공선성 검증도 했고 제가 아는 선에서는 최대한 정교하게 돌릴려고 노력했습니다. 회귀모형의 상수항(Y절편의 값)을 토대로 제가 5단계로 구분하여 만든 것임을 밝힙니다.



27
Comments
2016-01-10 01:53:32

본문중 05-06 레이알렌은 시애틀 아니었나요?

WR
2016-01-10 01:55:51

시애틀이 맞네요. 레퍼런스에 가보니까 밀워키 유니폼을 입고 있는 사진이 나와서 제가 밀워키로 착각했습니다.

2016-01-10 01:57:35

05-06시즌인가 시애틀 vs 피닉스전을 잊지 못해서... 하하;;

2
Updated at 2016-01-10 04:32:19

저는 오히려 커리 없는 골스가 강팀이라 할 근거가 부족하다고 생각합니다.

강팀이라기엔 커리가 없을때 성적 경기력 모두 너무 처참하죠.

지난 시즌 올시즌
커리 결장시: 1승 3패
그린 결장시: 3승 0패
탐슨 결장시: 5승 2패
3
2016-01-10 05:10:07
골스가 커리가 없으면 힘들수밖에 없는게
스스로의 힘으로 효율 높은 슛을 만들어낼수 있는게 커리 빼면 탐슨밖에 없습니다.

샌안의 경우엔 카와이, 던컨, 파커, 지노빌리, 알드리지, 디아우..
너무 많죠.
샌안의 농구를 흔히들 시스템농구라고 하지만
기본적으로 1대1로 매치업상대를 제압할수 있는 자원이 너무 많습니다.
한두명 빠져도 티도 안나는 이유가 있죠.

골스의 시스템이란건 기본적으로 커리의 중력장으로 인해 수비 밸런스가 망가지는 걸
효율적으로 활용하기 위한 부분이 크죠.
같은 시스템 농구라도 같은 역할이 여러명에게 분산된 샌안의 그것과는 많이 다릅니다.

골스의 경우 커리가 빠진다면 페이스, 스페이싱 방법 등등 게임플랜을 아예 다 바꿔야 될겁니다.
강팀이 되려면 여기에 커리 대체자원으로 공수 모두 준수한 포인트가드가 와야 될테구요.
대체자원 없이 지금 로스터에서 그냥 커리만 그대로 빠진다면.. 전 딱 5할팀 봅니다.
커 감독과 코칭스탭이 있으니 5할이라는 거지 로스터만 보면 5할 미만이라고 봐요.
2016-01-10 05:40:49

제가 통계학을 몰다보니 X축에 어떤 변수들이 어떤 비중으로 들어가는지 몰라서 어떻게 하셨는지 궁금하긴 하네요.(의문X, 호기심) 그리고 확실히 커리 비중이 크긴 큰가 보네요, 제가 생각한 것보다 골스의 파괴력에 상당히 큰 것 같네요. 이런 분석이 나올수록 커리의 MVP가치는 더 커지는 것 같네요^^ 그린이 저리 작은 것은 의외긴 하구요(어쩌면 그린처럼 중간에서 공을 뿌려주거나 흐름을 도와주거나 하는 역할은 대체 선수 내지는 다른 선수들에 의해 소화될 수 있는 부분이라는 생각이 드네요)

WR
2016-01-10 11:55:56

모형의 정교화를 위해 최대한 단순화 했습니다.

각 종 슛 성공률, 리바, 어시, 스틸, 블락, 턴오버가 독립변수로 포함되었고

3점을 안던지는 선수의 경우 3점슛 성공률이 제외됐습니다.

1
Updated at 2016-01-10 08:15:12

글 너무 잘 읽었습니다. 글의 주제도 좋았는데 던컨 부분 보면서 소름 돋았네요.. 샌안 빅3 나머지 둘의 상하편차도 궁금해지네요

2016-01-10 08:43:45

흥미로운 결과 잘봤습니다. 헌데 온코트 마진은 그 선수와 함께뛰는 선수도 관여하니 커리와 그린의 차이가 생각보다 더 큰 걸까요? 물론 그걸 감안하더라도 둘의 차이는 너무 크지만요.

WR
2016-01-10 11:56:57

커리가 모터라면 그린은 몸체라서 그런게 아닐런지요. 그린은 팀을 유지시켜주는 몸체와 같다는 느낌이 듭니다.

1
2016-01-10 09:31:01

좋은 글 잘봤습니다.

쪼잔한 저 양반은 안끼는 곳이 없네요.
밀레니엄 쓰리핏 샼과 코비가 원투펀치지만 샼의 원펀치가 핵펀치..
01-02 던컨은 좀 기이하네요. 스퍼스의 시스템 농구는 생각보다 그리 오래되진 않았습니다. 10년 정도?

2016-01-10 11:52:13

재미있는 분석 잘 봤습니다.

제가 맞게 이해했다면... Y 축이 개인의 온코트 마진을 의미하는것인가요? 
사견입니다만 Y축은 개인의 온코트 마진보다는 팀 전체의 +/- 마진으로 하는게 어떨까요. 
선수 개인의 활약도와 선수 개인의 +/- 마진의 상관관계는 당연히 높을수 밖에 없을테니까요. 
( 커리의 영향력이 절대적으로 높다는 뻔한 결과가 나올것 같기는 합니다  )

이 분석에서 제가 놀란건 오히려 그린입니다. 
  " 재미있는 건 눈부신 활약을 보여주는 올해에는 오히려 더 상하편차가 줄어 16.46에 불과합니다. "
이 말인 즉 그린 개인의 수치적 활약( X축에 어떤 데이터를 쓰셨는지 모르겠지만 PER 든 1차 스탯이든 ) 이 어떻게 찍히든 간에 표준편차 없이 무시무시한 마진을 찍어낸다는 말이 되니까요. 
수치로 드러나지 않는 +/- 마진을 찍어대고 있다는 말이죠.. 그것도 꾸준하게요. 


WR
2016-01-10 11:59:21

온 코트마진이라는 스탯은 '한 선수가 코트에 있을 때 그 팀의 득실마진'을 의미하기 때문에

개인 스텟상으로 추출한 마진이 아닙니다. 말씀하시는 바는 잘 알겠습니다만 결국 개인의 온코트 마진이라는 스탯은 개인이 코트에 있는 동안에 팀에 가지는 영향력을 보여준다고 할 수 있는 기록이죠.


그린의 경우 생각해보니 위의 댓글에도 달았지만 팀을 유지해주는 몸체와 같다는 생각이 듭니다. 그린이 몸체라면 커리는 가속기가 아닐까 그렇게 추측해봅니다.

2016-01-10 12:09:08
그렇네요. 결국 개인의 코트 마진이 팀의 득실마진이네요. 바보인가봅니다
커리의 영향력이야 두말하면 입아픈 수준이죠. 
개인적으로는 어떤 숫자나 2차스탯을 가지고 지지고 볶아봐도 실제 경기 영향력을 제대로 보여주는 수치가 나올지 의심스럽습니다. 

표준편차가 큰것은 가속기이자 감속기가 될 수 있다라고 해석할 수 있고 결국 팀 전체에 영향을 가장 많이 끼치는 선수다 라는 식으로 분석하신 거군요. 
WR
1
2016-01-10 12:11:36

네네 맞습니다. 정확히 그렇게 보고 있습니다. ^^

2차스탯은 일단 개별경기별 기록이 있어야 하는데 제가 개별 경기 데이터로 2차 스탯을 추출할 줄 모르고, 실제로 레퍼런스에서도 경기별(게임로그) 2차 스텟은 없더군요. 그래서 불가능합니다 ㅠㅠ

또한 2차 스텟자체가 가공된 스텟이다보니 독립변수로는 적절하지 않을 수도 있습니다. 독립변수가 단순한 요소일수록 모형이 좀 더 신뢰성이 높아지거든요. 

Updated at 2016-01-10 12:01:29

근데 확실히 인기스포츠들 중에서 농구만큼 스탯만으론 설명하기 힘든 스포츠도 없는것 같아요.
물론 대체적으로 레전드들의 스탯은 그에 합당한 모습을 보여주는 경우가 많지만, 던컨의 경우도 그렇고.. 누구도 부정못할 독보적인 넘버원 파포인데..
상대적으로 스탯이 실제 활약을 못따라오는것 같아요.

마사장님처럼 임팩트 있는 경기모습, 스탯, 반지, 개인수상, 모든걸 갖추면야 반박의 여지조차 없겠지만..

2016-01-10 12:43:21

농구는 그래도 스탯으로 많은걸 알수 있는 스포츠라고 봅니다. 야구만큼은 아니지만 축구 보다는 훨씬 많은걸 볼수 있죠

2016-01-11 08:56:45

저도 그렇게 생각해요. 농구는 스텟뿐만이 아니라 보이지않는 헌신적인 몇몇플레이들로 분위기를 가져오는 상황들이 있기때문이죠 허슬플레이로 공을 살려서 공격권을 한번 더 얻거나 분위기를 살리더라도 결국엔 스탯으로 쌓이지 않거든요

2016-01-10 12:51:37

제가 던컨의 경기별 스텟을 하나하나 본 것도 아니고 글을 확실하게 이해 한 것도 아니라 확신은 못하겠지만, 상하편차가 낮은 이유는 그만큼 던컨의 잘한 경기와 못 한 경기 사이의 차이가 크지 않아서일수도 있지 않을까요?

WR
2016-01-10 12:53:29

네 맞습니다. 선수의 플레이유형을 보면, 분명 그런 부분 이외에는 해석이 안됩니다. 특이한 것은 보통 저렇게 상하편차가 크지 않은 경우는 팀의 2옵션이나 조력자 들에게서 나타나더군요. 그런데 던컨은 1옵션임에도 저렇게 나타났다는 건...그냥 꾸준했다고 밖에 해석하는 수밖에 없는 것 같습니다.

2016-01-10 13:29:35

그렇게 아름답게 해석할수도 있지만, 사실 던컨의 영항력이 생각보다 작았고 팀 덕을 많이 봤다고 해석하는게 더 본 연구(?)의 방향과 일치하는거 아닐까요? 편차가 큰건 그만큼 영항력이 큰거고 편차가 작은건 기복이 작았다로 해석하는건 좀 아닌거 같아요

2016-01-10 19:15:40

일반적인 경우엔 그렇게 설명하는게 맞을텐데, 01-02시즌 스퍼스 팀 스텟만 보면 던컨의 영향력이 적은 것이 조금 이해가 되지 않는 느낌이어서요... 제가 그 시절 경기를 본 것이 아니라 강하게 주장은 할 수 없네요. http://www.basketball-reference.com/teams/SAS/2002.html

2016-01-10 19:28:28

저 때 스텟을 보니 제가 확인 할 수 있는 수치인 게임스코어랑 +/- 수치가 그렇게까지 유의미한 상관관계가 없는 것 같아 보이는데 이 점과 전체적으로 고른 활약을 하는 점(게임스코어 수치 차이가 크지 않은 점?)이 영향을 준 것 같네요. 그래도 확신을 가질 수 없어서 강한 주장은 하지 못하겠습니다.

1
2016-01-10 19:32:24

아니면 제가 좋아하는 주장은 아니긴 하지만 던컨이 잘 보이지 않는 1차 스텟이 아닌 쪽으로 팀에 도움이 되어 +/- 마진에 영향을 끼친다는 생각도 할 수 있을 것 같습니다. 결국 해석은 너무 말이 안되는 범위가 아니라면독자의 몫이라고 생각하기에, 해석이 옳고 그르고는 없다고 봅니다.

WR
Updated at 2016-01-10 20:41:40

사실 저의 분석이 어떤 전문가의 분석도 아니기에 부족한 점이 있는데요, 일단 저 분석에서 분명 말씀드릴 수 있는 것은 상하편차가 큰 선수이면 확실히 팀의 간판 급 선수라고는 할 수 있다는 점입니다. 그렇다고 모든 간판 선수급 선수가 상하편차는 큰 것만은 아니지 않을까 추측해봅니다.


이를 테면 제가 모형에서 구한 퍼포먼스에 따른 상하편차는 그 값이 클수록 확실히 간판급 선수라고할 수 있지만 그 수치가 높지 않은 간판급 선수가 존재할 수도 있다는 것이죠.


애초에 데이터라는 것에는 다양한 해석 가능성을 두어야 나중에 더 발전된 형태의 데이터가 나오는 것으로 알고 있습니다. 그런 관점에서 이해하려고 노력중이고 말씀해주신 부분은 잘 참고해서 다음에 다시 시도할 때는 좀 더 좋은 설계를 하도록 노력하겠습니다.

2016-01-10 13:19:07

분석이 좀 이상한데요...

차라리 1점일때의 팀 득실마진 평균, 득실마진의 상하폭 모두 다 있으면 모르겠는데...
WR
2016-01-10 21:39:48

어떤 점이 이상한지 구체적인 말씀이 없으셔서 저도 뭐라 답변하기가 애매합니다만...

1점이라는 것이 퍼포먼스가 상당히 안 좋을 때의 x 축의 값을 의미하는 거라면 위에서 설명드렸다시피 1점 퍼포먼스는 거의 실제 빈도가 없는 값입니다. 1과 5의 값은 2~4의 값으로 추정한 것이죠.



보통 이런 식으로 모형이 나오는데

X  축의 값은 평균이 0이되도록 표준화된 값이므로 제가 -4~+4의 값을 보기 편하시게

1~5로 단순화 한 것입니다.

위 도표를 보시면 아시겠지만 양 극단에 존재하는 값은 실제빈도가 매우 적은 편입니다.

bosmia
84
5857
24-04-25
minphx
36
3968
24-04-25
nyk
65
5467
24-04-23
nykphi
32
3707
24-04-21
miaphi
42
7698
24-04-18
bos
80
10185
24-04-16
min
84
15258
24-04-16
atlbkn
41
6796
24-04-13
por
69
16689
24-04-12
hou
33
12190
24-04-08
orl
43
8124
24-04-10
dalsac
48
8543
24-04-05
dal
57
20312
24-04-04
gswind
89
11410
24-04-02
hou
62
11168
24-03-23
bos
126
31468
24-03-18
atlgsw
91
23100
24-03-18
bosden
59
7870
24-03-16
den
125
26239
24-03-14
검색 대상
띄어쓰기 시 조건









SERVER HEALTH CHECK: OK