[숫자로 보는 NBA] 가장 기복이 큰, 아니면 없는 선수는 누구인가?
[숫자로 보는 NBA] 가장 기복이 큰, 아니면 없는 선수는 누구인가?
안녕하세요^^ 취미로 농구 스탯을 분석하는 고등학생 미생입니다~
제가 분석할 주제에 대한 아이디어를 얻기 위해서 종종 농구 관련 팟캐스트를 듣고는 합니다.
그 중에서 자주 듣는 것이 매주 수요일 KBS에서 하는 ‘조손의 느바’로, 손대범 기자와 조현일 해설 위원 등등이 농구에 대한 이야기 및 토론을 하는 방송입니다.
그러던 중 제이슨 테이텀과 자말 머레이중 누가 기복이 큰지에 대해 토론하는 방송을 보고 수치적으로 분석을 할 수 있겠다는 생각이 들어 분석을 시도해보았습니다.
분석을 하기 위해서 몇가지 질문들에 대한 답을 찾아야 했습니다.
1. 기복은 어느 스탯을 기준으로 보아야 하는가?
2. 기복을 위한 스탯의 비교는 어느 정도의 경기를 걸처 해야 하는가?
첫 번째 질문에 대한 답은 2가지 스탯, 바로true shooting percentage(필드골과 자유투를 모두 고려한 슛 성공률, 이하 TS)과 (경기에서 팀의 득점)/(선수의 득점)이었습니다.
기복은 주로 슛감을 놓고 이야기를 하는 경우가 많으며, 슛 셀렉션부터 성공까지, 선수 개인의 컨디션을 가장 많이 반영할 수 있는 TS를 첫 번째 스탯으로 두었습니다.
또한 (경기에서 팀의 득점)/(선수의 득점), 이하 points portion,은 팀 득점의 어느 정도는 안정적으로 책임지면서 경기를 치룰 수 있는지를 고려하기 위해 선택하였습니다.
두 번째 질문으로 인해서 3가지 다른 관점의 기복을 정의해주는 스탯을 만들었습니다.
스탯은 2018-2019 시즌과 이번 시즌을 합처, 가장 득점을 많이 한 상위 150명을 대상으로 하였습니다.
플레이별 편차
먼저 플레이별 단위로 끊어보았을 때 선수의 TS 또는 points portion이 얼마나 달라지는지를 고려한 스탯입니다. 즉, 전 경기와 다음 경기에서 수치적으로 얼마나 많은 차이를 보였는지를 평균 낸 것입니다. 가장 일반적으로 편차라고 하면 떠올릴 수 있는 스탯이 될 것입니다.
(선수의 플레이별 기복)=sigma(|(전 경기 기록)-(다음 경기 기록)|)
스탯을 구해 상, 하위 12명을 그래프에 나타내 보았습니다. (색이 짙을수록 더 많은 득점을 하는 선수들입니다)
기복인 큰 선수로는 조해리스, 테렌스 로즈가 1,2위를 차지했고 주 득점위 중에선 버틀러, 갈리날리, 클락슨, 레딕, 그리고 방송에서 언급된 머레이가 위치하였습니다. 많은 선수들이 미드레인지 또는 3점에 주로 의존하는 선수들임을 볼 수 있습니다.
기복이 없는 선수에는AD, 드로잔, 르브론, 레너드등이 있었습니다. 특이한 점은 인식상으로 기복이 크다고 느끼었던 러셀과 하든이 하위 랭크 되었다는 점입니다. 아무래도 슛 시도가 많은 선수는 경기를 거치면서 성공률이 평균에 수렴할 가능성이 좀 더 높다는 점은 감안하고 봐야 할 듯 합니다.
기복이 가장 컸던 조 해리스와 반대로 가장 적었던 AD의 경기 별 TS%의 변천을 보면 아래와 같습니다.
points portion을 기준으로 구해본 스탯에서는 순위가 많이 변하는 것을 볼 수 있습니다.
커리, 켐바, 어빙, 하든 등이 기복이 큰 선수로 치고 올라왔고, 루디 고베어, 위긴스 등이 기복이 없는 선수로 선택되었습니다. 기복이 큰 선수들은 주로 3점의 선택이 많은 선수들이기 때문에 득점과 비례하는 points portion을 고려한 스탯에서 기복이 크게 나타나진 듯 합니다.
게임별 편차
게임 단위로 끊어보았을 때 선수의 TS 또는 points portion이 얼마나 달라지는지를 고려한 스탯입니다. 극단적인 예로 판타지 리그를 할 때 선수를 넣을지 말지 결정하는 것처럼 그 경기가 평균 이상의 경기였는지, 아래의 경기였는지를 얼마나 반복하는지를 고려한 것입니다.
선수의 TS와 points portion의 평균을 구한 뒤 위 아래로 10% 구간을 정해, 그 범위 안의 기록은 기복으로 인정하지 않습니다. 10% 위의 기록과 10% 아래의 기록을 오간 인접한 경기를 체크한 뒤, 그 경기 사이 간격의 평균을 구했습니다.
기복이 적은 선수는 위 아래를 오간 날이 적을 것이고, 오간 경기 사이 간격은 커지게 됩니다. 반대로 기복이 큰 선수는 수시로 위 아래를 오갈 것이고, 오간 경기 사이 간격은 작아지게 됩니다.
따라서 간격의 평균을 역수 취하며 기복이 큰 선수가 큰 수치를 가지게 했습니다.
스탯을 구해 상, 하위 12명을 그래프에 나타내 보았습니다. (색이 짙을수록 더 많은 득점을 하는 선수들입니다)
이 기준으로 기복인 큰 선수로는 라우리 마카넨, 조쉬 리차드슨 등이 있으며, 버틀러는 아직도 상위권에 올랐습니다. 시카고를 이끄는 잭 라빈 또한 큰 기복을 보였습니다. 개인의 기록으로 기준을 세워 구한 수치이기 때문에 위와는 다른 선수들이 랭크된 것을 볼 수 있습니다.
기복이 없는 선수는 데빈 부커, 고베어, 르브론, 쿰보등이 아직도 하위에 있으며 큰 차이를 보여주지는 않았습니다.
여기서도 기복이 컸던 버틀러와 적었던 부커의 경기 별 TS%의 변천을 보면 아래와 같습니다.
points portion을 기준으로 구해본 스탯에서는 니콜라 부세비치의 기복이 심했고 커리와 그리핀은 아직도 높은 것을 볼 수 있습니다. 반대로 섹스턴과 잉그램등이 작은 기복을 보여주었습니다.
시즌별 편차
시즌 단위로 끊어보았을 때 선수의 TS 또는 points portion이 얼마나 달라지는지를 고려한 스탯입니다. 엄밀히 말해서는 지난 시즌부터 지금까지의 성적이기 때문에 시즌은 아니지만 장기적으로 보았을 때를 구해보려고 합니다.
기록은 단순히 전체 기간 동안의 선수의 TS와 points portion의 표준편차를 구하면서 알 수 있습니다.
스탯을 구해 상, 하위 12명을 그래프에 나타내 보았습니다. (색이 짙을수록 더 많은 득점을 하는 선수들입니다)
테렌스 로스와 조 해리스 등과 같이 플레이별로 보았을 때의 기복과 비슷한 선수들이 분포된 것을 볼 수 있습니다. 다시 말해 기록이 분산적으로 나타나는 선수들은 잘하는 기간과 슬럼프 기간과 같이 길게 길게 흐름을 이어가기 보다는 기복이 심한 선수들이 많다는 것입니다. 기복이 적은 선수들도 플레이별과 비슷히 나온 것을 볼 수 있습니다.
시즌과 플레이 관점서 모두 의외로 기복이 적었던 제임스 하든과 기복이 큰 테렌스 로스의 TS변화는 다음과 같습니다.
하지만 시즌에서의 points portion 기록에서 하든과 AD같이 본래 적었던 선수가 치고 나왔고 조 해리스와 갈리날리 같은 선수가 기복이 작게 나왔는데, 이는 다득점 경기가 많은 선수들, 좋게 말해서 폭발력 있는 선수들이 치고 올라와 그런 듯합니다.
결론
결론적으로 당연하지만 TS에 있어서 슛을 많이 쏘는 백코트의 선수들의 편차가 심하게 나는 것을 볼 수 있었습니다. 그럼에도 불구하고 하든, 부커, 러셀 등은 적은 기복을 보여주는 모습을 볼 수 있었습니다. 빅맨 중에서는쿰보, 르브론, AD와 같은 돌파와 포스트 업을 기반으로 하는 선수들이 기복이 적은 모습을 보여주었습니다. 지미 버틀러, 그리핀, 데릭 로즈 등이 팀 내 주 득점원 중에서는 큰 기복을 보였습니다. 팀 내 득점 비중에서는 커리, 켐바, 어빙 등 3점의 선택이 많은 선수들이 큰 기복을 나타냈습니다.
혹시 궁금한 선수 있으시면 댓글에 남겨주시면 알려드리겠습니다.~^^
WR
2020-02-26 12:28:52
넹 그렇습니다.^^ 데이터 분석 또는 통계 관련하여 진로를 결정할 예정입니다.~
재밌게 봤습니다.
https://nbamania.com/g2/bbs/board.php?bo_table=maniazine&wr_id=196362&sca=&sfl=mb_id%2C1&stx=tapcal 위 링크는 제가 예전에 했던 분석인데 3점슛 기복을 주제로 잡았었습니다. 3점슛 성공률의 변동계수를 통해 기복을 측정했는데, 당시 추가적으로 고려했던 것이, 3점 시도가 많은 선수들은 적은 선수들에 비해 값의 변화폭이 적어 마치 기복이 적은 것처럼 느껴지기에 시도와 성공을 따로 변동계수를 구해 나중에 나누는 방식을 사용했었습니다. 이렇게 하면 켐바, 디안젤로 러셀은 3점슛 기복이 없어보이는 선수였다가 매우 큰 선수로 바뀌게 됩니다 (당시 데이터 기준)
p.s. 제가 ggplot을 잘 다루는 것은 아니지만... x축 텍스트 설정하실 때 angle=90에 vjust=0.3을 하시면 글자가 막대 그래프 가운데에 정렬됩니다. WR
2020-02-26 12:36:51
아무래도 3가지의 관점에서 기복을 분석하는 것이다 보니 기복이 있기도, 없기도 하는 부분이 나타나는 것 같습니다. 다시 데이터를 보니 자말 머레이가 기복이 심한 2 관점에서는 테이텀과의 수치 차이가 크게 나타났습니다. 아무래도 수치 상으로는 자말 머레이가 더 심한 기복을 보이는 듯 합니다.^^ 말콤은 부상 보다는 관점의 차이를 볼 때는 기본적으로는 기복이 심하지 않지만 기복이 있는 날에는 엄청 기복이 심한 선수로 해석될 수 있을 듯 합니다. |
고등학생이라니 존경스럽습니다~ 정성이 담겨있는 글 잘 봤습니다. 혹시 통계 쪽을 지망하시나요?