농구에서 유전이 차지하는 비중
들어가기에 앞서 이런 간단한 분석으로 결론지을 수 없는 사항이기에 재미로 봐주시길 부탁드립니다
--------------------------------------------------------------
Heritability, 유전력 혹은 유전성이란 "어떤 그룹 내 특성 (trait)의 편차가 (variance)가 얼마나 유전적 요인에 의해 설명되는가"를 의미합니다.
예시를 들어 설명하면, A 학교와 B 학교의 학업성취도를 비교한다고 했을 때, 표현형! (phenotype) 여기선 성적이겠죠? 이들의 차이를 두 학교 학생들의 유전자 차이로 인해 얼마나 설명할 수 있는가... 뭐 이런 개념입니다.
유전성을 측정하기 위해 전통적으로 널리 쓰인 방법은 twin study입니다.
일란성 쌍둥이의 유전정보가 동일하다는 사실을 바탕으로 그 절반의 유전성을 가진 이란성 쌍둥이 (또는 형제)와 형질을 비교합니다.
여기에는 이 쌍둥이들 (그리고 형제들)은 동일한 양육환경을 가지며 자랐다는 가정이 들어가는데, 이 가정에 의해 두 그룹 사이에 환경적 영향이 없다고 생각하고, 나오는 모든 차이는 유전적 요인에 의해 유발되었다고 판단하는 겁니다. 간단하죠?
(제가 찾아본 바로는) NBA에는 총 7쌍의 일란성 쌍둥이가 있었습니다.
1. 로페즈 형제 (브룩 & 로빈)
2. 모리스 형제 (마커스 & 마키에프)
3. 마틴 형제 (코디 & 칼렙)
4. 콜린스 형제 (제이슨 & 제런)
5. 그랜트 형제 (호레이스 & 하비)
6. 아스데일 형제 (딕 반 아스데일 & 톰 반 아스데일)
7. 그래엄 형제 (스테판 & 조이)
또한 상당히 많은 그냥 형제가 있었는데요,
이중에서 두명다 최소 50경기 이상은 출전한 선수들만 추려보니 57명이더군요.
일란성 쌍둥이는 숫자가 적어서 웬만하면 전부 포함시키고 싶었지만, 마틴 형제의 경우 둘다 경기수가 지나치게 적어서.. (칼렙 6경기, 코디 37경기) 제외했습니다. (올시즌 샬럿 루키입니다)
저는 이들의 "플레이 타입"과 "퍼포먼스" 차이가 얼마나 유전적 요인에 의해 결정되는지를 확인해봤습니다.
플레이 타입을 설명하기 위한 변수로
ORB%, DRB%, AST%, BLK%, STL%, USG%, TOV%, FTr, 3PAr을 채택하였고,
퍼포먼스를 설명하기 위해서는 대표적인 올인원 스탯들인 PER, WS/48, BPM, PIPM을 사용하였습니다.
위 69명의 선수들을 "플레이스타일"에 따른 차이를 전반적으로 훑어보면 이렇습니다.
선으로 짝지어진 그룹이 쌍둥이또는 형제입니다.
그냥 형제보다 쌍둥이들 사이의 거리가 좀더 가깝다는 것을 느낄 수 있습니다.
퍼포먼스 측면에서 보면?
플레이 타입보단 좀더 어지러워 보입니다. 서로 간의 거리 비교도 쉽지 않고요.
형제끼리의 플레이타입 or 퍼포먼스 상 "차이"를 유클리디안 거리로 수치화해보면,
플레이 타입의 경우 일란성 쌍둥이와 단순 형제 사이에서 유의미한 차이가 존재하며,
(=일란성 쌍둥이의 플레이 스타일이 형제보다 더 닮았다)
형제와 무작위 페어까리는 이보다 더 뚜렷한 차이를 보실 수 있습니다. (p-value가 3.9x10^-7승이니 대단히 유의미한 결과입니다.)
근데 이런 유의미한 차이는 퍼포먼스를 비교했을 때는 양상이 살짝 변하는데요,
일란성 쌍둥이와 형제 사이의 차이는 유지되는 편인데, 형제와 무작위 페어의 비교에서는 차이가 많이 희석되는 것처럼 보입니다.
페어를 비교하는 방법을 조금 바꿔서 거리 대신 상관성(correlation)으로도 계산해보았는데요.
Correlation이 0이면 아무 상관이 없는 것인데, 플레이 타입이나 퍼포먼스나 둘다 무작위로 뽑은 선수간 비교에서는 상관성의 중간값이 0근처에 형성되었습니다.
쌍둥이와 형제의 플레이스타일은 매우 닯아 있었고, 퍼포먼스 또한 꽤 비슷한 편이나 플레이타입에 비하면 약한 편입니다.
유전성 (Heritability)를 수치화하는 방법은 몇 가지가 있는데,
그중에서 저는 Falcon's formula를 사용하였습니다.
H^2 = 2(r(MZ)-r(DZ))
해석하면, 유전성 = 2* (일란성 쌍둥이들의 상관성 - 이란성 쌍둥이들의 상관성) 입니다
2를 곱하는 이유는 일란성 쌍둥이가 형제/이란성 쌍둥이보다 2배 더 identical 하다고 보기때문에 둘의 차이는 유전적 차이의 절반만큼만 설명한다고 생각하기 때문입니다.
이 과정을 통해 구한 값을 보면!!
플레이 타입의 유전력은 75.6% 입니다.
반면 퍼포먼스의 유전력은 13.0% 였습니다.
플레이 타입은 유전에 의해 결정되는 부분이 상당히 많지만 결국 잘하는건 그 외에 요소가 많이 포함된다.. 라고 볼 수 있겠네요.
* 해석할때 조심해야할 점은 비록 퍼포먼스에서 유전적 차이가 적다고 나오긴했으나, 조사대상의 백그라운드가 거의 95% 정도 흑인이었으며 전체적인 샘플 숫자가 꽤 적다는 것을 감안하셔야합니다.. 어디까지나 재미로~
플레이 타입의 유전력은... 유전적 영향 보다는, 유전적 구조상 거의 비슷한 신체조건 + 형제이기에 거의 비슷할 농구 교육환경의 영향이 있기에 높은것일 수도 있겠네요.