얼마 전 배구장에 다녀왔다. 배구장 가본 지 10년은 족히 넘은 것 같다.
연습 중인 모습을 하나 찍었는데 찍사가 신통치 않다. (-_-)
어떤 선수의 3라운드와 4라운드의 공격성공률을 보자. 굳이 3, 4 라운드를 선정한 것은 3라운드와 4라운드 사이엔 열흘 정도의 휴식기간이 있는데, 휴식기간이 그 선수의 '공격성공률'에 영향을 주었는 지를 보기 위해서였다.
그러나 여기서 간과할 수 없는 것은 다른 선수도 쉰다는 것. 즉 '공격성공률'이라는 척도가 어떤 선수의 공격력 차이를 합리적으로 보여주기엔 미흡한 면이 없지 않지만 이 부분은 그냥 그러려니 하자.
집단 간 차이 비교이니 T-검정이나 일원배치법을 이용하면 되는데, '공격점유율'이라는 변수를 더 추가해 본다.
벌써부터 골이 띵~ 해진다(어쩐담?). 선학자들이 이럴 걸 궁리해서 만든 분석 방법이 있는데, 공분산분석ANCOVA이란 걸 써먹자(공분산분석에 대한 자세한 내용은 별도 확인 바람). 공분산분석은 대충 '회귀분석 + 분산분석'이라고 보면 된다. 계산의 편리를 위해서 자료 배치를 조금 수정한 후 회귀분석을 돌린다.
간단모형과 완전모형에 대한 잔차제곱합은 아래와 같이 구하면 된다.
여기서 간단모형과 완전모형의 독립변수를 보면 '공격점유율'이 공통적으로 존재한다.
따라서 완전모형에서 간단모형을 제하면 '라운드'(집단)의 변동만 남게 된다. 단, 잔차제곱합을 이용해야 되므로 계산은 '간단_잔차제곱합 - 완전_잔차제곱합'으로 한다.
앞에서 계산된 각각의 잔차제곱합을 보면, 완전모형에는 가변수로 '라운드' 변수가 두 개나 추가됐음에도 간단모형에 비해 잔차제곱합는 높게 나오지 않았다. 즉 종속변수인 '공격성공률'을 설명하기엔 '라운드'의 변동이 힘이 딸려 보이는 양상이다. 위에서 공분산분석은 회귀분석과 분산분석을 합체(?)한 것이라 하였다. 회귀분석은 진행했으니 분산분석만 처리하면 결과를 얻을 수 있겠다.
그 결과, '공격점유율'의 영향력을 제거했을 때 유의확률은 0.918이므로 유의수준 0.1에서 '공격성공률'은 '라운드' 간 차이는 없다. 즉 '공격점유율'이 '공격성공률'에 어떤 영향을 주든지 상관 없이 '라운드' 간에 '공격성공률'은 동일하다는 것이다. 이것은 어떤 선수의 공격성공률은 일정 수준을 꾸준히 유지하고 있다는 얘기가 된다.
공분산분석을 사용할 때 가정을 만족하지 못한다면 이 분석방법은 아쉽지만 무용지물이 된다.
언제나 말하듯, 숫자가 거짓말을 하는 게 아니라 사람이 거짓말을 하는 것이다.