간단한 예제를 이용해 엑셀에서 단순회귀모형을 구해보자.

LinEst 함수로 회귀계수를 추정해야겠지만 이번엔 분산형 차트 그린 후 추세선을 이용해 단순회귀모형을 구하고자 한다. 단, 추세선으로 추정된 회귀계수는 정밀도가 떨어져 정확하지 않다. 그래서 LinEst 함수로 구해야 한다.

창조적 발상(?)으로 중학교 때인가 배웠던 방정식을 떠올리며 X를 추정한답시고 역함수 구하는 이들이 있다.

결론을 먼저 얘기하면, 틀렸다. 다르다가 아니라 틀렸다. 그들이 떠올린 것은 수학에서는 맞을 지 모르지만 통계학에서 단연코 틀렸다. 나부터도 회귀모형, 즉 회귀방정식을 Y = b0 + b1X라고 간단히 써버리는 습관이 있지만 정확하게는 Y = b0 + b1X + ε이다. 이 때 오차항 ε ~ i.i.d N(0,σ²)으로 가정한다.

때문에 창조적 발상으로 방정식을 떠올리며 역함수 구해봤자 틀린 답만 구하게 된다.

그럼 X를 추정해야 될 땐 어쩌라고? 간단하다. 독립변수와 종속변수를 바꿔서 구하면 된다.

아직도 수학과 통계학의 차이를 못 느끼겠다면 앞서 구한 추세선의 계수를 가지고 X에 대한 역함수를 구해 나중에 구한 추세선의 회귀계수와 비교해 보시기 바란다. 그리고 어느 방식이 잔차제곱합이 더 작은지 비교해 보시라.
