위계적 회귀분석
위계적 회귀분석
- 위계적 회귀분석(hierarchical regression)은 분석가가 의도/가설을 가지고 기존 회귀분석 모형에 한 뭉텅이(chunk)의 변수들을 추가하여 설명력의 차이를 비교/검증하는 방법
- 주로 통계적인 통제 를 하거나, 기존 모형의 확장 을 위해 사용하는 기법
- 연구자가 가설을 가지고 접근하더라도, 실제로 유의미하지 않은 에측변수들이 포함되어 있을 수도 있기 때문에 이를 확인하는 기법
예제
MASS
라이브러리에 내장된 quine
데이터셋을 사용한다. 이 데이터는 학생의 결석에 관한 데이터이다. 종속변수는 결석일수를 나타내는 Days
이고 독립변수는 Eth
, Sex
, Age
, Lrn
이다.
library(MASS)
head(quine)
Eth Sex Age Lrn Days 1 A M F0 SL 2 2 A M F0 SL 11 3 A M F0 SL 14 4 A M F0 AL 5 5 A M F0 AL 5 6 A M F0 AL 13
첫번째 모형을 만든다.
model.1 = lm(Days ~ Eth + Age, data = quine)
첫번째 모형에 Lrn
과 Sex
변수를 추가한 두 번째 모형을 만든다.
model.2 = lm(Days ~ Eth + Age + Lrn + Sex, data = quine)
두 모형의 차이가 통계적으로 유의미한지 확인한다.
anova(model.1, model.2)
Res.Df RSS Df Sum of Sq F Pr(>F) 1 141 33048.83 NA NA NA NA 2 139 32236.64 2 812.1908 1.751028 0.1774026
- 첫번째 모형에
Lrn
과Sex
변수를 추가해서 모형을 확장해도 유의미한 차이를 보이진 않음 - 다르게 표현하면 변수
Eth
,Age
의 영향력을 통제했을 때,Lrn
과Sex
는Days
를 예측하는 유의미한 변수는 아닌 것으로 확인됨
결과 보고 형식
결과 보고를 할 때는 다음과 같이 보고한다.
기존 모형에
Lrn
,Sex
를 추가한 새로운 모형을 구성하였으나, 두 모형의 설명력은 유의미한 차이를 보이지 않았다(F(2, 139) = 1.75, p > 0.05).
또는
Eth
,Age
의 영향력을 통제했을 때,Lrn
과Sex
로 인한 설명력의 증가는 유의미하지 않았다(F(2, 139) = 1.75, p > 0.05).