위계적 회귀분석 :: R 기초 통계 - mindscale
Skip to content

위계적 회귀분석

위계적 회귀분석

  • 위계적 회귀분석(hierarchical regression)은 분석가가 의도/가설을 가지고 기존 회귀분석 모형에 한 뭉텅이(chunk)의 변수들을 추가하여 설명력의 차이를 비교/검증하는 방법
  • 주로 통계적인 통제 를 하거나, 기존 모형의 확장 을 위해 사용하는 기법
  • 연구자가 가설을 가지고 접근하더라도, 실제로 유의미하지 않은 에측변수들이 포함되어 있을 수도 있기 때문에 이를 확인하는 기법

예제

MASS 라이브러리에 내장된 quine 데이터셋을 사용한다. 이 데이터는 학생의 결석에 관한 데이터이다. 종속변수는 결석일수를 나타내는 Days이고 독립변수는 Eth, Sex, Age, Lrn이다.

library(MASS)
head(quine)
  Eth Sex Age Lrn Days
1 A   M   F0  SL   2  
2 A   M   F0  SL  11  
3 A   M   F0  SL  14  
4 A   M   F0  AL   5  
5 A   M   F0  AL   5  
6 A   M   F0  AL  13  

첫번째 모형을 만든다.

model.1 = lm(Days ~ Eth + Age, data = quine)

첫번째 모형에 LrnSex 변수를 추가한 두 번째 모형을 만든다.

model.2 = lm(Days ~ Eth + Age + Lrn + Sex, data = quine)

두 모형의 차이가 통계적으로 유의미한지 확인한다.

anova(model.1, model.2)
  Res.Df RSS      Df Sum of Sq F        Pr(>F)   
1 141    33048.83 NA       NA        NA        NA
2 139    32236.64  2 812.1908  1.751028 0.1774026
  • 첫번째 모형에 LrnSex 변수를 추가해서 모형을 확장해도 유의미한 차이를 보이진 않음
  • 다르게 표현하면 변수 Eth, Age의 영향력을 통제했을 때, LrnSexDays를 예측하는 유의미한 변수는 아닌 것으로 확인됨

결과 보고 형식

결과 보고를 할 때는 다음과 같이 보고한다.

기존 모형에 Lrn, Sex를 추가한 새로운 모형을 구성하였으나, 두 모형의 설명력은 유의미한 차이를 보이지 않았다(F(2, 139) = 1.75, p > 0.05).

또는

Eth, Age의 영향력을 통제했을 때, LrnSex로 인한 설명력의 증가는 유의미하지 않았다(F(2, 139) = 1.75, p > 0.05).