R 기초 통계

R로 하는 기초 통계 분석법


수강중

25. 계획비교

동영상이 없는 텍스트 강의 자료입니다.

계획비교

  • 사후 검증에서는 1 vs. 2, 1 vs. 3, 1 vs. 4, 2 vs. 3, 등등 모든 비교를 수행. 많은 비교를 수행하여 과잉검증의 문제가 있음.
  • 계획비교(planned comparison): 두 집단으로 나누어가며 비교하는 방법
    • 1, 2, 3, 4와 같이 4개의 집단이 있는 경우:
      • 1 vs 2, 3, 4로 한 번 2 vs. 3, 4로 또 한 번, 그리고 마지막으로 3 vs. 4로 비교
      • 또는 1, 2 vs. 3, 4로 한 번, 1 vs. 2로 또 한 번. 마지막으로 3 vs. 4로 비교할 수도 있음
  • 대비계수(contrast)를 통해 비교할 집단에 수치를 설정
levels(PlantGrowth$group)
[1] "ctrl" "trt1" "trt2"

수준이 k개이면 k - 1번 비교가 가능

  • poison 변수의 수준(level, 집단의 수)을 확인해보면 3가지
  • 따라서 2번 비교가 가능

먼저 trt1, trt2를 하나로 묶어 crtl와 비교하고자 하면 대비계수를 다음과 같이 작성

contr.1 = c(2, -1, -1)

한 집단의 대피계수는 +, 다른 -로. 총합은 0

  • crtl의 대비계수는 2, trt1trt2의 대비계수는 각각 -1
  • ctrl처럼 혼자서 비교 집단이 된 경우에는 이후로는 더이상 비교에 사용하지 못함. 이후로는 대비계수가 0 다음으로는 trt1trt2를 비교
contr.2 = c(0, 1, -1)

대비계수를 적용

contrasts(PlantGrowth$group) = cbind(contr.1, contr.2)
contrasts(PlantGrowth$group)
     contr.1 contr.2
ctrl  2       0     
trt1 -1       1     
trt2 -1      -1     

ANOVA 계획비교를 실시

m = aov(weight ~ group, data = PlantGrowth)
summary(m)
            Df Sum Sq Mean Sq F value Pr(>F)  
group        2  3.766  1.8832   4.846 0.0159 *
Residuals   27 10.492  0.3886                 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  • 분석 결과, group에 따라 weight의 차이가 유의미함
  • 계획비교 결과는 summary.lm() 함수를 이용해서 확인
summary.lm(m)
Call:
aov(formula = weight ~ group, data = PlantGrowth)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.0710 -0.4180 -0.0060  0.2627  1.3690 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)   5.07300    0.11381  44.573  < 2e-16 ***
groupcontr.1 -0.02050    0.08048  -0.255  0.80086    
groupcontr.2 -0.43250    0.13939  -3.103  0.00446 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.6234 on 27 degrees of freedom
Multiple R-squared:  0.2641,	Adjusted R-squared:  0.2096 
F-statistic: 4.846 on 2 and 27 DF,  p-value: 0.01591
  • groupcontr.1: control과 처치조건들(trt1, trt2) 사이에 유의미한 차이를 발견하지 못함
  • groupcontr.2: trt1, trt2 사이에 유의미한 차이가 있음(p < .05)