계획비교
계획비교
- 사후 검증에서는 1 vs. 2, 1 vs. 3, 1 vs. 4, 2 vs. 3, 등등 모든 비교를 수행. 많은 비교를 수행하여 과잉검증의 문제가 있음.
- 계획비교(planned comparison): 두 집단으로 나누어가며 비교하는 방법
- 1, 2, 3, 4와 같이 4개의 집단이 있는 경우:
- 1 vs 2, 3, 4로 한 번 2 vs. 3, 4로 또 한 번, 그리고 마지막으로 3 vs. 4로 비교
- 또는 1, 2 vs. 3, 4로 한 번, 1 vs. 2로 또 한 번. 마지막으로 3 vs. 4로 비교할 수도 있음
- 대비계수(contrast)를 통해 비교할 집단에 수치를 설정
levels(PlantGrowth$group)
[1] "ctrl" "trt1" "trt2"
수준이 k개이면 k - 1번 비교가 가능 - poison 변수의 수준(level, 집단의 수)을 확인해보면 3가지 - 따라서 2번 비교가 가능
먼저 trt1
, trt2
를 하나로 묶어 crtl
와 비교하고자 하면 대비계수를 다음과 같이 작성
contr.1 = c(2, -1, -1)
한 집단의 대피계수는 +, 다른 -로. 총합은 0
- crtl
의 대비계수는 2, trt1
과 trt2
의 대비계수는 각각 -1
- ctrl
처럼 혼자서 비교 집단이 된 경우에는 이후로는 더이상 비교에 사용하지 못함. 이후로는 대비계수가 0
다음으로는 trt1
과 trt2
를 비교
contr.2 = c(0, 1, -1)
대비계수를 적용
contrasts(PlantGrowth$group) = cbind(contr.1, contr.2)
contrasts(PlantGrowth$group)
contr.1 contr.2 ctrl 2 0 trt1 -1 1 trt2 -1 -1
ANOVA 계획비교를 실시
m = aov(weight ~ group, data = PlantGrowth)
summary(m)
Df Sum Sq Mean Sq F value Pr(>F) group 2 3.766 1.8832 4.846 0.0159 * Residuals 27 10.492 0.3886 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
- 분석 결과, group에 따라 weight의 차이가 유의미함
- 계획비교 결과는 summary.lm() 함수를 이용해서 확인
summary.lm(m)
Call: aov(formula = weight ~ group, data = PlantGrowth) Residuals: Min 1Q Median 3Q Max -1.0710 -0.4180 -0.0060 0.2627 1.3690 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.07300 0.11381 44.573 < 2e-16 *** groupcontr.1 -0.02050 0.08048 -0.255 0.80086 groupcontr.2 -0.43250 0.13939 -3.103 0.00446 ** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.6234 on 27 degrees of freedom Multiple R-squared: 0.2641, Adjusted R-squared: 0.2096 F-statistic: 4.846 on 2 and 27 DF, p-value: 0.01591
- groupcontr.1:
control
과 처치조건들(trt1
,trt2
) 사이에 유의미한 차이를 발견하지 못함 - groupcontr.2:
trt1
,trt2
사이에 유의미한 차이가 있음(p < .05)