대응표본 t 검증
대응표본이란?
- 두 집단의 자료를 쌍으로 묶을 수 있을 때
- 예) 남편과 아내, 쌍둥이, before & after
- 두 집단의 자료를 쌍으로 묶어야 하기 때문에, 독립표본과는 달리 두 집단의 자료 갯수가 동일해야 함
대응표본 t-test의 논리
- 쌍을 이루고 있는 두 값의 차이를 구함
- 모집단에서 차이의 평균은 0이라고 귀무가설을 세움
- 그렇다면 표본에서도 차이의 평균은 0에 가까울 것
- 표본에서 구한 차이의 평균이 0보다 심각하게 크다면, 귀무가설이 옳을 확률은 희박
- 그렇다면 귀무 가설을 기각하게 되고, 두 집단 간 차이가 유의미하다고 말하는 것
대응표본 t-test 실시하기
dat_M
과 dat_F
가 순서대로 짝지어져 있다고 가정(예: 117과 121, 108과 101 등등)
dat_M = [117, 108, 105, 89, 101, 93, 96, 108, 108, 94, 93, 112, 92, 91, 100, 96, 120, 86, 96, 95]
dat_F = [121, 101, 102, 114, 103, 105, 101, 131, 96, 109, 109, 113, 115, 94, 108, 96, 110, 112, 120, 100]
paired=T
를 하여 대응표본 t-test:
import scipy.stats
scipy.stats.ttest_rel(dat_M, dat_F)
Ttest_relResult(statistic=-2.9868874599588247, pvalue=0.007578486289181322)
통계적으로 유의미한 차이가 있음(p < 0.05)
효과 크기의 계산과 결과 보고는 독립표본 t-검증과 동일