대응표본 t검정
대응표본 t 검정
대응표본은 영어로 paired samples입니다. 피겨스케팅 중에 두 사람 짝을 지어가지고 출전하는 페어(pair) 종목 있죠. 대응표본은 A 집단하고 B 집단이 있으면 이렇게 서로 짝이 하나씩 있는 거예요. 예를 들면, 남편과 아내. 언니와 동생. 치료 전과 치료 후. 이런 식으로. 이렇게 짝끼리 비교하는 게 대응표본 t 검정입니다.
두 집단의 자료를 쌍으로 묶어야 하기 때문에, 독립표본과는 달리 두 집단의 자료 갯수가 동일해야 합니다.
대응표본 t 검정에서는 먼저, 쌍을 이루고 있는 두 값의 차이를 구합니다. 독립표본 t 검정의 귀무가설은 "평균의 차이는 0이다"인 반면에, 대응표본 t 검정의 귀무가설은 "차이의 평균은 0이다"입니다.
차이의 평균과 평균의 차이는 값 자체는 똑같습니다 다만, 신뢰구간이 다르고, 따라서 가설검정의 결과가 달라질 수 있습니다.
대응표본 t-test 실시하기
husband
과 wife
가 순서대로 짝지어져 있다고 가정(예: 117과 121, 108과 101 등등)
cp = pd.read_excel('couple.xlsx')
cp = readxl::read_excel('couple.xlsx)
paired=T
를 하여 대응표본 t-test:
pg.ttest(cp['husband'], cp['wife'], paired=True)
t.test(cp$husband, cp$wife, paired=T)
위의 결과를 보면 통계적으로 유의미한 차이가 있습니다(p < 0.05).
그런데 대응표본이 아닌 독립표본으로 분석하면 유의하지 않습니다.
독립표본과 대응표본의 예시
데이터
import numpy as np
a = np.array([1, 2, 3, 4, 5])
b = np.array([3, 3, 4, 5, 6])
독립표본 t 검정(유의하지 않음)
pg.ttest(a, b)
독립표본일 경우 표준편차
np.std(np.concatenate([a, b]), ddof=1)
대응표본 t 검정(유의함)
pg.ttest(a, b, paired=True)
대응표본일 경우 표준편차
np.std(b - a)
윌콕슨 부호순위 검정
pg.wilcoxon(cp['husband'], cp['wife'])