t 검증 결과 보고
효과크기
- t-test에서 효과 크기(effect size)란 두 집단의 평균 차이를 일정한 기준으로 표현한 것
- 효과 크기의 표현 방법에는 Cohen's d, Pearson's r 등 여러 가지가 있음
- 다른 실험의 효과 크기와 비교하여 상대적으로 판단한다.
- 절대적인 것은 아니나 보통 0.2 정도면 작은 편, 0.5 정도면 중간, 0.8이면 큰 편
먼저 t-test를 수행한다.
dat_M = [117, 108, 105, 89, 101, 93, 96, 108, 108, 94, 93, 112, 92, 91, 100, 96, 120, 86, 96, 95]
dat_F = [121, 101, 102, 114, 103, 105, 101, 131, 96, 109, 109, 113, 115, 94, 108, 96, 110, 112, 120, 100]
import scipy.stats
m = scipy.stats.ttest_ind(dat_M, dat_F, equal_var=False)
Cohen's d:
import numpy as np
t = m.statistic
df = len(dat_M) + len(dat_F) - 2
abs(t) / np.sqrt(df)
0.4332242888591059
Pearson's r:
t2 = t ** 2
np.sqrt(t2 / (t2 + df))
0.39752319599996255
독립표본 t 검증 결과 보고
- 각 표본에 대한 기술통계(평균, 표준편차, 표본크기 등)
- t값과 그 때의 자유도(df)
- p-value와 유의수준의 비교 (p-value를 적시하지는 않음)
- 효과크기(주로 Cohen's d나 Pearson's r)와 그에 대한 해석
집단 M과 F에 대하여 독립표본 t 검증을 실시한 결과, 집단 M의 측정값(M = 100, SD = 9.515)은 집단 F의 측정값(M = 108, SD = 9.431)보다 통계적으로 유의미하게 낮았으며(t(37.997) = -2.671, p < 0.05), 효과 크기는 중간 수준이었다(Cohen's d = 0.43, r = 0.39).