Python 기초 통계

Python으로 하는 기초 통계 분석법


수강중

18. 대응표본 t 검증

동영상이 없는 텍스트 강의 자료입니다.

대응표본이란?

  • 두 집단의 자료를 쌍으로 묶을 수 있을 때
    • 예) 남편과 아내, 쌍둥이, before & after
  • 두 집단의 자료를 쌍으로 묶어야 하기 때문에, 독립표본과는 달리 두 집단의 자료 갯수가 동일해야 함

대응표본 t-test의 논리

  • 쌍을 이루고 있는 두 값의 차이를 구함
  • 모집단에서 차이의 평균은 0이라고 귀무가설을 세움
  • 그렇다면 표본에서도 차이의 평균은 0에 가까울 것
  • 표본에서 구한 차이의 평균이 0보다 심각하게 크다면, 귀무가설이 옳을 확률은 희박
  • 그렇다면 귀무 가설을 기각하게 되고, 두 집단 간 차이가 유의미하다고 말하는 것

대응표본 t-test 실시하기

dat_Mdat_F가 순서대로 짝지어져 있다고 가정(예: 117과 121, 108과 101 등등)

dat_M = [117, 108, 105, 89, 101, 93, 96, 108, 108, 94, 93, 112, 92, 91, 100, 96, 120, 86, 96, 95]
dat_F = [121, 101, 102, 114, 103, 105, 101, 131, 96, 109, 109, 113, 115, 94, 108, 96, 110, 112, 120, 100]

paired=T를 하여 대응표본 t-test:

import scipy.stats

scipy.stats.ttest_rel(dat_M, dat_F)
Ttest_relResult(statistic=-2.9868874599588247, pvalue=0.007578486289181322)

통계적으로 유의미한 차이가 있음(p < 0.05)

효과 크기의 계산과 결과 보고는 독립표본 t-검증과 동일