Python 기초 통계

Python으로 하는 기초 통계 분석법


수강중

28. 카이제곱 검증

동영상이 없는 텍스트 강의 자료입니다.

카이제곱 검증의 논리

  • 영가설: 분할표의 행과 열은 독립적이다
  • 대안가설: 분할표의 행과 열은 독립적이지 않다

housetasks.txt를 다운로드 받아 연다.

import pandas as pd

data = pd.read_csv('housetasks.txt', sep='\t', index_col=0)
data.head()
Wife Alternating Husband Jointly
Laundry 156 14 2 4
Main_meal 124 20 5 4
Dinner 77 11 7 13
Breakfeast 82 36 15 7
Tidying 53 11 1 57

카이제곱 검증을 실시한다:

import scipy.stats

chi2, pvalue, dof, expected = scipy.stats.chi2_contingency(data)

검정통계량 $\chi^2$

chi2
1944.4561959955277

자유도

dof
36

p 값

pvalue
0.0

분석 결과, 집안일의 종류와 수행하는 사람이 독립이 아님($\chi^2$(36) = 1944.5, p < 0.05)