카이제곱 검증
카이제곱 검증의 논리
- 영가설: 분할표의 행과 열은 독립적이다
- 대안가설: 분할표의 행과 열은 독립적이지 않다
housetasks.txt를 다운로드 받아 연다.
import pandas as pd
data = pd.read_csv('housetasks.txt', sep='\t', index_col=0)
data.head()
Wife | Alternating | Husband | Jointly | |
---|---|---|---|---|
Laundry | 156 | 14 | 2 | 4 |
Main_meal | 124 | 20 | 5 | 4 |
Dinner | 77 | 11 | 7 | 13 |
Breakfeast | 82 | 36 | 15 | 7 |
Tidying | 53 | 11 | 1 | 57 |
카이제곱 검증을 실시한다:
import scipy.stats
chi2, pvalue, dof, expected = scipy.stats.chi2_contingency(data)
검정통계량 $\chi^2$
chi2
1944.4561959955277
자유도
dof
36
p 값
pvalue
0.0
분석 결과, 집안일의 종류와 수행하는 사람이 독립이 아님($\chi^2$(36) = 1944.5, p < 0.05)