다원분산분석 :: Python 기초 통계 - mindscale
다원분산분석
다원분산분석이란?
- 집단을 구분하는 변수(즉, 요인)이 두 개일 때 이원분산분석(two-way ANOVA)라 함
- 요인이 세 개이면, 삼원분산분석(three-way ANOVA)라 함
- 일반적인 표현으로, 요인이 n개 일 때, n원분산분석(n-way ANOVA)라고 함
- 다원분산분석을 실시하는 주요 목적 중 하나는 요인 간 상호작용을 파악하기 위함임
다원분산분석의 가정
- 정규성: 집단/조건별 모집단들은 정규분포를 따른다는 가정
- shapiro test나 Q-Q plot으로 확인 가능
- 독립성: 집단/조건별 개체(entity)들이 독립적이라는 가정
- 연구 설계상 집단/조건 간 독립이고, 표본수집시 무선표집(random sampling)을 실시했다면 만족한다고 봄
- 등분산성: 집단/조건별 모집단들의 분산은 동일하다는 가정
- box test나 levene test 등을 이용하여 검증
주요 용어
- 주 효과: 다른 요인(집단구분 변수)과 상관없이, 한 요인의 수준(집단)에 따라 효과가 유의미하게 달라질 때 "주효과가 있다"고 함
- 상호작용 효과: 한 요인의 수준에 따른 효과의 차이가 또 다른 요인의 수준에 따라 달라질 때, "요인들 간 상호작용(효과)이 존재한다"고 함
사후분석 vs. 계획비교
- 다원분산분석의 사후분석 혹은 계획비교는 일원분산분석의 그것과 절차가 동일함
- 다만, 사후분석은 일반적으로 주효과에만 권장됨
균형설계 vs 비균형설계
- 균형설계: 각 집단/조건별 표본수가 동일한 경우
- 비균형설계: 각 집단/조건별 표본수가 동일하지 않은 경우
- 균형설계와 비균형설계에 따라 계산 방법이 다름
처음으로