Python 기초 통계

Python으로 하는 기초 통계 분석법


수강중

24. 다원분산분석

동영상이 없는 텍스트 강의 자료입니다.

다원분산분석이란?

  • 집단을 구분하는 변수(즉, 요인)이 두 개일 때 이원분산분석(two-way ANOVA)라 함
  • 요인이 세 개이면, 삼원분산분석(three-way ANOVA)라 함
  • 일반적인 표현으로, 요인이 n개 일 때, n원분산분석(n-way ANOVA)라고 함
  • 다원분산분석을 실시하는 주요 목적 중 하나는 요인 간 상호작용을 파악하기 위함임

다원분산분석의 가정

  • 정규성: 집단/조건별 모집단들은 정규분포를 따른다는 가정
    • shapiro test나 Q-Q plot으로 확인 가능
  • 독립성: 집단/조건별 개체(entity)들이 독립적이라는 가정
    • 연구 설계상 집단/조건 간 독립이고, 표본수집시 무선표집(random sampling)을 실시했다면 만족한다고 봄
  • 등분산성: 집단/조건별 모집단들의 분산은 동일하다는 가정
    • box test나 levene test 등을 이용하여 검증

주요 용어

  • 주 효과: 다른 요인(집단구분 변수)과 상관없이, 한 요인의 수준(집단)에 따라 효과가 유의미하게 달라질 때 "주효과가 있다"고 함
  • 상호작용 효과: 한 요인의 수준에 따른 효과의 차이가 또 다른 요인의 수준에 따라 달라질 때, "요인들 간 상호작용(효과)이 존재한다"고 함

사후분석 vs. 계획비교

  • 다원분산분석의 사후분석 혹은 계획비교는 일원분산분석의 그것과 절차가 동일함
  • 다만, 사후분석은 일반적으로 주효과에만 권장됨

균형설계 vs 비균형설계

  • 균형설계: 각 집단/조건별 표본수가 동일한 경우
  • 비균형설계: 각 집단/조건별 표본수가 동일하지 않은 경우
  • 균형설계와 비균형설계에 따라 계산 방법이 다름