Python 기초 통계

Python으로 하는 기초 통계 분석법


수강중

8. 유의할 점

동영상이 없는 텍스트 강의 자료입니다.

상관분석 실시 전 유의할 점

  • 두 변수의 관계가 선형적(= 직선)인지 확인할 것!
    • 산점도을 그려서 확인
    • 명확하게 두 변수의 관계가 곡선 형태라면 spearman이나 kendall의 방법을 사용

상관분석 결과 해석 시 유의할 점

  • 두 변수의 상관관계는 인과관계를 담보하지 않음
    • 상관관계가 있다고 반드시 인과관계가 있는 것은 아님
  • 제3 변인의 문제

    • 도시 내 범죄 발생 건수와 종교 시설의 수는 양의 상관 관계가 있음
    • 범죄가 많아서 종교에 의존하는가? 또는 종교가 범죄를 부추기는가?
    • 사실은 인구가 많아지면 범죄도 늘고, 종교 시설도 많아짐.
  • 이질적인 집단들의 합 (심슨의 역설)

    • 각 집단별 상관관계와 전체 총합의 상관관계는 다를 수 있음
    • 상관분석 결과가 예상과 다를 경우, 이질적인 하위집단들이 존재하는지 살펴봐야 할 수도 있음
  • 극단치(outliers)에 의한 인위적 상관 존재 가능성

    • 자료 내에 극단치가 있을 때, 존재하지 않는 상관관계가 포착되거나, 존재하는 상관관계가 포착되지 못하는 경우가 생기기도 함