유의할 점
상관분석 실시 전 유의할 점
- 두 변수의 관계가 선형적(= 직선)인지 확인할 것!
- 산점도을 그려서 확인
- 명확하게 두 변수의 관계가 곡선 형태라면 spearman이나 kendall의 방법을 사용
상관분석 결과 해석 시 유의할 점
- 두 변수의 상관관계는 인과관계를 담보하지 않음
- 상관관계가 있다고 반드시 인과관계가 있는 것은 아님
- 제3 변인의 문제
- 도시 내 범죄 발생 건수와 종교 시설의 수는 양의 상관 관계가 있음
- 범죄가 많아서 종교에 의존하는가? 또는 종교가 범죄를 부추기는가?
-
사실은 인구가 많아지면 범죄도 늘고, 종교 시설도 많아짐.
-
이질적인 집단들의 합 (심슨의 역설)
- 각 집단별 상관관계와 전체 총합의 상관관계는 다를 수 있음
-
상관분석 결과가 예상과 다를 경우, 이질적인 하위집단들이 존재하는지 살펴봐야 할 수도 있음
-
극단치(outliers)에 의한 인위적 상관 존재 가능성
- 자료 내에 극단치가 있을 때, 존재하지 않는 상관관계가 포착되거나, 존재하는 상관관계가 포착되지 못하는 경우가 생기기도 함