Python 기초 통계

Python으로 하는 기초 통계 분석법


수강중

15. t 검증

동영상이 없는 텍스트 강의 자료입니다.

표준화(standardization)

  • 표준화란? 어떤 변수의 값(들)에서 그 변수의 평균을 빼고, 표준편차로 나누어주는 것 $$z = \dfrac{x-\mu}{\sigma}$$
  • 표준화하는 이유: 변수마다 각 변수의 단위와 변산성(=퍼져있는 정도)이 다르기 때문에 직접적인 비교를 할 수 없는데, 표준화를 하게 되면 이러한 정보들이 제거되므로 변수들 간에 비교가 가능해짐

t 검증

  • 정규분포를 따르는 무선변수를 표준화하면, 표준정규분포를 따르는 것으로 변환됨
    • 표준정규분포: 평균이 0이고 표준편차가 1인 정규분포
  • 보통 모집단의 표준편차($\sigma$)를 모름
    • 모집단의 표준편차 대신 표본의 표준편차를 이용하면 됨
    • 표본의 표준편차로 표준화를 하면, 변환된 무선변수는 표준정규분포를 따르지 않고 t 분포를 따름
  • t 분포: 표준정규분포와 매우 유사하게 생긴 분포 (똑같지는 않음)
  • 따라서, 표본에서 구한 분산/표준편차로 어떤 변수를 표준화를 하면 z값이 아닌 t값이 되고, 이를 이용하여 검증하기 때문에 t-test 라고 함