평균에 대한 가설 검정 :: 통계 - mindscale
Skip to content

평균에 대한 가설 검정

일표본 t 검정

중고차 데이터에서 price의 평균이 810만원이라는 귀무가설을 검정해봅시다.

pg.ttest(df.price, 810, confidence=0.95)
t.test(df$price, mu=810, conf.level=.95)

신뢰구간을 구할 때와 동일한 코드이지만, 귀무가설로 평균 810만원이 추가된 것을 볼 수 있습니다. p 값을 보면 0.03 정도입니다. 퍼센트로 바꾸면 3%이죠. 유의수준을 5%라고 하면, 유의수준보다 p 값이 작으므로 우리는 귀무가설을 기각할 수 있습니다. 즉, 810만원은 아니라고 할 수 있겠네요.

이때 95% 신뢰구간을 보면 814~893만원입니다. 우리의 귀무가설 810만원은 이 구간을 벗어나있죠. 이렇게 보아도 귀무가설은 기각된다는 것을 알 수 있습니다.

Question

신뢰수준을 95%에서 99%로 높히면 신뢰구간은 어떻게 됩니까?

  • 넓어진다
  • 좁아진다
  • 변하지 않는다
  • 알 수 없다

Question

유의수준을 높이면 p 값은 어떻게 됩니까?

  • 커진다
  • 작아진다
  • 변하지 않는다
  • 알 수 없다

Question

HR 데이터를 다운로드 받아 overtime의 모평균이 12시간이라는 귀무가설을 유의수준 5%에서 검정해보세요. p-value는 얼마입니까?

  • 0.05보다 작다
  • 0.05보다 크다

유의수준 5%일 때 어떤 결론을 내릴 수 있습니까?

  • 귀무가설을 기각한다. overtime ≠ 12
  • 귀무가설을 기각할 수 없다. 결론을 유보한다.

p-value 직접 구하기

표준오차 구하기

표본크기 = df.price.count()
표준오차 = stats.sem(df.price)
표준오차 = df.price.std() / np.sqrt(표본크기)

신뢰구간 구하기

평균 = df.price.mean()
하한, 상한 = stats.t.interval(0.95, df=표본크기 - 1, loc=평균, scale=표준오차)

p-value 구하기

귀무가설 = 880
차이 = np.abs(귀무가설 - 평균)
p = 2 * stats.t.cdf(귀무가설  차이, df=표본크기  1, loc=귀무가설, scale=표준오차)