p-value :: 통계 - mindscale
Skip to content

p-value

p-value는 모수에 대한 특정한 가설과 통계량이 일치함을 보여주는 한 가지 지표입니다. p-value는 표집분포에서 모수를 특정 값으로 가정할 때, 표본평균 바깥쪽 영역의 넓이로 정의됩니다. 이렇게 정의하면 신뢰구간을 구하지 않아도, p-value만 보면 어떤 가정된 모수가 신뢰구간에 포함되는지 알 수 있습니다.

유의수준은 신뢰수준과 짝을 이루는 개념으로 p-value에 대해 판단할 때 사용합니다. 유의수준 + 신뢰수준 = 100%로 정의됩니다. 즉, 신뢰수준 95%일 때 유의수준은 5%가 됩니다.

예를 들어 p-value가 5% 미만일 경우, 해당 모수는 95% 신뢰구간을 벗어나게 됩니다.

아래 예에서 중고차 평균 가격의 95% 신뢰구간은 814~893만원입니다. 이때 810만원이라는 모평균을 가정하면, 이는 신뢰구간을 벗어나게 됩니다. 이 모평균의 p-value 3%로 유의수준 5%보다 작은 것을 알 수 있습니다.

pg.ttest(df.price, 810)

875만원이라는 모평균을 가정하면 이는 신뢰구간에 포함됩니다. 이때 p-value는 28%로 유의수준 5%보다 큰 것을 알 수 있습니다.

pg.ttest(df.price, 875)

중간값 등 처럼 신뢰구간을 직접 구하기 어려운 경우에는 p-value를 통해서 특정한 모수의 신뢰구간 포함여부를 판정할 수 있습니다.