통계의 기본 개념

복잡한 수학을 빼고 통계의 기본 개념을 알아봅니다


수강중

13. 조건부 확률

조건부 확률

  • 비가 오는 날 고객이 하루 10명 방문할 확률
  • 고객이 하루 10명 방문했을 때 비가 오는 날일 확률
  • 이 둘은 다른 개념임
  • 천재가 지저분한 책상을 가질 확률과 지저분한 책상을 가진 사람이 천재일 확률은 다른 개념임
  • 예시 문제
    • 직장에서 실시하는 정기검진에서 A 검사에 양성으로 나옴
    • XX병에 걸린 사람들의 95%가 A 검사에서 양성으로 나옴
    • XX병에 걸리지 않은 사람들의 5%가 A 검사에서 양성으로 나옴
    • XX병에 걸린 사람들은 2%
    • 당신이 XX병에 걸렸을 확률은?
    • 95%나 2%라고 대답하면 오답
환자 건강 합계
양성 190 490 680
음성 10 9,310 9,320
합계 200 9,800 10,000
  • 전체 인구는 10,000명, 환자일 확률이 2%이므로 환자는 200명, 건강한 사람은 9,800명
  • 환자 중 양성이 나올 확률은 95%니까 190명, 음성은 10명
  • 건강한 사람 중에서 양성이 나오는 경우는 5%이므로 490명, 음성은 9,310명

  • 양성이 나왔을 때 환자일 확률은 190/680 = 약 27%

  • 양성일 때 환자일 확률과 환자일 때 양성일 확률은 다름

우도(likelihood)

  • 모수를 알면 데이터가 나올 확률을 구할 수 있음
  • 우도는 일종의 조건부 확률
  • 우도는 모수가 얼마일 때 데이터가 나올 확률을 뜻함
  • 예) 평균이 10일 때 15가 나올 확률
  • 최대우도추정: 우도가 가장 큰 모수를 찾음
  • 데이터에서 나온 평균을 실제 평균의 추정치로 사용