조건부 확률
조건부 확률
- 비가 오는 날 고객이 하루 10명 방문할 확률
- 고객이 하루 10명 방문했을 때 비가 오는 날일 확률
- 이 둘은 다른 개념임
- 천재가 지저분한 책상을 가질 확률과 지저분한 책상을 가진 사람이 천재일 확률은 다른 개념임
- 예시 문제
- 직장에서 실시하는 정기검진에서 A 검사에 양성으로 나옴
- XX병에 걸린 사람들의 95%가 A 검사에서 양성으로 나옴
- XX병에 걸리지 않은 사람들의 5%가 A 검사에서 양성으로 나옴
- XX병에 걸린 사람들은 2%
- 당신이 XX병에 걸렸을 확률은?
- 95%나 2%라고 대답하면 오답
환자 | 건강 | 합계 | |
---|---|---|---|
양성 | 190 | 490 | 680 |
음성 | 10 | 9,310 | 9,320 |
합계 | 200 | 9,800 | 10,000 |
- 전체 인구는 10,000명, 환자일 확률이 2%이므로 환자는 200명, 건강한 사람은 9,800명
- 환자 중 양성이 나올 확률은 95%니까 190명, 음성은 10명
-
건강한 사람 중에서 양성이 나오는 경우는 5%이므로 490명, 음성은 9,310명
-
양성이 나왔을 때 환자일 확률은 190/680 = 약 27%
- 양성일 때 환자일 확률과 환자일 때 양성일 확률은 다름
우도(likelihood)
- 모수를 알면 데이터가 나올 확률을 구할 수 있음
- 우도는 일종의 조건부 확률
- 우도는 모수가 얼마일 때 데이터가 나올 확률을 뜻함
- 예) 평균이 10일 때 15가 나올 확률
- 최대우도추정: 우도가 가장 큰 모수를 찾음
- 데이터에서 나온 평균을 실제 평균의 추정치로 사용