푸아송 분포
푸아송 분포
- 평균을 추정하여 확률을 구하는 분포
- 평균적으로 ~일 때
- 하루에 방문하는 고객수
- 1Km 당 자동차 수
- 1시간에 발생하는 불량의 수
- 1개월 간 사이트 방문자 수
실습
100일간 하루에 10명의 고객이 방문한다고 할 때 각 날의 랜덤 방문자 수 데이터 생성
rpois(100, 10)
[1] 11 8 12 15 16 8 13 9 13 13 6 10 12 7 8 15 12 11 6 11 7 14 8 10 7 [26] 12 8 8 13 8 13 7 6 13 9 11 6 11 11 7 6 9 13 5 12 13 10 17 11 8 [51] 11 6 12 11 10 14 11 7 11 10 7 15 8 7 5 6 13 10 16 9 16 4 11 8 7 [76] 11 8 9 8 11 12 4 11 8 5 4 8 14 9 7 13 15 14 9 7 13 12 14 5 12
- 가게에 자리를 몇 개를 만들어야 할까?
- 웹 사이트에 어떤 수준의 서버를 구매할까?
- 평균 10명 방문한다고 하더라도 20명이 방문하는 날도 있고 6명이 방문하는 날도 있음
히스토그램
hist(rpois(10000, 10))
- 데이터의 개수를 늘려 실제 분포와 가깝게 함
- 고객의 수는 항상 양수이므로 0부터 시작함
- 평균을 중심으로 오른쪽으로 늘어진 형태
- 정규분포와는 다르게 그래프의 왼쪽은 항상 0에서부터 시작이고 오른쪽으로 길게 늘어짐
평균 10명이 방문하는데 5명이 방문할 확률
dpois(5, 10)
[1] 0.03783327
평균 10명이 방문하는데 5명이하가 방문할 누적 확률
ppois(5, 10)
[1] 0.06708596
평균 10명이 방문하는데 20명이하가 방문할 누적 확률
ppois(20, 10)
[1] 0.9984117
- 즉, 20자리가 있으면 99%의 손님을 받을 수 있음
90% 수준의 고객 방문 수
qpois(0.9, 10)
[1] 14
- 90%의 경우에는 14명 이하로 방문
포아송분포 vs 이항분포
- 이항 분포는 확률이 p일 때 N개 중 몇 개?
- 고객이 하루에 1000명 방문할 때 그 중 몇 명이 구매하는가?
- 푸아송 분포는 평균적으로 m일 때 몇 개?
- 이항 분포에서 p가 작고 N이 크면 푸아송 분포와 비슷해짐
- 예) 구매율이 1%이고 하루에 고객이 1만 명 온다면
- 이항분포: 구매율이 1%일 때 1만 명 중 몇 명이 구매?
- 푸아송 분포: 평균적으로 100명이올 때(1만 명 중 1%) 몇 명이 구매?
- 이항 분포나 푸아송 분포나 계산 결과가 비슷함
- 확률이 확실하지 않거나 N이 일정하지 않은 경우에는 푸아송 분포를 쓰는 게 현실적으로 맞음