통계의 기본 개념

복잡한 수학을 빼고 통계의 기본 개념을 알아봅니다


수강중

10. 푸아송 분포

푸아송 분포

  • 평균을 추정하여 확률을 구하는 분포
  • 평균적으로 ~일 때
    • 하루에 방문하는 고객수
    • 1Km 당 자동차 수
    • 1시간에 발생하는 불량의 수
    • 1개월 간 사이트 방문자 수

실습

100일간 하루에 10명의 고객이 방문한다고 할 때 각 날의 랜덤 방문자 수 데이터 생성

rpois(100, 10)
  [1] 11  8 12 15 16  8 13  9 13 13  6 10 12  7  8 15 12 11  6 11  7 14  8 10  7
 [26] 12  8  8 13  8 13  7  6 13  9 11  6 11 11  7  6  9 13  5 12 13 10 17 11  8
 [51] 11  6 12 11 10 14 11  7 11 10  7 15  8  7  5  6 13 10 16  9 16  4 11  8  7
 [76] 11  8  9  8 11 12  4 11  8  5  4  8 14  9  7 13 15 14  9  7 13 12 14  5 12
  • 가게에 자리를 몇 개를 만들어야 할까?
  • 웹 사이트에 어떤 수준의 서버를 구매할까?
  • 평균 10명 방문한다고 하더라도 20명이 방문하는 날도 있고 6명이 방문하는 날도 있음

히스토그램

hist(rpois(10000, 10))
  • 데이터의 개수를 늘려 실제 분포와 가깝게 함
  • 고객의 수는 항상 양수이므로 0부터 시작함
  • 평균을 중심으로 오른쪽으로 늘어진 형태
  • 정규분포와는 다르게 그래프의 왼쪽은 항상 0에서부터 시작이고 오른쪽으로 길게 늘어짐

평균 10명이 방문하는데 5명이 방문할 확률

dpois(5, 10)
[1] 0.03783327

평균 10명이 방문하는데 5명이하가 방문할 누적 확률

ppois(5, 10)
[1] 0.06708596

평균 10명이 방문하는데 20명이하가 방문할 누적 확률

ppois(20, 10)
[1] 0.9984117
  • 즉, 20자리가 있으면 99%의 손님을 받을 수 있음

90% 수준의 고객 방문 수

qpois(0.9, 10)
[1] 14
  • 90%의 경우에는 14명 이하로 방문

포아송분포 vs 이항분포

  • 이항 분포는 확률이 p일 때 N개 중 몇 개?
    • 고객이 하루에 1000명 방문할 때 그 중 몇 명이 구매하는가?
  • 푸아송 분포는 평균적으로 m일 때 몇 개?
  • 이항 분포에서 p가 작고 N이 크면 푸아송 분포와 비슷해짐
  • 예) 구매율이 1%이고 하루에 고객이 1만 명 온다면
    • 이항분포: 구매율이 1%일 때 1만 명 중 몇 명이 구매?
    • 푸아송 분포: 평균적으로 100명이올 때(1만 명 중 1%) 몇 명이 구매?
  • 이항 분포나 푸아송 분포나 계산 결과가 비슷함
  • 확률이 확실하지 않거나 N이 일정하지 않은 경우에는 푸아송 분포를 쓰는 게 현실적으로 맞음