logo

[확률] 이산 확률 분포

 

이산 확률 분포

확률 분포란 어떤 확률 변수가 가질 수 있는 모든 값들과 그 값들이 발생할 확률을 정리한 것입니다. 이산 확률 분포는 이러한 확률 분포 중, 확률 변수가 취할 수 있는 값이 명확하게 분리되어 있는 경우, 즉 이산적인 값만을 가지는 경우를 다룹니다.

이산 확률 분포는 확률 변수가 취할 수 있는 값이 셀 수 있을 만큼의 유한하거나 무한하지만 셀 수 있는 경우에 해당합니다. 예를 들어, 동전 던지기의 결과, 주사위 던지기의 결과, 어떤 시험에서 0점부터 100점까지 얻을 수 있는 점수 등이 있습니다.

 

이산 확률 분포가 다루는 주요 개념과 특성

주요 개념으로는 확률 질량 함수(probability mass function, PMF)가 있습니다. 확률 질량 함수는 이산 확률 변수의 각 값에 대해서 그 값이 발생할 확률을 나타냅니다.

특성으로는 기대값(평균), 분산, 표준편차 등을 들 수 있습니다. 이러한 수치들은 확률 분포의 중심 경향과 분포의 폭을 나타내는 중요한 지표입니다.

 

대표적인 이산 확률 분포의 정의 및 활용 예

 

이항 분포

이항 분포는 성공 확률이 pp인 베르누이 시행을 nn번 반복했을 때의 성공 횟수를 나타냅니다. 예를 들어, 동전을 10번 던져서 앞면이 나올 횟수의 분포는 이항 분포를 따릅니다.

P(X=k)=(nk)pk(1p)nk P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

여기서 kk는 성공 횟수, nn은 시행 횟수, pp는 한 번의 시행에서 성공할 확률입니다.

 

포아송 분포

포아송 분포는 단위 시간 또는 단위 공간에서 발생하는 이벤트의 평균 발생 횟수(λ, 람다라고 표현)를 알 때, 실제로 몇 번의 이벤트가 발생할지에 대한 확률을 나타냅니다. 예를 들어, 한 시간 동안 웹사이트에 접속하는 사용자 수의 분포가 평균 5명일 때, 실제로 한 시간 동안 3명의 사용자가 접속할 확률을 계산할 수 있습니다.

P(X=k)=eλλkk! P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}

여기서 kk는 발생 횟수, λ\lambda는 단위 시간 또는 공간당 평균 발생 횟수입니다.

 

이산 확률 분포의 기대값과 분산 계산 방법

 

기대값(평균) 계산

이산 확률 분포의 기대값은 해당 확률 변수가 가질 수 있는 각 값과 그 값이 발생할 확률의 곱의 합으로 계산됩니다.

E(X)=xip(xi) E(X) = \sum x_i p(x_i)

여기서 xix_i는 확률 변수가 취할 수 있는 값, p(xi)p(x_i)는 그 값이 발생할 확률입니다.

 

분산 계산

분산은 확률 변수의 각 값에서 기대값을 뺀 뒤 제곱한 것의 기댓값으로, 분포의 퍼짐 정도를 나타냅니다.

Var(X)=(xiE(X))2p(xi) Var(X) = \sum (x_i - E(X))^2 p(x_i)

여기서 xix_ip(xi)p(x_i)는 위와 동일합니다.

이산 확률 분포는 통계학, 공학, 컴퓨터 과학, 경제학 등 다양한 분야에서 중요한 역할을 합니다. 여러분의 활용 예와 계산 방법을 이해하면 데이터를 분석하고 예측하는 데 있어 큰 도움이 됩니다.

Previous
확률 변수의 정의