logo

[확률] 이항 분포

 

이항 분포 소개

 

이항 분포의 정의

이항 분포는 베르누이 시행이라고 불리는 실험을 여러 번 반복할 때 나타나는 확률 분포입니다. 베르누이 시행은 오직 두 가지 결과(예: 성공/실패)만을 가지는 실험을 의미합니다. 만약 이러한 시행을 nn번 반복하고, 각 시행에서의 성공 확률을 pp라 할 때, 성공 횟수 XX의 확률 분포를 이항 분포라고 합니다.

 

이항 분포의 성질

이항 분포는 이산 확률 분포에 속합니다. 이는 가능한 성공 횟수가 연속적이지 않고, 분명히 구별되는 몇 가지 값으로 이루어져 있다는 의미입니다. 이항 분포의 중요한 특징은 그것이 두 개의 파라미터에 의해 완전히 정의된다는 점입니다: 시행 횟수(nn)와 각 시행에서의 성공 확률(pp).

 

이항 분포의 활용 예

이항 분포는 다양한 분야에서 매우 유용하게 활용됩니다. 예를 들어, 품질 관리에서 제품이 불량일 확률이 pp일 때, nn개의 제품을 검사했을 때 불량품의 개수가 얼마나 될지 예측하는 데 사용될 수 있습니다. 또한, 동전을 nn번 던져 앞면이 나올 횟수를 예측하는 데도 이항 분포를 사용할 수 있습니다.

 

이항 분포의 확률 계산하기

 

수학적 정의와 식

이항 분포의 확률 질량 함수(PMF)는 다음과 같이 주어집니다:

P(X=k)=(nk)pk(1p)nk P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

여기서 (nk)\binom{n}{k}는 조합을 나타내며, nn개 중 kk개를 선택하는 방법의 수입니다. 이 식은 nn번의 시행 중에서 정확히 kk번 성공할 확률을 계산합니다.

 

계산 예시

예를 들어, 동전을 10번 던져서 정확히 3번 앞면이 나올 확률을 계산한다고 가정합시다. 동전 던지기에서 앞면이 나올 확률(p)는 0.5이므로, 이항 분포의 식에 따르면:

P(X=3)=(103)(0.5)3(10.5)1030.117 P(X=3) = \binom{10}{3} (0.5)^3 (1-0.5)^{10-3} \approx 0.117

즉, 10번 던질 때 앞면이 정홸히 3번 나올 확률은 약 11.7%입니다.

 

numpy로 계산

Python에서 numpy 라이브러리를 사용하여 이항 분포의 확률을 쉽게 계산할 수 있습니다.

import numpy as np
n = 10  # 시행 횟수
p = 0.5 # 성공 확률
k = 3   # 성공 횟수

prob = np.math.comb(n, k) * (p ** k) * ((1-p) ** (n-k))
print(prob)
 

이항 분포의 기대값과 분산

 

기대값(E[X])과 분산(Var[X])의 공식

이항 분포의 기대값과 분산은 각각 다음과 같습니다:

  • 기대값: E[X]=np E[X] = n\cdot p
  • 분산: Var[X]=np(1p) \text{Var}[X] = n\cdot p\cdot (1-p)
 

기대값과 분산의 의미

기대값은 실험을 무수히 많이 반복했을 때, 평균적으로 기대할 수 있는 성공의 횟수를 의미합니다. 분산은 성공 횟수가 그 평균값(기대값)에서 얼마나 떨어져 있는지를 나타내는 척도로, 결과의 변동성이나 불확실성을 측정하는 데 사용됩니다.

 

분산의 활용

결과의 변동성을 이해하고 예측하는 데 분산을 활용할 수 있습니다. 큰 분산은 결과가 평균값으로부터 크게 벗어날 수 있음을, 작은 분산은 결과가 평균값에 근접할 가능성이 높음을 의미합니다.

 

이항 분포의 가정과 적용 조건

 

독립성 가정

이항 분포를 적용하기 위해서는 각 시행이 서로 독립적이어야 합니다. 이는 한 시행의 결과가 다른 시행의 결과에 영향을 주지 않음을 의미합니다.

 

동일성 가정

모든 시행에서의 성공 확률이 동일해야 합니다. 이는 실험 조건이나 환경이 바뀌지 않음을 가정합니다.

 

적용 조건과 한계

이항 분포는 위에서 설명한 가정들이 충족될 때 유용하게 적용될 수 있습니다. 하지만, 이 가정들이 현실에서 항상 충족되는 것은 아니어서, 일부 상황에서는 이항 분포가 적절하지 않을 수 있습니다. 예를 들어, 시행 간의 독립성이나 확률의 동일성이 보장되지 않는 경우 이항 분포를 사용하는 것이 부적합할 수 있습니다.

Previous
조건부 확률 분포