logo

[확률] 기하 분포

 

기하 분포 소개

 

기하 분포의 정의

기하 분포란, 독립적인 베르누이 시행에서 첫 번째 성공이 나타나기까지의 실패 횟수를 나타내는 확률 분포입니다. 여기서 베르누이 시행은 단 두 가지 결과(성공 또는 실패)를 나타내는 실험이며, 각 시행의 성공 확률은 p로 일정합니다.

 

기하 분포가 사용되는 예시

기하 분포는 여러 분야에서 활용됩니다. 예를 들어, 제품 검사에서 첫 번째 불량품을 발견하기 전까지 검사하는 제품의 수, 서버에 연결을 시도하며 처음으로 성공하기까지 시도한 횟수 등이 기하 분포의 예로 볼 수 있습니다.

 

기하 분포와 이항 분포의 차이점

기하 분포와 이항 분포는 서로 다른 개념입니다. 이항 분포는 고정된 n번의 독립적인 베르누이 시행에서 성공한 횟수의 분포를 다루며, 기하 분포는 첫 성공까지의 실패 횟수에 초점을 맞춥니다. 기하 분포의 시행 횟수는 고정되지 않으며, 첫 성공이 나타날 때까지 계속됩니다.

 

기하 분포의 특성 및 성질

 

첫 성공까지의 실패 횟수

기하 분포에서 첫 성공까지의 실패 횟수 X는 자연수로 표현될 수 있으며, 이는 기하 분포의 확률 변수입니다.

 

기댓값과 분산

기댓값(E[X])과 분산(Var(X))은 다음과 같이 계산됩니다.

  • 기댓값: E[X] = (1-p)/p
  • 분산: Var(X) = (1-p)/p^2

여기서 p는 성공 확률을 나타냅니다.

 

기하 분포의 기억 없음(Memorylessness) 속성

기하 분포는 기억 없음 속성을 갖고 있습니다. 즉, 이미 여러 번의 실패를 겪었다 해도, 다음 시행에서 성공할 확률은 여전히 p로 동일합니다.

 

기하 분포의 확률 계산하기

 

확률 질량 함수(PMF, Probability Mass Function)의 정의 및 식

기하 분포의 확률 질량 함수는 P(X=k) = (1-p)^k * p로 정의됩니다. 여기서 k는 실패 횟수, p는 성공 확률입니다.

 

특정 횟수의 실패 후 첫 성공의 확률 계산 예시

성공 확률이 0.2인 경우, 3번의 실패 후 첫 성공의 확률을 계산해봅시다. P(X=3) = (1-0.2)^3 * 0.2 = (0.8)^3 * 0.2 = 0.1024

 

누적 분포 함수(CDF, Cumulative Distribution Function)를 사용한 확률 계산

기하 분포의 누적 분포 함수는 P(X ≤ k) = 1 - (1-p)^(k+1)으로 계산됩니다. 이는 첫 번째 성공이 k번째 시행 이하에서 발생할 확률을 나타냅니다.

 

기하 분포의 응용 예

 

품질 관리에서의 활용

제품 생산 라인에서 첫 번째 불량품이 나올 때까지의 검사 과정에서 기하 분포를 사용해 불량품 발생 확률을 계산할 수 있습니다.

 

대기열 이론에서의 활용

고객이 서비스를 받기 위해 대기하는 시스템에서, 첫 번째 고객이 도착하기까지 기다리는 시간이나 서비스가 시작되기까지의 시간 등을 모델링하는 데 기하 분포가 사용될 수 있습니다.

 

컴퓨터 네트워크에서의 패킷 전송 시도 관련 예시

네트워크에서 패킷을 보내려 할 때, 성공적으로 전송될 때까지 시도하는 횟수는 기하 분포를 따를 수 있습니다. 이는 특히 네트워크가 혼잡할 때 유용한 분석 도구가 됩니다.

Previous
포아송 분포