[확률] 지수 분포 :: 마인드스케일

지수 분포란 무엇인가?

지수 분포는 연속 확률 분포의 한 형태로, 어떤 사건이 발생할 때까지 걸리는 시간을 모델링하는데 주로 사용됩니다. 즉, 독립적인 사건들 사이의 간격을 나타내는데 이상적입니다.

지수 분포는 파라미터 $\lambda$ (>0)에 의해 정의됩니다. 이 파라미터는 단위 시간당 평균적으로 발생하는 사건의 수를 나타냅니다. 지수 분포의 수학적 표현은 다음과 같습니다:

f(x;\lambda) = \lambda e^{-\lambda x} \, \text{for } x \ge 0

여기서, $f(x;\lambda)$ 는 확률 밀도 함수(PDF)입니다. 이 분포는 무한대로 확장되며, 사건 발생 간격은 양의 실수로 제한됩니다.

확률 밀도 함수(PDF)는 연속 확률 분포에서 특정 변수의 값이 특정 구간에 놓일 확률을 나타냅니다.

지수 분포의 PDF는 앞에서 언급한 수식을 따릅니다.

지수 분포의 PDF 그래프는 x=0에서 시작하여 점차 감소하며, 파라미터 $\lambda$ 의 값에 따라서 그 감소율이 달라집니다. $\lambda$ 가 클수록, 그래프는 더 빠르게 감소합니다.

지수 분포의 경우:

이는 해당 분포가 $\lambda$ 에 의존한다는 것을 보여줍니다.

$\lambda$ 가 클수록 기대값과 분산은 감소합니다. 이는 사건이 더 자주 발생함을 의미하며, 결과적으로 대기 시간이 짧아집니다.

누적 분포 함수(CDF)는 확률 변수 X가 특정 값 x 이하가 될 확률을 나타냅니다.

지수 분포의 CDF는 다음과 같이 주어집니다:

F(x;\lambda) = 1 - e^{-\lambda x} \, \text{for } x \ge 0

이는 주어진 시간 $x$ 까지 사건이 발생할 확률을 나타냅니다.

시간 $x = 2$ 에서의 사건 발생 확률은 다음과 같이 계산할 수 있습니다 (예를 들어 $\lambda = 1$ 일 때):

F(2;1) = 1 - e^{-1 \times 2} = 1 - e^{-2} \approx 0.8647

메모리리스 속성은 지수 분포의 특징 중 하나로, 과거 사건이 미래 사건의 확률에 영향을 주지 않는 성질입니다.

예를 들어, 특정 전구가 100시간 동안 꺼지지 않았다면, 다음 10시간 동안 계속해서 켜져 있을 확률은 처음부터 10시간 동안 켜져 있을 확률과 동일합니다. 이는 과거의 사용 시간이 미래의 생존 시간에 영향을 주지 않음을 의미합니다.

이 속성은 다양한 시스템의 설계와 분석에 유용하게 적용됩니다. 예를 들어, 통신 네트워크에서 패킷 전송 지연 시간의 분석, 고장 예측 모델에서의 고장 시간 분석 등에 활용됩니다.