[확률] 연속 확률 분포
연속 확률 분포의 정의
연속 확률 분포는 결과가 연속적인 범위 내에서 어떤 값이든 취할 수 있는 확률 변수에 대한 확률 분포를 말합니다. 즉, 이 분포는 연속 변수에 대한 확률적 특성을 설명하며, 이 변수는 특정 구간 내에서 어떤 값이든 무한하게 가질 수 있습니다.
이산 확률 분포와 차이
이산 확률 분포와 연속 확률 분포의 주요 차이점은 변수가 취할 수 있는 값의 유형입니다. 이산 확률 분포는 변수가 취할 수 있는 값이 명확하게 분리되고 셀 수 있는 경우(예: 주사위 던지기)에 사용되는 반면, 연속 확률 분포는 변수가 연속적인 값을 취할 수 있을 때 사용됩니다(예: 특정 공간에서의 무작위 점의 위치).
연속 확률 분포가 다루는 주요 개념과 특성
연속 확률 분포는 확률 밀도 함수(PDF: Probability Density Function)와 누적 분포 함수(CDF: Cumulative Distribution Function)를 통해 특징지어집니다. 확률 밀도 함수는 연속 확률 변수가 특정 값에 있을 확률 밀도를 나타내며, 누적 분포 함수는 확률 변수가 특정 값 이하가 될 확률을 나타냅니다.
대표적인 연속 확률 분포의 정의 및 활용 예
- 정규 분포(Normal Distribution): 평균(
μ
)과 표준편차(σ
)에 의해 정의되며, 종모양의 곡선을 그립니다. 많은 자연현상과 사회현상에서 관측되는 데이터 분포가 정규 분포를 따르는 것으로 알려져 있습니다. - 지수 분포(Exponential Distribution): 어떤 사건이 발생하는 사이의 시간을 모델링하는 데 사용됩니다. 예를 들어 전화가 걸려오기까지의 시간이나, 기계가 고장 나기까지의 시간 등을 모델링할 수 있습니다.
연속 확률 분포의 확률 밀도 함수와 누적 분포 함수 이해
-
확률 밀도 함수(PDF): PDF는 확률 변수가 특정 구간 내에 있을 가능성을 설명합니다. PDF 아래의 특정 구간에 대한 면적은 그 구간에 변수가 존재할 확률을 나타냅니다. 수학적으로는
f(x)
로 표현되며, 는 변수X
가[a, b]
구간 안에 있을 확률을 의미합니다. -
누적 분포 함수(CDF): CDF는 변수의 값이 특정 값보다 작거나 같을 확률을 나타냅니다. 수학적으로
F(x)
로 표현되며, 와 같은 형태로 계산됩니다. CDF는 0에서 1까지의 값을 가지며, 그래프는 오른쪽으로 증가하는 형태를 갖습니다.
PDF와 CDF는 연속 확률 분포의 특성과 확률을 이해하고 계산하는 데 중요한 도구입니다. 예를 들어, 특정 범위 내의 확률을 알고 싶다면, 해당 범위에 대한 PDF를 적분하거나 CDF의 차이를 계산함으로써 알 수 있습니다.