[확률] 이산 확률 분포
이산 확률 분포
확률 분포란 어떤 확률 변수가 가질 수 있는 모든 값들과 그 값들이 발생할 확률을 정리한 것입니다. 이산 확률 분포는 이러한 확률 분포 중, 확률 변수가 취할 수 있는 값이 명확하게 분리되어 있는 경우, 즉 이산적인 값만을 가지는 경우를 다룹니다.
이산 확률 분포는 확률 변수가 취할 수 있는 값이 셀 수 있을 만큼의 유한하거나 무한하지만 셀 수 있는 경우에 해당합니다. 예를 들어, 동전 던지기의 결과, 주사위 던지기의 결과, 어떤 시험에서 0점부터 100점까지 얻을 수 있는 점수 등이 있습니다.
이산 확률 분포가 다루는 주요 개념과 특성
주요 개념으로는 확률 질량 함수(probability mass function, PMF)가 있습니다. 확률 질량 함수는 이산 확률 변수의 각 값에 대해서 그 값이 발생할 확률을 나타냅니다.
특성으로는 기대값(평균), 분산, 표준편차 등을 들 수 있습니다. 이러한 수치들은 확률 분포의 중심 경향과 분포의 폭을 나타내는 중요한 지표입니다.
대표적인 이산 확률 분포의 정의 및 활용 예
이항 분포
이항 분포는 성공 확률이 인 베르누이 시행을 번 반복했을 때의 성공 횟수를 나타냅니다. 예를 들어, 동전을 10번 던져서 앞면이 나올 횟수의 분포는 이항 분포를 따릅니다.
여기서 는 성공 횟수, 은 시행 횟수, 는 한 번의 시행에서 성공할 확률입니다.
포아송 분포
포아송 분포는 단위 시간 또는 단위 공간에서 발생하는 이벤트의 평균 발생 횟수(λ, 람다라고 표현)를 알 때, 실제로 몇 번의 이벤트가 발생할지에 대한 확률을 나타냅니다. 예를 들어, 한 시간 동안 웹사이트에 접속하는 사용자 수의 분포가 평균 5명일 때, 실제로 한 시간 동안 3명의 사용자가 접속할 확률을 계산할 수 있습니다.
여기서 는 발생 횟수, 는 단위 시간 또는 공간당 평균 발생 횟수입니다.
이산 확률 분포의 기대값과 분산 계산 방법
기대값(평균) 계산
이산 확률 분포의 기대값은 해당 확률 변수가 가질 수 있는 각 값과 그 값이 발생할 확률의 곱의 합으로 계산됩니다.
여기서 는 확률 변수가 취할 수 있는 값, 는 그 값이 발생할 확률입니다.
분산 계산
분산은 확률 변수의 각 값에서 기대값을 뺀 뒤 제곱한 것의 기댓값으로, 분포의 퍼짐 정도를 나타냅니다.
여기서 와 는 위와 동일합니다.
이산 확률 분포는 통계학, 공학, 컴퓨터 과학, 경제학 등 다양한 분야에서 중요한 역할을 합니다. 여러분의 활용 예와 계산 방법을 이해하면 데이터를 분석하고 예측하는 데 있어 큰 도움이 됩니다.