푸아송 분포

푸아송 분포(Poisson distribution)는 이산 확률 분포의 일종으로, 특정 시간 간격이나 공간 내에서 특정 사건이 발생할 확률을 모델링하는 데 사용된다. 이 분포는 19세기 프랑스 수학자 시메옹-데니 푸아송(Siméon-Denis Poisson)의 이름을 따서 명명되었다.

푸아송 분포는 다음과 같은 조건을 만족하는 사건의 발생 횟수를 묘사한다:

1. 사건은 독립적으로 발생한다.

2. 짧은 시간 또는 공간 간격 내에서 사건이 발생할 확률은 일정하다.

3. 한 시간 또는 공간 간격 내에서 최대 한 번 발생할 수 있다.

푸아송 분포의 확률 질량 함수(PMF)는 다음과 같이 정의된다:

\[ P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} \]

여기서,

- \( P(X = k) \)는 사건이 \( k \)번 발생할 확률,

- \( \lambda \)는 단위 시간이나 공간 내에서 사건이 평균적으로 발생하는 횟수,

- \( e \)는 자연상수(약 2.71828),

- \( k! \)는 \( k \)의 계승(factorial)을 의미한다.

푸아송 분포의 평균과 분산은 모두 \( \lambda \)로, 이는 분포의 특정한 특성을 제공한다. 푸아송 분포는 주로 전화 교환, 고객 도착 시간, 고장 발생 횟수 등 다양한 분야에서 사건 발생 횟수를 예측하는 데 사용된다.

또한, 푸아송 분포는 정규 분포와의 관계가 있다. \( \lambda \)가 충분히 클 경우, 푸아송 분포는 정규 분포에 근사하게 된다. 이로 인해, 실제 데이터 분석 시 푸아송 분포와 정규 분포 간의 변환이 종종 이루어진다.