ポアソン分布
Contents
ポアソン分布
ポアソン分布 (英:Poisson distribution) とは、ある時間内で $\lambda$ 回生起する事象において、同じ時間内で任意も生起回数を考えたとき、その確率は幾らかを示す離散確率分布のこと。
\[ X\sim\mathrm{Po}(\lambda) \]
確率質量関数
単位時間内に平均 $\lambda$ 回発生する事象が、ある単位時間でちょうど $k$ 回発生する発生する確率を表す。
\[ f_X(k;\lambda) = \frac{\lambda^k}{k!}e^{-\lambda} \]
ポアソンの極限定理:
二項係数の期待値を $\lambda=np$ とし、$n$ を無限大にとると、ポアソン分布の確率質量関数が得られる。これをポアソンの極限定理 (英:Poisson limit theorem) という。
\[ \begin{aligned} f_X(k;\lambda) &= \lim_{n\to\infty}\left.\binom n k p^k(1-p)^{n-k}\right|_{np=\lambda} \cr &= \lim_{n\to\infty}\frac{n!}{k!(n-k)!}\left(\frac{\lambda}{n}\right)^k\left(1-\frac \lambda n\right)^{n-k} \cr &= \frac{1}{k!}\lim_{n\to\infty}\underbrace{n(n-1)(n-2)\cdots(n-k+1)}_{k\text{ times}}\left(\frac{\lambda}{n}\right)^k\left(1-\frac \lambda n\right)^{n-k} \cr &= \frac{\lambda^k}{k!}\lim_{n\to\infty}\left[\prod_{i=0}^{k-1}\left(1-\frac{i}{n}\right)\cdot\left(1-\frac \lambda n\right)^{n-k}\right] \cr &= \frac{\lambda^k}{k!}\lim_{n\to\infty}\left(1-\frac \lambda n\right)^{n-k} \cr &= \frac{\lambda^k}{k!}\lim_{n\to\infty}\left(1-\frac \lambda n\right)^n\left(1-\frac \lambda n\right)^{-\lambda} \cr &= \frac{\lambda^k}{k!}\lim_{n\to\infty}\left(1-\frac \lambda n\right)^n \cr &= \frac{\lambda^k e^{-\lambda}}{k!} \cr \cr \therefore f_X(k;\lambda) &= \frac{\lambda^k e^{-\lambda}}{k!} \end{aligned} \]
確率分布であることの証明:
\[ \begin{aligned} \sum_{k=0}^nf_X(k;\lambda) &= \sum_{k=0}^n\frac{\lambda^k e^{-\lambda}}{k!} \\ &= e^{-\lambda}\sum_{k=0}^n\frac{\lambda^k}{k!} \\ &= e^{-\lambda}\left(1+\lambda+\frac{1}{2!}\lambda^2+\frac{1}{3!}\lambda^3+\cdots\right) \\ &= e^{-\lambda}e^\lambda \quad \because e^x = 1 + x + \frac{1}{2!}x^2 + \frac{1}{3!}x^3+\cdots \\ &= 1 \end{aligned} \]
確率質量関数のグラフ:
# Python 3
from scipy.stats import poisson
import matplotlib.pyplot as plt
cases = [
1, # λ
2,
4,
8,
]
plt.figure()
for p in cases:
x = range(10)
dist = poisson.pmf(x, p)
plt.plot(x, dist, marker='o', label="$\lambda={}$".format(p))
plt.title("PMF of Poisson distribution")
plt.xlabel("Number of occurrences")
plt.ylabel("Probability")
plt.legend()
plt.show()
累積分布関数
\[ F_X(x;\lambda) = \sum_{k=0}^x\frac{\lambda^k e^{-\lambda}}{k!} \]
累積分布関数のグラフ:
# Python 3
from scipy.stats import poisson
import matplotlib.pyplot as plt
cases = [
1, # λ
2,
4,
8,
]
plt.figure()
for p in cases:
x = range(10)
dist = poisson.cdf(x, p)
plt.plot(x, dist, marker='o', label="$\lambda={}$".format(p))
plt.title("CDF of Poisson distribution")
plt.xlabel("Number of occurrences")
plt.ylabel("Probability")
plt.legend()
plt.show()
期待値
\[ E[X] = \lambda \]
確率変数の期待値の導出:
\[ \begin{aligned} E[X] &= \lim_{n\to\infty}\sum_{k=0}^n k\frac{\lambda^k e^{-\lambda}}{k!} \cr &= \lambda\lim_{n\to\infty}\sum_{k=0}^n \frac{\lambda^{k-1} e^{-\lambda}}{(k-1)!} \cr &= \lambda \cr \cr \therefore E[X] &= \lambda \end{aligned} \]
分散
\[ V[X] = \lambda \]
確率変数の分散の導出:
\[ \begin{aligned} V[X] &= E[X^2] - E[X]^2 \cr &= \lim_{n\to\infty}\sum_{k=0}^n k^2\frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \cr &= \lim_{n\to\infty}\sum_{k=0}^n (k(k-1)+k)\frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \cr &= \lim_{n\to\infty}\sum_{k=0}^n k(k-1)\frac{\lambda^k e^{-\lambda}}{k!} + \lim_{n\to\infty}\sum_{k=0}^n k\frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \cr &= \lambda^2\lim_{n\to\infty}\sum_{k=0}^n\frac{\lambda^{k-2} e^{-\lambda}}{(k-2)!} + \lambda - \lambda^2 \cr &= \lambda^2 + \lambda - \lambda^2 \cr &= \lambda \cr \cr \therefore V[X] &= \lambda \end{aligned} \]
ポアソン分布の畳み込み
二つのポアソン分布の確率密度関数の畳み込みは、それぞれの母数の和を母数とするポアソン分布の確率密度関数である。
\[ P_{\text{Po}(\lambda_1)}\ast P_{\text{Po}(\lambda_2)} = P_{\text{Po}(\lambda_1+\lambda_2)} \]
ポアソン分布の畳み込みの導出:
\[ \begin{aligned} \left(P_{\text{Po}(\lambda_1)}\ast P_{\text{Po}(\lambda_2)}\right)(z) &= \sum_{t=0}^zP_{\mathrm{Po}(\lambda_1)}(t)P_{\mathrm{Po}(\lambda_2)}(z-t) \\ &= \sum_{t=0}^z\left[\frac{\lambda_1^t}{t!}e^{-\lambda_1}\cdot\frac{\lambda_2^{z-t}}{(z-t)!}e^{-\lambda_2}\right] \\ &= \frac{e^{-(\lambda_1+\lambda_2)}}{z!}\sum_{t=0}^z\frac{z!}{t!(z-t)!}\lambda_1^t\lambda_2^{z-t} \\ &= \frac{e^{-(\lambda_1+\lambda_2)}}{z!}\sum_{t=0}^z\binom z t\lambda_1^t\lambda_2^{z-t} \\ &= \frac{(\lambda_1+\lambda_2)^z}{z!}e^{-(\lambda_1+\lambda_2)} \quad \because\text{二項定理} \\ &= P_{\mathrm{Po}(\lambda_1+\lambda_2)}(z) \vphantom{\int} \\ \\ \therefore P_{\text{Po}(\lambda_1)}\ast P_{\text{Po}(\lambda_2)} &= P_{\text{Po}(\lambda_1+\lambda_2)} \end{aligned} \]