幾何分布
Contents
幾何分布
幾何分布 (英:geometric distribution) とは、互いに独立で同一なベルヌーイ試行を繰り返し、初めて成功させるまでの失敗回数を確率変数の値とした離散確率分布のこと。離散的な待ち時間分布 (英:waiting time distribution) と呼ばれることもある。
\[ X\sim\mathrm{G}(p) \]
確率質量関数
幾何分布の確率質量関数は、成功回数が一回の負の二項分布でもある。一回のベルヌーイ試行で成功する確率 $p$ を母数とする。
\[ \begin{aligned} f_X(k; p) &= p(1-p)^k \cr &= \left.\binom {k+r-1} {k}p^r(1-p)^k\right|_{r=1} \end{aligned} \]
確率質量関数のグラフ:
# Python 3
from scipy.stats import geom
import matplotlib.pyplot as plt
cases = [
.2, # p
.5,
.8,
]
plt.figure()
for p in cases:
x = range(10)
dist = geom.pmf(list(map(lambda k: k+1, x)), p)
plt.plot(x, dist, marker='o', label="p={}".format(p))
plt.title("PMF of geometric distribution")
plt.xlabel("Number of failures")
plt.ylabel("Probability")
plt.legend()
plt.show()
累積分布関数
\[ \begin{aligned} F_X(x;p) = 1-(1-p)^{x+1} \end{aligned} \]
累積分布関数の導出:
\[ \begin{aligned} F_X(x;p) &= \sum_{k=0}^x p(1-p)^k \cr &= p + p(1-p) + p(1-p)^2 +\cdots p(1-p)^x \cr (1-(1-p))F_X(x;p) &= (p + p(1-p) + p(1-p)^2 +\cdots p(1-p)^x) \cr &\quad - (p(1-p) + p(1-p)^2 +\cdots p(1-p)^{x+1}) \cr &= p - p(1-p)^{x+1} \cr \cr \therefore F_X(x;p) &= 1-(1-p)^{x+1} \end{aligned} \]
累積分布関数のグラフ:
# Python 3
from scipy.stats import geom
import matplotlib.pyplot as plt
cases = [
.2, # p
.5,
.8,
]
plt.figure()
for p in cases:
x = range(10)
dist = geom.cdf(list(map(lambda k: k+1, x)), p)
plt.plot(x, dist, marker='o', label="p={}".format(p))
plt.title("CDF of geometric distribution")
plt.xlabel("Number of failures")
plt.ylabel("Probability")
plt.legend()
plt.show()
期待値
\[ E[X] = \frac{1-p}{p} \]
期待値の導出:
\[ \begin{aligned} E[X] &= \sum_{k=0}^\infty kf_X(k;p) \cr &= \sum_{k=0}^\infty kp(1-p)^k \cr &= p\sum_{k=0}^\infty k(1-p)^k \cr (1-(1-p))E[X] &= p\left[\sum_{k=0}^\infty k(1-p)^k - \sum_{k=0}^\infty k(1-p)^{k+1}\right] \cr &= p\sum_{k=0}^\infty(1-p)^{k+1} \cr E[X] &= \sum_{k=0}^\infty(1-p)^{k+1} \cr (1-(1-p))E[X] &= \sum_{k=0}^\infty(1-p)^{k+1} - \sum_{k=0}^\infty(1-p)^{k+2} \cr &= \lim_{k\to\infty}\left[(1-p)-(1-p)^{k+2}\right] \cr E[X] &= \lim_{k\to\infty}\frac{1-p-(1-p)^{k+2}}{p} \cr \end{aligned} \]
$0\lt p\lt 1$ であるため、
\[ \therefore E[X] = \frac{1-p}{p} \]
分散
\[ V[X] = \frac{1-p}{p^2} \]
分散の導出:
分散の諸定理により、
\[ \begin{aligned} V[X] &= E[X^2] - E[X]^2 \cr &= \sum_{k=0}^\infty k^2f_X(k;p) - \left(\frac{1-p}{p}\right)^2 \cr &= \sum_{k=0}^\infty k^2p(1-p)^k - \frac{(1-p)^2}{p^2} \cr &= p\sum_{k=0}^\infty k^2(1-p)^k - \frac{(1-p)^2}{p^2} \cr \end{aligned} \tag{1} \]
幾何分布の期待値から、
\[ \begin{aligned} p\sum_{k=0}^\infty k(1-p)^k &= \frac{1-p}{p} \cr \sum_{k=0}^\infty k(1-p)^k &= \frac{1-p}{p^2} \cr \frac{\mathrm d}{\mathrm dp}\left[\sum_{k=0}^\infty k(1-p)^k\right] &= \frac{\mathrm d}{\mathrm dp}\left(\frac{1-p}{p^2}\right) \cr -\sum_{k=0}^\infty k^2(1-p)^{k-1} &= -\frac{2-p}{p^3} \cr \sum_{k=0}^\infty k^2(1-p)^k &= \frac{(1-p)(2-p)}{p^3} \end{aligned} \tag{2} \]
$(1),(2)$ より、
\[ \begin{aligned} V[X] &= p\cdot\frac{(1-p)(2-p)}{p^3} - \frac{(1-p)^2}{p^2} \cr &= \frac{1-p}{p^2} \cr \cr \therefore V[X] &= \frac{1-p}{p^2} \end{aligned} \]
幾何分布の無記憶性
幾何分布は、無記憶性 (英:memoryless property) を持つ唯一の離散確率分布である。幾何分布の無記憶性とは、幾何分布の確率は過去の失敗回数の影響を受けない性質のこと。
\[ P(X\ge m+n\mid X\ge m) = P(X\ge n) \]
幾何分布の無記憶性の証明:
\[ \begin{aligned} P(X\ge n) &= 1-F_X(n-1;p) \cr &= 1-(1-(1-p)^{(n-1)+1}) \cr &= (1-p)^n \cr \cr P(X\ge m+n \mid X\ge m) &= \frac{P(X\ge m+n)}{P(X\ge m)} \cr &= \frac{(1-p)^{m+n}}{(1-p)^m} \cr &= (1-p)^n \cr &= P(X\ge n) \cr \cr \therefore P(X\ge m+n\mid X\ge m) &= P(X\ge n) \end{aligned} \]