blue271828's misc :-)

幾何分布

幾何分布

幾何分布 (英:geometric distribution) とは、互いに独立で同一なベルヌーイ試行を繰り返し、初めて成功させるまでの失敗回数を確率変数の値とした離散確率分布のこと。離散的な待ち時間分布 (英:waiting time distribution) と呼ばれることもある。

\[ X\sim\mathrm{G}(p) \]

確率質量関数

幾何分布の確率質量関数は、成功回数が一回の負の二項分布でもある。一回のベルヌーイ試行で成功する確率 $p$ を母数とする。

\[ \begin{aligned} f_X(k; p) &= p(1-p)^k \cr &= \left.\binom {k+r-1} {k}p^r(1-p)^k\right|_{r=1} \end{aligned} \]


確率質量関数のグラフ:

pmf

# Python 3
from scipy.stats import geom
import matplotlib.pyplot as plt

cases = [
    .2, # p
    .5,
    .8,
]

plt.figure()
for p in cases:
    x = range(10)
    dist = geom.pmf(list(map(lambda k: k+1, x)), p)
    plt.plot(x, dist, marker='o', label="p={}".format(p))

plt.title("PMF of geometric distribution")
plt.xlabel("Number of failures")
plt.ylabel("Probability")
plt.legend()
plt.show()

累積分布関数

\[ \begin{aligned} F_X(x;p) = 1-(1-p)^{x+1} \end{aligned} \]


累積分布関数の導出:

\[ \begin{aligned} F_X(x;p) &= \sum_{k=0}^x p(1-p)^k \cr &= p + p(1-p) + p(1-p)^2 +\cdots p(1-p)^x \cr (1-(1-p))F_X(x;p) &= (p + p(1-p) + p(1-p)^2 +\cdots p(1-p)^x) \cr &\quad - (p(1-p) + p(1-p)^2 +\cdots p(1-p)^{x+1}) \cr &= p - p(1-p)^{x+1} \cr \cr \therefore F_X(x;p) &= 1-(1-p)^{x+1} \end{aligned} \]


累積分布関数のグラフ:

pmf

# Python 3
from scipy.stats import geom
import matplotlib.pyplot as plt

cases = [
    .2, # p
    .5,
    .8,
]

plt.figure()
for p in cases:
    x = range(10)
    dist = geom.cdf(list(map(lambda k: k+1, x)), p)
    plt.plot(x, dist, marker='o', label="p={}".format(p))

plt.title("CDF of geometric distribution")
plt.xlabel("Number of failures")
plt.ylabel("Probability")
plt.legend()
plt.show()

期待値

\[ E[X] = \frac{1-p}{p} \]


期待値の導出:

\[ \begin{aligned} E[X] &= \sum_{k=0}^\infty kf_X(k;p) \cr &= \sum_{k=0}^\infty kp(1-p)^k \cr &= p\sum_{k=0}^\infty k(1-p)^k \cr (1-(1-p))E[X] &= p\left[\sum_{k=0}^\infty k(1-p)^k - \sum_{k=0}^\infty k(1-p)^{k+1}\right] \cr &= p\sum_{k=0}^\infty(1-p)^{k+1} \cr E[X] &= \sum_{k=0}^\infty(1-p)^{k+1} \cr (1-(1-p))E[X] &= \sum_{k=0}^\infty(1-p)^{k+1} - \sum_{k=0}^\infty(1-p)^{k+2} \cr &= \lim_{k\to\infty}\left[(1-p)-(1-p)^{k+2}\right] \cr E[X] &= \lim_{k\to\infty}\frac{1-p-(1-p)^{k+2}}{p} \cr \end{aligned} \]

$0\lt p\lt 1$ であるため、

\[ \therefore E[X] = \frac{1-p}{p} \]

分散

\[ V[X] = \frac{1-p}{p^2} \]


分散の導出:

分散の諸定理により、

\[ \begin{aligned} V[X] &= E[X^2] - E[X]^2 \cr &= \sum_{k=0}^\infty k^2f_X(k;p) - \left(\frac{1-p}{p}\right)^2 \cr &= \sum_{k=0}^\infty k^2p(1-p)^k - \frac{(1-p)^2}{p^2} \cr &= p\sum_{k=0}^\infty k^2(1-p)^k - \frac{(1-p)^2}{p^2} \cr \end{aligned} \tag{1} \]

幾何分布の期待値から、

\[ \begin{aligned} p\sum_{k=0}^\infty k(1-p)^k &= \frac{1-p}{p} \cr \sum_{k=0}^\infty k(1-p)^k &= \frac{1-p}{p^2} \cr \frac{\mathrm d}{\mathrm dp}\left[\sum_{k=0}^\infty k(1-p)^k\right] &= \frac{\mathrm d}{\mathrm dp}\left(\frac{1-p}{p^2}\right) \cr -\sum_{k=0}^\infty k^2(1-p)^{k-1} &= -\frac{2-p}{p^3} \cr \sum_{k=0}^\infty k^2(1-p)^k &= \frac{(1-p)(2-p)}{p^3} \end{aligned} \tag{2} \]

$(1),(2)$ より、

\[ \begin{aligned} V[X] &= p\cdot\frac{(1-p)(2-p)}{p^3} - \frac{(1-p)^2}{p^2} \cr &= \frac{1-p}{p^2} \cr \cr \therefore V[X] &= \frac{1-p}{p^2} \end{aligned} \]

幾何分布の無記憶性

幾何分布は、無記憶性 (英:memoryless property) を持つ唯一の離散確率分布である。幾何分布の無記憶性とは、幾何分布の確率は過去の失敗回数の影響を受けない性質のこと。

\[ P(X\ge m+n\mid X\ge m) = P(X\ge n) \]


幾何分布の無記憶性の証明:

\[ \begin{aligned} P(X\ge n) &= 1-F_X(n-1;p) \cr &= 1-(1-(1-p)^{(n-1)+1}) \cr &= (1-p)^n \cr \cr P(X\ge m+n \mid X\ge m) &= \frac{P(X\ge m+n)}{P(X\ge m)} \cr &= \frac{(1-p)^{m+n}}{(1-p)^m} \cr &= (1-p)^n \cr &= P(X\ge n) \cr \cr \therefore P(X\ge m+n\mid X\ge m) &= P(X\ge n) \end{aligned} \]

関連記事

参考文献

統計学入門 (基礎統計学Ⅰ)

東京大学出版会
売り上げランキング: 3,194

Tags

#Ansible (3) #Bash (1) #Docker (1) #Git (2) #Hugo (2) #Molecule (1) #Python (1) #WSLtty (1) #アルゴリズム (4) #ビジネス用語 (1) #プログラミング (1) #位相空間論 (8) #初等数学 (20) #初等関数 (1) #実解析 (1) #幾何学 (3) #微分積分学 (18) #情報理論 (4) #抽象代数学 (14) #数理モデル (2) #数理論理学 (21) #機械学習 (3) #正規表現 (1) #測度論 (3) #特殊関数 (4) #確率論 (18) #組合せ論 (5) #統計学 (12) #線型代数学 (18) #複素解析学 (4) #解析学 (15) #論理学 (6) #順序集合論 (9)