結合確率分布
Contents
結合確率分布とは
結合確率分布 (英:joint probability distribution) とは、複数の確率変数に確率を対応させた確率分布のこと。本稿では二変量の結合確率分布を使って説明する。
\[ \Pr(X=x,Y=y) \]
二変量正規分布のグラフ例:
# Python3
from scipy.stats import norm
from mpl_toolkits import mplot3d
import numpy as np
import matplotlib.pyplot as plt
cases = [
(0, 1., 0, 1.),
]
plt.figure()
ax = plt.axes(projection="3d")
for m_1,s_1,m_2,s_2 in cases:
x = np.arange(-5,5,.1)
xx, yy = np.meshgrid(x,x)
p_1 = norm.pdf(xx,m_1,s_1)
p_2 = norm.pdf(yy,m_2,s_2)
ax.plot_surface(xx,yy,p_1*p_2, cmap='coolwarm')
plt.title("Joint PDF of bivariate normal distribution")
ax.set_xlabel("$x$")
ax.set_ylabel("$y$")
ax.set_zlabel("$f_{X,Y}(x,y)$")
plt.show()
結合確率質量関数
確率測度の値域が離散型で、かつ次式を満たすとき、非負実関数 $P_{X,Y}$ を結合確率質量関数 (英:joint probability mass function) という。
\[ \sum_x\sum_y P_{X,Y}(x,y) = 1 \quad (f(x,y)\ge 0) \]
結合確率密度関数
確率測度の値域が連続型で、かつ次式を満たすとき、非負実関数 $p_{X,Y}$ を結合確率密度関数 (英:joint probability density function) という。
\[ \iint p_{X,Y}(x,y)~dxdy = 1 \quad (p(x,y)\ge 0) \]
結合累積分布関数
確率変数 $X,Y$ それぞれの値が $x,y$ 以下である確率を結合累積分布関数 (英:joint cumulative distribution function) という。
\[ \begin{aligned} F_{X,Y}(x,y) &= P(X\le x,Y\le y) \\ &= \begin{cases} \displaystyle\sum_{u\le x}\sum_{v\le y} P_{X,Y}(u,v) & \text{if discrete} \\ \displaystyle\int_{-\infty}^x\int_{-\infty}^y p_{X,Y}(u,v)~dudv & \text{if continuous} \\ \end{cases} \end{aligned} \]
周辺累積分布関数
結合累積分布関数 $F_{X,Y}$ の引数 $x,y$ のいずれかを無限大 $\infty$ にすると、全確率の公式により引数を無限大にした確率変数を消去した累積分布関数を得ることができる。このときこの分布関数を周辺分布関数 (英:marginal distribution function) という。
\[ \begin{aligned} F_X(x) &= F_{X,Y}(x,\infty) \\ F_Y(y) &= F_{X,Y}(\infty,y) \\ \end{aligned} \]
結合確率分布の独立性
累積分布関数 $F_{X,Y}$ と $F_{X,Y}$ の周辺分布関数 $F_X,F_Y$ において、次式が成り立つとき $X$ と $Y$ は互いに独立 (英:independent) であるという。
\[ F_{X,Y}(x,y) = F_X(x)F_Y(y) \]