確率分布とは
確率空間 (Ω,F,Pr) において標本空間 Ω を定義域とする実関数 X:Ω→R を Ω 上の確率変数 (英:random variable) と呼ぶ。また確率変数の値域が可算であることを離散型 (英:discrete) 、値域が連続であることを連続型 (英:continuous) と呼ぶ。X の値に、その値をとる確率を対応させたものを確率分布 (英:probability distribution) という。X は次式で表される。
∀x∈R ({ω∈Ω∣X(ω)≤x}∈F)(x∈B(R))
累積分布関数
確率変数 X が x 以下になる確率を求める関数 FX:R→[0,1] を累積分布関数 (英:cumulative distribution function, CDF) という。下側確率 (英:lower-tail probability) とも呼ばれる。
FX(x)=Pr(X≤x)=Pr({ω∈Ω∣X(ω)≤x})
累積分布関数は、以下の性質を持っている。
(C1)(C2)(C3)(C4):x→−∞limFX(x)=0:x→+∞limFX(x)=1:x≤y⇒FX(x)≤FX(y):P(a<X≤b)=FX(b)−FX(a)
相補累積分布関数
相補累積分布関数 (英:complementary cumulative distribution function, CCDF) とは、確率変数 X が x より大きくなる確率を求める関数 FˉX:R→[0,1] のこと。上側確率 (英:upper-tail probability) とも呼ばれる。
FˉX(x)=Pr(X>x)=1−FX(x)
確率質量関数
確率分布が離散型であり、確率変数の値 x に対応させる非負関数 PX が存在するとき、PX を確率質量関数 (英:probability mass function, PMF) という。
FX(x)=xi≤x∑PX(xi)=xi≤x∑Pr(X=xi)
確率密度関数
確率分布が連続型であり、次式を満たす非負関数 pX が存在するとき、pX を確率密度関数 (英:probability density function, PDF) という。
FX(x)=∫−∞xpX(u) du=Pr(X≤x)
また、もし FX が微分可能であれば、さらに次式が成り立つ。
pX(x)=dxdFX(x)
規格化条件
確率質量関数および確率密度関数は、確率測度の定義から次式を条件を満たさなければならない。この条件を規格化条件 (英:normalization condition) という。
⎩⎪⎪⎪⎨⎪⎪⎪⎧x∑P(x)=1∫−∞∞p(x) dx=1⋯PMF⋯PDF
またある関数 φ が規格化条件を満たさないとき、定数 c を掛け合わせて条件を満たそうとすることがある。この操作は規格化 (英:normalization) と呼ばれ、c を規格化定数 (英:normalizing constant) と呼ぶ。
⎩⎪⎪⎪⎨⎪⎪⎪⎧x∑cφ(x)=1∫−∞∞cφ(x) dx=1if φ is discrete functionif φ is continuous function c:normalizing constant
関連記事
参考文献
稲井 寛
森北出版
売り上げランキング: 43,700