blue271828's misc :-)

イェンセンの不等式

イェンセンの不等式

イェンセンの不等式 (英:Jensen's inequality) とは、凸関数 ff において次式が成り立つことを主張したもの。

i=1nλif(xi)f(i=1nλixi)(i=1nλi=1) \sum_{i=1}^n\lambda_i f(x_i)\ge f\left(\sum_{i=1}^n\lambda_i x_i\right) \quad\left(\sum_{i=1}^n \lambda_i = 1\right)


イェンセンの不等式の証明:

次の不等式が成り立つと仮定する。

i=1nλif(xi)f(i=1nλixi)(i=1nλi=1)(1) \sum_{i=1}^n\lambda_i f(x_i)\ge f\left(\sum_{i=1}^n\lambda_i x_i\right) \quad\left(\sum_{i=1}^n \lambda_i = 1\right) \tag{1}

n=1n=1 のとき、以下により (1)(1) は成り立つ。

i=11λif(xi)f(i=11λixi)λ1f(x1)f(λ1x1)f(x1)f(x1)(i=11λi=λ1=1) \begin{aligned} \sum_{i=1}^1\lambda_i f(x_i) &\ge f\left(\sum_{i=1}^1\lambda_i x_i\right) \cr \lambda_1 f(x_1) &\ge f(\lambda_1 x_1) \cr f(x_1) &\ge f(x_1) \quad \because \left(\sum_{i=1}^1 \lambda_i = \lambda_1 = 1\right) \end{aligned}

n=2n=2 のとき、凸関数の定義が導かれ、ff は凸関数であるため (1)(1) が成り立つ。

i=12λif(xi)f(i=12λixi)λ1f(x1)+λ2f(x2)f(λ1x1+λ2x2)λ1f(x1)+(1λ1)f(x2)f(λ1x1+(1λ1)x2)(i=12λi=1) \begin{aligned} \sum_{i=1}^2\lambda_i f(x_i) &\ge f\left(\sum_{i=1}^2\lambda_i x_i\right) \cr \lambda_1f(x_1)+\lambda_2f(x_2) &\ge f(\lambda_1 x_1+\lambda_2 x_2) \cr \lambda_1f(x_1)+(1-\lambda_1)f(x_2) &\ge f(\lambda_1 x_1+(1-\lambda_1) x_2) \quad \because \left(\sum_{i=1}^2 \lambda_i = 1\right) \end{aligned}

n=k+1n=k+1 のとき、

i=1k+1λif(xi)=i=1kλif(xi)+λk+1f(xk+1)Λ=i=1kλi(i=1k+1λi=1,i=1kλi1)(2) \begin{aligned} \sum_{i=1}^{k+1}\lambda_if(x_i) &= \sum_{i=1}^k\lambda_i f(x_i) + \lambda_{k+1}f(x_{k+1}) \cr \varLambda^\prime &= \sum_{i=1}^k \lambda_i \quad \because \left(\sum_{i=1}^{k+1}\lambda_i = 1,\sum_{i=1}^{k}\lambda_i \ne 1\right) \cr \end{aligned} \tag{2}

(1)(1) が仮定されているため、(2)(2) から次式が得られる。

i=1kλif(xi)=Λi=1kλiΛ(i=1kλiΛ=1)(3) \begin{aligned} \sum_{i=1}^k\lambda_i f(x_i) &= \varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime} \quad \left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime} = 1\right) \end{aligned} \tag{3}

よって (2),(3)(2),(3) から以下が導かれ、数学的帰納法によりイェンセンの不等式が証明される。

i=1k+1λif(xi)=i=1kλif(xi)+λk+1f(xk+1)=Λi=1kλiΛf(xi)+λk+1f(xk+1)Λf(i=1kλiΛxi)+λk+1f(xk+1)(i=1kλiΛ=1)Λf(i=1kλiΛxi)+λk+1f(xk+1)f(Λi=1kλiΛxi+λk+1xk+1)(Λ+λk+1=1)f(Λi=1kλiΛxi+λk+1xk+1)=f(i=1kλixi+λk+1xk+1)=f(i=1k+1λixi)i=1k+1λif(xi)f(i=1k+1λixi) \begin{aligned} \sum_{i=1}^{k+1}\lambda_if(x_i) &= \sum_{i=1}^k\lambda_i f(x_i) + \lambda_{k+1}f(x_{k+1}) \cr &= \varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}f(x_i) + \lambda_{k+1}f(x_{k+1}) \cr &\ge \varLambda^\prime f\left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i\right) + \lambda_{k+1}f(x_{k+1}) \quad \because\left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime} = 1\right) \cr \cr \varLambda^\prime f\left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i\right) + \lambda_{k+1}f(x_{k+1}) &\ge f\left(\varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i+\lambda_{k+1}x_{k+1}\right) \quad \because\left(\varLambda^\prime+\lambda_{k+1}=1\right) \cr f\left(\varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i+\lambda_{k+1}x_{k+1}\right) &= f\left(\sum_{i=1}^k\lambda_ix_i+\lambda_{k+1}x_{k+1}\right) \cr &= f\left(\sum_{i=1}^{k+1}\lambda_ix_i\right) \cr \cr \therefore \sum_{i=1}^{k+1}\lambda_if(x_i) &\ge f\left(\sum_{i=1}^{k+1}\lambda_ix_i\right) \end{aligned}

関連記事

 

参考文献

Tags

#Ansible (3) #Bash (1) #Docker (1) #Git (2) #Hugo (2) #Molecule (1) #Python (1) #WSLtty (1) #アルゴリズム (4) #ビジネス用語 (1) #プログラミング (1) #位相空間論 (8) #初等数学 (20) #初等関数 (1) #実解析 (1) #幾何学 (3) #微分積分学 (18) #情報理論 (4) #抽象代数学 (14) #数理モデル (2) #数理論理学 (21) #機械学習 (3) #正規表現 (1) #測度論 (3) #特殊関数 (4) #確率論 (18) #組合せ論 (5) #統計学 (12) #線型代数学 (18) #複素解析学 (4) #解析学 (15) #論理学 (6) #順序集合論 (9)