blue271828's misc :-)

イェンセンの不等式

イェンセンの不等式

イェンセンの不等式 (英:Jensen's inequality) とは、凸関数 $f$ において次式が成り立つことを主張したもの。

\[ \sum_{i=1}^n\lambda_i f(x_i)\ge f\left(\sum_{i=1}^n\lambda_i x_i\right) \quad\left(\sum_{i=1}^n \lambda_i = 1\right) \]


イェンセンの不等式の証明:

次の不等式が成り立つと仮定する。

\[ \sum_{i=1}^n\lambda_i f(x_i)\ge f\left(\sum_{i=1}^n\lambda_i x_i\right) \quad\left(\sum_{i=1}^n \lambda_i = 1\right) \tag{1} \]

$n=1$ のとき、以下により $(1)$ は成り立つ。

\[ \begin{aligned} \sum_{i=1}^1\lambda_i f(x_i) &\ge f\left(\sum_{i=1}^1\lambda_i x_i\right) \cr \lambda_1 f(x_1) &\ge f(\lambda_1 x_1) \cr f(x_1) &\ge f(x_1) \quad \because \left(\sum_{i=1}^1 \lambda_i = \lambda_1 = 1\right) \end{aligned} \]

$n=2$ のとき、凸関数の定義が導かれ、$f$ は凸関数であるため $(1)$ が成り立つ。

\[ \begin{aligned} \sum_{i=1}^2\lambda_i f(x_i) &\ge f\left(\sum_{i=1}^2\lambda_i x_i\right) \cr \lambda_1f(x_1)+\lambda_2f(x_2) &\ge f(\lambda_1 x_1+\lambda_2 x_2) \cr \lambda_1f(x_1)+(1-\lambda_1)f(x_2) &\ge f(\lambda_1 x_1+(1-\lambda_1) x_2) \quad \because \left(\sum_{i=1}^2 \lambda_i = 1\right) \end{aligned} \]

$n=k+1$ のとき、

\[ \begin{aligned} \sum_{i=1}^{k+1}\lambda_if(x_i) &= \sum_{i=1}^k\lambda_i f(x_i) + \lambda_{k+1}f(x_{k+1}) \cr \varLambda^\prime &= \sum_{i=1}^k \lambda_i \quad \because \left(\sum_{i=1}^{k+1}\lambda_i = 1,\sum_{i=1}^{k}\lambda_i \ne 1\right) \cr \end{aligned} \tag{2} \]

$(1)$ が仮定されているため、$(2)$ から次式が得られる。

\[ \begin{aligned} \sum_{i=1}^k\lambda_i f(x_i) &= \varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime} \quad \left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime} = 1\right) \end{aligned} \tag{3} \]

よって $(2),(3)$ から以下が導かれ、数学的帰納法によりイェンセンの不等式が証明される。

\[ \begin{aligned} \sum_{i=1}^{k+1}\lambda_if(x_i) &= \sum_{i=1}^k\lambda_i f(x_i) + \lambda_{k+1}f(x_{k+1}) \cr &= \varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}f(x_i) + \lambda_{k+1}f(x_{k+1}) \cr &\ge \varLambda^\prime f\left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i\right) + \lambda_{k+1}f(x_{k+1}) \quad \because\left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime} = 1\right) \cr \cr \varLambda^\prime f\left(\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i\right) + \lambda_{k+1}f(x_{k+1}) &\ge f\left(\varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i+\lambda_{k+1}x_{k+1}\right) \quad \because\left(\varLambda^\prime+\lambda_{k+1}=1\right) \cr f\left(\varLambda^\prime\sum_{i=1}^k\frac{\lambda_i}{\varLambda^\prime}x_i+\lambda_{k+1}x_{k+1}\right) &= f\left(\sum_{i=1}^k\lambda_ix_i+\lambda_{k+1}x_{k+1}\right) \cr &= f\left(\sum_{i=1}^{k+1}\lambda_ix_i\right) \cr \cr \therefore \sum_{i=1}^{k+1}\lambda_if(x_i) &\ge f\left(\sum_{i=1}^{k+1}\lambda_ix_i\right) \end{aligned} \]

関連記事

 

参考文献

Tags

#Ansible (3) #Bash (1) #Docker (1) #Git (2) #Hugo (2) #Molecule (1) #Python (1) #WSLtty (1) #アルゴリズム (4) #ビジネス用語 (1) #プログラミング (1) #位相空間論 (8) #初等数学 (20) #初等関数 (1) #実解析 (1) #幾何学 (3) #微分積分学 (18) #情報理論 (4) #抽象代数学 (14) #数理モデル (2) #数理論理学 (21) #機械学習 (3) #正規表現 (1) #測度論 (3) #特殊関数 (4) #確率論 (18) #組合せ論 (5) #統計学 (12) #線型代数学 (18) #複素解析学 (4) #解析学 (15) #論理学 (6) #順序集合論 (9)