以下,全て1変数の凸函数についての性質を幾つか挙げる.
$L:\mathbb{R} \to \mathbb{R}$ が凸函数であるとは, ${}^\forall v,w\in \mathbb{R},{}^\forall \theta \in [0,1],$
\begin{align}
L\bigl( \theta v + (1-\theta) w \bigr)\leq \theta L(v) +(1-\theta) L(w)
\end{align} をみたすことである.
また,対称的に, $L:\mathbb{R} \to \mathbb{R}$ が凹函数であるとは,$-L$ が凸函数であることをいう.
高校の数学で学ぶ「下に凸な函数」 は凸函数のことであり,「上に凸な函数」は凹函数のことである.
$\alpha\geq1$ とする. $f(x) = |x|^{\alpha}, \ x \in \mathbb{R}$ は凸函数である.
微分可能な凸函数について,(著者が)頻繁に用いる次の不等式を挙げておく.
$L \in C^{1}(\mathbb{R})$ を凸函数とする. このとき, 各 $x\in \mathbb{R}$ に対して,
\begin{align*}
L(y) \geq L(x) + L'(x)\cdot (y-x), \quad y \in \mathbb{R} \qquad \tag{1}
\end{align*}
が成り立つ.
この不等式は, $L$ の各点でその点に於ける接線が常に $L$ の下側にあることを表している. 証明は[1]を参照.
微分可能性を仮定しない凸函数に対しては, "subdifferential"(劣微分,劣勾配などと呼ぶ [2])を用いて,次の様に言い換えられる:
$L \in C(\mathbb{R})$ を凸函数とする. このとき,
\begin{align}
{}^\forall x \in \mathbb{R}, \quad D^{-}L(x) \neq \emptyset
\end{align}
が成り立つ.
この補題は, $L$ が凸函数であれば全ての点で下から接する滑らかな函数(具体的には $C^{1}$ 級)が存在することを示している. 証明は, 凸集合による分離定理に根差したものによるが, 詳しくは [1] を参照のこと.
この補題より, 微分可能性を仮定しない凸函数に対して, (1)に該当する次の不等式が導かれる:
$L \in C(\mathbb{R})$ を凸函数, $ x \in \mathbb{R},\ p\in D^{-}L(x) $ とする. このとき, ${}^\exists \delta>0 \ {\rm s.t.}$
\begin{align}
L(y)\geq L(x) + p \cdot (y-x), \quad y \in B_{\delta}(x)
\end{align}
が成り立つ.
但し, $ B_{\delta}(x):={z\in \mathbb{R} \mid |z-x|<\delta }$ とする.
これは, $x$ の近傍での評価であることに注意する. 証明は, [2] の Lemma1.7(b) を参照のこと.
以上より, 微分可能性を仮定しないより一般の凸函数に対しても,この不等式を適用できることが分かる.
その一例として, 凸かつ強圧的の条件をみたす Lagrangian $L$ を与えたときに, $L$ のLegendre変換 $L^{*}$ でHamiltonian $H$ を定義できることの証明にこの命題が用いられる. 詳しくは[3]を参照.(次の記事で書く予定.)
参考文献