変分法について

673

変分法とは

変分法とは、汎函数の最大･最小を考えるために用いられるもので、普通の(?)函数の最大･最小を考えるために用いられる微分法に似たものです。汎函数は「函数の函数」とでも言うべきもので、通常の函数がスカラーを引数にとりスカラーを返すのに対し、汎函数は函数を引数にとりスカラーを返します。ここでは特に以下のような積分で表されるものを扱います。
$$I[f(x)]=\int_a^bF\left(x,f,\frac{df}{dx}\right)dx$$
なお、変分法は主に物理で用いられるため、ここでは微分可能性や微分と積分の順序交換などの細かい議論は省きます。

変分問題の解き方

微分法における最大･最小問題の解法のポイントは、$y=f(x)$について、$y$の変化が小さくなるような$x$、即ち停留点を見つけることにありました。
$$\begin{align*}&\qquad\left.\frac{dy}{dx}\right|_{x=a}=0\\\ &\to\ x=a\text{の付近で}y\text{の変化が十分に小さい}\\\ &\to\ x=a\text{が停留点となる}\end{align*}$$
これが基本的な流れです。これと同様に汎函数でも最大･最小を議論したいのですが、$\displaystyle\frac{dI}{df}$などというものを考えるのは難しいです。そのため、少し違う方法でアプローチします。まず、「微分」とは本来微小変化、即ち以下のように表される量を意味します($1$変数函数における全微分と考えてもよいです)。

微分の定義

$$df=f(x+dx)-f(x)$$

これと同様に、汎函数においても汎函数の微小変化として変分を考えます。ただ、函数の変化の仕方は色々あって扱いづらいため、函数の微小変化として「何らかの函数の微小スカラー倍」を使うことを考えます。

変分の定義

$$d_\delta I[f(x)](t)=I[f(x)+\delta(x)dt]-I[f(x)]$$

これを用いて、汎函数$I$の$\delta$方向のガトー微分(方向微分の一般化)を次のように定義します。

汎函数のガトー微分

$$D_\delta I[f(x)]=\lim_{dt\to0}\frac{d_\delta I[f(x)](t)}{dt}$$

汎函数のガトー微分が定義できたので、停留函数を見つけることができます。
$$\begin{align*}&\qquad\text{任意の}\delta \text{について}\left.D_\delta I[f(x)]\right|_{f=f_0}=0\\\ &\to\ f=f_0\text{の付近で}I\text{の変化が十分に小さい}\\\ &\to\ f=f_0\text{が停留函数となる}\end{align*}$$
なお、後々のため、$\delta(x)$は汎函数の定積分の端点$a,b$において$0$であるものとします。

Euler-Lagrange方程式

それでは、汎函数
$$I[f(x)]=\int_a^bF\left(x,f,\frac{df}{dx}\right)dx$$
の停留函数を求めましょう。境界条件$\delta(a)=\delta(b)=0$を満たすような函数$\delta$方向のガトー微分が$0$になればよいので、
$$\begin{align*}D_\delta I[f(x)]&=\lim_{dt\to0}\frac{I[f(x)+\delta(x)dt]-I[f]}dt\\&=\frac d{dt}\int_a^bF\left(x,f,\frac{df}{dx}\right)dx\\&=\int_a^b\frac d{dt}F\left(x,f,\frac{df}{dx}\right)dx\\&=\int_a^b\left(\frac{\partial F}{\partial f}\cdot\frac{\partial f}{\partial t}+\frac{\partial F}{\partial f'}\cdot\frac{\partial f'}{\partial t}\right)dx\\&=\int_a^b\left(\frac{\partial F}{\partial f}\delta(x)+\frac{\partial F}{\partial f'}\delta'(x)\right)dx\\&=\int_a^b\frac{\partial F}{\partial f}\delta(x)dx+\left[\frac{\partial F}{\partial f'}\delta(x)\right]_a^b-\int_a^b\frac d{dx}\frac{\partial F}{\partial f'}\delta(x)dx\\&=\int_a^b\left(\frac{\partial F}{\partial f}-\frac d{dx}\frac{\partial F}{\partial f'}\right)\delta(x)dx\end{align*}$$
これが境界条件を満たす任意の函数$\delta$に対して0になることから、次の定理が成り立ちます。

Euler-Lagrange方程式

$$f_0(x)\text{が汎函数}I[f(x)]=\int_a^bF\left(x,f,\frac{df}{dx}\right)dx\text{の停留函数となる}\\\Leftrightarrow f=f_0で\frac{\partial F}{\partial f}-\frac d{dx}\frac{\partial F}{\partial f'}=0$$
また、この微分方程式をEuler-Lagrange方程式と呼ぶ。

凸汎函数

変分問題においては、凸汎函数と呼ばれる種類の汎函数が重要な性質を持ちます。

凸汎函数の定義

任意の函数$f,g$について以下の不等式が成り立つとき、汎函数$I$を凸汎函数であるという。
$$I[f(x)+g(x)]\geq I[f(x)]+D_gI[f(x)]$$

また、$-I$が凸汎函数であるとき、$I$は凹汎函数と呼ばれます。
さて、函数$f(x)$が汎函数$I$の停留函数であると分かっているとき、任意の函数$g$に対して$D_gI[f(x)]=0$が成り立ちます。更に$I$が凸汎函数であるとき、定義より次の不等式が成り立ちます。
$$I[f(x)+g(x)]\geq I[f(x)]$$
これより、$f(x)$は汎函数$I$を最小化する函数であると分かります。

汎函数を最小化する充分条件

汎函数$I$が凸であるとき、
$$f(x)\text{が}I\text{の停留函数}\Rightarrow f(x)\text{が}I\text{を最小化する}$$

しかし、定義通りに汎函数の凸性を判定しようとすると困難なので、$2$変数凸函数の性質を利用して判定します。

$2$変数凸函数

一般の正整数$n$について、$n$変数凸函数とは次の性質を持つ函数$f$のことを言います。

$n$次元凸函数の定義

任意の$n$次元ベクトル$\boldsymbol x,\boldsymbol y$と$0< t<1$なる実数$t$について、
$$f(t\boldsymbol x+(1-t)\boldsymbol y)\leq tf(\boldsymbol x)+(1-t)f(\boldsymbol y)$$
が成り立つとき、$f$を凸函数という。

式のままだとイメージが沸きづらいと思うので、グラフ的に説明します。まず、$1$変数の場合は$x^2+2x$や$\cosh x$などが凸函数となります。つまり、$1$変数の凸函数とはいわゆる「下に凸な」函数のことです。同様に$2$変数凸函数$f$でも、$3$次元座標空間内に$z=f(x,y)$のグラフを描くと$z$軸の負の方向(下)に出っ張った形になります。例えば$2$変数函数$x^2+y^2$は凸函数です。
このグラフのイメージから、$2$変数凸函数のグラフ上の任意の点における接平面はグラフよりも下にあることが分かります。曲面$C:z=f(x,y)$の点$(x_0,y_0)$で$C$に接する平面の方程式は
$$z=f(x_0,y_0)+f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)$$
ですから($f_x,f_y$はそれぞれ$f$の$x,y$についての偏導関数)、次の定理が成り立ちます。

$f(x,y)$が凸函数であるとき、任意の$x_0,y_0$について、以下の不等式が任意の$x,y$で成り立つ。
$$f(x,y)\geq f(x_0,y_0)+f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)$$

この性質を使って汎函数の凸性を判定します。

汎函数の凸性の判定

結論から言うと、$I[f]$の被積分函数$F\left(x,f,\displaystyle\frac{df}{dx}\right)$を$f,\displaystyle\frac{df}{dx}$についての$2$変数函数$G\left(f,\displaystyle\frac{df}{dx}\right)$と見なしたとき、$G$が凸函数になれば$I$は凸汎函数になります。以下、そのことを証明します。
まず、$G(s,t)$が凸函数であることから、
$$G(s,t)\geq G(s_0,t_0)+G_s(s_0,t_0)(s-s_0)+G_t(s_0,t_0)(t-t_0)$$
これに$$s=f(x)+g(x),s_0=f(x),t=f'(x)-g'(x),t_0=f'(x)$$を代入して
$$\quad G\left(f+g,\frac{df}{dx}-\frac{dg}{dx}\right)\\\geq G\left(f,\frac{df}{dx}\right)+G_s\left(f,\frac{df}{dx}\right)g(x)+G_t\left(f,\frac{df}{dx}\right)g'(x)\\=G+\frac{\partial G}{\partial f}g(x)+\frac{\partial G}{\partial f'}g'(x)$$
両辺を$a\leq x\leq b$で積分し、函数$F$を用いて書き改めると
$$\int_a^bF\left(x,f+g,\frac{d(f+g)}{dx}\right)dx\\\geq\int_a^bF\left(x,f,\frac{df}{dx}\right)dx+\int_a^b\left(\frac{\partial F}{\partial f}g(x)+\frac{\partial F}{\partial f'}g'(x)\right)dx$$
ここで、
$$D_gI[f(x)]=\int_a^b\left(\frac{\partial F}{\partial f}g(x)+\frac{\partial F}{\partial f'}g'(x)\right)dx$$
であったので、
$$I[f(x)+g(x)]\geq I[f(x)]+D_gI[f(x)]$$
これが任意の$f,g$で成り立つことから、$I$が凸汎函数であることが示されました。

凸汎函数の充分条件

$F(x,y,z)$が$y,z$についての凸函数
$\Rightarrow$汎函数${\displaystyle\int_a^bF\left(x,f,\frac{df}{dx}\right)dx}$は凸

これで(一部の)汎函数の最小化問題が解けるようになったので、実際に簡単な例題を解いてみましょう。

例題

問題

$xy$-座標平面上で光が原点から点$(2,2)$に進む。以下の$2$つの場合についてその経路を求めよ。
$(1)$ 座標平面全体が真空(屈折率$1$)である
$(2)$ $x$座標が$x$の部分が屈折率$1+x$の透明な物質で満たされている

フェルマーの原理より、光は到達時間が最小になるような経路を通ります。故に、光路を曲線$y=f(x)$ $(0< x<2)$として、それぞれの場合において到達時間を計算し、それを最小化する$f$を求めます。なお、真空中の光速は$c$とし、始点および終点の条件から$f(0)=0$,$f(2)=2$が成り立つことに注意します。
$$\ $$
$(1)$ 解答
曲線$y=f(x)\ (0< x<2)$の長さは$$\int_0^2\sqrt{1+\left(\frac{df}{dx}\right)^2}dx$$
で表されるので、到達時間を$T[f]$とすれば
$$T[f]=\frac1c\int_0^2\sqrt{1+\left(\frac{df}{dx}\right)^2}dx$$
となります。$y=\sqrt{1+x^2}$は凸函数であるので、グラフを考えれば$\sqrt{1+\left(\displaystyle\frac{df}{dx}\right)^2}$は$f$,$\displaystyle\frac{df}{dx}$についての凸函数であると分かります。即ち、$T[f]$も凸です。ですから、停留函数を見つければこれが求める函数になります。
この汎函数のEuler-Lagrange方程式は
$$-\frac1c\cdot\frac d{dx}\frac{f'}{\sqrt{1+f'^2}}=0$$
まず、$x$で微分して$0$になるのは定数函数のみなので、任意定数$C_0(\neq\pm1)$を用いて
$$\frac{f'}{\sqrt{1+f'^2}}=C_0$$
と書けます。これより$f'$が求まりますが、$f'$は実数であってほしいので$-1< C_0<1$とします。
$$f'(x)=\pm C_0\sqrt{\frac1{1-C_0^2}}$$
$C_0$が開区間$(-1,1)$全体を動くとき右辺は実数全体を動くので、これを新たに$C_1$とおきます。よって$f$は、任意定数$C_1,C_2$を用いて
$$f(x)=C_1x+C_2$$
と書けます。ここで、境界条件$f(0)=0$,$f(2)=2$から$C_1=1$,$C_2=0$となり、求める函数は$f(x)=x$になります。
こちらはかなり自明な結果になりました。
$$\ $$
$(2)$ 解答
屈折率$n$の物質中での光速は$\displaystyle\frac cn$であるので、到達時間$T[f]$は
$$T[f]=\frac1c\int_0^2(1+x)\sqrt{1+\left(\frac{df}{dx}\right)^2}dx$$
と表せます。$1+x$は$f,f'$に依らないので、(1)と同様に$T$は凸汎函数であることが分かり、停留函数によって最小化されることになります。そして、(1)と同様のEuler-Lagrange方程式により
$$(1+x)\frac{f'}{\sqrt{1+f'^2}}=C_0$$
が成り立つことが分かります($C_0$は任意定数)。これを整理して、
$$\begin{align*}f(x)&=\int \pm C_0\sqrt{\frac1{(x+1)^2-C_0^2}}dx\\&=\pm C_0\int\sqrt{\frac1{\sinh^2t}}\cdot C_0\sinh tdt\quad(x+1=C_0\cosh t)\\&=\pm C_0^2t+C_2\quad(\because0\leq x\rightarrow0\leq\sinh t)\\&=C_1\cosh^{-1}(x+1)+C_2\end{align*}$$
ただし、$C_1=\pm C_0^2,C_2$は任意定数です。ここで、境界条件から
$$\left\{\begin{array}{l}C_1\cosh^{-1}1+C_2=C_2=0\\C_1\cosh^{-1}3+C_2=2\end{array}\right.\\\rightarrow(C_1,C_2)=\left(\frac2{\cosh^{-1}3},0\right)\\\therefore f(x)=\frac2{\cosh^{-1}3}\cosh^{-1}(x+1)$$
屈折率の条件を付け加えるだけで、逆双曲線函数が出てきました。

例題2

$f$と$\displaystyle\frac{df}{dx}$の両方が含まれるものもやっておきます。

問題

境界条件$f(-1)=f(1)=1$を満たす函数$f$に対して、汎函数
$$I[f]=\int_{-1}^1\left(f(x)^2+f'(x)^2\right)dx$$
の最小値をとるときの$f$を求めよ。

$$\ $$
解答
グラフを考えれば$f(x)^2+f'(x)^2$は$f$,$\displaystyle\frac{df}{dx}$についての凸函数であると分かります。即ち、$I[f]$も凸です。ですから、停留函数を見つければこれが求める函数になります。
Euler-Lagrange方程式を立てると
$$2f(x)-\frac d{dx}2f'(x)=0\quad\therefore f(x)=f''(x)$$
これを解いて
$$f(x)=C_1e^x+C_2e^{-x}$$
ただし、$C_1,C_2$は任意定数。ここで、境界条件から
$$\left\{\begin{array}{l}C_1e+C_2e^{-1}=1\\C_1e^{-1}+C_2e=1\end{array}\right.\rightarrow C_1=C_2=\frac e{e^2+1}$$
よって、$f(x)=\displaystyle\frac{2e}{e^2+1}\cosh x$となります。

あとがき

最後まで読んでいただきありがとうございます。最速降下曲線やカテナリーは物理力の欠如により解説できなかったので、気が向いたら勉強して書きます。

投稿日：2020年11月20日

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

mathphilia

6312

他の人のコメント

コメントはありません。

読み込み中

mathphilia

変分法について