変分法の練習として,2次元平面での最短経路問題を陽関数表示にせず2次元のまま解くことを試みる.
2点$A,B$を結ぶ曲線の中で,長さが最小となるものを求める.
AとBを結ぶ曲線
この問題は拡大,回転,平行移動を行うことによって点$(0,0)$と$(0,1)$を通る関数$y=f(x)$の長さの最小化問題に変換することで1次元の変分法として解くことができるが,行って戻って来たり接線が$y$軸に平行になる部分を含む曲線は$y=f(x)$と顕に書くことができない.
そんな部分を含む曲線は明らかに解にならないため別途除いてしまえば良いのだが,今回は2次元平面上の媒介変数表示のまま,変換を行わない状態で解いてみる.
1次元(関数が1つ)の場合はネットで検索すると多くの解説が出てくる([1]など).
2次元にしても大して変わりはないが,記号がややこしく混乱しやすいため一応最初から書き下してみる.
本題は[
#最短経路を求める
]へ.
パラメータ表示された曲線
$$
\begin{cases}
x = f(t)\\
y = g(t)
\end{cases}\; (t\in[0,T])
$$
に関する汎関数
$$
S[f,g]=\int_0^T F\left(\phantom{\frac{}{}}t,f(t),f'(t),g(t),g'(t)\right)\;\mathrm{d}t
$$
(作用と呼ばれる)を最小化する問題を考える.
ただし,$f,g$は$t\in(0,T)$で連続で微分可能,$F$は各引数について偏微分可能とする.
$S$が最小となる$f,g$では$S$の停留点になっている必要があるので,適当に$f,g$を微小変化させたときに値が変わらない,すなわち
$$
\delta S[f,g] = S[f+\delta f, g+\delta g] - S[f,g] = 0
$$
(ただし,微小変化は端点が固定されている i.e. $\delta f(0)=\delta f(T)=0, \delta g(0)=\delta g(T)=0$とする)が必要条件である.
$S$を具体的に書くと,
$$
\delta S[f,g] = \int_0^T \left\{F\left(\phantom{\frac{}{}}t, (f+\delta f)(t), (f+\delta f)'(t), (g+\delta g)(t), (g+\delta g)'(t)\right)\right.
$$
$$\phantom{\delta S[f,g] = \int_0^T \{} \left. - F\left(\phantom{\frac{}{}}t,f(t),f'(t),g(t),g'(t)\right)\right\}\mathrm{d}t
$$
被積分関数を微小な変化について1次近似で展開すると
$$
\delta F:=F(t, (f+\delta f)(t), (f+\delta f)'(t), (g+\delta g)(t), (g+\delta g)'(t)) - F(t,f(t),f'(t),g(t),g'(t))
$$
$$
=\left(F(t,f(t),f'(t),g(t),g'(t))
+ \left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial \xi_0}\right|_{\xi_0=t,\ \xi_1=f(t),\ \xi_2=f'(t),\ \xi_3=g(t),\ \xi_4=g'(t)}\cdot\delta\xi_0\right.
$$
$$
\left.\phantom{===}+\cdots
+ \left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial \xi_4}\right|_{\xi_0=t,\ \xi_1=f(t),\ \xi_2=f'(t),\ \xi_3=g(t),\ \xi_4=g'(t)}\cdot\delta\xi_4+O(\delta^2)\right)
- F(t,f(t),f'(t),g(t),g'(t))
$$
(ただし$\delta\xi_i$は$t,f(t),f'(t),g(t),g'(t)$のうち$i$番目の微小変化を加える前後の差(変分)を表し,$O(\delta^2)$はこれらの2次以上の項を表す.)
ここで,$\delta\xi_0$は$t$の変分であり$0$になる.
また,微分の計算法則より$\delta\xi_2=(f+\delta f)'(t)-f(t)=(\delta f)'(t)$
作用の話に戻ると,後々定積分されるので,この項についての積分を考えると,
$$
\int_0^T h(t)(\delta f)'(t)\;\mathrm{d}t=\int_0^T \left\{\phantom{\frac{}{}}(h(t)\cdot\delta f(t))'-h'(t)\delta f(t)\phantom{\frac{}{}}\right\}\mathrm{d}t
$$
$$
=\left[\phantom{\frac{}{}}h(t)\delta f(t)\phantom{\frac{}{}}\right]_0^T
-\int_0^T h'(t)\delta f(t)\;\mathrm{d}t
$$
$\delta f(0)=\delta f(T)=0$であるから第1項は$0$となるので,被積分関数の変形として
$$
h(t)(\delta f)'(t)=-h'(t)\delta f(t)
$$
とみなせる.$\delta\xi_4=(\delta g)'(t)$の項についても同様にして,結局
$$
\delta F
= \left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_1}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\cdot\delta f(t)
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right)\cdot\delta f(t)
$$
$$
\phantom{\delta F=}+ \left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_3}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\cdot\delta g(t)
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_4}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right)\cdot\delta g(t)+O(\delta^2)
$$
$$
\delta S[f,g] = \int_0^T \left[\left\{
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_1}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right)
\right\}\cdot\delta f(t)\right.
$$
$$
\phantom{\delta S[f,g] = \int_0^T[] }\left.+\left\{
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_3}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_4}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right)
\right\}\cdot\delta g(t)+O(\delta^2)\right]\mathrm{d}t
$$
となる.
これが任意の微小な$\delta f, \delta g$に対して$=0$が成り立つので,すべての$t\in(0,T)$についてこれらの係数が$0$である必要があり,
$$
\begin{cases}
\displaystyle
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_1}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right) = 0\\
\displaystyle
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_3}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_4}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right)=0
\end{cases}
$$
これが2関数の場合のいわゆる「Euler–Lagrange方程式」である.
$F$を偏微分してから関数の値を代入するという操作を省略してカッコ内に書くと
$$
\begin{cases}
\displaystyle\frac{\partial F(t,f,\ldots,g')}{\partial f}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial F(t,f,\ldots,g')}{\partial (f')}\right) = 0\\
\displaystyle\frac{\partial F(t,f,\ldots,g')}{\partial g}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial F(t,f,\ldots,g')}{\partial (g')}\right) = 0
\end{cases}
$$
というよく目にする表記となる.
これはあくまで略記であり,慣れないうちは混乱を生みやすいので本記事では上記の表記を用いている.
$F$の引数として用いられる関数の数が増減した場合すべて同様に計算すれば良いため,1関数の場合もほぼ同じであるし,$f_1, f_2, \ldots, f_N$と$N$個の関数を使う場合も
$$
\frac{\partial F(t,f_1,f_1'\ldots,f_N,f_N')}{\partial f_k}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial F(t,f_1,f_1'\ldots,f_N,f_N')}{\partial (f_k')}\right) = 0\quad(k=1,2,\dots,N)
$$
のように一般化できる.
関数の$n$次導関数を含む場合など,より広い一般化については[2]が詳しい.
2点$A(x_0, y_0), B(x_1, y_1)$を結ぶ曲線,すなわち
$$
\begin{cases}
x = f(t)\\
y = g(t)
\end{cases}\; (t\in[0,T]),\ (f(0),g(0))=(x_0,y_0),\ (f(T),g(T))=(x_1,y_1)
$$
で長さが最短であるものを求める.
ここで,$f(t), g(t)$は$t\in(0,T)$で連続かつ微分可能とする.すなわち途中に尖点を持つ曲線などは含まれない.
(微分不能な点が有限個であればそれぞれ区間で分割してから以下の帰結より最短経路が折れ線となるので,これが一直線より長さが大きいことを幾何的に示せる)
$A$から$B$までの長さは
$$
L=\int_0^T \sqrt{\left(\frac{\mathrm{d}f(t)}{\mathrm{d}t}\right)^2+\left(\frac{\mathrm{d}g(t)}{\mathrm{d}t}\right)^2}\;\mathrm{d}t
$$
変分法の議論から,$L$を最小化すべき作用,$F(\xi_0,\xi_1,\xi_2,\xi_3,\xi_4)=\sqrt{{\xi_2}^2+{\xi_4}^2}$とすれば,求めたい関数$f(t),g(t)$はEuler–Lagrange方程式
$$
\begin{cases}
\displaystyle
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_1}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right) = 0\quad\cdots\cdots(1)\\
\displaystyle
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_3}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
- \frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_4}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right)=0\quad\cdots\cdots(2)
\end{cases}
$$
の解となる.
$F$は$\xi_1$を含まないので$(1)$の第1項は$0$.
よって$(1)$は
$$
\frac{\mathrm{d}}{\mathrm{d}t}\left(\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}\right) = 0
$$
$$
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)} = c_1
$$
となる.
$$
\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}
=\frac{\xi_2}{\sqrt{{\xi_2}^2+{\xi_4}^2}}
$$
$$
\left.\frac{\partial F(\xi_0,\ldots,\xi_4)}{\partial\xi_2}\right|_{\xi_0=t,\ \ldots,\ \xi_4=g'(t)}
=\frac{f'(t)}{\sqrt{\left(f'(t)\right)^2+({g'(t)})^2}}
$$
であるから,
$$
f'(t)=c_1\sqrt{\left(f'(t)\right)^2+({g'(t)})^2}
$$
$$
(f'(t))^2=c_1^2\left({\left(f'(t)\right)^2+({g'(t)})^2}\right)
$$
$$
(f'(t))^2=\frac{c_1^2}{1-c_1^2}(g'(t))^2 \quad \text{or}\quad g'(t)=0
$$
$$
\therefore\quad f'(t)=c_1'g'(t) \quad \text{or}\quad g'(t)=0
$$
$$
f(t)=c_1'g(t)+c_2\ \cdots\cdots(3) \quad \text{or}\quad g(t)=c_3\ \cdots\cdots(4)
$$
(適宜,積分定数をつけた.)
同様に,$(2)$より
$$
g(t)=c_4f(t)+c_5\ \cdots\cdots(5) \quad \text{or}\quad f(t)=c_6\ \cdots\cdots(6)
$$
(i) $x_0< x_1,\ y_0=y_1$の場合について考えると,
$g(0)=g(T)$より$(4)$を満たし$g(t)=y_0$.
このような$g(t)$について$(5)$は$c_4=0,\ c_5=y_0$とすれば成り立つ.
よって解は直線$y=y_0$.
(ii) $x_0< x_1,\ y_0< y_1$の場合について考えると,
$f(0)\neq f(T),\ g(0)\neq g(T)$より$(4),\ (6)$は満たさないので.$(3),\ (5)$を考えればよい.
$(5)$より
$$
y_0=c_4 x_0 + c_5,\ y_1=c_4 x_1 + c_5
$$
$$
\therefore\ c_4=\frac{y_1-y_0}{x_1-x_0},\ c_5=\frac{x_1 y_0 - x_0 y_1}{x_1 - x_0}
$$
同様に,$(4)$から$c_1'=\frac{x_1-x_0}{y_1-y_0},\ c_2=-\frac{x_1 y_0 - x_0 y_1}{y_1 - y_0}$
これらから,解はともに直線$y=\frac{y_1-y_0}{x_1-x_0}x+\frac{x_1 y_0 - x_0 y_1}{x_1 - x_0}$が導かれる.
他の$x_0,\ x_1,\ y_0,\ y_1$の関係の場合も$x,y$や正負を入れ替えることによって同様に解が点$A,B$を通る直線であることが導かれる.$\Box$
東大入試の有名な問題に「円周率が3.05より大きいことを証明せよ。(2003年第6問)」([3])というものがある.
セオリーとしては円に内接する正多角形の面積または周の長さを求め,そこから$\pi$を評価すると$3.05$以上になるというものである.
面積を使って求める場合,周長の場合と同じ評価精度を得るには$n$が2倍の正$n$角形を用いる必要があり,計算が大変であるが,周長での証明にはここで示した「2点を結ぶ最短の曲線は直線である」という事実を用いる必要がある.
これは一見明らかであるが非ユークリッド空間("平ら"ではない空間)では成り立たない.長距離を結ぶ旅客機の航路が(メルカトル図法などでの)地図上での直線にならず,大圏コースと呼ばれる大円を通るものとなるのが一例である.
(面積の場合,ある図形が他の図形に内包されているとき,測度の定義から明らかに前者のほうが面積が小さいのでスムーズに行く.)
半径1の円に内接する正$n$角形を考える.
この正$n$角形の1辺の長さ$x$は,等しい辺の長さが$1$,頂角が$\frac{2\pi}{n}$の二等辺三角形の底辺であるから,余弦定理より
$$
x^2 = 1^2 + 1^2 - 2\cdot 1\cdot 1\cdot \cos \frac{2\pi}{n}
$$
$$
\phantom{x^2} = 2 - 2 \cos \frac{2\pi}{n}
$$
$$
x = \sqrt{2 - 2 \cos \frac{2\pi}{n}}
$$
$$
\phantom{x} = \sqrt{4\cdot\sin^2\frac{\pi}{n}}
$$
$$
\phantom{x} = 2\sin\frac{\pi}{n}
$$
一方,中心角$\frac{2\pi}{n}$の孤の長さ($\frac{2\pi}{n}$)と正$n$角形の1辺の長さを比べると「2点を結ぶ最短の曲線は直線である」ことから,
$$
x<\frac{2\pi}{n}
$$
辺々を$\frac{n}{2}$倍すると,
$$
\pi > \frac{n}{2} x
$$
が得られる.
ここで$n=12$とすると,
$$
x=\sqrt{2 - 2 \cos \frac{\pi}{6}}=\sqrt{2 - \sqrt{3}}
$$
$$
\pi > 6\sqrt{2 - \sqrt{3}}
$$
$$
\pi^2 > 36({2 - \sqrt{3}})
$$
$3<3.0276=1.74^2$より,
$$
36({2 - \sqrt{3}})>9.36>9.3025=3.05^2
$$
以上より$\pi>3.05$が示された.$\Box$