0

ラグランジアンの位置と速度は独立か

58
0
$$\newcommand{bbR}[0]{\mathbb{R}} \newcommand{Spec}[0]{\text{Spec}} $$

ラグランジアンの位置と速度は独立か

解析力学を勉強するときに誰しもが思うこの疑問に焦点を当てて、変分原理からオイラー・ラグランジュ方程式の導出をします。

大変に長ったらしい記事になってしまったのですが、ひとことで言うと、

ラグランジアン$L(x, v)$偏導関数を計算する際には位置と速度は独立な変数だと思って計算する。
その後、偏導関数 $\dfrac{\partial L(x, v)}{\partial x}$$\dfrac{\partial L(x, v)}{\partial v}$を道$x(t)$の上で評価するときは
$\left.\dfrac{\partial L(x, v)}{\partial x}\right|_{\substack{x=x(t)\\v=\dot{x}(t)}}$$ \left.\dfrac{\partial L(x, v)}{\partial v}\right|_{\substack{x=x(t)\\v=\dot{x}(t)}}$という偏微分係数を考えることになり、このときは独立ではなく、$x(t)$の時間微分をしたものが$\dot{x}(t)$である。

ということになります。以下で詳しく説明していきます。

配位空間と速度相空間

$n$次元空間$M$の中の1質点の運動を考える。運動の舞台となるこの空間$M$のことを配位空間と呼ぶ。配位空間$M$の点は質点の位置を表す。運動は文字通り質点の動きを伴うものであるから、その速度を考えることも大切である。そのために質点の速度を表すベクトル空間$T$も導入する。多様体を知っている人に向けて言うと、このことは配位空間$M$を多様体としてその接束$TM$を考えていることになる。
ここでは多様体の知識は仮定せずシンプルな状況に話を限ることにする。すなわち、配位空間$M$$n$次元ユークリッド空間$\bbR^n$に限定し、速度のベクトル空間$T$$\bbR^n$を自然にベクトル空間とみなしたものとする。これら2つの直積空間を
\begin{equation} TM := M \times T = \bbR^n \times \bbR^n \end{equation}
と記すことにする。接束$TM$と同じ記号を使ったが、接束という語を知らなければ忘れてしま
って構わない。また、$T$がベクトル空間であるという事実も当面は使わないので忘れてしまって単に$n$次元空間$\bbR^n$だと思ってしまってよい。質点の位置と速度をまとめたこの空間$TM$のことを速度相空間と呼ぶことにする。(これはあまり定着した用語ではないようだが、名前がないと不便なので命名しておく。)
$M$の座標を$x^i$, $T$の座標を$v^i$, $i = 1,\dots,n$とする。速度相空間$TM$の点はそれらの組$(x^i, v^i)$と同一視される。
ここで$(x^i, v^i)$$(x^1, \dots, x^n, v^1, \dots, v^n)$の略記であり、これをさらに$x := (x^1, \dots, x^n)$, $v := (v^1, \dots, v^n)$$(x, v) := (x^1, \dots, x^n, v^1, \dots, v^n)$と略記することもあるが文脈から明らかであろう。

位相空間上の道と道の空間

$M$を位相空間とする(phase space ではなく topological space を指している)。位相空間を知らなければ、前節同様$M$として$\bbR^n$を思い浮かべておけば十分である。
固定した2つの実数$t_I, t_F \in \bbR$が与えられたときに、閉区間$I = [t_I, t_F]$から$M$への連続写像
$$\begin{align} \gamma: I &\longrightarrow M \\ t &\longmapsto \gamma(t) \end{align}$$
という。($t_I$の添字$I$はInitialのIである。区間の$I$と混同しないように注意。)本稿では、道といったときには、さらに滑らかさを仮定するものとする。すなわち
$M$は滑らかな位相空間であり$\gamma$は滑らかな、つまり何度でも微分可能な、写像であるとする。($\bbR^n$は標準的に、滑らかな位相空間の構造を持つ。)
力学の文脈では$t \in I$は時間変数を意味している。$t_I$は運動の初期時刻、$t_F$は終時刻である。道$\gamma$に対して$x_I := \gamma(t_I) \in M$$\gamma$始点, $x_F := \gamma(t_F) \in M$終点と呼ぶ。また、始点と終点を総称して端点と呼ぶ。またこのとき、$\gamma$$x_I$を始点、$x_F$を終点に持つ道であるという。あるいはまとめて$\gamma$$x_I, \ x_F$を端点に持つ道とか、端点を固定した道などという。
2点$x_I, \ x_F \in M$を与えたとき、$M$上の、$x_I$を始点、$x_F$を終点に持つ道全体の空間を
$\Omega(x_I, x_F)$と記すことにする。この記法には区間$I$や空間$M$が暗黙に仮定されていることに注意せよ。
また$TM$も位相空間であるから、$TM$上の道や道の空間を考えることができる。

質点の軌道

配位空間$M$の点は質点の位置を表すのだから、質点の運動は時間$t$の経過とともに刻々と連続的に移動していく$M$の点により記述されると考えられる。これはすなわち$M$上の道
$$\begin{align} x: I &\longrightarrow M (= \bbR^n)\\ t &\longrightarrow x(t) \end{align}$$
に対応する。ここで、$n$個の変数をまとめて$x = (x^1, \dots, x^n) \in M = \bbR^n$と書いた。また、前に$\gamma$と書いていた道の記号を座標変数と同じ$x$という名前で書いたことに注意。このような省略記法は物理の文脈ではよく行われることである。
質点の運動を表す$M$上の道$x = x(t)$が与えられると、それを時間変数$t$で微分することにより接ベクトル$\dfrac{dx}{dt} = \left(\dfrac{dx^1}{dt}, \dots , \dfrac{dx^n}{dt}\right)$が得られる。これは質点の速度ベクトルとみなせるから、すなわち$T$の元であると考えられる:$\dfrac{dx}{dt} \in T$. 以下では時間微分をドット($\ \dot{ }\ $)を用いて$\dot{x} := \dfrac{dx}{dt}$などとも書き表すことにする。
さて、$M$上の道$x = x(t)$に対して速度相空間$TM$上の道が
$$\begin{align} I &\longrightarrow TM (= \bbR^n \times \bbR^n) \\ t &\longmapsto (x(t), \dot{x}(t)) \end{align}$$
により一意に定まる。このような対応のことを持ち上げという。つまり$M$上の道$x(t)$が持ち上げにより$TM$上の道$(x(t), \dot{x}(t))$に写されたということである。
力学の文脈ではこの「持ち上がった道」に定まった名前はついていないようだが、本稿ではこれを質点の軌道と呼ぶことにする。すなわち、質点の軌道と言ったら位置の変化と速度の変化をまとめて考えた$(x(t), \dot{x}(t))$のことだと理解する。軌道は配位空間上の道$x = x(t)$と一対一に対応するから$x(t)$と比べてなにか新しい情報が加わったものではないが、速度ベクトル$\dot{x}(t)$を陽に示しておくことで質点のダイナミクスをわかりやすく記述するものとなっている。軌道を考えているとき、$x(t)$$\dot{x}(t)$は無関係ではなく、定義通り$\dot{x}(t)$$x(t)$の導関数であることに注意せよ。 また、速度相空間$TM$上の全く勝手な道$t \mapsto (x(t), v(t))$は質点の軌道となるとは限らない$v(t) = \dfrac{dx(t)}{dt}$という条件が満たされているとき、またそのときに限り、この道は軌道である。

端点を固定した軌道

時間の区間$I = [t_I, t_F]$$M$上の2点$x_I, x_F$が与えられたとすると、$x_I, x_F$を端点に持つ$M$上の道$x = x(t);\ x(t_I) = x_I, \ x(t_F) = x_F$を考えることができる。$x \in \Omega(x_I, x_F)$である。これを$TM$上の道に持ち上げて軌道を作ることを考えたいが、問題となるのは端点での速度ベクトル$\dot{x}(t_I), \dot{x}(t_F)$をどうするかである。道$x$の端点を固定するだけでは、その接ベクトルまでは固定されず、任意の値を取ることができるから、これらに条件はつかない。そこで、端点を固定した道を$TM$上に持ち上げるときには素直に、$x(t),\ \dot{x}(t)$のうち$x(t)$だけ端点が$x(t_I) = x_I$, $x(t_F) = x_F$と固定され、$\dot{x}(t_I)$$\dot{x}(t_F)$については何も条件をつけないものとする。これを端点を固定した持ち上げ、あるいは端点を固定した軌道と呼ぶことにする。記号としては、端点を固定した軌道全体の集合を

$$\begin{align} \widetilde{\Omega}&(x_I, x_F) := \nonumber \\ &\left\{(x, \dot{x}) \mid x(t_I) = x_I, \ x(t_F) = x_F, \ \dot{x} \text{には端点に関する条件はつけない}\right\} \tag{1}\label{space of paths with endpoints fixed} \end{align}$$
と記すことにする。
$\Omega(x_I, x_F)$$M$上の道の部分集合であるのに対し、$\widetilde{\Omega}(x_I, x_F)$$TM$上の道の部分集合であることに注意せよ。

ラグランジアン

ラグランジアン$L$は速度相空間$TM$上の実数値関数
$$\begin{align} L: TM &\longrightarrow \bbR \\ (x^i, v^i) &\longmapsto L(x^i, v^i) \end{align}$$
である。ここでは$L$は好きなだけ何度でも微分できる滑らかな関数であるとしておく。ラグランジアンが「まともな」運動を記述するためには他にもいろいろ条件があるがここでは触れないこととする。
この段階では$L$はあくまで$TM$上の関数$L = L(x^i, v^i)$であり、したがって$x^i$$v^i$は完全に独立な変数であることに注意せよ。

ラグランジアンの微分

ラグランジアン$L$を微分する際、$2n$個の$x^i$, $v^i$は独立な変数であるから、いつものように当たり前に偏微分すればよい。したがって例えば全微分は
$$\begin{align} dL(x^i, v^i) = \frac{\partial L(x^i, v^i)}{\partial x^i} dx^i + \frac{\partial L(x^i, v^i)}{\partial v^i} dv^i \tag{2}\label{partial derivative of Lagrangian} \end{align}$$
と計算される。(アインシュタインの和の規約を使っている。)

ラグランジアンから導かれる汎関数

速度位相空間$TM$上の必ずしも軌道とは限らない一般の道$\widetilde{\gamma}: I \rightarrow TM; \ t \mapsto (x(t), v(t)) \in TM$を考える。ラグランジアン$L$をこの道に沿って評価したもの$L = L(x(t), v(t))$$I$上の関数とみなせるから、$I$上での積分を考えることができる。そこで以下の量$\widetilde{S}[x, v]$を定義する:
$$\begin{align} \widetilde{S}[x, v] := \int_{t_I}^{t_F} L(x(t), v(t)) dt. \tag{3}\label{general functional on TM} \end{align}$$
ちなみに余談であるが被積分関数$L(x(t), v(t))$$TM$上の関数$L$を道$\widetilde{\gamma}: I \rightarrow TM$により$I$上の関数に引き戻したものになっている。すなわち、
$$\begin{align} L(x(t), v(t)) = (\widetilde{\gamma}^*L)(t) \end{align}$$
である。
$\widetilde{S}[x, v]$$TM$上の道、すなわち1変数関数$\widetilde{\gamma}(t) = (x(t), v(t))$に対して実数値が一つ定まる対応になっている。このように関数に対して一つ値を対応させるもの、いわば関数の関数を汎関数と呼ぶ。

汎関数の変分

汎関数\eqref{general functional on TM}は$TM$上の道の関数であった。したがって道$\widetilde{\gamma}(t) = (x(t), v(t))$を少しだけ変化させるとそれに伴って汎関数の値$\widetilde{S}[x, v]$も少しだけ変わるはずである。この変化の度合いを汎関数の変分と呼び、$\delta \widetilde{S}[x, v]$で表す。これは以下のように計算することができる。
まず、道$\widetilde{\gamma}(t)$
$$\begin{align} \widetilde{\gamma} \rightarrow \widetilde{\gamma}(t) + \delta\widetilde{\gamma}(t) \end{align}$$
と少しだけ変化させたとする。ここで$\delta \gamma(t)$は微小量である。成分で書くと
$$\begin{align} \widetilde{\gamma}(t) + \delta\widetilde{\gamma}(t) = (x(t) + \delta x(t), \ v(t) + \delta v(t)) \end{align}$$
であるとする。すなわち、
$$\begin{align} x(t) \rightarrow x(t) + \delta x(t), \ \ v(t) \rightarrow v(t) + \delta v(t) \end{align}$$
と変化する。$\delta x(t), \delta v(t)$も同様に微小量である。
$\widetilde{\gamma} = (x(t), v(t))$$TM$上の軌道とは限らない勝手な道であったから$x(t)$$v(t)$を独立に変えられることに注意せよ。$\delta\widetilde{\gamma}(t)$$\delta x(t)$, $\delta v(t)$といった量も(道の)変分と呼ぶ。
すると、時刻$t \in I$におけるラグランジアンの評価値は
$$\begin{align} L(x(t), v(t)) \rightarrow L(x(t) + \delta x(t), v(t) + \delta v(t)) \end{align}$$
と変化する。したがってその変化分$\delta L(x(t), v(t))$
$$\begin{align} \delta L(x(t), v(t)) = L(x(t) + \delta x(t), v(t) + \delta v(t)) - L(x(t), v(t)) \end{align}$$
である。$\delta x(t), \delta v(t)$は微小量なのでそれらの1次の近似で
$$\begin{align} \delta L(x(t), v(t)) = \frac{\partial L(x(t), v(t))}{\partial x^i} \delta x^i(t) + \frac{\partial L(x(t), v(t))}{\partial v^i} \delta v^i(t) \end{align}$$
と計算される。これは式(\ref{partial derivative of Lagrangian})と同様の計算である。
ここで、$\dfrac{\partial L(x(t), v(t))}{\partial x^i}$といった量は、言うまでもないが、まず$L = L(x, v)$の偏導関数
$\dfrac{\partial L(x, v)}{\partial x^i}$を計算し、それを$TM$の点$x = x(t), \ v = v(t)$において評価したものである。
もう少し丁寧に書くと、
$$\begin{align} \dfrac{\partial L(x(t), v(t))}{\partial x^i} := \left.\frac{\partial L(x, v)}{\partial x^i}\right|_{\substack{x=x(t) \\ v=v(t)}} \end{align}$$
となる。
最後に汎関数(\ref{general functional on TM})の変化量、すなわち変分$\delta \widetilde{S}[x, v]$
$$\begin{align} \delta \widetilde{S}[x, v] &:= \widetilde{S}[x + \delta x, v + \delta v] - \widetilde{S}[x, v] \nonumber \\ &= \int_{t_I}^{t_F} L(x(t) + \delta x(t), v(t) + \delta v(t)) dt - \int_{t_I}^{t_F} L(x(t), v(t)) dt \nonumber \\ &= \int_{t_I}^{t_F} \left\{ L(x(t) + \delta x(t), v(t) + \delta v(t)) - L(x(t), v(t)) \right\} dt \nonumber \\ &= \int_{t_I}^{t_F}\delta L(x(t), v(t)) dt \nonumber \\ &= \int_{t_I}^{t_F} \left\{ \frac{\partial L(x(t), v(t))}{\partial x^i} \delta x^i(t) + \frac{\partial L(x(t), v(t))}{\partial v^i} \delta v^i(t) \right\} dt \nonumber \\ &= \int_{t_I}^{t_F} \left\{ \left.\frac{\partial L(x, v)}{\partial x^i}\right|_{\substack{x=x(t) \\ v=v(t)}} \delta x^i(t) + \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=v(t)}} \delta v^i(t) \right\} dt \tag{4}\label{variation of general functional} \end{align}$$
と計算される。

作用汎関数

上で定義した汎関数$\widetilde{S}[x, v]$の定義域は$TM$の任意の道の集合であった。
しかしながら、力学で重要となるのは位置の時間変化$x(t)$と速度の時間変化$v(t)$が整合している特別な道、すなわち軌道である。
また、われわれは初期時刻$t = t_I$に位置$x = x_I$, 終時刻$t = t_F$に位置$x = x_F$を通る質点の運動に興味があるとしよう。
すると考えるべき道の集合は、\eqref{space of paths with endpoints fixed}で定義した端点を固定した軌道の集合$\widetilde{\Omega}(x_I, x_F)$にほかならない。$\widetilde{\Omega}(x_I, x_F)$は道の集合であるからもちろん$\widetilde{S}[x, v]$の定義域の部分集合である。
そこで、$\widetilde{S}[x, v]$の定義域を$\widetilde{\Omega}(x_I, x_F)$に制限した汎関数を改めて$S[x]$と記すことにしよう:
$$\begin{align} S: \widetilde{\Omega}(x_I, x_F) \longrightarrow \bbR. \end{align}$$
この汎関数$S$作用汎関数、あるいは作用積分、あるいは単に作用という。$S$の引数を$S[x, \dot{x}]$と書きたくなるかもしれないが、$M$上の道$x(t)$と軌道$(x(t), \dot{x}(t))$は一対一に対応するので$S[x]$と書いておけば十分である。むしろ$x$$\dot{x}$はそれぞれを独立に変えることはできず、あくまで$\dot{x}(t) = \dfrac{dx(t)}{dt}$という関係がついているのに、$S[x, \dot{x}]$という書き方は独立な関数がふた組あるようでかえって混乱を招くように思われる。
式\eqref{general functional on TM}に相当する作用汎関数$S[x]$の形を書いておくと、
$$\begin{align} S[x] = \int_{t_I}^{t_F} L(x(t), \dot{x}(t))dt \tag{5}\label{action integral} \end{align}$$
となる。

変分原理

さて、解析力学の教えるところによれば、初期時刻$t = t_I$に位置$x = x_I$, 終時刻$t = t_F$に位置$x = x_F$を通る質点の運動について、
実際に実現される軌道 $(x(t), \dot{x}(t))$は作用汎関数$S[x]$を停留にするものであるという。
すなわち、このような軌道を見つけることは
$$\begin{align} \delta S[x] = 0 \tag{6}\label{variation principle} \end{align}$$
を満たす端点を固定した軌道$(x(t), \dot{x}(t)) \in \widetilde{\Omega}(x_I, x_F)$を見つけることになる。
これを変分原理、または最小作用の原理、またはハミルトンの原理と呼ぶ。

作用汎関数の変分

\eqref{variation principle}の左辺の変分はどのように計算するのだろうか。$S[x]$$\widetilde{S}[x, v]$の定義域を制限しただけのものであるから、変分計算自体は\eqref{variation of general functional}と全く同じである。単にその評価が$\widetilde{\Omega}(x_I, x_F)$に属する道、すなわち端点を固定した軌道の上でのみ行われる、というだけである。
したがって、
$$\begin{align} \delta S[x] = \int_{t_I}^{t_F} \left\{ \left.\frac{\partial L(x, v)}{\partial x^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \delta x^i(t) + \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \delta \dot{x}^i(t) \right\} dt \tag{7}\label{eq: variation of the action} \end{align}$$
となる。大事なことは、道の変分も勝手に変えるのではなく常に$\widetilde{\Omega}(x_I, x_F)$の中に収まるように変えるというところで、
すなわち位置$x(t)$
$$\begin{align} x(t) \rightarrow x(t) + \delta x(t) \end{align}$$
と変えるならば、速度ベクトルもちゃんと軌道をなすように
$$\begin{align} \dot{x}(t) \rightarrow \dot{x}(t) + \delta \dot{x}(t) \end{align}$$
と変えなければならないということである。ここで、
$$\begin{align} \delta \dot{x}(t) = \dfrac{d}{dt} (\delta x(t)) \end{align}$$ が成り立つことに注意せよ。
つまり作用関数の変分を取る際には位置の変分$\delta x(t)$と速度の変分$\delta v(t)$は独立ではなく
$$\begin{align} v(t) = \delta\dot{x}(t) = \dfrac{d}{dt}(\delta x(t)) \tag{8}\label{eq: variation condition 1} \end{align}$$
を満たしていなければならない。

もう一つの注意点は変分後の道$x(t) + \delta x(t)$も端点を$x_I, x_F$に持たねばならないという点である。
これより、
$$\begin{align} \delta x(t_I) = 0, \ \ \delta x(t_F) = 0 \tag{9}\label{eq: variation condition 2} \end{align}$$
という条件が出てくる。
このような条件\eqref{eq: variation condition 1}, \eqref{eq: variation condition 2}のもとで変分$\delta S[x]$を取ったときに、それが停留、すなわち$\delta S[x] = 0$となる軌道$(x(t), \dot{x}(t))$が実現される、というのがハミルトンの原理である。

オイラー・ラグランジュ方程式

変分の計算をもう少し進めよう。\eqref{eq: variation of the action}の被積分関数第2項は\eqref{eq: variation condition 1}を用いて部分積分を行うことができる。すなわち、
$$\begin{align} \text(第2項) &= \int_{t_I}^{t_F} \left\{ \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \dfrac{d}{dt}(\delta x(t)) \right\} dt \nonumber \\ &= \left[ \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \delta x(t) \right]_{t_I}^{t_F} -\int_{t_I}^{t_F} \left\{ \frac{d}{dt}\left( \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \right) \delta x(t) \right\} dt \nonumber \\ &= -\int_{t_I}^{t_F} \left\{ \frac{d}{dt}\left( \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \right) \delta x(t) \right\} dt. \end{align}$$
ここで2行目から3行目の変形は\eqref{eq: variation condition 2}を用いた。これを第1項と合わせると変分全体は
$$\begin{align} \delta S[x] = \int_{t_I}^{t_F} \left\{ \left.\frac{\partial L(x, v)}{\partial x^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} - \frac{d}{dt}\left( \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \right) \right\} \delta x(t) dt \end{align}$$
となる。これが停留条件$\delta S[x] = 0$を満たすための条件はけっきょく、
$$\begin{align} \left.\frac{\partial L(x, v)}{\partial x^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} - \frac{d}{dt}\left( \left.\frac{\partial L(x, v)}{\partial v^i}\right|_{\substack{x=x(t) \\ v=\dot{x}(t)}} \right) = 0 \tag{10}\label{eq: Euler-Lagrange} \end{align}$$
となる。実現される軌道が満たすべきこの方程式をオイラー・ラグランジュ方程式という。
ここまでで、解析力学の教科書でよく見る、「ラグランジアンの偏微分は$x(t)$$\dot{x}(t)$を独立だと思って行い、しかしながらその後に部分積分をする際は$\delta{x}(t)$$\delta \dot{x}(t)$は独立でないので部分積分を行う」という一見奇妙な操作をできる限り丁寧に説明した。
ここまでを理解できれば、\eqref{eq: Euler-Lagrange}をよく見かけるコンパクトな形
$$\begin{align} \frac{\partial L(x, \dot{x})}{\partial x^i} - \frac{d}{dt}\left(\frac{\partial L(x, \dot{x})}{\partial \dot{x}^i}\right) = 0 \end{align}$$
という形に書いてもその意味を理解できるだろう。

投稿日:83
更新日:817
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中