この記事は指数関数に関する記事の第2弾です。よろしければ第一弾をお読みください。
さて、これを読んでいる読者のみなさんは$a^x$は微分可能であって、特にネイピア数を底とした指数関数$e^x$は
$$(e^x)'=e^x$$
が成り立つはご存じのことでしょう(もしごぞんじでないのであればおまけの1.5もご覧ください)。また、$e^0=1$であることを思い出すと、$f(x)=e^x$は次の微分方程式を満たすことがわかります:
$$f(0)=1,\quad f'(x)=f(x) \quad (★)$$
では逆に上の式を満たすような$f$はどのような関数なのでしょうか?それについて考えてみましょう。
$\phi$が(★)を満足するとき, 次が成り立つ.
(1)$\phi(-t)\phi(t)=1\quad (t\in\mathbb{R})$である. これより特に$\phi(t)\neq 0$であり, $\phi^{-1}(t)=\phi(-t)$である.
(2)$\phi$は存在すれば一意である.
(3)$x, y\in\mathbb{R}$に対し$\phi(x+y)=\phi(x)\phi(y)$である。
(1)から順に示します. $\Phi(t)=\phi(t)\phi(-t)$とおくと, (1.1)より
$$\Phi'(t)=\phi'(t)\phi(-t)-\phi(t)\phi'(-t)=\phi(t)\phi(-t)-\phi(t)\phi(-t)=0$$
となります. したがって微分して$0$になるのは定関数のみであり, $\Phi(0)=\phi(0)\phi(0)=1$より
$$\Phi(t)=\phi(t)\phi(-t)=1$$
が得られます. ゆえに(1)が成り立つことがわかります.
次に(2)を示します. 仮に$\phi$とは別に$\psi$という解があると仮定しましょう. このとき
$\Psi(t)=\phi(-t)\psi(t)$とすれば(1)と同様に
$$\Psi'(t)=0$$
が得られます. したがって,
$\phi(-t)\psi(t)=1$
より$\psi(t)=\phi(t)$となります.
最後に(3)の$\phi(t+s)=\phi(t)\phi(s)$を示します. いま$f(t)=\phi(at)$とすると$f$は次の初期値問題を満たします:
\begin{equation}
\begin{cases}
\frac{df}{dt}(t)=af(t)\\
f(0)=1
\end{cases}
\end{equation}
したがって、上の微分方程式の解が存在すれば一意であることがわかります. そこで,
$$g(t)=\phi(xt)\phi(yt)$$
と定義して$a=x+y$としたとき$g$が満足すれば$t=1$を代入して(3)が示されたことになります. いま$g$を$t$で微分すると
$$g'(t)=x\phi(xt)\phi(yt)+y\phi(xt)\phi(yt)=(x+y)g(t)$$
となって$g(0)=1$であるから(3)が示されました.(証明終了)
証明は淡々としていましたが、ここで重要なことは(★)の性質からこれまでの指数関数の性質が成り立ってしまうということです。しかも、(2)よりこの方程式を満たす関数は$e^x$ただ一つしかありません。であるなら、この微分方程式の解として指数関数を定義してしまえばいいのでは?という発想は生まれます。実際、この程度の微分方程式の解の存在性は簡単に示せますが、まあそれで終わらすのもインチキ臭い気がします。そこで、指数関数を(★)が成り立つようにあらためて定義してみましょう。
さて、本題に入る前に微分をもう少し振り返ってみましょう。
$$\lim_{h\to 0}\frac{f(x+h)-f(x)}{h}=f'(x)$$
でしたが、これはつまり$f(x+h)$はほとんど$f(x)+f'(x)h$だということです。つまりある$\varepsilon(h)$があって
$$f(x+h)=f(x)+f'(x)+\varepsilon(h) かつ \lim_{h\to 0}\frac{\varepsilon(h)}{h}=0$$
が成り立つということになります。ここで出てくる$\varepsilon$は例えば$x^3$でいうと
$$(x+h)^3-x^3=3hx^2+3h^2x+h^3$$
の右辺における$3h^2x+h^3$にあたります。つまり$h$のオーダーが$1$次よりも上の残りカスが$\varepsilon$ということになります。
ここで気付いてほしいことは$f(x+h)$はほぼ$h$の一次関数であるということです。つまり微分というのは関数を1次関数で近似するという操作と考えることができることです。
では一般的により高次の多項式で近似できるのか?というのは気になるところです。そこででてくるのがテイラーの定理になります。
$f$は$n$回微分可能とする。 このとき、 $x, a\in I, x>a$に対し、 ある定数$c\in I$が存在して、
$$f(x)=\sum_{k=0}^{n-1}\frac{f^{(k)}(a)}{k!}(x-a)^k+R_n(x)$$
が成り立つ. ただし$R_n$は剰余項で
$$R_n(x)=\frac{f^{(n)}(c)}{n!}(x-a)^n$$
である。
ということでテイラーの定理です。これに関してはもはや説明不要の超有名定理ですが、とくに剰余項$R_n$については次のことがいえます。
$f$が何回でも微分可能であり、任意の$n\in\mathbb{N}$に対して
$$|f^{(n)}(x)|\leq M$$
となる正定数$M$が存在するならば
$$\lim_{n\to\infty}R_n(x)=0$$
が成り立つ。ここで$f^{(n)}$は$f$を$n$回微分したものである。
さて、(★)を満たす$f$は$f'=f$なので何回でも微分可能であって、$f^{(n)}(0)=f(0)=1$なので上の定理3の条件を満たします。したがってテイラーの定理の右辺を$n\to\infty$とすれば
$$f(x)=\sum_{n=0}^{\infty}\frac{f^{(n)}(0)}{n!}x^n=\sum_{n=0}^{\infty}\frac{x^n}{n!}$$
という等式が得られます(おまけまで読んだ方はまたお前かとなるかと思います)。これを原点周りのテイラー展開もしくはマクローリン展開といいます。というわけで、そういうことなら
$$e^x=\sum_{n=0}^{\infty}\frac{x^n}{n!}$$
で定義しちゃえばいいじゃん。というのが今回の発想になります。この定義は現代の解析のテキストなんかでは割とよく用いられる定義です。
実際右辺が(★)を満たすのかというと$f(0)=1$は明らかです。また、
$$f'(x)=\sum_{n=0}^{\infty}\frac{nx^{n-1}}{n!}=\sum_{n=1}\frac{x^{n-1}}{(n-1)!}=f(x)$$
となるので(★)を満たします。はい、ここで和と微分の交換をしれっとしていますがこれはべき級数の一般論として次が成り立つことから保証されます。
$\displaystyle f(x)=\sum_{n=0}^{\infty}a_nx^n$が$|x|< R$で$\displaystyle\sum_{n=0}^{\infty}|a_n||x^n|$が収束しているとき、
$|x|< R$で$f$は微分可能であり、
$$f'(x)=\sum_{n=1}^{\infty}na_nx^{n-1}$$
が成り立つ。
はい、というわけで微分可能性についても問題がないことになります。もし証明が知りたい方がいたら、杉浦光夫先生の解析入門Iを参照されるとよいでしょう。
さてこのように定義してしまえば、定理の1から指数法則は成り立つことがわかっているので、$e^x=(e^{\frac{x}{2}})^2\geq 0$であり, $e^x\times e^{-x}=1$より$e^x>0$とわかります。これより特に$f'(x)=e^x>0$なので狭義の単調増加であることから逆関数$\log x$が定義されます。
ということは任意の$a>0$に対しては
$$a^x=e^{x\log a}$$
と定義してしまえばよいことがわかります。つまりはじめからべき級数で定義してしまえばその1でやったような地道な拡張も必要なく、指数法則も定理1のようにあっさり示せるわけですね。
さらにもっといえば、べき級数の形であれば別に実数でなくても収束の意味合いだけしっかりと定義すれば指数関数は定義できます。
実際、複素数の指数関数を次のように定義できます。
$z\in\mathbb{C}$に対して、
$$e^z=\sum_{n=0}^{\infty}\frac{z^n}{n!}$$
と定義し、指数関数という。
さて、ここで先ほど言った収束の意味合いさえ定義できればという言葉を思い出すと、別に数にこだわる必要もないはずです。そこで最後に次章では数でないものについて指数関数を定義してみましょう。
みなさんは行列をご存じでしょうか?教育課程によってはやってない方もいるかと思います。筆者はぎりぎり行列をやる高校3年生でした。
簡単に言えば行列とは
$$A=\left( \begin{array}{cccc} a_{11} & a_{12} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \ldots & a_{mn} \end{array} \right)$$
のように数を縦と横に並べたようなものを指します。この記事では簡単のため$2\times 2$行列、すなわち
$$A=\left(
\begin{array}{cccc}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{array}
\right)$$
の形しか扱いませんが、より一般的に扱える事実もあることは予め断っておきます。
さて、収束の意味合いを定めるとは結局ノルムを決めることが大切になってきます。そこで、行列$A$に対してつぎのようなノルムを定めます。
$A$を$2\times 2$行列とするとき
$$\|A\|=\sup_{\substack{x\in\mathbb{R}^2\setminus\{0\}}}\frac{\|Ax\|}{\|x\|}$$
と定義する。ただし、$A=\left(
\begin{array}{cccc}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{array}
\right),\ x={}^t(x_1, x_2)$に対して
$$Ax= \left(
\begin{array}{c}
a_{11}x_1+a_{12}x_2 \\
a_{21}x_1+a_{22}x_2 \\
\end{array}
\right)
$$
であり、
$$\|x\|=\sqrt{x_1^2+x_2^2}$$
である。
作用素ノルムというからにはノルムになります。$\|A\|\geq 0$であって$\|A\|=0$であれば$A=0$であることは$Ax=0$が任意の$x\in\mathbb{R}^2$について成り立つことからわかります。また、定数倍が外に出ることは明らかですし、三角不等式については
$$\|Ax+Bx\|\leq \|Ax\|+\|Bx\|$$
よりわかります。
というわけで、このように行列にノルムを定義しました。これについて次が成り立ちます。
$A$を$2\times 2$行列とするとき$x\in \mathbb{R}^2$に対して
$$\|Ax\|\leq \|A\|\|x\|$$
が成り立つ。
$x=0$ならば明らかなので$x\neq 0$とします。さて、このとき作用素ノルムの定義から
$$\|Ax\|=\frac{\|Ax\|}{\|x\|}\|x\|\leq \|A\|\|x\|$$
となるので成り立つことがわかります。(証明終了)
これより特に$\|A^n\|\leq \|A\|^n$が成り立つので次がわかります。
$A$を$2\times 2$行列とするとき、
$$e^A=\sum_{n=0}^{\infty}\frac{A^n}{n!}$$
と定義すると作用素ノルムに関して収束する。
$$\left\|\sum_{n=0}^{\infty}\frac{A^n}{n!}\right\|\leq \sum_{n=0}^{\infty}\frac{\|A\|^n}{n!}=e^{\|A\|}<\infty$$
より収束することがわかります。(証明終了)
ということで指数関数は行列についても定義できることがわかりました。しかも行列の微分を定めることで次が成り立つこともわかります。
$$X(t)= \left(
\begin{array}{ccc}
x_{11}(t) & x_{12}(t) \\
x_{21}(t) & x_{22}(t)
\end{array}
\right)
$$に対して
$$\frac{dX}{dt}(t)= \left(
\begin{array}{ccc}
x_{11}'(t) & x_{12}'(t) \\
x_{21}'(t) & x_{22}'(t)
\end{array}
\right)
$$
と定義する。このとき、$2\times 2$行列$A$に対して$\Phi_A(t)=e^{tA}$とすると以下が成り立つ:
(1)$\Phi_A(-t)\Phi_A(t)=1\quad (t\in\mathbb{R})$である. これより特に$\Phi_A(t)\neq O$であり, $\Phi_A^{-1}(t)=\Phi_A(-t)$である.
(2)$$\Phi_A(0)=\left(
\begin{array}{ccc}
1 & 0\\
0 & 1
\end{array}
\right),\ \frac{d\Phi_A}{dt}(t)=A\Phi_A(t)$$
が成り立つ。またこのような$X(t)$は$\Phi_A(t)$のみである。
(3)$A, B$を$2\times 2$行列とするとき、$AB=BA$ならば$\Phi_{A+B}=\Phi_{A}\Phi_{B}$である。
一般に行列の掛け算は
$$A=\left(
\begin{array}{ccc}
a_{11} & a_{12}\\
a_{21} & a_{22}
\end{array}
\right),\quad B=\left(
\begin{array}{ccc}
b_{11} & b_{12}\\
b_{21} & b_{22}
\end{array}
\right)
$$
とするとき
$$AB=\left(
\begin{array}{ccc}
a_{11}b_{11}+a_{12}b_{21} & a_{11}b_{12}+a_{12}b_{22}\
a_{21}b_{11}+a_{22}b_{21} & a_{21}b_{12}+a_{22}b_{22}
\end{array}
\right)
$$
と定義されます。この積は一般には非可換です。
証明は定理1と同様にできます。このように指数関数は行列に拡張することができました。ただし、指数関数は可換なときに限られます。我々は前回指数法則を手掛かりに指数関数を拡張してきましたが、今度は(★)を手掛かりに拡張していった結果指数関数はある程度切り離さざるを終えないということです。このあたりは何をもって指数関数を特徴づけるかというところによります。まぁ、この辺りがちょっと難しいところですね。
というわけで、今回は微分されたときの性質に注目することで指数関数をさらに拡張することを考えました。
次回は指数関数がどんなところに現れるのか、というところに注目して話を進めてみることとしましょう。
ではまたいつか。