後期の線形代数で行列の対角化を学習しました。これを理解する際に重要となるのが「固有空間によるベクトル空間の分解」です。
しかし、この「線形写像で空間を分割する」という感覚がわからないわからない…最近やっと整理がついたので、ここでは備忘録の第一回として、対角化が何を目指した作業なのかを整理してみたいと思います。
まず、固有空間の定義を確認しておきましょう。
$V$をベクトル空間とし、$f:V\to V$を線形写像とする。
このとき、$f$が$f(v)=\lambda v$を満たすとき$\lambda$を$f$の固有値といい、$v$を$\lambda$に属する固有ベクトルという。
各$\lambda$に属する固有ベクトルの張る空間は$V$の部分空間となる。この部分空間を$\lambda$の固有空間といい$E(\lambda)$と書くことにする。
ここで注目しておきたいのは、「各固有空間の中では線形写像を楽に作用させることができる」という点です。
上の定義を幾何的に解釈すれば、「$v$という固有空間の元を$f$でおくることで得られるベクトルは、$v$の定数倍になっている」ということになります。
また代数的にも、「$v$に固有値(定数)$\lambda$をかける」という操作なので、想像がしやすいです。
さて、固有空間について次の定理が成り立ちます。
$f:V\to V$を線形写像とする。また、$\lambda_{1},\cdots,\lambda_{r}$を相異なる$f$の固有値とする。このとき、固有空間$E(\lambda_1),\cdots,E(\lambda_{r})$の和空間は、直和になる:
$$
E(\lambda_{1})+\cdots+E(\lambda_{r})=E(\lambda_1)\oplus\cdots\oplus E(\lambda_r)
$$
Proof.
帰納法で示します。
まず、$k-1$個まで直和になることを仮定します:
$E(\lambda_1)+\cdots+E(\lambda_{k-1})=E(\lambda_1)\oplus\cdots\oplus E(\lambda_{k-1})$
次に、$k$個の場合も直和になること、すなわち
$
\bigl(E(\lambda_1)\oplus\cdots\oplus E(\lambda_{k-1})\bigr)\cap E(\lambda_k)=\{0\}
$
を示します。
$v\in\bigl(E(\lambda_1)\oplus\cdots\oplus E(\lambda_{k-1})\bigr)\cap E(\lambda_k)$を取ります。
帰納法の仮定より、この$v$は
$
v=v_1+\cdots+v_{k-1}\qquad (v_i\in E(\lambda_i))
$
と一意に書けます。
ここで$v\in E(\lambda_k)$なので
$
Av=\lambda_k v=\lambda_k(v_1+\cdots+v_{k-1})
$
が成り立ちます。
一方で、各$v_i\in E(\lambda_i)$より
$
Av=\lambda_1 v_1+\cdots+\lambda_{k-1}v_{k-1}
$
でもあります。したがって
$
\lambda_k(v_1+\cdots+v_{k-1})
=
\lambda_1 v_1+\cdots+\lambda_{k-1}v_{k-1},
$
つまり
$
0=\sum_{i=1}^{k-1}(\lambda_i-\lambda_k)v_i
$
となります。
帰納法の仮定から$E(\lambda_1)\oplus\cdots\oplus E(\lambda_{k-1})$は直和なので、上の和が$0$になるためには各成分が$0$でなくてはなりません。よって
$
(\lambda_i-\lambda_k)v_i=0\qquad (i=1,\dots,k-1)
$
が従います。
さらに$\lambda_k\neq\lambda_i$(固有値は相異なる)より$\lambda_i-\lambda_k\neq 0$なので、結局$v_i=0$が従います。したがって
$
v=v_1+\cdots+v_{k-1}=0
$
となり、交わりは$\{0\}$です。
以上より
$
E(\lambda_1)+\cdots+E(\lambda_k)
=
E(\lambda_1)\oplus\cdots\oplus E(\lambda_k)
$
が成り立ちます。□
この節では、線形写像の対角化について見ていきます。
$f:V\to V$を線形写像とする。このとき$f$が対角化可能であるとは、$V$が
$$
V=E(\lambda_1)\oplus\cdots\oplus E(\lambda_r)
$$
と直和分解できること。
この定義だけ見ると、「いったいどこが対角化なの?」という感じもします。次のように定義すると、対角化という言葉の意味が直感的に分かりやすいかもしれません。
$A\in M_n(\mathbb{C})$が対角化可能であるとは、ある正則行列$P$が存在して$B=P^{-1}AP$が対角行列になること。
今回のメインテーマは「空間の分解」の意味を理解することなので、前者を定義として採用していますが、これら二つの命題が同値なことは証明することができます。
さて、対角化を考えるためには「表現行列」と「基底の変換行列」を理解しておく必要があります。そこでまずは、表現行列から見ていきます。
まずは、表現行列の定義を確認しましょう。
$V$を$n$次元、$W$を$m$次元のベクトル空間とし、$f:V\to W$を線形写像とする。
また、$V$の基底を$\{v_1,\dots,v_n\}$、$W$の基底を$\{w_1,\dots,w_m\}$とする。このとき
$
(f(v_1),\dots,f(v_n))=(w_1,\dots,w_m)A
$
を満たす$A\in M_{m\times n}(\mathbb{C})$が存在する。この$A$を$f$の表現行列という。
Remark.
存在すると言ってはいるものの、その存在はまだ示していません。そこで、存在することを以下に示しておきます。
Proof.
各$i$について
$f(v_i)=a_{1i}w_1+\cdots+a_{mi}w_m$
とします。これは
$ f(v_i)=(w_1\ \cdots\ w_m) \begin{pmatrix} a_{1i}\\ \vdots\\ a_{mi} \end{pmatrix} $
のように書き直せます。よって
$ A= \begin{pmatrix} a_{11}&\cdots&a_{1n}\\ \vdots&\ddots&\vdots\\ a_{m1}&\cdots&a_{mn} \end{pmatrix} $
が存在します。□
さて、以上のようにして表現行列を定義でき、またその存在も示すことができました。ここで注意したいのは、任意の線形写像について表現行列が存在しているという点です。実際、上の証明でも特定の線形写像にしか成り立たないような性質は使っていません。
ここまでで説明した内容を、図を用いて整理することがあります。その準備として、写像$\phi:V\to\mathbb{R}^n$を
$
\phi(a_1v_1+\cdots+a_nv_n)={}^t(a_1,\dots,a_n)
$
写像$\psi:W\to\mathbb{R}^m$を
$
\psi(b_1w_1+\cdots+b_mw_m)={}^t(b_1,\dots,b_m)
$
として定めておきましょう。これは「基底を軸とするような座標系を考えている」ということでもあります。大学受験のときにテクニックとして「斜交座標系」を学習した方もいるかもしれません。これらの写像は斜光座標の考え方を$n$次元に一般化し、さらに写像の言葉で表現しなおしたものともいえます。
さて、この$\phi$と$\psi$を用いると、上の「表現行列」は次の図式で整理できます。
\begin{CD} V @>f>> W\\ @VV\phi V @VV\psi V\\ \mathbb{R}^n @>A>> \mathbb{R}^m \end{CD}
実際、$v\in V$をとったとき、これは$f(v)=q_1w_1+\cdots+q_mw_m$と書くことができますが、この操作は次の手順に対応します。
Remark.
(step3)で何をしているのかが少し分かりにくいかもしれません。そもそも表現行列というのは、各基底$v_j$がどこに送られるのかを指定しているような行列でした。
一方で
\begin{pmatrix} p_1\\ \vdots\\ p_n \end{pmatrix}
は$v$を基底で表現したときの係数です。$f$の線形性により、$v=\sum_j p_jv_j$なら$f(v)=\sum_j p_jf(v_j)$となるので、係数は「列ベクトルの線形結合」でまとめて計算できます。
行列$A$の第$ij$成分は「$f(v_j)$の$w_i$成分はいくらか」という情報であり、これを左から掛けることでまとめて計算しています。
続いて、基底の変換行列という概念を見ていきます。先ほど表現行列を見ましたが、定義が少し似ています。実際に定義すると次のとおりです。
$V$をベクトル空間とする。
このとき$V$の基底として
$\mathscr{E}=\{v_1,\dots,v_n\}$
$\mathscr{E}'=\{v'_1,\dots,v'_n\}$
をとる。すると
$(v'_1,\dots,v'_n)=(v_1,\dots,v_n)P$
を満たすような正則行列$P$が存在する。この$P$を基底の変換行列という。
存在については表現行列の場合と同じように、各$v'_i$を$v_1,\dots,v_n$の線形結合で表すことで$P$を得ることができます。
注目したいのはこれが正則という点です。これは各$v_iをv'_1,\dots,v'_n$の線形結合で表して得た行列を$Q$とすると
\begin{CD}
\mathscr{E} @>P>> \mathscr{E}' @>Q>> \mathscr{E}
\end{CD}
という変換を考えたとき、$QP$が恒等変換にならなくてはならないことから分かります。
この基底の変換行列についても図式で整理すると次のようになります(下付きの$\mathscr{E},\mathscr{E}'$はその空間の基底を表します)。
\begin{CD}
V_{\mathscr{E}} @>>> V_{\mathscr{E}'}\\
@VV\phi V @VV\phi V\\
\mathbb{R}^n @>P>> \mathbb{R}^n
\end{CD}
原理自体は先ほどの表現行列と同じです。
Remark.
このときの$\mathbb{R}^n$の基底は標準基底になっています。
ここまでで表現行列、そして基底の変換行列について、その性質を見てきました。これを踏まえて対角化について見ていきます。定義を再掲しておきます。
$f:V\to V$を線形写像とする。このとき$f$が対角化可能であるとは、$V$が$V=E(\lambda_1)\oplus\cdots\oplus E(\lambda_r)$と直和分解できること。
このように対角化可能であるとはベクトル空間$V$が直和分解できることを意味します。そして、このように直和分解できるなら、$V$の基底を「各$E(\lambda_i)$の基底を集めたもの」としてとることができます。これが「線形写像による空間の分解」の中身だと言えるでしょう。
$V$を$n$次元のベクトル空間とし、$f:V\to V$を線形写像とする。$f$が対角化可能である条件は、固有空間の基底をすべて集めた集合が$V$の基底となること。
まず$f$が対角化可能であるとします。このとき$V=E(\lambda_1)\oplus\cdots\oplus E(\lambda_r)
$と直和分解できます。$E(\lambda_i)$の基底を$v_i^{(1)},\dots,v_i^{(\mu_i)}$とします($\mu_1+\cdots+\mu_r=n$)。この基底全体の集合が$V$の基底になっていることを示します。
$w_i=\sum_{k=1}^{\mu_i} a_i^{(k)}v_i^{(k)}$とし、$\sum_{l=1}^r w_l=0$とすると直和分解の一意性から$w_l=0$です。さらに、$v_{i}^{(k)}$は固有空間$E(\lambda_{i})$の基底なので、すべての$k$で$a_i^{(k)}=0$となります。したがって一次独立です。また、本数が$n$本あるので、これは$V$の基底となります。
逆に、固有空間の基底をすべて集めた集合が$V$の基底であるとします。各固有空間が$V$の部分空間であることから$V\supset E(\lambda_1)\oplus\cdots\oplus E(\lambda_r)$です。ここで$\dim E(\lambda_i)=\mu_i$と置くと、基底を全部集めた本数が$n=\dim V$なので$\sum_{i=1}^r \mu_i = n$となります。したがって上の包含は等号になり$V=E(\lambda_1)\oplus\cdots\oplus E(\lambda_r)$が成り立ちます。□
このように、対角化可能な線形写像$f$を用いることによって、$V$を$E(\lambda_i)$という「小さな空間」に全体を重複なく分割できたことになります。そしてこの空間の最大の特徴は「$f$を作用させる計算が非常にやりやすい」ということです。
そう考えると$V$の元に対して$f$を作用させる場面において、そのまま$f$を作用させるよりも、(取り直すことができるのなら)基底を取り直して各$E(\lambda_i)$のなかで$f$を作用させたほうが計算が実行しやすいと考えられます。つまり次の図式のように、最初は$\mathscr{E}$で見ていたものを、固有ベクトルから作った基底$\mathscr{E}'$で表現しなおしてから$f$を適用し、また$\mathscr{E}$に戻す(合成を$g$とする)ということです。
\begin{CD}
V_{\mathscr{E}} @>g>> V_{\mathscr{E}}\\
@VV\psi V @AA\psi^{-1}A\\
V_{\mathscr{E}'} @>f>> V_{\mathscr{E}'}
\end{CD}
Remark.
上の図にあるような$\psi$を作用させたとき、元の見た目(各基底の係数)が変わったとしても、実際にどの元なのかは変わっていません。基底が変われば見え方が変わることに注意したいです。
このように$\psi$を構成することができますが、このままだと少し扱いにくいです。そこで$V_{\mathscr{E}}$の基底を$\mathbb{R}^n$の標準基底に変換して考えてみます(要するに線形写像$g$を行列表示するだけです)。$g$の行列表示を$B$としましょう。すると次の図式に整理できます。
\begin{CD}
\mathbb{R}^n @>B>> \mathbb{R}^n\\
@VV P V @AA P^{-1}A\\
V_{\mathscr{E}'} @>f>> V_{\mathscr{E}'}
\end{CD}
$\mathscr{E}=\{e_1,\dots,e_n\}$、$\mathscr{E}'=\{v'_1,\dots,v'_n\}$とすると、この$P$は$(v'_1,\dots,v'_n)=(e_1,\dots,e_n)P$を満たす行列です。つまり$P=(v'_1,\dots,v'_n)$
のように、固有ベクトルを並べて構成できる行列ということになりました。
ここまでで、対角化のモチベーションを話してきました。もし、計算がしやすい基底をとれるのなら、そういう基底を取ろう!というわけです。しかし、上のような直和分解は必ずできるというわけではありません。それでも、楽に計算することができればうれしいことに変わりありません。ではどうすればいいのか。ここで登場するのがつぎの「広義固有空間」です。
$A:\mathbb{C}^n \to \mathbb{C}^n$を$n$次正方行列とし、$\lambda \in \mathbb{C}^n$を$A$の固有値とする。このとき、
$\tilde{E}(\lambda) = \{v|\exists k \in \mathbb{N}, s.t. (A - \lambda I)^{k}v=0 \} $
を$A$の広義固有空間という。
先ほどの固有空間の定義では$k=1$に限っていましたが、別にこの1に限る理由はありません。次回の記事では広義固有空間を考えるとどうなるのか?ということを考えていこうと思います。