この記事ではジョルダン標準形の導出について雑に解説していきます。
正方行列$A\in M_n(\C)$に対してある正則行列$P$が存在して$P^{-1}AP$は上三角行列となる。
$n$に関する数学的帰納法によって示す。$n=1$のときは明らか。
いま$A$の固有ベクトルを任意に一つ取り$\x$とおき、対応する固有値を$\la$とする。このとき$\x$を含む$n$個の線形独立なベクトル、つまり$\C^n$の基底$\x_1,\x_2,\ldots,\x_n\quad(\x_1=\x)$を取り
$$Q=\begin{pmatrix}
\x_1&\x_2&\cdots&\x_n
\end{pmatrix}$$
とおくとこれは正則行列であり
\begin{align}
Q^{-1}AQ
&=Q^{-1}\begin{pmatrix}
A\x_1&A\x_2&\cdots&A\x_n
\end{pmatrix}\\
&=Q^{-1}\begin{pmatrix}
\la\x_1&\huge\ast
\end{pmatrix}\\
&=\begin{pmatrix}
\la&\huge\ast\\
\O&A'
\end{pmatrix}\qquad(A'\in M_{n-1}(\C))
\end{align}
が成り立つ。
また帰納法の仮定より$P'^{-1}A'P'$を上三角行列とするような正則行列$P'$が取れるので、これに対し
$$P=Q\begin{pmatrix}
1&\huge\ast\\
\O&P'
\end{pmatrix}$$
とおくと
$$P^{-1}AP=\begin{pmatrix}
\la&\huge\ast\\
\O&P'^{-1}A'P'
\end{pmatrix}$$
は上三角行列となる。
$A$の上三角化$P^{-1}AP$の対角成分を$\la_1,\la_2,\ldots,\la_n$とおくと$A$の固有多項式は
$$\det(xI-A)=(x-\la_1)(x-\la_2)\cdots(x-\la_n)$$
と求まる。
$$\det(xI-A)=\det(P(xI-P^{-1}AP)P^{-1})=\det(xI-P^{-1}AP)$$
に注意するとわかる。
$A$の固有多項式
$$\Phi_A(x)=\det(xI-A)$$
に対し
$$\Phi_A(A)=\O$$
が成り立つ。
$A$の上三角化を
$$T=P^{-1}AP=\begin{pmatrix}
\begin{matrix}
\la_1\\&\la_2
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&\la_n
\end{matrix}
\end{pmatrix}$$
とおくと
\begin{align}
\Phi_A(A)
&=(A-\la_1I)(A-\la_2I)\cdots(A-\la_nI)\\
&=P(T-\la_1I)(T-\la_2I)\cdots(T-\la_nI)P^{-1}\\
&=P\begin{pmatrix}
\begin{matrix}
0\\&\la_2-\la_1
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&\la_n-\la_1
\end{matrix}
\end{pmatrix}\begin{pmatrix}
\begin{matrix}
\la_1-\la_2\\&0
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&\la_n-\la_2
\end{matrix}
\end{pmatrix}\cdots\begin{pmatrix}
\begin{matrix}
\la_1-\la_n\\&\la_2-\la_n
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&0
\end{matrix}
\end{pmatrix}P^{-1}
\end{align}
が成り立つので、これを計算することで
$$\Phi_A(A)=P\O P^{-1}=\O$$
となることがわかる
以下、行列$A$の固有多項式が互いに異なる固有値$\la_1,\la_2,\ldots,\la_k$によって
$$\Phi_A(x)=(x-\la_1)^{r_1}(x-\la_2)^{r_2}\cdots(x-\la_k)^{r_k}$$
と因数分解されているものとし、$A$の上三角化を
$$T=P^{-1}AP=\begin{pmatrix}
\begin{matrix}
T_1\\&T_2
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&T_k
\end{matrix}
\end{pmatrix}\qquad(T_j=\begin{pmatrix}
\begin{matrix}
\la_j\\&\la_j
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&\la_j
\end{matrix}
\end{pmatrix}\in M_{r_j}(\C))$$
とおきます。
行列$A$の固有値$\la$に対し
\begin{align}
W(\la)
&=\bigcup^\infty_{m=1}\Ker((A-\la I)^m)\\
&=\{\x\in\C^n\mid \exists m,\ (A-\la I)^m\x=0\}
\end{align}
と定まる空間$W(\la)$のことを広義固有空間と言う。
$$W(\la_j)=\Ker((A-\la_jI)^{r_j})$$
および
$$\dim W(\la_j)=r_j$$
が成り立つ。
適当に番号を入れ替えることで$j=1$としてよい。
いまケイリー・ハミルトンの定理により
$$(T_1-\la_1I)^{r_1}=0$$
が成り立つことに注意すると$m\geq r_1$において
\begin{align}
(A-\la_1I)^m
&=P(T-\la_1I)P^{-1}\\
&=P\begin{pmatrix}
\begin{matrix}
\O\\&(T_2-\la_1I)^m
\end{matrix}&\huge\ast\\
\O&\begin{matrix}
\ddots\\&(T_k-\la_1I)^m
\end{matrix}
\end{pmatrix}P^{-1}
\end{align}
となるので$\C^n$の標準基底を$\e_1,\e_2,\ldots,\e_n$とおくと
\begin{align}
\Ker((A-\la_1I)^m)
&=\operatorname{span}\langle P\e_1,P\e_2,\ldots,P\e_{r_1}\rangle\\
&=\Ker((A-\la_1I)^{r_1})
\end{align}
を得る。
$$\sum^k_{j=1}W(\la_j)=\bigoplus^k_{j=1}W(\la_j)$$
が成り立つ。特に
$$\C^n=\bigoplus^k_{j=1}W(\la_j)$$
となる。
ある$\x_j\in W(\la_j)\;(j=1,2,\ldots,k)$に対し
$$\sum^k_{j=1}\x_j=0$$
が成り立つとすると
$$\x_1=\x_2=\cdots=\x_k=0$$
となることを示せばよい。
いま
$$\x_1\in\operatorname{span}\langle P\e_1,P\e_2,\ldots,P\e_{r_1}\rangle$$
であったことに注意すると
\begin{align}
(A-\la_jI)^{r_j}\x_1
&=P(T-\la_jI)^{r_j}P^{-1}\x_1\\
&=P\begin{pmatrix}
(T_1-\la_jI)^{r_j}&\huge\ast\\
\O&\huge\ast
\end{pmatrix}P^{-1}\x_1\\
&=P\begin{pmatrix}
(T_1-\la_jI)^{r_j}&\O\\
\O&I
\end{pmatrix}P^{-1}\x_1\\
\end{align}
が成り立つので、仮定の式に$(A-\la_2I)^{r_2}\cdots(A-\la_kI)^{r_k}$を掛けることで
\begin{align}
&(A-\la_2I)^{r_2}\cdots(A-\la_kI)^{r_k}\x_1\\
={}&P\begin{pmatrix}
(T_1-\la_2I)^{r_2}\cdots(T_1-\la_kI)^{r_k}&\O\\
\O&I
\end{pmatrix}P^{-1}\x_1\\
={}&0
\end{align}
が得られる。あとは$j\neq1$に対し
$$(T_1-\la_jI)^{r_j}=\begin{pmatrix}
(\la_1-\la_j)^{r_j}&&\huge\ast\\
&\ddots\\
\O&&(\la_1-\la_j)^{r_j}
\end{pmatrix}$$
は可逆であることに注意すると$\x_1=0$でなければならないことがわかる。$\x_2,\ldots,\x_k$についても上三角化の取り方を変えることで同様にして示せる。
また
$$\dim\l(\bigoplus^k_{j=1}W(\la_j)\r)=\sum^k_{j=1}r_j=n$$
より
$$\C^n=\bigoplus^k_{j=1}W(\la_j)$$
を得る。
行列$A$の固有値$\la$に対し
$$(A-\la I)^{m-1}\x\neq0,\quad(A-\la I)^m\x=0$$
を満たすようなベクトル$\x$のことを階数$m$の広義固有ベクトルと言う。
階数$m$の広義固有ベクトルに$\Ker((A-\la I)^{m-1})$の元を足してもそれは再び階数$m$の広義固有ベクトルとなります。そのことを踏まえて
$$V_m=\Ker((A-\la I)^m)/\Ker((A-\la I)^{m-1})$$
という商空間を考えてみましょう。
$$\dim V_{m+1}\leq\dim V_m$$
が成り立つ。
簡単のため$B=A-\la I$とおく。
線形写像
\begin{align}
V_{m+1}&\to V_m\\
\x+\Ker(B^m)&\mapsto B\x+\Ker(B^{m-1})
\end{align}
を考えると
$$B\x\in\Ker(B^{m-1})\iff\x\in\Ker(B^m)$$
よりこれは単射である。よって主張を得る。
階数$m$の広義固有ベクトル$\x$に対し
\begin{alignat}{3}
\x_m&=\x\\
\x_{m-1}&=(A-\la I)\x_m\\
\x_{m-2}&=(A-\la I)\x_{m-1}&&=(A-\la I)^2\x\\
&\ \ \vdots\\
\x_1&=(A-\la I)\x_2&&=(A-\la I)^{m-1}\x
\end{alignat}
と定まる列$\x_1,\x_2,\ldots,\x_m$のことを$\x_m$が生成するジョルダン鎖と言う。
また$m$次正方行列
$$J_m(\la)=\begin{pmatrix}
\la&1&&&\O\\
&\la&1&\\
&&\ddots&\ddots\\
&&&\la&1\\
\O&&&&\la
\end{pmatrix}\in M_m(\C)$$
のことをジョルダン細胞と言う。
ジョルダン鎖$\x_1,\x_2,\ldots,\x_m$に対し
$$Q=\begin{pmatrix}
\x_1&\x_2&\cdots&\x_m
\end{pmatrix}$$
とおくと
$$AQ=QJ_m(\la)$$
が成り立つ。
\begin{align}
AQ&=\begin{pmatrix}
A\x_1&A\x_2&\cdots&A\x_m
\end{pmatrix}\\
&=\begin{pmatrix}
\la\x_1&\x_1+\la\x_2&\cdots&\x_{m-1}+\la\x_m
\end{pmatrix}\\
&=\begin{pmatrix}
\x_1&\x_2&\cdots&\x_m
\end{pmatrix}\begin{pmatrix}
\la&1&&\\
&\la&\ddots\\
&&\ddots&1\\
&&&\la
\end{pmatrix}
\end{align}
とわかる。
正方行列$A\in M_n(\C)$に対してある正則行列$P$が存在して
$$P^{-1}AP=\begin{pmatrix}
J_{m_1}(\rho_1)&&&\O\\
&J_{m_2}(\rho_2)\\
&&\ddots\\
\O&&&J_{m_l}(\rho_l)
\end{pmatrix}$$
とブロック対角化できる。この右辺の行列のことを$A$のジョルダン標準形と言う。
命題6の証明から$A$の固有値$\la$(重複度$r$)に対し
$$d_m=\dim V_1-\dim V_m$$
とおくと
$$V_m=BV_{m+1}\oplus\bigoplus^{d_{m+1}}_{j=d_m+1}\C(\x_{m,j}+\Ker(B^{m-1}))$$
を満たすような
$$d_{m+1}-d_m=\dim V_m-\dim V_{m+1}$$
個の線形独立な元が取れる。このときその代表元$\x_{m,j}$が生成するジョルダン鎖$\x_{1,j},\ldots,\x_{m,j}$を考えると
\begin{align}
V_m&=\bigoplus^{d_r}_{j=d_m+1}\C(\x_{m,j}+\Ker(B^{m-1}))\\
\Ker(B^m)&=\Ker(B^{m-1})\oplus\bigoplus^{d_r}_{j=d_m+1}\C\x_{m,j}\\
&=\bigoplus^m_{l=1}\bigoplus^{d_r}_{j=d_l+1}\C\x_{l,j}
\end{align}
などが成り立つ。
特に$\{\x_{l,j}\}_{l,j}$は広義固有空間$W(\la)$の基底を成し、それらを横に並べた$n\times r$行列を$Q(\la)$とおくと
$$AQ(\la)=Q(\la)\begin{pmatrix}
J^1(\la)\\
&\ddots\\
&&J^{d_{r+1}}(\la)
\end{pmatrix}$$
のようにブロック対角化できるので、各固有値に対してこれを並べた$n$次正方行列を
$$P=\begin{pmatrix}
Q(\la_1)&Q(\la_2)&\cdots&Q(\la_k)
\end{pmatrix}$$
とおくと(命題5より)これは正則であり、$P^{-1}AP$はジョルダン標準形となる。
$A$のジョルダン標準形において、固有値$\la$に関するジョルダン細胞の個数は
$$\dim\Ker(A-\la I)$$
個である。またそのうちサイズ$m$のものは
$$2\dim\Ker((A-\la I)^m)-\dim\Ker((A-\la I)^{m-1})-\dim\Ker((A-\la I)^{m+1})$$
個である。
上の証明からジョルダン細胞の個数、つまりジョルダン鎖の本数は
$$d_{r+1}=\dim V_1=\dim\Ker(A-\la I)$$
と求まる。またサイズ$m$のジョルダン細胞の個数、つまり長さ$m$のジョルダン鎖の本数は
\begin{align}
\dim V_m-\dim V_{m+1}
&=(\dim\Ker(B^m)-\dim\Ker(B^{m-1}))-(\dim\Ker(B^{m+1})-\dim\Ker(B^m))\\
&=2\dim\Ker(B^m)-\dim\Ker(B^{m-1})-\dim\Ker(B^{m+1})
\end{align}
と求まる。