$A$を$\mathbb{C}$上の$n$次正方行列とする。$A$の固有多項式を$\Phi_A(\lambda)$とし、$\lambda$を$\Phi_A(\lambda)$における重複度が$n$の固有値とする。このとき、固有値$\lambda$に対応する広義固有空間$W(\lambda)$とは
\begin{equation}
W(\lambda)=\ker(A-\lambda I)^{n}
\end{equation}
を指す。また、$W(\lambda)$に含まれるベクトルを固有値$\lambda$の広義固有ベクトルという。
固有値$\lambda$に対応する固有空間$V(\lambda)$の定義が
\begin{equation}
V(\lambda)=\ker(A-\lambda I)
\end{equation}
であったことを踏まえると、広義固有空間は固有空間を含む事がわかる。
この記事では次の定理を示すことを目的とする。
$A$の相異なる固有値を$\lambda_1,\,\dots,\,\lambda_m$とする。このとき、
\begin{equation}
\mathbb{C}^n=\bigoplus_{i=1}^mW(\lambda_i)
\end{equation}
が成立する。
この定理は、全ての$\mathbb{C}^n$のベクトルは広義固有ベクトルの和で表すことができること、広義固有ベクトルのみからなる$\mathbb{C}^n$の基底が存在することを指している。
固有空間の直和は必ずしも$\mathbb{C}^n$と一致しなかったことと対比させておこう。例えば、$A=\begin{pmatrix}0&1\\0&0\end{pmatrix}$を考える。$A$の固有値は0のみであり、0に対応する固有空間は$\left\{\begin{pmatrix}x_1\\0\end{pmatrix}\middle| x_1\in\mathbb{C}\right\}$であるため、固有空間の直和は$\mathbb{C}^2$全体とならない。
ここで、以下の補題を考える。補題3の主張に納得できる場合は補題2と補題3の証明は読み飛ばしても構わない。
$p_1(x),\,p_2(x)\in\mathbb{C}[x]$の最大公約数を$g(x)$とする。このとき、$a_1(x),\,a_2(x)\in\mathbb{C}[x]$で、
\begin{equation}
a_1(x)p_1(x)+a_2(x)p_2(x)=g(x)
\end{equation}
となるものが存在する。
$p_i(x)$の$p_{i+1}(x)$による割り算が定義できるとき、割ったあまりを$p_{i+2}(x)$とする。これを繰り返すことによって多項式の列$\{p_{i}(x)\}_i$を定義する。このとき、ある$q_{i+1}(x)$を用いて
\begin{equation}
p_i(x)-q_{i+1}(x)p_{i+1}(x)=p_{i+2}(x)
\end{equation}
となる。$\deg p_{i+1}(x)>\deg p_{i+2}(x)$より$i=2$以降$\deg p_i(x)$は単調減少で、ある$R$において$p_{R-1}(x)\neq0,\,p_R(x)=0$となる。
$d(x)$が$p_i(x)$と$p_{i+1}(x)$を割り切るとき$p_{i+2}(x)$も$d(x)$で割り切れ、$d(x)$が$p_{i+1}(x)$と$p_{i+2}(x)$を割り切るとき$p_{i}(x)$も$d(x)$で割り切れるため、$p_i(x)$と$p_{i+1}(x)$の最大公約数と$p_{i+1}(x)$と$p_{i+2}(x)$は等しい。$p_{R-1}(x)|p_{R-2}(x)$より、$p_{R-1}(x)$と$p_{R-2}(x)$の最大公約数は$p_{R-1}(x)$であり、$p_1(x)$と$p_2(x)$の最大公約数も$p_{R-1}(x)$である。よって、$p_{R-1}(x)=g(x)$である。
ここで、$i=2,\,\dots,\,R-1$について$b_i(x)p_{i-1}(x)+c_i(x)p_{i}(x)=g(x)$となる$b_i(x),\,c_i(x)\in\mathbb{C}[x]$が存在することを帰納法により示す。$i=R-1$のときは、$b_i(x)=0,\,c_i(x)=1$とすればよい。$i$のときの成立を仮定すると、$b_i(x)p_{i-1}(x)+c_i(x)p_{i}(x)=g(x)$で、$p_i(x)=p_{i-2}(x)-q_{i-1}(x)p_{i-1}(x)$より、
\begin{equation}
c_ip_{i-2}(x)+(b_i(x)-c_i(x)q_{i-1}(x))p_{i-1}(x)=g(x)
\end{equation}
であり、$b_{i-1}(x)=c_i(x),\ c_{i-1}(x)=b_i(x)-c_i(x)q_{i-1}(x)$とすればよく、$i-1$でも成立する。
$a_1(x)=b_2(x),\,a_2(x)=c_2(x)$とすれば補題2は示される。
$p_1(x),\,\dots,\,p_r(x)\in\mathbb{C}[x]$が互いに素であるとする。このとき、$a_1(x),\,\dots,\,a_r(x)\in\mathbb{C}[x]$で、
\begin{equation}
\sum_{i=1}^ra_i(x)p_i(x)=1
\end{equation}
となるものが存在する。
$q_1(x)=p_1(x),\ q_{i+1}(x)=\gcd(q_i(x),\,p_{i+1}(x))$とする。このとき、$q_r(x)=\gcd(p_1(x),\,\dots,\,p_r(x))=1$である。このとき、$\sum_{i=1}^ka_{k,i}(x)p_i(x)=q_k(x)$となるような$a_{k,i}(x)\in\mathbb{C}[x]$が存在することを示せばよい。帰納法により示す。
$k=1$のとき、$a_{1,1}(x)=1$とすればよい。$k$のとき成立すると仮定すると、$\sum_{i=1}^ka_{k,i}(x)p_i(x)=q_k(x)$となるような$a_{k,i}(x)\in\mathbb{C}[x]$が存在する。また、B'{e}zoutの定理より$b(x)q_k(x)+c(x)p_{k+1}(x)=q_{k+1}(x)$なる$b(x),\,c(x)\in\mathbb{C}[x]$が存在する。よって、$a_{k+1,i}(x)=b(x)a_{k,i}(x)\,(i=1,\,\dots,\,k),\ a_{k+1,k+1}(x)=c(x)$とすればよい。
Lemma 3を用いると広義固有空間分解ができることが示せる。見てみよう。
固有値$\lambda_i$の$\Phi_A(\lambda)$における重複度を$n_i$とする。このとき、
\begin{equation}
\Phi_A(\lambda)=\prod_{i=1}^m(\lambda-\lambda_i)^{n_i}
\end{equation}
とかける。このとき、$p_i(x)=\prod_{i\neq j}(\lambda-\lambda_j)^{n_j}$とすると、$p_1(x),\,\dots,\,p_m(x)$の最大公約数は1であり、Lemma 4より$a_i(x)\in\mathbb{C}[x]$が存在して
\begin{equation}
\sum_{i=1}^m a_i(x)p_i(x)=1 \tag{1}
\end{equation}
となり、
\begin{equation}
\sum_{i=1}^m a_i(A)p_i(A)=I
\end{equation}
となる。このとき、任意の$v\in\mathbb{C}^n$について
\begin{equation}
\sum_{i=1}^m a_i(A)p_i(A)v=v \tag{2}
\end{equation}
となる。ここで、$(A-\lambda_iI)^{n_i},\,a_i(A),\,p_i(A)$は全て$A$の多項式で表される行列なので交換し、Cayley-Hamiltonの定理より
\begin{equation}
(A-\lambda_iI)^{n_i}a_i(A)p_i(A)=a_i(A)(A-\lambda_iI)^{n_i}p_i(A)=a_i(A)\Phi_A(A)=O\end{equation}
となり、$\mathrm{Im\;} a_i(A)p_i(A)\subset\ker(A-\lambda_iI)^{n_i}=W(\lambda_i)$。逆に、$w\in W(\lambda_i)=\ker(A-\lambda_iI)^{n_i}$を取ると
\begin{equation}
w=\sum_{i=1}^m a_i(A)p_i(A)w=a_i(A)p_i(A)w\in\mathrm{Im\;} a_i(A)p_i(A)
\end{equation}
となり、$\mathrm{Im\;} a_i(A)p_i(A)\supset W(\lambda_i)$。以上より、$\mathrm{Im\;} a_i(A)p_i(A)= W(\lambda_i)$
式(2)は$\mathrm{Im\;} a_i(A)p_i(A)=W(\lambda_i)$の元の和で$v$を表している式である。よって、
\begin{equation}
\mathbb{C}^n=\sum_{i=1}^mW(\lambda_i) \tag{3}
\end{equation}
式(3)の右辺が直和であることを示すには、どのように$w_i\in W(\lambda_i)$をとっても$w_1,\,\dots,\,w_m$が線形独立であることを示せば良い。$\sum_{i=1}^mw_i=0$とする。(2)より、
\begin{align}
w_i={}&a_i(A)P_i(A)w_j\ (\rm{後に示す}) \tag{4}\\
={}&a_i(A)P_i(A)\sum_{j=1}^mw_j\\
={}&0
\end{align}
となり、$w_1,\,\dots,\,w_m$は線形独立となり、(3)の右辺は直和となり、Theorem 2は示される。
以下、式(4)を示す。$P_i(x)$の定義より$a_i(x)P_i(x)=0\mod (x-\lambda_j)^{n_j}\ (i\neq j)$であり、式(1)より$a_i(x)P_i(x)=1\mod (x-\lambda_i)^{n_i}$なので、$\left(a_i(x)P_i(x)\right)^2=a_i(x)P_i(x)\mod \Phi_A(x)$で、Cayley-Hamiltonの定理より
\begin{equation}
\left(a_i(A)P_i(A)\right)^2=a_i(A)P_i(A)
\end{equation}
である。これと、$w_i\in W(\lambda_i)=\mathrm{Im;}a_i(A)P_i(A)$より$w_i=a_i(A)P_i(A)w_i$となり、式(4)が示される。
$P_i(A)=a_i(A)p_i(A)$とすると、式(2)は単位行列を$P_i(A)$の和で表している。最後の議論より各$P_i(A)$は$P_i(A)^2=P_i(A)$を満たす射影行列であり、Cayley-Hamiltonの定理より$P_i(A)P_j(A)=P_j(A)P_i(A)=0$となるので、各$P_i(A)$は互いに交わらない射影である。そのため、射影行列の一般論より、各射影行列の像の直和で元の空間が表されることが言える。これと$\mathrm{Im\;} a_i(A)p_i(A)= W(\lambda_i)$より、広義固有空間の直和で元の空間が表されることが言える、という流れである。Bézoutの定理により各広義固有空間への射影が得られるところが鍵である。