Bézoutの等式による広義固有空間の直和で線形空間全体が表せることの証明

この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。

広義固有空間・広義固有ベクトル

$A$を$\mathbb{C}$上の$n$次正方行列とする。$A$の固有多項式を$\Phi_A(\lambda)$とし、$\lambda$を$\Phi_A(\lambda)$における重複度が$n$の固有値とする。このとき、固有値$\lambda$に対応する広義固有空間$W(\lambda)$とは
\begin{equation} W(\lambda)=\ker(A-\lambda I)^{n} \end{equation}
を指す。また、$W(\lambda)$に含まれるベクトルを固有値$\lambda$の広義固有ベクトルという。

固有値$\lambda$に対応する固有空間$V(\lambda)$の定義が
\begin{equation} V(\lambda)=\ker(A-\lambda I) \end{equation}
であったことを踏まえると、広義固有空間は固有空間を含む事がわかる。
この記事では次の定理を示すことを目的とする。

広義固有空間分解

$A$の相異なる固有値を$\lambda_1,\,\dots,\,\lambda_m$とする。このとき、
\begin{equation} \mathbb{C}^n=\bigoplus_{i=1}^mW(\lambda_i) \end{equation}
が成立する。

この定理は、全ての$\mathbb{C}^n$のベクトルは広義固有ベクトルの和で表すことができること、広義固有ベクトルのみからなる$\mathbb{C}^n$の基底が存在することを指している。
固有空間の直和は必ずしも$\mathbb{C}^n$と一致しなかったことと対比させておこう。例えば、$A=\begin{pmatrix}0&1\\0&0\end{pmatrix}$を考える。$A$の固有値は0のみであり、0に対応する固有空間は$\left\{\begin{pmatrix}x_1\\0\end{pmatrix}\middle| x_1\in\mathbb{C}\right\}$であるため、固有空間の直和は$\mathbb{C}^2$全体とならない。
ここで、以下の補題を考える。補題3の主張に納得できる場合は補題2と補題3の証明は読み飛ばしても構わない。

Bézoutの補題

$p_1(x),\,p_2(x)\in\mathbb{C}[x]$の最大公約数を$g(x)$とする。このとき、$a_1(x),\,a_2(x)\in\mathbb{C}[x]$で、
\begin{equation} a_1(x)p_1(x)+a_2(x)p_2(x)=g(x) \end{equation}
となるものが存在する。

$p_i(x)$の$p_{i+1}(x)$による割り算が定義できるとき、割ったあまりを$p_{i+2}(x)$とする。これを繰り返すことによって多項式の列$\{p_{i}(x)\}_i$を定義する。このとき、ある$q_{i+1}(x)$を用いて
\begin{equation} p_i(x)-q_{i+1}(x)p_{i+1}(x)=p_{i+2}(x) \end{equation}
となる。$\deg p_{i+1}(x)>\deg p_{i+2}(x)$より$i=2$以降$\deg p_i(x)$は単調減少で、ある$R$において$p_{R-1}(x)\neq0,\,p_R(x)=0$となる。
$d(x)$が$p_i(x)$と$p_{i+1}(x)$を割り切るとき$p_{i+2}(x)$も$d(x)$で割り切れ、$d(x)$が$p_{i+1}(x)$と$p_{i+2}(x)$を割り切るとき$p_{i}(x)$も$d(x)$で割り切れるため、$p_i(x)$と$p_{i+1}(x)$の最大公約数と$p_{i+1}(x)$と$p_{i+2}(x)$は等しい。$p_{R-1}(x)|p_{R-2}(x)$より、$p_{R-1}(x)$と$p_{R-2}(x)$の最大公約数は$p_{R-1}(x)$であり、$p_1(x)$と$p_2(x)$の最大公約数も$p_{R-1}(x)$である。よって、$p_{R-1}(x)=g(x)$である。
ここで、$i=2,\,\dots,\,R-1$について$b_i(x)p_{i-1}(x)+c_i(x)p_{i}(x)=g(x)$となる$b_i(x),\,c_i(x)\in\mathbb{C}[x]$が存在することを帰納法により示す。$i=R-1$のときは、$b_i(x)=0,\,c_i(x)=1$とすればよい。$i$のときの成立を仮定すると、$b_i(x)p_{i-1}(x)+c_i(x)p_{i}(x)=g(x)$で、$p_i(x)=p_{i-2}(x)-q_{i-1}(x)p_{i-1}(x)$より、
\begin{equation} c_ip_{i-2}(x)+(b_i(x)-c_i(x)q_{i-1}(x))p_{i-1}(x)=g(x) \end{equation}
であり、$b_{i-1}(x)=c_i(x),\ c_{i-1}(x)=b_i(x)-c_i(x)q_{i-1}(x)$とすればよく、$i-1$でも成立する。
$a_1(x)=b_2(x),\,a_2(x)=c_2(x)$とすれば補題2は示される。

$p_1(x),\,\dots,\,p_r(x)\in\mathbb{C}[x]$が互いに素であるとする。このとき、$a_1(x),\,\dots,\,a_r(x)\in\mathbb{C}[x]$で、
\begin{equation} \sum_{i=1}^ra_i(x)p_i(x)=1 \end{equation}
となるものが存在する。

証明手法（任意）

$q_1(x)=p_1(x),\ q_{i+1}(x)=\gcd(q_i(x),\,p_{i+1}(x))$とする。このとき、$q_r(x)=\gcd(p_1(x),\,\dots,\,p_r(x))=1$である。このとき、$\sum_{i=1}^ka_{k,i}(x)p_i(x)=q_k(x)$となるような$a_{k,i}(x)\in\mathbb{C}[x]$が存在することを示せばよい。帰納法により示す。
$k=1$のとき、$a_{1,1}(x)=1$とすればよい。$k$のとき成立すると仮定すると、$\sum_{i=1}^ka_{k,i}(x)p_i(x)=q_k(x)$となるような$a_{k,i}(x)\in\mathbb{C}[x]$が存在する。また、B'{e}zoutの定理より$b(x)q_k(x)+c(x)p_{k+1}(x)=q_{k+1}(x)$なる$b(x),\,c(x)\in\mathbb{C}[x]$が存在する。よって、$a_{k+1,i}(x)=b(x)a_{k,i}(x)\,(i=1,\,\dots,\,k),\ a_{k+1,k+1}(x)=c(x)$とすればよい。

Lemma 3を用いると広義固有空間分解ができることが示せる。見てみよう。

(定理1)

固有値$\lambda_i$の$\Phi_A(\lambda)$における重複度を$n_i$とする。このとき、
\begin{equation} \Phi_A(\lambda)=\prod_{i=1}^m(\lambda-\lambda_i)^{n_i} \end{equation}
とかける。このとき、$p_i(x)=\prod_{i\neq j}(\lambda-\lambda_j)^{n_j}$とすると、$p_1(x),\,\dots,\,p_m(x)$の最大公約数は1であり、Lemma 4より$a_i(x)\in\mathbb{C}[x]$が存在して
\begin{equation} \sum_{i=1}^m a_i(x)p_i(x)=1 \tag{1} \end{equation}
となり、
\begin{equation} \sum_{i=1}^m a_i(A)p_i(A)=I \end{equation}
となる。このとき、任意の$v\in\mathbb{C}^n$について
\begin{equation} \sum_{i=1}^m a_i(A)p_i(A)v=v \tag{2} \end{equation}
となる。ここで、$(A-\lambda_iI)^{n_i},\,a_i(A),\,p_i(A)$は全て$A$の多項式で表される行列なので交換し、Cayley-Hamiltonの定理より
\begin{equation} (A-\lambda_iI)^{n_i}a_i(A)p_i(A)=a_i(A)(A-\lambda_iI)^{n_i}p_i(A)=a_i(A)\Phi_A(A)=O\end{equation}
となり、$\mathrm{Im\;} a_i(A)p_i(A)\subset\ker(A-\lambda_iI)^{n_i}=W(\lambda_i)$。逆に、$w\in W(\lambda_i)=\ker(A-\lambda_iI)^{n_i}$を取ると
\begin{equation} w=\sum_{i=1}^m a_i(A)p_i(A)w=a_i(A)p_i(A)w\in\mathrm{Im\;} a_i(A)p_i(A) \end{equation}
となり、$\mathrm{Im\;} a_i(A)p_i(A)\supset W(\lambda_i)$。以上より、$\mathrm{Im\;} a_i(A)p_i(A)= W(\lambda_i)$
式(2)は$\mathrm{Im\;} a_i(A)p_i(A)=W(\lambda_i)$の元の和で$v$を表している式である。よって、
\begin{equation} \mathbb{C}^n=\sum_{i=1}^mW(\lambda_i) \tag{3} \end{equation}
式(3)の右辺が直和であることを示すには、どのように$w_i\in W(\lambda_i)$をとっても$w_1,\,\dots,\,w_m$が線形独立であることを示せば良い。$\sum_{i=1}^mw_i=0$とする。(2)より、
\begin{align} w_i={}&a_i(A)P_i(A)w_j\ (\rm{後に示す}) \tag{4}\\ ={}&a_i(A)P_i(A)\sum_{j=1}^mw_j\\ ={}&0 \end{align}
となり、$w_1,\,\dots,\,w_m$は線形独立となり、(3)の右辺は直和となり、Theorem 2は示される。
以下、式(4)を示す。$P_i(x)$の定義より$a_i(x)P_i(x)=0\mod (x-\lambda_j)^{n_j}\ (i\neq j)$であり、式(1)より$a_i(x)P_i(x)=1\mod (x-\lambda_i)^{n_i}$なので、$\left(a_i(x)P_i(x)\right)^2=a_i(x)P_i(x)\mod \Phi_A(x)$で、Cayley-Hamiltonの定理より
\begin{equation} \left(a_i(A)P_i(A)\right)^2=a_i(A)P_i(A) \end{equation}
である。これと、$w_i\in W(\lambda_i)=\mathrm{Im;}a_i(A)P_i(A)$より$w_i=a_i(A)P_i(A)w_i$となり、式(4)が示される。

$P_i(A)=a_i(A)p_i(A)$とすると、式(2)は単位行列を$P_i(A)$の和で表している。最後の議論より各$P_i(A)$は$P_i(A)^2=P_i(A)$を満たす射影行列であり、Cayley-Hamiltonの定理より$P_i(A)P_j(A)=P_j(A)P_i(A)=0$となるので、各$P_i(A)$は互いに交わらない射影である。そのため、射影行列の一般論より、各射影行列の像の直和で元の空間が表されることが言える。これと$\mathrm{Im\;} a_i(A)p_i(A)= W(\lambda_i)$より、広義固有空間の直和で元の空間が表されることが言える、という流れである。Bézoutの定理により各広義固有空間への射影が得られるところが鍵である。

投稿日：2025年8月27日

数学の力で現場を変えるアルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

sim

331

B4です。

他の人のコメント

コメントはありません。

読み込み中

sim

Bézoutの等式による広義固有空間の直和で線形空間全体が表せることの証明