文献あり

ちょっと強めの線形空間の基底変換について

179

とある演習問題をずっと考えていた

Lang Linear Algebra を読み終えて、線形代数の本、2冊目に取り組んでいました。次の問題をずーっと考えていました。

Steven Roman著 Advanced Linear Algebra Exercise 1.23より引用
Let $ \mathcal{B} =\{b_1,…,b_n\} $ and $\mathcal{C} =\{c_1,…,c_n\}$ be bases for a vector space $V$. Let $1 \leq m \leq n - 1$. Show that there is a permutation $ \sigma $ of $\{1,…,n\}$ such that
$$ b_1,…,b_m,c_{\sigma(m+1)},…,c_{\sigma(n)} $$
and
$$ c_{\sigma(1)},…,c_{\sigma(m)},b_{m+1},…,b_n $$
are both bases for $V$.

要するに、基底の入れ替えは全取り換えでなくても一部同士でできるよという話なわけですね。主張としては直感的にわかりやすいのですが、いざ証明してみようとすると……。

うーんわからない。私の頭の問題かもしれませんが、思ったより手強いぞと。

よく教科書に載っているやつを思い出してみる

上記の演習問題は、線形空間の基底変換としては強めの命題です。よく一般的な教科書に載っているやつを思い出してみます。いわゆる演習問題の「片側」バージョンです。

線形空間の基底変換

$\mathcal{B} =\{b_1,…,b_n\} $ および $\mathcal{C} =\{c_1,…,c_n\}$を線形空間$V$の基底とする. $1 \leq m \leq n-1$とする. このとき, $\{1,…,n\}$の置換$\sigma $であって, 次を満たすものが存在する.
$$ b_1,…,b_m,c_{\sigma(m+1)},…,c_{\sigma(n)} $$
は$V$の基底である.

$ b_1,…,b_m $で張られる$ V $の部分空間を$S_m= \langle b_1,…,b_m \rangle $とすると, ある $ c_{i_{m+1}} $$(1 \leq i_{m+1} \leq n)$について $ c_{i_{m+1}} \notin S_m $ が成り立つ. なぜなら, すべての$ i,1 \leq i \leq n $について$c_i \in S_m $とすれば, $ V=\langle c_1,…,c_n \rangle \subset S_m $となり, $ \dim V=n$に反するからである.
よって$ c_{i_{m+1}} \notin S_m $であるから, $ S_{m,1}=\langle b_1,…,b_m,c_{i_{m+1}}\rangle $ とすれば,$b_1,…,b_m,c_{i_{m+1}}$は一次独立であり,$S_m\subsetneqq S_{m,1}$が得られる。
$m=n-1$の場合, これで証明は完了する.
$m< n-1$の場合, ある $ c_{i_{m+2}} $ $(1 \leq i_{m+2} \leq n,i_{m+2} \neq i_{m+1})$について $ c_{i_{m+2}} \notin S_{m,1} $が成り立つ.なぜなら, すべての$ i,1 \leq i \leq n, i\neq i_{m+1} $について$c_i \in S_{m,1} $とすれば, $ V=\langle c_1,…,c_n \rangle \subset S_{m,1} $となり,やはり$ \dim V=n$に反するからである.
同様の議論によって, 帰納的に, 一次独立な$V$の$n$個の元 $ b_1,…,b_m,c_{i_{m+1}},…,c_{i_{n}} $が存在して,
$$ S_{m,n-m}=\langle b_1,…,b_m,c_{i_{m+1}},…,c_{i_{n}} \rangle = V $$
である.
したがって, $\{1,…,n\}$の置換$\sigma $を$ \sigma(k)=i_{k},m+1 \leq k \leq n$となるように定めれば,
$$ b_1,…,b_m,c_{\sigma(m+1)},…,c_{\sigma(n)} $$
は$V$の基底である. □

よく載っているやつと同じ方法ではできない

上記の証明では、あまり細かいことは気にしないで、とにかく$S_{m,k}=\langle b_1,…,b_m,c_{i_{m+1}},…,c_{i_{m+k}}\rangle$に属していない元を$\mathcal{C}$の中から取ってくればよかったわけです。

線形代数の教科書によく載っている、一次独立な元の組を拡張して基底とすることができるというアレと本質的には同じ議論で示せるわけです。

しかしながら、

$$ c_{\sigma(1)},…,c_{\sigma(m)},b_{m+1},…,b_n $$

も同時に基底にしようと思うと、同様の（雑な）論法でやっていると簡単に破綻してしまいます。例を挙げてみます。

命題1の証明法では上手くいかない

$ \mathbb{R}^{2} $の基底 $\mathcal{B}=\left\{ \begin{pmatrix} 1 \\ 0 \end{pmatrix},\begin{pmatrix} 0 \\ 1 \end{pmatrix} \right\}$, $\mathcal{C}=\left\{ \begin{pmatrix} 1 \\ 1 \end{pmatrix},\begin{pmatrix} 0 \\ 1 \end{pmatrix} \right\}$ を考える.
命題1の証明の論法に従うと, $\begin{pmatrix} 1 \\ 1 \end{pmatrix} \notin \left\langle \begin{pmatrix} 1 \\ 0 \end{pmatrix} \right\rangle $ であり, 確かに $\left\{ \begin{pmatrix} 1 \\ 0 \end{pmatrix},\begin{pmatrix} 1 \\ 1 \end{pmatrix} \right\}$ は$ \mathbb{R}^{2} $の基底となっている.
しかし,$\left\{ \begin{pmatrix} 0 \\ 1 \end{pmatrix},\begin{pmatrix} 0 \\ 1 \end{pmatrix} \right\}$ は明らかに$ \mathbb{R}^{2} $の基底ではない!

この例からもわかるように、演習問題を解くにあたっては、さらなる精査が必要なようです。

余因子展開（ラプラス展開）の一般化

実はこの演習問題にはヒントが付いていました。それによると、余因子展開の一般化を利用してくれということです。

1行1列の余因子展開はともかく、一般形は今まで使ったこともない式だったのですが、調べてみました。証明は自分なりに付けてみました（誤りがあるかもしれません）。

一般の余因子

$A$を$n×n$行列とする. $A$のうち, 任意の$k$行$k$列を選んで交差する部分のなす$k×k$行列の行列式を$A$の$k$-minerという.
$d$を$A$の$k$-minerとする. このとき, 選ばなかった$(n-k)$行$(n-k)$列の交差する部分のなす$(n-k)×(n-k)$行列の行列式を$d$のcomplement minerといい,$d^{*}$で表す.
$i_{1},i_{2},…,i_{k}$行と$j_{1},j_{2},…,j_{k}$列を選んだとする.
また, $I=i_{1}+i_{2}+…+i_{k},J=j_{1}+j_{2}+…+j_{k}$とする.
$d$のcofactor（余因子）$\tilde{ d } $ を
$$ \tilde{ d }= (-1)^{I+J}d^{*}$$
で定める.

一般の余因子展開

$A$を$n×n$行列とする. $i_{1},i_{2},…,i_{k}$行と$j_{1},j_{2},…,j_{k}$列
（$i_{1}< i_{2}<…< i_{k},j_{1}< j_{2}<…< j_{k})$を選んで構成した$A$の$k$-miner$d(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})$に対して, 余因子 $\tilde{ d }(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})$ とする.
このとき,
$$ \mathrm{det}A= \sum_{1\leq j_{1}< j_{2}<…< j_{k} \leq n} d(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})\tilde{ d }(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k}) $$
が成り立つ.

$A$の$(i,j)$成分を$a_{i,j}$とする.
また, 写像$\{j_{1},…,j_{k}\}\rightarrow \{j_{1},…,j_{k}\} $のうち全単射であるもの全体の集合と$k$次対称群$\mathfrak{S}_{k}$を対応 $p \mapsto j_p(1 \leq p \leq k)$によって同一視する.
それから,$\{1,…,n\} \setminus \{i_{1},…,i_{k}\} = \{\tilde{i}_{1},…,\tilde{i}_{n-k} \}$,$\{1,…,n\} \setminus \{j_{1},…,j_{k}\} = \{\tilde{j}_{1},…,\tilde{j}_{n-k} \}$ と表しておくこととし, 写像$\{\tilde{j}_{1},…,\tilde{j}_{n-k} \}\rightarrow \{\tilde{j}_{1},…,\tilde{j}_{n-k}\} $うち全単射であるもの全体の集合と$(n-k)$次対称群 $\mathfrak{S}_{n-k}$を同様に同一視する.
以上の同一視の下で,
$$\sum_{1\leq j_{1}< j_{2}<…< j_{k} \leq n} d(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})\tilde{ d }(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})$$
$$=\sum_{1\leq j_{1}< j_{2}<…< j_{k} \leq n} \sum_{\sigma \in \mathfrak{S}_{k}}sgn(\sigma)a_{i_1,\sigma(j_{1})}…a_{i_k,\sigma(j_{k})} ×(-1)^{I+J}\sum_{\tau \in \mathfrak{S}_{n-k}} sgn(\tau)a_{\tilde{i}_{1},\tau(\tilde{j}_{1})}…a_{\tilde{i}_{n-k},\tau(\tilde{j}_{n-k})} \ \cdots ① $$

ここで, $\sigma \in \mathfrak{S}_{k} $を$ \mathfrak{S}_{n} $の元であって$j_{1},…,j_{k}$以外を動かさないものと同一視し,$\tau \in \mathfrak{S}_{n-k}$を$ \mathfrak{S}_{n} $の元であって$j_{1},…,j_{k}$を動かさないものと同一視できる.
この同一視において,
$$ \sigma(j_{p})=\sigma \tau(j_{p})(1 \leq p \leq k),\tau(\tilde{j}_{q})=\sigma \tau(\tilde{j}_{q})(1 \leq q \leq n-k) $$
が成り立つこと,それと $\sigma \in \mathfrak{S}_{k} $および$\tau \in \mathfrak{S}_{n-k}$が全体を動くとき,$\sigma \tau$が$\{\psi \in \mathfrak{S}_{n} | \psi(\{j_{1},j_{2},…,j_{k}\})=\{j_{1},…,j_{k}\}\} $全体を動くことに注意すると, ①は次のように変形できる.

$$ \sum_{1\leq j_{1}< j_{2}<…< j_{k} \leq n} (-1)^{I+J} \sum_{\psi \in \mathfrak{S}_{n},\psi(\{j_{1},j_{2},…,j_{k}\})=\{j_{1},…,j_{k}\}}sgn(\psi)a_{i_1,\psi(j_{1})}…a_{i_k,\psi(j_{k})} a_{\tilde{i}_{1},\psi(\tilde{j}_{1})}…a_{\tilde{i}_{n-k},\psi(\tilde{j}_{n-k})} \ \cdots ② $$

ここで, $sgn(\psi)a_{i_1,\psi(j_{1})}…a_{i_k,\psi(j_{k})} a_{\tilde{i}_{1},\psi(\tilde{j}_{1})}…a_{\tilde{i}_{n-k},\psi(\tilde{j}_{n-k})}$ は,次の行列$B=(b_{i,j})$の行列式の項を表す.
$$ b_{i,j}= \begin{eqnarray} \left\{ \begin{array}{l} a_{i_{p},j_{q}}(1\leq p\leq k,1 \leq q \leq k) \\ a_{i_{p},\tilde{j}_{q-k}}(1\leq p \leq k,k+1 \leq q \leq n) \\ a_{\tilde{i}_{p-k},\tilde{j}_{q-k}}(k+1\leq p \leq n,1 \leq q \leq k) \\ a_{\tilde{i}_{p-k},\tilde{j}_{q-k}}(k+1\leq p \leq n,k+1 \leq q \leq n) \\ \end{array} \right. \end{eqnarray} $$

この行列$B$は,$A$から次のように行基本変形と列基本変形を施すことによって得られる.
　$A$の$i_{1}$行目が1行目に来るように, 隣同士の行を$i_{1}-1$回交換する.
　$A$の$i_{2}$行目が2行目に来るように, 隣同士の行を$i_{2}-2$回交換する.
　……
　$A$の$i_{k}$行目が$k$行目に来るように, 隣同士の行を$i_{k}-k$回交換する.
　$A$の$j_{1}$列目が1列目に来るように, 隣同士の列を$j_{1}-1$回交換する.
　$A$の$j_{2}$列目が2列目に来るように, 隣同士の列を$j_{2}-2$回交換する.
　……
　$A$の$j_{k}$列目が$k$列目に来るように, 隣同士の列を$j_{k}-k$回交換する.

したがって,
$$ \mathrm{det}B=(-1)^{\sum_{p=1}^{k}(i_{p}-p)+\sum_{q=1}^{k}(j_{q}-q)} \mathrm{det}A=(-1)^{I+J}\mathrm{det}A $$
が成り立つ.

このことに注意して, 上記基本変形に対応する置換を各項 $sgn(\psi)a_{i_1,\psi(j_{1})}…a_{i_k,\psi(j_{k})} a_{\tilde{i}_{1},\psi(\tilde{j}_{1})}…a_{\tilde{i}_{n-k},\psi(\tilde{j}_{n-k})}$ で考える. すなわち, 以下の置換を行および列に施す.
$\begin{pmatrix} i_{1} & … & i_{k} & \tilde{i}_{1} & … & \tilde{i}_{n-k} \\ 1 & … & k & k+1 &　…　& n \end{pmatrix}$,$\begin{pmatrix} j_{1} & … & j_{k} & \tilde{j}_{1} & … & \tilde{j}_{n-k} \\ 1 & … & k & k+1 &　…　& n \end{pmatrix}$

すると, ②は次の式に等しいことがわかる.

$$ \sum_{1\leq j_{1}< j_{2}<…< j_{k} \leq n} \sum_{\varphi \in \mathfrak{S}_{n},\varphi(\{1,2,…,k\})=\{j_{1},…,j_{k}\}}sgn(\varphi)a_{1,\varphi(1)}…a_{k,\varphi(k)} a_{k+1,\varphi(k+1)}…a_{n,\varphi(n)} $$
$1\leq j_{1}< j_{2}<…< j_{k} \leq n$ を動かして和をとると, これは$\mathrm{det}A$に等しい. □

本題の証明に戻る

一般の余因子展開を用いて、次を示します。

$A$を可逆な$n×n$行列とする. $A$の列を適当に入れ替えることで, 左上の$k$行$k$列を取り出した$k×k$行列と右下の$(n-k)$行$(n-k)$列を取り出した$(n-k)×(n-k)$行列が共に可逆であるようにできる.

$A$が可逆であることから,
$$ \mathrm{det}A= \sum_{1\leq j_{1}< j_{2}<…< j_{k} \leq n} d(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})\tilde{ d }(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})\neq 0 $$
が成り立つので, 少なくとも1つの組$\{j_{1},…j_{k}\}$について,
$$ d(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})\tilde{ d }(i_{1},i_{2},…,i_{k} \ ; \ j_{1},j_{2},…,j_{k})\neq 0 $$
よって, 各$j_{p}(1 \leq p \leq k)$列が$p$列に来るように列を入れ替えると, 求める可逆行列を得る. □

いよいよ本丸へと突入します。

演習問題の証明

補題3より, 基底$\mathcal{C} =\{c_1,…,c_n\}$を適当に並べ替えた$\mathcal{C'} =\{c_{\sigma(1)},…,c_{\sigma(n)}\}$ の基底$\mathcal{B}$による表現行列$A$は可逆行列であり, さらに
$$ A= \begin{pmatrix} A_{m,m} & B_{m,n-m} \\ C_{m,n-m} & A_{n-m,n-m} \end{pmatrix} $$
と区分けしたとき, $m×m$行列$A_{m,m}$および$(n-m)×(n-m)$行列$A_{n-m,n-m}$がともに可逆となるようにできる.
$$ b_1,…,b_m,c_{\sigma(m+1)},…,c_{\sigma(n)} $$を基底$\mathcal{B}$で表現した行列は
$$ X= \begin{pmatrix} E_{m,m} & B_{m,n-m} \\ O_{m,n-m} & A_{n-m,n-m} \end{pmatrix} $$
となり, 可逆であるから,
$$b_1,…,b_m,c_{\sigma(m+1)},…,c_{\sigma(n)} $$
は$V$の基底である.
また,
$$ c_{\sigma(1)},…,c_{\sigma(m)},b_{m+1},…,b_n $$を基底$\mathcal{B}$で表現した行列は
$$ Y= \begin{pmatrix} A_{m,m} & O_{m,n-m} \\ C_{m,n-m} & E_{n-m,n-m} \end{pmatrix} $$
となり, 可逆であるから,
$$ c_{\sigma(1)},…,c_{\sigma(m)},b_{m+1},…,b_n $$
は$V$の基底である. □