今回は、齋藤線型代数入門にある行列式の特徴づけを用いた「積の行列式」と「行列式の積」が等しいことの証明が面白かったので紹介ついでに記事にしてみました。
この記事では齋藤線型代数に倣って、行列やベクトルの成分は複素数$\mathbb{C}$とします。が、今回の内容ではあまり関係がないので気にしなくてもかまいません。
$n$次正方行列$A=\left\{a_{ij}\right\}_{1\leq i,j\leq n}=\begin{pmatrix}
a_{11} & a_{12}& \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix}$の行列式$\det A$($|A|$などともかく)は
$$\det A=\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}a_{2\sigma(2)}\cdots a_{n\sigma(n)}$$
で定義される。
ここで出てくる$\displaystyle\sum_{\sigma\in\mathfrak{S}_{n}}$は$n$次対称群$\mathfrak{S}_{n}$の元全てについて足し合わせるという意味です。一般的な形を見てもよくわからないと思うので、$n$に具体的な値を入れてどうなるか見てみます。
例で見たように、行列式の定義式は$n$が増えるたびに項の数がとても大きくなり(具体的には$|\mathfrak{S}_{n}|=n!$個)、計算が困難です。これを解消するために、行列式の性質を考えてみましょう。
まず、行列を列ベクトルを横に並べたものとして考えます。つまり$n$次列ベクトル$\bm{a}_{1},\dots,\bm{a}_{n}$を用いて
$$\bm{a}_{1}=\begin{pmatrix}
a_{11} \\
a_{21} \\
\vdots \\
a_{n1}
\end{pmatrix},\bm{a}_{2}=\begin{pmatrix}
a_{12} \\
a_{22} \\
\vdots \\
a_{n2}
\end{pmatrix},\dots,\bm{a}_{n}=\begin{pmatrix}
a_{1n} \\
a_{2n} \\
\vdots \\
a_{nn}
\end{pmatrix}
$$
とおくことで行列$A$を
$$A=\begin{pmatrix}
\bm{a}_{1} & \bm{a}_{2} & \cdots & \bm{a}_{n}
\end{pmatrix}$$
と表すと、次の性質が成り立ちます。
交代性
任意の$i,j(1\leq i< j\leq n)$に対し
$$\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}_{j} & \cdots & \bm{a}_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}=-\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}_{i} & \cdots & \bm{a}_{j} & \cdots & \bm{a}_{n}
\end{pmatrix}$$
ただし、左辺の$\bm{a}_{j}$は$i$列目、$\bm{a}_{i}$は$j$列目にある。
$n$重線型性
任意の$i(1\leq i\leq n)$と任意の$s,t\in\mathbb{C}$に対し
\begin{multline}\det \begin{pmatrix}
\bm{a}_{1} & \cdots & s\bm{a}'_{i}+t\bm{a}''_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}=s\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}'_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}\\
+t\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}''_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}
\end{multline}
単位行列の行列式
単位行列$E_{n}$の行列式$\det E_{n}$は$1$である。
交代性について
まず、行列$A$の$i$列目と$j$列目を入れ替えた行列を$B=\left\{b_{kl}\right\}_{1\leq k,l\leq n}$とする。この行列式$\det B$は
$$\det B=\sum_{\tau\in\mathfrak{S}_{n}}\operatorname{sgn}\tau\ b_{1\tau(1)}\cdots b_{i\tau(i)}\cdots b_{j\tau(j)}\cdots b_{n\tau(n)}$$
となるが、$B$の定義より$a_{1\tau(1)}=b_{1\tau(1)},\dots,a_{j\tau(i)}=b_{i\tau(i)},\dots,a_{i\tau(j)}=b_{j\tau(j)},\dots,a_{n\tau(n)}=b_{n\tau(n)}$が成り立つので
$$\det B=\sum_{\tau\in\mathfrak{S}_{n}}\operatorname{sgn}\tau\ a_{1\tau(1)}\cdots a_{j\tau(i)}\cdots a_{i\tau(j)}\cdots a_{n\tau(n)}$$
となる。ここで、$\sigma\in\mathfrak{S}_{n}$を$\sigma(1)=\tau(1),\dots,\sigma(i)=\tau(j),\dots\sigma(j)=\tau(i),\dots\sigma(n)=\tau(n)$と定めると、$\sigma=\tau(i\ j)$が成り立ち、$\tau$が$\mathfrak{S}_{n}$の元全てを動くとき$\sigma$も$\mathfrak{S}_{n}$の元全てを動くことが分かる。よって
$$\det B=\sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\tau\ a_{1\sigma(1)}\cdots a_{i\sigma(i)}\cdots a_{j\sigma(j)}\cdots a_{n\sigma(n)}$$
また$\operatorname{sgn}\sigma = \operatorname{sgn}\tau(i\ j) =-\operatorname{sgn}\tau$なので
$$\det B=\sum_{\sigma\in\mathfrak{S}_{n}}-\operatorname{sgn}\sigma\ a_{1\sigma(1)}\cdots a_{i\sigma(i)}\cdots a_{j\sigma(j)}\cdots a_{n\sigma(n)}=-\det A$$
となって証明が完了する。
$n$重線型性について
$\displaystyle \sum_{\sigma\in\mathfrak{S}_{n}}$の線型性に注意すると
\begin{align}
&\det \begin{pmatrix}
\bm{a}_{1} & \cdots & s\bm{a}'_{i}+t\bm{a}''_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}\\
&=\sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\sigma\ a_{1\sigma(1)}\cdots \left(sa'_{i\sigma(i)}+t'a_{i\sigma(i)}\right)\cdots a_{n\sigma(n)}\\
&=\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots sa'_{i\sigma(i)}\cdots a_{n\sigma(n)}+\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots ta''_{i\sigma(i)}\cdots a_{n\sigma(n)}\\
&=s\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots a'_{i\sigma(i)}\cdots a_{n\sigma(n)}+t\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots a''_{i\sigma(i)}\cdots a_{n\sigma(n)}\\
&=s\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}'_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}+t\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}''_{i} & \cdots & \bm{a}_{n}
\end{pmatrix}
\end{align}
となって証明が完了する。
$\det E_{n}=1$について
行列式の定義より、$a_{1\sigma(1)},\cdots,a_{n\sigma(n)}$のいずれか1つでも$0$であればその$\sigma$についての項は$0$になる。ここで、単位行列$E_{n}$について$a_{1\sigma(1)}\cdots a_{n\sigma(n)}$が$0$とならないのは$\sigma=(1)$のときのみであるから
$$\det E_{n}=\operatorname{sgn}(1)\ 1\cdots 1=1$$
となって証明が完了する。
このうち、交代性から次のことが直ちにわかります。
$n$次正方行列$A$を$n$次列ベクトルに分解したとき、その中で一致するものがあれば$\det A=0$
交代性の等式において$\bm{a}_{i}=\bm{a}_{j}$とすれば$\det A=-\det A$となって$\det A=0$が分かる。
さらに交代性から次のことが分かります(齋藤線型代数ではこちらを交代性としています)。
任意の$\sigma\in\mathfrak{S}_{n}$に対し
$$\det \begin{pmatrix}
\bm{a}_{\sigma(1)} & \cdots & \bm{a}_{\sigma(n)}
\end{pmatrix}=\operatorname{sgn}\sigma\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}_{n}
\end{pmatrix}$$
$\sigma(i)=1$となる$i$をとって$i$列目を1列ずつ左にずらしていく。この作業を$n$(実際には$n-1$で終わる)まで繰り返すことで、交代性の等式から結論を得る(置換の符号は一意的であることに注意)。
この性質を使う前に一つ基本ベクトルというものを定義しましょう。
$n$次基本ベクトル$\bm{e}_{i}(1\leq i\leq n)$を$i$行目が$1$の列ベクトル、つまり
$$\bm{e}_{1}=\begin{pmatrix}
1 \\
0 \\
\vdots \\
0
\end{pmatrix},\bm{e}_{2}=\begin{pmatrix}
0 \\
1 \\
\vdots \\
0
\end{pmatrix},\dots,\bm{e}_{n}=\begin{pmatrix}
0 \\
0 \\
\vdots \\
1
\end{pmatrix}
$$
として定義する。
基本ベクトルを用いると、単位行列$E_{n}$は
$$E_{n}=\begin{pmatrix}
\bm{e}_{1} & \cdots & \bm{e}_{n}
\end{pmatrix}$$
と表すことができます。
これらの性質を使って、例1で得た結果を定義を使わずに求めてみましょう。($n=2$のときのみ)
$\bm{a}_{1}=\begin{pmatrix}
a_{11} \\
a_{21}
\end{pmatrix}=a_{11}\bm{e}_{1}+a_{21}\bm{e}_{2},\bm{a}_{2}=\begin{pmatrix}
a_{12} \\
a_{22}
\end{pmatrix}=a_{12}\bm{e}_{1}+a_{22}\bm{e}_{2}$なので
\begin{align}
\det A &= \det \begin{pmatrix}
a_{11}\bm{e}_{1}+a_{21}\bm{e}_{2} & a_{12}\bm{e}_{1}+a_{22}\bm{e}_{2}
\end{pmatrix}\\
&=a_{11}\det \begin{pmatrix}
\bm{e}_{1} & a_{12}\bm{e}_{1}+a_{22}\bm{e}_{2}
\end{pmatrix}+a_{21}\det \begin{pmatrix}
\bm{e}_{2} & a_{12}\bm{e}_{1}+a_{22}\bm{e}_{2}
\end{pmatrix}\\
&=a_{11}a_{12}\det \begin{pmatrix}
\bm{e}_{1} & \bm{e}_{1}
\end{pmatrix}+a_{11}a_{22}\det \begin{pmatrix}
\bm{e}_{1} & \bm{e}_{2}
\end{pmatrix}+a_{21}a_{12}\det \begin{pmatrix}
\bm{e}_{2} & \bm{e}_{1}
\end{pmatrix}+a_{21}a_{22}\det \begin{pmatrix}
\bm{e}_{2} & \bm{e}_{2}
\end{pmatrix}\\
&=(a_{11}a_{22}-a_{21}a_{12})\det \begin{pmatrix}
\bm{e}_{1} & \bm{e}_{2}
\end{pmatrix}\\
&=a_{11}a_{22}-a_{21}a_{12}
\end{align}
となります。ただし1行目から2行目の等号は第1列に関する線型性、2行目から3行目の等号は第2列に関する線型性、3行目から4行目の等号は交代性(とその系)、4行目から5行目の等号は単位行列の行列式が$1$であることを用いました。
ここから、ようやく本題である行列式の特徴づけに入ります。実は今挙げた3つの性質は、行列式を特徴づけている性質と言うことができます。つまり以下の主張が成り立ちます。
$n$本の$n$次列ベクトルの組$(\bm{a}_{1},\dots,\bm{a}_{n})$に対して$F(\bm{a}_{1},\dots,\bm{a}_{n})\in\mathbb{C}$を対応させる写像$F$が以下の3条件を満たすとき$F=\det$である。
(R1) 交代性
$n$重線型性
$F(\bm{e}_{1},\dots,\bm{e}_{n})=1$
この証明は例2でやったように$\bm{a}_{1}$から$\bm{a}_{n}$を基本ベクトルで表した後に、3つの性質を駆使して行います。ここで、定理1の系の内容は行列式特有の性質ではなく交代性を満たすもの全てに適用できることに注意しましょう。
各$j(1\leq j \leq n)$に対して$\bm{a}_{j}$は基本ベクトル$\bm{e}_{1},\dots,\bm{e}_{n}$を用いて
$$\bm{a}_{j}=\sum_{i=1}^{n}a_{ij}\bm{e}_{i}$$
と表せる。これと$n$重線型性を用いて$F(\bm{a}_{1},\dots,\bm{a}_{n})$を展開すると
\begin{align}
F(\bm{a}_{1},\dots,\bm{a}_{n})&=F\left(\sum_{i=1}^{n}a_{i1}\bm{e}_{i},\dots,\sum_{i=1}^{n}a_{in}\bm{e}_{i}\right)\\
\vdots\\
&=\sum_{i_{1}=1}^{n}a_{i_{1}1}F\left(\bm{e}_{i_{1}},\dots,\sum_{i=1}^{n}a_{in}\bm{e}_{i}\right)\\
&=\sum_{i_{1}=1}^{n}\dots\sum_{i_{n}=1}^{n}a_{i_{1}1}\cdots a_{i_{n}n}F(\bm{e}_{i_{1}},\dots,\bm{e}_{i_{n}})
\end{align}
となる(例2の等式の3行目を参照)。ここで、$i_{1}$から$i_{n}$のうち少なくとも1つは同じものを選んだ時は、交代性の系から$F(\bm{e}_{i_{1}},\dots,\bm{e}_{i_{n}})$は$0$になり、$i_{1}$から$i_{n}$がすべて異なるときはある$\sigma\in\mathfrak{S}_{n}$が存在して、$\sigma=\begin{pmatrix}
1 & \cdots & n \\
i_{1} & \cdots & i_{n}
\end{pmatrix}$となる。よって、再び交代性と$F(\bm{e}_{1},\dots,\bm{e}_{n})=1$から
\begin{align}
F(\bm{a}_{1},\dots,\bm{a}_{n})&=\sum_{\sigma\in\mathfrak{S}_{n}}a_{\sigma(1)1}\cdots a_{\sigma(n)n}F(\bm{e}_{\sigma(1)},\dots,\bm{e}_{\sigma(n)})\\
&=\sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\sigma\ a_{\sigma(1)1}\cdots a_{\sigma(n)n}F(\bm{e}_{1},\dots,\bm{e}_{n})\\
&=\sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\sigma\ a_{\sigma(1)1}\cdots a_{\sigma(n)n}
\end{align}
ここで、$\displaystyle \sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\sigma\ a_{\sigma(1)1}\cdots a_{\sigma(n)n}=\det \begin{pmatrix} \bm{a}_{1} & \cdots & \bm{a}_{n} \end{pmatrix}$としたいところですが$i$と$\sigma(i)$が反対なのですぐに言うことはできません。つまり、$\displaystyle \sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\sigma\ a_{\sigma(1)1}\cdots a_{\sigma(n)n} =\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots a_{n\sigma(n)}$が成り立っていてほしいのですが、これは実際に成り立ちます。このことは正方行列$A=\left\{a_{ij}\right\}$の転置行列${}^t\! A=\left\{a_{ji}\right\}$を用いて次のように定式化できます。
正方行列$A$に対し
$$\det A=\det {}^t\! A$$
証明の概要としては、$\sigma$の代わりに$\sigma^{-1}$(逆置換)を考えてその行き先について注意すればよいです。これを真面目に書くと長くなりすぎるので省略しました
これを使って証明を終わらせます。
補題4から$\displaystyle \sum_{\sigma\in\mathfrak{S}_{n}}\operatorname{sgn}\sigma\ a_{\sigma(1)1}\cdots a_{\sigma(n)n} =\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots a_{n\sigma(n)}$なので
\begin{align}
F(\bm{a}_{1},\dots,\bm{a}_{n})&=\sum_{\sigma\in\mathfrak{S}_{n}}\ope{sgn} \sigma \ a_{1\sigma(1)}\cdots a_{n\sigma(n)}\\
&=\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}_{n}
\end{pmatrix}
\end{align}
となって証明が完了する。
これで行列式が特徴づけられることが分かりましたが、この証明をよく見てみると(iii)はあまり本質的でないことが分かります。なぜかというと、定理3の仮定から(iii)を抜いたとしてもその証明から
$$F(\bm{a}_{1},\dots,\bm{a}_{n})=F(\bm{e}_{1},\dots,\bm{e}_{n})\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}_{n}
\end{pmatrix}$$
が分かり、$F(\bm{e}_{1},\dots,\bm{e}_{n})$は$\bm{a}_{1},\dots,\bm{a}_{n}$によらない定数なので高々定数倍の差しか生まれないからです。なのでこれも定理としておきましょう。(実際、齋藤線型代数ではこちらが定理として紹介されています)
$n$本の$n$次列ベクトルの組$(\bm{a}_{1},\dots,\bm{a}_{n})$に対して$F(\bm{a}_{1},\dots,\bm{a}_{n})\in\mathbb{C}$を対応させる写像$F$が以下の2条件を満たすとき$F(\bm{a}_{1},\dots,\bm{a}_{n})=F(\bm{e}_{1},\dots,\bm{e}_{n})\det \begin{pmatrix}
\bm{a}_{1} & \cdots & \bm{a}_{n}
\end{pmatrix}$である。
(R1) 交代性
これを用いることで「積の行列式」=「行列式の積」を示すことができます。
$n$次正方行列$A,B$に対して
$$\det AB=\det A\det B$$
が成り立つ。
$B=\begin{pmatrix}
\bm{b}_{1} & \cdots & \bm{b}_{n}
\end{pmatrix}$と分解し、写像$F$を
$$F(\bm{b}_{1},\dots,\bm{b}_{n}):=\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & A\bm{b}_{n}
\end{pmatrix}$$
で定めると、この$F$は定理4の条件(i),(ii)を満たす。
(i) 交代性について
行列式の交代性より、任意の$i,j(1\leq i< j\leq n)$について
\begin{align}
F(\bm{b}_{1},\dots,\bm{b}_{j},\dots,\bm{b}_{i},\dots,\bm{b}_{n})&=\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & A\bm{b}_{j} & \cdots & A\bm{b}_{i} & \cdots & A\bm{b}_{n}
\end{pmatrix}\\
&=-\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & A\bm{b}_{i} & \cdots & A\bm{b}_{j} & \cdots & A\bm{b}_{n}
\end{pmatrix}\\
&=-F(\bm{b}_{1},\dots,\bm{b}_{i},\dots,\bm{b}_{j},\dots,\bm{b}_{n})
\end{align}
となるからよい。
(ii) $n$重線型性について
行列の分配律と行列式の$n$重線型性より、任意の$i(1\leq i\leq n)$と任意の$s,t\in\mathbb{C}$について
\begin{align}
F(\bm{b}_{1},\dots,s\bm{b}'_{i}+t\bm{b}''_{i},\dots,\bm{b}_{n})&=\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & A(s\bm{b}'_{i}+t\bm{b}''_{i}) & \cdots & A\bm{b}_{n}
\end{pmatrix}\\
&=\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & (sA\bm{b}'_{i}+tA\bm{b}''_{i}) & \cdots & A\bm{b}_{n}
\end{pmatrix}\\
&=\begin{aligned}[t]
&s\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & A\bm{b}'_{i} & \cdots & A\bm{b}_{n}
\end{pmatrix}\\
&+t\det \begin{pmatrix}
A\bm{b}_{1} & \cdots & A\bm{b}''_{i} & \cdots & A\bm{b}_{n}
\end{pmatrix}
\end{aligned}\\
&=sF(\bm{b}_{1},\dots,\bm{b}'_{i},\dots,\bm{b}_{n})+tF(\bm{b}_{1},\dots,\bm{b}''_{i},\dots,\bm{b}_{n})
\end{align}
となるからよい。
行列式の特徴づけを上手く使うことで、簡単に証明することができました。
今回は「積の行列式」=「行列式の積」を行列式の特徴づけを用いて示しました。これは直接計算するとかなり大変です。自分はこのような直接やると大変なものを工夫して簡単に示す話が好きなので、また見つけたら記事にするかもしれません。