本稿では, 正規行列や半正定値行列などの有名かつ割と頻繁に用いられるものの詳しく述べられることの少ない行列たちの性質について述べていくことにする. なお内容が間違っていたり誤植がある場合にはご指摘願いたい.
$\cdot\ n$を正整数とする.
$\cdot\ \mathbb{R}$を実数全体, $\mathbb{C}$を複素数全体で, $x\in\mathbb{C}$に対し$\lvert x\rvert$で絶対値を, $\overline{x}$で複素共役を表す.
$\cdot\ \mathbb{M}_n$を$n\times n$複素行列全体とし, $I=I_n\in \mathbb{M}_n$を単位行列(対角成分が全て1の対角行列)とする.
$\cdot\ A=(a_{ij})\in \mathbb{M}_n$に対して$A^*=(\overline{a_{ji}})$と定め, $A$の行列式を$\mathrm{det}A,\,A$の逆行列を$A^{-1}$と表す.
$\cdot\ \mathbb{C}^n$を複素$n$次元数ベクトル空間とする. また, $\langle x,y\rangle=y^*x\ (x,y\in\mathbb{C}^n)$を$\mathbb{C}^n$の標準内積とし, $\lVert x\rVert=\sqrt{\langle x,x\rangle}$とする.
$\cdot\ e_j\in\mathbb{C}_n$を第$j$成分のみ1の単位ベクトルとする.
$\cdot\ A\in\mathbb{M}_n$が$AA^*=A^*A$を満たすとき$A$を正規行列といい, 正規行列全体を$\mathbb{M}_n^\mathrm{N}$と表す.
$\cdot\ A\in\mathbb{M}_n$が$A=A^*$を満たすとき$A$をエルミート行列といい, エルミート行列全体を$\mathbb{M}_n^\mathrm{H}$と表す.
$\cdot\ U\in \mathbb{M}_n$が$UU^*=U^*U=I$を満たすとき$U$をユニタリ行列という.
$\cdot\ A\in \mathbb{M}_n^\mathrm{H}$が任意の$x\in\mathbb{C}^n$に対して$\langle Ax,x\rangle\ge 0$を満たすとき$A$を半正定値行列といい, $A\ge 0$と表す.
$\cdot\ A\in \mathbb{M}_n^\mathrm{H}$が任意の$x\in\mathbb{C}^n\setminus\{0\}$に対して$\langle Ax,x\rangle >0$を満たすとき$A$を正定値行列といい, $A>0$と表す.
しばしば"行列"は省略して行列$A$は正規であるなどという風に述べる.
$A\ge 0$は$A>0$または$A=0$であることを意味しない. 例えば$A=\bigl( \begin{smallmatrix} 1&0\\ 0&0 \end{smallmatrix}\bigr)$等が反例である.
本題に入る前に, 前提となる概念の定義と性質について簡単に述べておく.
$A\in\mathbb{M}_n$とする. ある$x\in\mathbb{C}^n\setminus\{0\}$が存在して$Ax=\lambda x$となる$\lambda\in\mathbb{C}$を$A$の固有値といい, このとき$x$を$\lambda$に対する固有ベクトルという. $\lambda$が$A$の固有値であることは$\mathrm{det}(A-\lambda I)=0$と同値である.
以下
$\cdot\ \sigma(A):A$の相異なる固有値の全体,
$\cdot\ r(A)\coloneqq\displaystyle\max_{\lambda\in\sigma(A)} \lvert\lambda\rvert$
と定めておく. これは後で用いる.
$V$を線形空間としたとき, 写像$\lVert\cdot\rVert:V\rightarrow\mathbb{R}$で以下の$(1)〜(4)$を満たすものを$V$のノルムという. なお$x,\,y\in V,\,\alpha\in\mathbb{C}$である:
$\!(1)\ \lVert x\rVert\ge 0;$
$\!(2)\ \lVert x\rVert=0\Leftrightarrow x=0;$
$\!(3)\ \lVert \alpha x\rVert=\lvert \alpha\rvert\lVert x\rVert;$
$\!(4)\ \lVert x+y\rVert\le\lVert x\rVert+\lVert y\rVert.$
特に$A\in\mathbb{M}_n$に対して
$$\lVert A\rVert\coloneqq\inf\{M:\forall x\in\mathbb{C}^n;\lVert Ax\rVert\le M\lVert x\rVert\}$$
と定めるとこれは$\mathbb{M}_n$のノルムとなる. このノルムを作用素ノルムという.
作用素ノルムがノルムであることは定義からすぐに分かる. また, $A,\,B\in\mathbb{M}_n$に対して$\lVert AB\rVert\le\lVert A\rVert\lVert B\rVert$であることもすぐに分かる.
任意の$A=(a_{ij})\in\mathbb{M}_n$に対して以下の性質が成り立つ. なお$i$を虚数単位, $\zeta\in\{\pm 1,\pm i\}$とする:
$$(1)\ \langle Ax,y\rangle =\frac{1}{4}\sum_{\zeta} \zeta\langle A(x+\zeta y),x+\zeta y\rangle\ (x,y\in\mathbb{C}^n).$$
$\!(2)\ \forall x\in\mathbb{C}^n;\langle Ax,x\rangle =0\Leftrightarrow A=0.$
$(1)$の式を偏極恒等式という.
$\!(1):\,\zeta\overline{\zeta}=1,\,\sum\zeta=\sum\zeta^2=0$だから
$$\begin{align}
&\sum_{\zeta} \zeta\langle A(x+\zeta y),x+\zeta y\rangle \\
&=\sum_{\zeta} \Bigl(\zeta\langle Ax,x\rangle +\langle Ax,y\rangle +\zeta^2\langle Ay,x\rangle+\zeta\langle Ay,y\rangle\Bigr)\\
&=4\langle Ax,y\rangle.
\end{align}$$
$\!(2)$
$(\Leftarrow):\,$明らか.
$(\Rightarrow):(1)$から任意の$x,y\in\mathbb{C}^n$に対して$\langle Ax,y\rangle=0$である. よって$\langle Ae_j,e_i\rangle=a_{ij}=0, $つまり$A=0.$ //
$x,y\in\mathbb{C}^n,\,A\in\mathbb{M}_n$に対して$\langle Ax,y\rangle=\langle x,A^*y\rangle.$
定義から明らかなので証明略.
任意の$x,y\in\mathbb{C}^n$に対して$\lvert\langle x,y\rangle\rvert\le\lVert x\rVert\lVert y\rVert.$
$y=0$のときは明らかに成り立つから$y\ne 0$とする. このとき任意の$\xi\in\mathbb{C}$に対して
$$\begin{align}
0&\le\lVert x+\xi y\rVert^2\lVert y\rVert^2\\
&=\lVert x\rVert^2\lVert y\rVert^2+\xi\lVert y\rVert^2\overline{\langle x,y\rangle}+\overline{\xi}\lVert y\rVert^2\langle x,y\rangle+\xi\overline{\xi}\lVert y\rVert^4
\end{align}
$$
だから$\xi=\dfrac{-\langle x,y\rangle}{\lVert y\rVert^2}$とすれば$0\le\lVert x\rVert^2\lVert y\rVert^2-\lvert\langle x,y\rangle\rvert^2$を得る. //
任意の$A\in\mathbb{M}_n$に対して以下の性質が成り立つ:
$\!(1)\,\lVert A\rVert=\lVert A^*\rVert.$
$\!(2)\,\lVert A^*A\rVert=\lVert A\rVert^2.$
$x\in\mathbb{C}^n$とする.
$\!(1):\,\langle Ax,x\rangle=\langle x,A^*x\rangle$だから, シュワルツの不等式より
$$\begin{align}
\lVert Ax\rVert^2&=\lvert\langle Ax,Ax\rangle\rvert=\lvert\langle A^*Ax,x\rangle\rvert\\
&\le\lVert A^*Ax\rVert\lVert x\rVert\le\lVert A^*\rVert\lVert Ax\rVert\lVert x\rVert
\end{align}$$
だから$\lVert A\rVert\le\lVert A^*\rVert$が言える. よって$\lVert A^*\rVert\le\lVert (A^*)^*\rVert=\lVert A\rVert$となるから$\lVert A\rVert=\lVert A^*\rVert.$
$\!(2):\,(1)$と同様な式変形により
$$\lVert Ax\rVert^2\le\lVert A^*A\rVert\lVert x\rVert^2$$
が言える. よって$\lVert A\rVert^2\le\lVert A^*A\rVert$となる. $(1)$より$\lVert A^*A\rVert\le\lVert A\rVert\lVert A^*\rVert=\lVert A\rVert^2$であるから$\lVert A^*A\rVert=\lVert A\rVert^2.$ //
ここから上で定義した行列たちの性質について見ていこう.
$A\in\mathbb{M}_n$に対して$A\in\mathbb{M}_n^{\mathrm{N}}\Leftrightarrow\forall x\in\mathbb{C}^n;\lVert Ax\rVert=\lVert A^*x\rVert.$
命題1(2)より
$$\begin{align}
&\forall x\in\mathbb{C}^n;\lVert Ax\rVert^2=\lVert A^*x\rVert^2\\
&\Leftrightarrow\forall x\in\mathbb{C}^n;\langle (A^*A-AA^*)x,x\rangle=0 \\
&\Leftrightarrow A^*A=AA^*
\end{align}$$
である. よって従う. //
任意の$A\in\mathbb{M}_n^{\mathrm{N}}$に対して$\lambda_1,\ldots,\lambda_n\in\mathbb{R}$と$\mathbb{C}^n$の正規直交基底$\{u_1,\ldots,u_n\}$が存在して$Au_i=\lambda_i u_i,\,$つまり$\lambda_i$は$A$の固有値で$u_i$は$\lambda_i$に対する固有ベクトルとなる.
この定理は線形代数や関数解析において重要な定理であるが, 証明は略する.
次に正規行列の特徴づけとして最も大事であろう定理を示す.
$A\in\mathbb{M}_n$に対して以下の$(1),\,(2)$は同値:
$\!(1)\ A$は正規.
$\!(2)\ $あるユニタリ行列$U$と対角行列$D$があって$A=UDU^*$と出来る.
$(2)$を$A$のユニタリ対角化という.
$\!((1)\Rightarrow (2)):\ $スペクトル定理から$\lambda_i$を固有値, $u_i$を$\lambda_i$に対する固有ベクトルとするような正規直交基底$\{u_1,\ldots,u_n\}$がある. このとき$u_i$を列ベクトルとする行列$U\coloneqq(u_1\,\cdots\,u_n)$がユニタリ行列であることは正規直交性からすぐに出る. さらに
$$\begin{align}
AU&=(Au_1\,\cdots\,Au_n)\\
&=(\lambda_1u_1\,\cdots\,\lambda_nu_n)\\
&=U\,\mathrm{Diag}(\lambda_1,\ldots,\lambda_n)
\end{align}$$
であるから(なお$\mathrm{Diag}(\lambda_1,\ldots,\lambda_n)$は$\lambda_1,\ldots,\lambda_n$を対角成分とする対角行列とする)
$$A=U\,\mathrm{Diag}(\lambda_1,\ldots,\lambda_n)U^*$$
となりこれが求めるユニタリ対角化である.
$\!((1)\Leftarrow(2)):$
$$\begin{align}
AA^*&=UDU^*UD^*U^*=UDD^*U^*\\
&=UD^*DU^*=UD^*U^*UDU^*=A^*A
\end{align}$$
だから$A$は正規である. //
この定理から一番上で定義した行列たちの様々な性質が証明される. 以下ユニタリ対角化における記法は上記と同様とし, $D=\mathrm{Diag}(\lambda_1,\ldots,\lambda_n)$とする.
$A\in\mathbb{M}_n^{\mathrm{N}}$に対して以下の性質が成り立つ:
$\!(1)\ A\in\mathbb{M}_n^{\mathrm{H}}\Leftrightarrow\sigma(A)\subset\mathbb{R}.$
$\!(2)\ A\ge 0\Leftrightarrow\sigma(A)\subset[ 0,\infty).$
$\!(3)\ A> 0\Leftrightarrow\sigma(A)\subset( 0,\infty).$
どの証明も似たようなものなので(2)のみ示す.
$\!(\Rightarrow):\,\lambda\in\sigma(A),\,x$を$\lambda$に対する固有ベクトルとすると
$$\langle Ax,x\rangle=\lambda\langle x,x\rangle\ge 0$$
である. よって$\lambda\ge 0.$
$\!(\Leftarrow):\,A=UDU^*$とユニタリ対角化すれば, 任意の$x\in\mathbb{C}^n$に対して
$$\begin{align}
\langle Ax,x\rangle&=x^*U\,\mathrm{Diag}(\lambda_1,\ldots,\lambda_n)U^*x\\
&=\sum_{i=1}^n \lambda_ix^*u_iu_i^*x=\sum_{i=1}^n \lambda_i\lvert u_i^*x\rvert^2\ge 0
\end{align}$$
より$A\ge 0.$ //
ここで固有値にまつわる有名性質について復習しておこう. $A\in\mathbb{M}_n,\,\lambda\in\mathbb{C}$とする. まず代数学の基本定理から$\mathrm{det}(A-\lambda I)=0$は重複を含めて$n$個の解をもつ. それを$\lambda_1,\ldots,\lambda_n$とする. このとき$\mathrm{det}(A-\lambda I)=\prod_{i=1}^n (\lambda_i-\lambda)$と展開されるから, $\lambda=0$とすると$\mathrm{det}A=\prod_{i=1}^n \lambda_i$が分かる. この事実と上の定理により$A>0$であることは$A\ge 0$かつ正則であることが必要十分であることが従う.
述べ続けてもきりがないので, 以下の定理を示して本稿を締めくくる.
任意の$A,\,B\in\mathbb{M}_n$に対して以下の性質が成り立つ:
$\!(1)\,\sigma(AB)=\sigma(BA).$ このことから$r(AB)=r(BA).$
$\!(2)\,r(A)\le\lVert A\rVert.$ さらに$A$が正規ならば等号が成立する.
$\!(1):\ \mathrm{det}(AB-\lambda I)=\mathrm{det}(BA-\lambda I)$ならよい. $A$が正則であるとき
$$\mathrm{det}(AB-\lambda I)=\mathrm{det}(A^{-1}(AB-\lambda I)A)=\mathrm{det}(BA-\lambda I)$$
である. さらに$A$が正則でない場合を考える. $\mathbb{C}\setminus\sigma(A)$上の数列$\varepsilon_n$で$\varepsilon_n\rightarrow 0\,
(n\rightarrow\infty)$なるものを取り, $A_n\coloneqq A-\varepsilon_n I$と定める. このとき$A_n$は正則だから$\mathrm{det}(A_nB-\lambda I)=\mathrm{det}(BA_n-\lambda I)$である. よって両辺$n\rightarrow\infty$とすれば$\mathrm{det}(AB-\lambda I)=\mathrm{det}(BA-\lambda I).$
$\!(2):\ r(A)=\lvert\lambda_0\rvert$なる$\lambda_0\in\sigma(A)$をとる. $x$を$\lambda_0$に対する固有ベクトルとすると$\lVert Ax\rVert=r(A)\lVert x\rVert$であるから$r(A)\le\lVert A\rVert.$ さらに$A$が正規ならばユニタリ対角化$A=UDU^*$が存在する. このとき
$$\begin{align}
\lVert Ax\rVert^2&=x^*UD^*DU^*x=\sum_{i=1}^n \lvert\lambda_i\rvert^2\lvert u_i^*x\rvert^2\\
&\le r(A)^2\sum_{i=1}^n \lvert u_i^*x\rvert^2=r(A)^2\lVert x\rVert^2
\end{align}$$
となるから$\lVert A\rVert\le r(A).$ よって等号が成り立つ. //
$\cdot$ 定義や証明は主に[3], [4]を参考にした. 命題3の証明は[2]による. 定理6の証明は[3]にある.
$\cdot$ 定理9の(1)には上に述べた証明の他にも様々な証明の仕方がある. 詳しくは[1]を見てほしい.
述べていない性質もまだまだあるので(特に固有空間が絡む性質やスペクトル分解については煩雑になるのを避けるために述べなかった), 気になった人は調べてみると良いだろう.