特異値分解は行列による基底を用いた形で述べられることが多く,線形代数的な構造がわかりにくくなっています.この記事では,特異空間の概念を導入し,特異値分解を各特異空間間の等長同型の特異値倍として定式化します.
以下,ベクトル空間はすべて$\mathbb{C}$上の有限次元ベクトル空間であるとします.一般的でない用語や表記を用います.
$V$を計量ベクトル空間,$W$を$V$の部分空間とする.任意の$v \in V$は$w \in W, w' \in W^\perp$を用いて$v = w+w'$と一意に書ける.このとき,$v$を$w$に対応させる線形写像$V \to W$を$V$から$W$への直交射影といい,$P_W$と書く.
$V$を計量ベクトル空間とする.
$V$をベクトル空間,$T \colon V \to V$を線形写像とする.
$\lambda\in\Lambda(T)$の場合は,$E(\lambda,T)$は固有値$\lambda$の固有空間となる.以下では$\lambda\notin\Lambda(T)$の場合にも$E(\lambda,T)$という記号を用いる.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき以下が成り立つ.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき以下が成り立つ.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき以下が成り立つ.
同型写像の合成は同型写像であることから従う.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき以下が成り立つ.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像,$\sigma \in \mathbb{R}_{>0}$とする.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像,$\sigma \in \mathbb{R}_{>0}$とする.
$T_\sigma \colon S_R(\sigma,T) \to S_L(\sigma,T)$を$T_\sigma v = \frac{1}{\sigma}Tv$と定めると,$T_\sigma$は well-defined で等長同型写像である.
$T_\sigma$の well-definedness を示す.
$v \in S_R(\sigma,T)$とする.$TT^*T_\sigma v = \frac{1}{\sigma}TT^*Tv = \frac{1}{\sigma}T\left(\sigma^2v\right) = \sigma^2\frac{1}{\sigma}Tv = \sigma^2T_\sigma v$より,たしかに$T_\sigma v \in S_L(\sigma,T)$である.
$T_\sigma$が全単射であることを示す.
$S_R(\sigma,T^*)=S_L(\sigma,T), S_L(\sigma,T^*)=S_R(\sigma,T)$に注意すると,$T^*_\sigma \colon S_L(\sigma,T) \to S_R(\sigma,T), w \mapsto \frac{1}{\sigma}T^*w$は well-defined である.
$v \in S_R(\sigma,T)$に対し,$T^*_\sigma T_\sigma v = \frac{1}{\sigma^2}T^*Tv = v$より,$T^*_\sigma T_\sigma = \operatorname{id}_{S_R(\sigma,T)}$.同様に$T_\sigma T_\sigma^* = \mathrm{id}_{S_L(\sigma,T)}$であるから,$T_\sigma$は全単射である.
$T_\sigma$が等長写像であることを示す.
$v,v'\in S_R(\sigma,T)$をとると,$(T_\sigma v) \cdot (T_\sigma v') = \frac{1}{\sigma^2}(Tv) \cdot (Tv') = \frac{1}{\sigma^2}v \cdot (T^*Tv') = \frac{1}{\sigma^2}v \cdot (\sigma^2v') = v \cdot v'$.よって$T_\sigma$は等長写像である.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像,$\sigma \in \mathbb{R}_{>0}$とする.このとき,$S_R(\sigma,T) \neq \{0\} \iff S_L(\sigma,T) \neq \{0\}$.
$S_R(\sigma,T) \cong S_L(\sigma,T)$であることから従う.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像,$\sigma \in \mathbb{R}_{>0}$とする.$S_R(\sigma,T) \neq \{0\}$のとき,$\sigma$は$T$の特異値であるという.系 2 よりこれは$S_L(\sigma,T) \neq \{0\}$と同値である.
$T$の特異値の集合を$\Sigma(T)$と表す.
一般的な定義では,$T^*T$が単射でないとき (すなわち$T$が単射でないとき) $0$を$T$の特異値とみなす.特異値分解において特異値$0$の存在により例外が生じるのを避けるため,ここでは一般的な定義とは異なり,正の特異値のみを考える.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.$\Sigma(T)=\Sigma(T^*)$である.
系 2 より,$\sigma \in \Sigma(T) \iff S_R(\sigma,T) \neq \{0\} \iff S_L(\sigma,T) \neq \{0\} \iff S_R(\sigma,T^*) \neq \{0\} \iff \sigma \in \Sigma(T^*)$
自己随伴作用素について,以下が有名です.証明は省略します.
$V$を計量ベクトル空間,$T \colon V \to V$を線形写像とする.$T$が自己随伴作用素ならば,$\Lambda(T) \subseteq \mathbb{R}$であり,$V = \bigoplus^\perp_{\lambda\in\Lambda(T)}E(\lambda,T)$である.
これを用いて,線形写像の特異値分解を与えます.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき$T^*T$は自己随伴作用素であり,$\Lambda(T^*T) \subseteq \mathbb{R}_{\geq 0}$.
$(T^*T)^* = T^*(T^*)^* = T^*T$であるから,$T^*T$は自己随伴作用素である.よって,$\Lambda(T^*T) \subseteq \mathbb{R}$である.
任意の$\lambda\in\Lambda(T^*T)$をとり,固有値$\lambda$の固有ベクトル$v \in V$をとる.$\lambda\|v\|^2 = (\lambda v) \cdot v = (T^*Tv) \cdot v = (Tv) \cdot (Tv) = \|Tv\|^2 \geq 0$であるから,$\lambda \geq 0$.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき以下が成り立つ.
$V,W$を計量ベクトル空間,$T \colon V \to W$を線形写像とする.このとき
$$
T = \sum_{\sigma \in \Sigma(T)} \sigma T_\sigma P_{S_R(\sigma,T)}
$$
が成り立つ.
$v \in V$をとる.$Tv = TP_{\operatorname{Coim} T}v$である.$\operatorname{Coim} T = \bigoplus^\perp_{\sigma\in\Sigma(T)}S_R(\sigma,T)$であるから,$P_{\operatorname{Coim} T} = \sum_{\sigma\in\Sigma(T)}P_{S_R(\sigma,T)}$.よって,$Tv = \sum_{\sigma\in\Sigma(T)} TP_{S_R(\sigma,T)}v = \sum_{\sigma\in\Sigma(T)}\sigma T_\sigma P_{S_R(\sigma,T)}v$.
以上の内容を自然言語でまとめると,以下のようになります.
$V,W$に正規直交基底が定められているとき,それを右特異空間・左特異空間の正規直交基底を並べたものに基底変換する行列を書き下すと,通常の行列の特異値分解が得られます.
$V$上の線形変換に対し,右特異空間から左特異空間へのノルムを$\sigma$倍する写像を考える代わりに,最初に右特異空間の中で$\sigma$倍し,その次に等長写像を施すと考えると,極分解が得られます.
$V$を計量ベクトル空間,$T \colon V \to V$を線形写像とする.$V$上の等長同型写像$U$と$V$上の半正定値作用素$P$であって$T=UP$となるものが存在する.
$\operatorname{Coim}T \cong \operatorname{Im}T$より,$\operatorname{dim}\operatorname{Ker}T = \operatorname{dim}\operatorname{Coker}T$であるから,等長同型$\operatorname{Ker}T \to \operatorname{Coker}T$が存在する.そのうち$1$つを任意に取りそれを$U_0$とおく.
$V = \left(\oplus^\perp_{\sigma\in\Sigma(T)}S_R(\sigma,T)\right) \oplus^\perp (\operatorname{Ker} T)$に注意する.$U,P$をそれぞれ$S_R(\sigma,T), \operatorname{Ker} T$上で以下のように定義し,直和の普遍性により$V$全体に拡張する.
$P$は明らかに半正定値作用素である.$V = \left(\oplus^\perp_{\sigma\in\Sigma(T)}S_L(\sigma,T)\right) \oplus^\perp (\operatorname{Coker} T)$で$T_\sigma, U_0$は等長同型写像であるから,$U$も等長同型写像である.また,$S_R(\sigma,T),\operatorname{Ker}T$上で$T = UP$が成り立つため,直和の普遍性により$V$全体で$T=UP$が成り立つ.