はじめに
この記事は
Wathematica Advent Calender 2021
の12/14の記事です.
この記事のメインテーマは「行列の対角化」です.
対角化
正方行列に対し,行列が対角行列になる正則行列を見つけることを対角化という.
固有方程式を解いて,固有空間の基底を見つけて,基底を並べて行列を作って……っていう流れを叩き込まれるのが,B1の線型代数だと思います(個人の感想です).このへんの数学的なしくみについては,
同期の記事
に詳しく載っています.
この記事では,その図形的な意味と,それを踏まえた応用の話をしてみようと思います.
対角化
まず,行列を例にとって,対角化について考察しましょう.実行列に対し,が対角行列になるような実行列が存在するとします.このとき,とおくとはの基底なので,任意のベクトルは
と一意に表せます.とは上の式からと求められます.
これは,を左から掛けると,座標から座標へと座標系を取り換えられることを意味します.たとえば,のときはなので,次図のようになります.
xy座標とst座標の関係
正確には「標準基底(座標)から基底(座標)へと基底(座標系)を取り換えられる」という表現がより適切です.
逆に,を左から掛ければ,座標から座標へと座標系を取り替えられます.よって,に行列を左から掛けると,は次のように変形されます.
- まずが掛けられることで,が座標で表わされる
- 次にが掛けられることで,軸方向にの成分倍,軸方向にの成分倍だけ拡大される
- 最後にが掛けられることで,が座標に戻される
以上をまとめると,対角化できる行列においては,行列をベクトルに掛ける操作が「ある座標系において各軸向きに拡縮する」という操作と同等になります.
スペクトル分解
前節では「対角化できる行列においては,行列をベクトルに掛ける操作が『ある座標系において各軸向きに拡縮する』という操作と同等になる」ということを見ました.ここではそれを踏まえて,対角化を別の形で表記してみましょう.
まず,だったので,とおくと
となります.よって,次式が成立します.
ここで,を掛けると,は軸方向に倍,軸方向に倍だけ拡大されるので
です.上の式を変形すると
となり,これが任意のに対して成立するので,が成り立ちます.
この式は,が直交行列ならもっと簡単になります.実際,なら,なので,です.
なぜが直交行列のときは,が消えるのでしょうか.その理由は,が直交行列のときは,とが正規直交基底をなし,座標が直交座標系になるからです.次の図を見てください.
st座標が直交座標系でないときの様子
以下では,の長さはともにであるとします.このときは,を方向へと正射影したベクトルの長さです.よって,図中に縦線で示された三角形は直角三角形です.そして図から,とが直交していないときは,の座標とは一致しないことが分かります.逆に,とが直交していれば,両者は一致します.
st座標が直交座標系であるときの様子
,の長さがともにで,かつ直交するとき,は直交行列になり,その逆も成り立ちます.そのため,が直交行列であれば,,を計算するのに,を定義しなくともよいわけです.
以上の議論は次元で成立します.つまり,実行列が直交行列で対角化されるとき,の成分をとおくと
が成立します.の値がすべて異なるとき,これをのスペクトル分解といいます(一般の場合については参考文献を参照してください).
データの要約
ここではスペクトル分解の応用例として,データを要約する手法について説明します.
人の生徒が4科目の試験を受け,次のような結果が得られたとします(この表をそのまま行列とみなしたものをとします).
| 国語 | 算数 | 理科 | 社会 |
生徒1 | 90 | 92 | 87 | 94 |
生徒2 | 70 | 68 | 74 | 71 |
生徒3 | 59 | 80 | 70 | 62 |
| | | | |
生徒 | 82 | 76 | 69 | 74 |
よく勉強している生徒はどの科目もそれなりに良い得点をとると考えられるので,各科目の得点には相関があると考えられます.そこで,各科目の得点を重みづけして足すことで,「総合得点」のような数値を算出できないか考えてみます.より正確には
となるようなを計算してみます.
まず,定数倍の差を除くため,の長さはであるという制約を課します.総合得点という変量は要するに,4つの変量を要約した変量ですから,各生徒間での差異が大きければ大きいほど,要約によって情報が失われていないと考えられます.そこで,総合得点の標本分散が最大になるようにを決定しましょう.
から各科目ごとに平均点を引いた行列をとおくと,各生徒の総合得点を並べた表はです.また,標本分散は表の2乗和
です.
は対称行列なので,直交行列で対角化できます.よって,相異なる固有値が個あると仮定すると,は次のようにスペクトル分解できます.
また,はの正規直交基底なので,はとおけます.すると,の正規直交性から
となります.よって,次式が成立します.
はすべて異なると仮定しているので,となるは一意に定まります.また,は正規直交基底なのでです.よって,上の式からの値が最大になるのは
のときであることが分かります.このときなので,の値が最大になるような重みはです.
以上から,総合得点はをスペクトル分解することで求められることが分かりました.実は,この手法をより発展させると「主成分分析」という手法に繋がります(詳しくは参考文献を参照してください).