1
現代数学解説
文献あり

Gershgorinの定理の無限次元版

79
0
$$\newcommand{A}[0]{\mathcal{A}} \newcommand{abs}[1]{\left\lvert#1\right\rvert} \newcommand{B}[0]{\mathbb{B}} \newcommand{Ball}[0]{\mathrm{Ball}} \newcommand{C}[0]{\mathbb{C}} \newcommand{End}[0]{\mathrm{End}} \newcommand{inpro}[1]{\mathopen{\langle}#1\mathclose{\rangle}} \newcommand{mapsfromup}[0]{\genfrac{}{}{0}{}{\xymatrix@=3pt{{} \\ {}\ar@/^15pt/[u]}}{}} \newcommand{mapstodown}[0]{\genfrac{}{}{0}{}{\xymatrix@=3pt{{} \ar@/^15pt/[d] \\ {}}}{}} \newcommand{N}[0]{\mathbb{N}} \newcommand{norm}[1]{\left\lVert#1\right\rVert} \newcommand{R}[0]{\mathbb{R}} \newcommand{set}[2]{\{\, #1 \mid #2\,\}} \newcommand{setmid}[0]{\mathrel{}\middle|\mathrel{}} \newcommand{sp}[0]{\mathrm{sp}} \newcommand{span}[0]{\mathrm{span}} \newcommand{tr}[0]{\mathrm{tr}} \newcommand{ve}[0]{\varepsilon} \newcommand{Z}[0]{\mathbb{Z}} $$

アブスト

行列に対してその固有値を求めるのは大変難しい問題(計算量的にも実際の運用上も)であるため、explicitな表示を諦め、不等式で簡単な評価を与えることを目指すわけです。その中でも対角行列に近い場合に有効である評価がGershgorinの定理であり、この記事ではその無限次元版を与えます、つまり

  • ステートメントをそのまま読むと無限次元では反例があること
  • しかし補正すれば成立すること(1
  • 及びその周辺

を書きます。

まずは有限次元での主張です。

Gershgorinの定理

$A=(a_{ij})$をサイズ$n$の複素正方行列とし、$R_i:=\sum_{j\neq i}\abs{a_{ij}}$$i$行の絶対和(対角成分を除く)とする。このときGershgorin円板$\Ball(a_{ii},R_i)$とは$a_{ii}$中心で半径が$R_i$の円板であり、$A$の固有値全体の集合$\sp(A)$は次を満たす:
$$\sp(A)\subset \bigcup_{i}\Ball(a_{ii},R_i)$$

まず、無限次元の場合、左辺はスペクトル集合に変えるのが自然であり、右辺は閉包を取る必要があります(対角行列の時点でこれが必要)。しかし、こう読んでも、一般にはこの主張は成り立たない(self-adjointだと成立する)ことが分かります。一方、$R_i$を行の絶対和だけじゃなく列の絶対和との$\max$に変えると一般に成立することを見ます。この主張は、どこかの行または列の絶対和が発散していたら面白くない理由で成立する(はなから対角行列から遠すぎる場合を相手にしていない)ので、行と列の絶対和は有界である場合のみを考えます。このとき、無限行列$A=(a_{ij})$は本当に$l^p$空間上の有界線形作用素($p\in[1,\infty]$)を定めるので、この意味での$A$のスペクトル$\sp(A)$を考えることができます。このスペクトルは$p$に依存していることも説明します。

成り立たない方

ある$A\in\mathbb{B}(l^2)$が存在し、その行列表示$A=(a_{ij})$について$R_i:=\sum_{j\neq i}\abs{a_{ij}}$$\sp(A)\not\subset \overline{\bigcup_{i}\Ball(a_{ii},R_i)}$となる。

$T$を根付き部分木とし、$\N$$T$(の頂点集合)の全単射を固定して$l^2=l^2(T)$と見なす(例えば、根を1に、その後分岐する度に0,1を右に追加して頂点に有限01列を対応させた後、それを二進表示として読めばいい)。
$A\in\B(l^2)$を(有向な)$T$の隣接行列とする。即ち、$a_{ij}$を「頂点$i$$j$が隣接していて、かつ辺$j\to i$が根から離れる向き」であるときに1でそれ以外は0、と定める。こういう定め方をした行列が$l^2$上有界であることは後々説明するが、この場合は$A^*A=2$であることが分かるから$A$の有界性がすぐ出る。または、$A$とは左シフト作用素の各成分を$\pmatrix{1\\1}$に変えたブロック行列と思ってもすぐ分かる。
(根以外の)各$i$に対して成分が生きている$j$は丁度一個だから$R_i=1$であり$a_{ii}=0$だから、Gershgorin円板の合併は単位円板になる。一方、$A^*A=2$だから$A$のスペクトル半径は$\sqrt{2}$である。これは等長作用素(の$\sqrt{2}$倍だが)がシフト作用素を直和に含むことや、もっと初等的に$(A^n)^*A^n=(A^{n-1})^*\times2\times A^{n-1}=\dots=2^n$より$r(A)=\lim_n\norm{A^n}^{\frac1n}=\sqrt{2}$が分かる。

このような例はself-adjointなものでは作れない(恐らくnormalでも)。実際、次のような議論で有限次元行列の場合の主張に帰着できる:
$A_n:=P_nAP_n$, $P_n$$l^2$上の最初$n$成分への射影(即ち、$A_n$$A$の左上$n\times n$部分のこと)とする。このとき、$A_n\to A$がSOT-収束することから、連続関数$f\in C_b(\R)$に対し$f(A_n)\to f(A)$がSOT-収束する(今は$A_n$がノルム有界だから$f$の多項式近似によりすぐ分かる)。ここから特に$\sp(A)\subset\overline{\bigcup_n\sp(A_n)}$が分かる、実際、右辺で消える$f$に対して$f(A_n)=0$から$f(A)=0$が出る。
さて、この右辺は有限次元行列でのGershgorinの定理により評価できるため、結局所望の評価を得る。

成り立つ方

self-adjointでなら成立するが、より強く「行の絶対和」を「行の絶対和と列の絶対和の最大値」に変えたら成立することを見る。

$A\in\B(l^p)\ (p\in[1,\infty])$に対し$A=(a_{ij})$を行列表示とする。$R'_i:=\max(\sum_{j\neq i}\abs{a_{ij}},\sum_{j\neq i}\abs{a_{ji}})$$i$行または$i$列の絶対和(対角成分を除く)とする。このとき$A$のスペクトル全体の集合$\sp(A)$は次を満たす:
$$\sp(A)\subset \bigcup_{i}\Ball(a_{ii},R'_i)$$

ただし、$R'_i$$i$について有界でない場合は右辺が$\C$全体($a_{ii}$が有界だから)であるため、つまらない理由でこれは成立している。

上で書いたように、$\abs{a_{ii}}+R'_i$が有界である場合のみ非自明な主張になる。故に、二重数列$a=(a_{ij})$に対し
$$\norm{a}:=\sup_i(\abs{a_{ii}}+R'_i)=\max(\sup_i\sum_j\abs{a_{ij}},\sup_j\sum_i\abs{a_{ij}})$$
と置く。ここで最右辺の第一引数は$a$$l^\infty$上の作用素と思ったときの作用素ノルムで、第二引数は$l^1$上の作用素と思ったときの作用素ノルムである。故に$\A:=\set{a=(a_{ij})}{\norm{a}<\infty}$はBanach環($l^\infty\oplus l^1$に対角で等長に作用する)になる。
後で示すように、$a\in\A$$l^p$上の有界線形作用素$A$を定めるが、このスペクトル$\sp(A)$$p$に依存する。しかし、$\A$でのスペクトル$\sp(a)$$p$に依らず$\sp(A)\subset\sp(a)$であり(これも後で説明する)、この右辺($p=1,\infty$での$l^p$上のスペクトルの合併だが)をGershgorin円板で抑えたらいい。

$$\sp(a)=\set{\lambda\in\C}{\lambda-a\text{は}\A\text{内で非可逆}}$$
だから、結局$a\in\A$がある$\ve>0$$\abs{a_{ii}}\geq\ve+R'_i$のとき$\A$内で可逆」を示せばいい。$d_{ij}=\delta_{ij}a_{ii}$を対角行列とする。$l^\infty$上の作用素として、$d^{-1}(a-d)$の作用素ノルムは$\leq\sup_i\abs{a_{ii}}^{-1}R'_i<1$となる。また、$l^1$上の作用素として$(a-d)d^{-1}$は作用素ノルムが1未満である。故に、
$$\norm{(d^{-1}(a-d))^n}_{\A}\leq\max(\norm{d^{-1}(a-d)}_{l^\infty}^n,\norm{(a-d)d^{-1}}_{l^1}^n\norm{d}_{l^1}\norm{d^{-1}}_{l^1})$$
十分大きい$n$ではこれは1未満である。Neumann級数により$1-d^{-1}(a-d)=-d^{-1}a$$\A$内で可逆、特に$a\in\A$は可逆。

補足

Riesz-Thorinの補間定理

上のBanach環$\A$の元は$l^p\ (p\in[1,\infty])$上の有界線形作用素を定める。この対応$\A\to\B(l^p)$は環($\C$-代数)準同型だから、先の$\sp(a)\supset\sp(A)$が出る。

実際に示す評価は$\norm{a}_{l^p}\leq\norm{a}_{l^1}^{\frac1p}\norm{a}_{l^\infty}^{1-\frac1p}$であり、これはRiesz-Thorinの補間定理という一般論から直ちに従うが、Hölderの不等式により素手で示せる。特に$p=2$の場合はよく知られている。

$p=1,\infty$の場合は簡単に分かる(上で述べたように作用素ノルムが素手で書ける)。$1< p<\infty$を仮定する。
$x=(x_j)\in l^p$に対し
$$\abs{(ax)_i}=\abs{\sum_ja_{ij}x_j}\leq\sum_j\abs{a_{ij}}^{1-\frac1p}\abs{a_{ij}^\frac1p x_j}\leq(\sum_j\abs{a_{ij}})^{1-\frac1p} (\sum_j\abs{a_{ij}x_j^p})^\frac1p$$
である。これの両辺$p$乗和の$p$乗根を取り、
$$\norm{ax}_p\leq\norm{a}_{l^\infty}^{1-\frac1p}(\sum_i\sum_j\abs{a_{ij}x_j^p})^\frac1p\leq\norm{a}_{l^\infty}^{1-\frac1p}(\sup_j\sum_i\abs{a_{ij}})^\frac1p\norm{x}_p=\norm{a}_{l^\infty}^{1-\frac1p}\norm{a}_{l^1}^\frac1p\norm{x}_p$$
故に、$\norm{a}_{l^p}\leq\norm{a}_{l^1}^{\frac1p}\norm{a}_{l^\infty}^{1-\frac1p}$となる。
この$\A\to\B(l^p)$$\C$-代数の準同型だから可逆元を可逆元に移し、従ってスペクトルの間の包含が出る。

$l^p$上の作用素としてのスペクトル

上の$\A\to\B(l^p)$はスペクトルを保存しない。それどころかこのスペクトルは$p$に依存する。

$T$を根付き二分木とし、$A$をその有向な隣接行列とする。$A^n$とは根から離れる方に$n$ステップ動かす操作であるが、各頂点の動かし先は被らないから$\norm{A^n}_{l^p}=\norm{2^n\text{個1が並ぶベクトル}}_p=2^{\frac{n}p}$である、特にスペクトル半径は$2^\frac1p$である。

Riesz-Thorinの補間定理から、$p_0< p< p_1$に対し$\norm{a}_{l^p}\leq\max(\norm{a}_{l^{p_0}},\norm{a}_{l^{p_1}})$だから、上と同じ理由で$l^p$でのスペクトルは$l^{p_0},l^{p_1}$でのスペクトルの合併で抑えられる。なんか凸性みたいなのだけある。

参考文献

[1]
P. N. Shivakumar, J. J. Williams, and N. Rudraiah, EigenvaIues for infinite matrices, , Linear Algebra Appl., 1989, 35-63
投稿日:923
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

SOFT ANALYSIS

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中