0
大学数学基礎解説
文献あり

Löwner-Heinz inequalityについて

82
0
$$$$

本稿では, Löwner-Heinz inequalityという半正定値行列に関する不等式を証明していく. また, その一般化であるFuruta inequalityについても述べる. なお本稿は 前に私が書いた記事 の続編となっている. なので前提となる定義や定理についてはそちらも参照していただきたい. 毎度のことながら間違いや誤植等ある場合にはご指摘願いたい.

用語と記法について

$\cdot\ n$を正整数とする.

$\cdot\ \mathbb{Z}$を整数全体, $\mathbb{R}$を実数全体, $\mathbb{C}$を複素数全体で, $x\in\mathbb{C}$に対し$\lvert x\rvert$で絶対値を, $\overline{x}$で複素共役を表す.

$\cdot\ \mathbb{M}_n$$n\times n$複素行列全体とし, $I=I_n\in \mathbb{M}_n$を単位行列(対角成分が全て1の対角行列)とする.

$\cdot\ A=(a_{ij})\in\mathbb{M}_n$に対して$A^*=(\overline{a_{ji}})$と定め, $A$の逆行列を$A^{-1}$と表す.

$\cdot\ \mathbb{M}_n^{\mathrm{N}}$を正規行列全体, $\mathbb{M}_n^{\mathrm{H}}$をエルミート行列全体で, $A\in\mathbb{M}_n$が半正定値であることを$A\ge 0,$ 正定値であることを$A>0$と表す. さらに$\sigma(A)$$A$の相異なる固有値全体, $r(A)$をスペクトル半径とする.

$\cdot\ \mathbb{C}^n$$n$次元複素数ベクトル空間とする. また, $\langle x,y\rangle=y^*x\ (x,y\in\mathbb{C}^n)$$\mathbb{C}^n$の標準内積とし, $\lVert x\rVert=\sqrt{\langle x,x\rangle}$とする.

$\cdot\ A\in\mathbb{M}_n$に対し$\lVert A\rVert=\sup\limits_{x\ne 0}\dfrac{\lVert Ax\rVert}{\lVert x\rVert}$を作用素ノルムとする.

$\cdot\ $半正定値行列, 正定値行列はエルミート行列であるとする.

Löwner order

行列に関する不等式と言っても, まず行列に順序をどのように定義するかという所から始めなければならない. いろいろ定義する方法はあるが, 本稿で主役となる順序はLöwner orderという順序である.

$A,B\in\mathbb{M}_n^{\mathrm{H}}$に対して$A-B\ge 0$であることを$A\succeq B$と書くと, 関係$\succeq$$\mathbb{M}_n^{\mathrm{H}}$上の半順序となるが, 全順序にはならない.

全順序にならないこと:$A=\bigl(\begin{smallmatrix} 1 & 0\\ 0 & 0 \end{smallmatrix}\bigr),\, B=\bigl(\begin{smallmatrix} 0 & 0\\ 0 & 1 \end{smallmatrix}\bigr)$とすれば$A-B$$B-A$も固有値が$\pm 1$だから$A\nsucceq B$かつ$B\nsucceq A.$
半順序であること:$A, B, C\in\mathbb{M}_n^{\mathrm{H}}$とする.
$\cdot\,A\succeq A$は明らか.
$\cdot\,A\succeq B$かつ$B\succeq A$とすると, 任意の$x\in\mathbb{C}^n$に対して$\langle Ax,x\rangle=\langle Bx,x\rangle$であるから$\langle (A-B)x,x\rangle=0.$ よって$A=B.$
$\cdot\, A\succeq B$かつ$B\succeq C$とすると, 任意の$x$に対して$\langle Ax,x\rangle\ge\langle Bx,x\rangle$かつ$\langle Bx,x\rangle\ge\langle Cx,x\rangle$だから$\langle Ax,x\rangle\ge\langle Cx,x\rangle.$ つまり$A\succeq C.$ //

上の定理で定義した$\mathbb{M}_n^{\mathrm{H}}$上の半順序$\succeq$Löwner orderという.

これが定義したかった順序である. 以下の性質は有用である:

$A\in\mathbb{M}_n$に対して$A^*A\preceq I\Leftrightarrow \lVert A\rVert\le 1.$

ちなみに$\lVert A\rVert\le 1$なる$A$をcontractionという.

\begin{align} A^*A\preceq I&\Leftrightarrow \forall x\in\mathbb{C}^n;\langle A^*Ax,x\rangle\le\langle x,x\rangle\\ &\Leftrightarrow\forall x\in\mathbb{C}^n;\langle Ax,Ax\rangle\le\langle x,x\rangle\\ &\Leftrightarrow\sup_{x\ne 0}\dfrac{\lVert Ax\rVert}{\lVert x\rVert}\le 1 \end{align}
より従う. //

行列の実数乗

順序を定義しただけではまだ本題には入れない. ここから関数カルキュラスという概念を導入してから行列の正の実数乗, つまり行列の正整数乗の一般化を定義していく. 端的に言うと, 複素数値関数へ行列を"代入"するという操作を正当化するのが関数カルキュラスである.

$A\in\mathbb{M}_n^{\mathrm{N}}$とする. このときあるユニタリ行列$U$と対角行列$D$を用いて$A=UDU^*$と表せる. $D$の対角成分は$A$のすべての固有値$\lambda_1,\ldots,\lambda_n$を並べたものとなるから, $D=\mathrm{Diag}(\lambda_1,\ldots,\lambda_n)$と表すことにすると, $f:\sigma(A)\rightarrow\mathbb{C}$に対して
$$f(A)\coloneqq U\,\mathrm{Diag}(f(\lambda_1),\ldots,f(\lambda_n))U^* $$
なる行列$f(A)$が定まる. これを$A$関数カルキュラス(functional calculus)または汎関数計算と呼ぶ.

行列の指数関数$\mathrm{exp}A$$f(x)=e^x$に対する関数カルキュラスである.

$A=UDU^*\ge 0,\,p>0$とする. このとき$f(x)=x^p$に対する関数カルキュラス
$$A^p\coloneqq U\,\mathrm{Diag}(\lambda_1^p,\ldots,\lambda_n^p)U^*$$
$A$$p$乗と定める.

なお$A^0=I$とする. $A^pA^q=A^{p+q},\,(A^p)^q=A^{pq}$であることはすぐに分かるだろう.

$A,B\in\mathbb{M}_n^{\mathrm{H}},\,C\in\mathbb{M}_n,\,A\succeq B$とする. このとき
$\!(1)\ C^*AC\succeq C^*BC$
が成り立つ. さらに$A,\,B$が正則なら
$\!(2)\ A^{-1}\preceq B^{-1}$
が成り立つ.

$\!(1):$明らか.
$\!(2):(1)$から
$$B^{-\frac{1}{2}}AB^{-\frac{1}{2}}=(B^{-\frac{1}{2}}A^{\frac{1}{2}})(A^{\frac{1}{2}}B^{-\frac{1}{2}})\succeq I$$
である. このとき$S=B^{-\frac{1}{2}}A^{\frac{1}{2}},\,T=A^{\frac{1}{2}}B^{-\frac{1}{2}}$とおくと
$$ST\succeq I\Leftrightarrow\sigma(ST)\subset[1,\infty)\Leftrightarrow\sigma(TS)\subset[1,\infty)\Leftrightarrow TS\succeq I$$
となるから$(A^{\frac{1}{2}}B^{-\frac{1}{2}})(B^{-\frac{1}{2}}A^{\frac{1}{2}})\succeq I,$ つまり$A^{-1}\preceq B^{-1}.$ //

これで本題を示すための準備は整った.

本題

ではここからメインとなる不等式を証明していこう.

Löwner-Heinz inequality

$0\le p\le 1$であるとき, $A,B\in\mathbb{M}_n^{\mathrm{H}}$に対し$A\succeq B\ge 0\Rightarrow A^p\succeq B^p.$

まず$A\succeq B>0$として$A^p\succeq B^p$であることを示す. そのために
$$\Delta\coloneqq\{p\in[0,1]:A^p\succeq B^p\}$$
とおく. $\Delta=[0,1]$なら証明が終わる. 明らかに$0,1\in\Delta$だから$p,q\in\Delta\Rightarrow(p+q)/2\in\Delta$であればよい$\!^{*1)}$.


$p,q\in\Delta$とする. このとき$A^p\succeq B^p,\,A^q\succeq B^q$だから
$$A^{-\frac{p}{2}}B^pA^{-\frac{p}{2}}\preceq I,\,A^{-\frac{q}{2}}B^qA^{-\frac{q}{2}}\preceq I$$
である. $A^{-\frac{p}{2}}B^{\frac{p}{2}}=(B^{\frac{p}{2}}A^{-\frac{p}{2}})^*,\,A^{-\frac{q}{2}}B^{\frac{q}{2}}=(B^{\frac{q}{2}}A^{-\frac{q}{2}})^*$であるから
$$\lVert B^{\frac{p}{2}}A^{-\frac{p}{2}}\rVert\le 1,\,\lVert B^{\frac{q}{2}}A^{-\frac{q}{2}}\rVert\le 1$$
となる. よって
\begin{align} \lVert A^{-\frac{p+q}{4}}B^{\frac{p+q}{2}}A^{-\frac{p+q}{4}}\rVert&=r(A^{-\frac{p+q}{4}}B^{\frac{p+q}{2}}A^{-\frac{p+q}{4}})\\ &=r(A^{-\frac{p+q}{4}}B^{\frac{p+q}{2}}A^{-\frac{q}{2}}A^{\frac{q-p}{4}})\\ &=r(A^{\frac{q-p}{4}}A^{-\frac{p+q}{4}}B^{\frac{p+q}{2}}A^{-\frac{q}{2}})\\ &=r(A^{-\frac{p}{2}}B^{\frac{p+q}{2}}A^{-\frac{q}{2}})\\ &\le\lVert A^{-\frac{p}{2}}B^{\frac{p+q}{2}}A^{-\frac{q}{2}}\rVert\\ &\le\lVert (B^{\frac{p}{2}}A^{-\frac{p}{2}})^*\rVert\lVert B^{\frac{q}{2}}A^{-\frac{q}{2}}\rVert\\ &\le 1 \end{align}
より$A^{-\frac{p+q}{4}}B^{\frac{p+q}{2}}A^{-\frac{p+q}{4}}\preceq I,\,$つまり$A^{\frac{p+q}{2}}\succeq B^{\frac{p+q}{2}}$となる. よって$(p+q)/2\in\Delta$が言えた.


ここから$A\succeq B\ge 0$のときを示していく. このとき任意の$\varepsilon>0$に対して$A+\varepsilon I\succeq B+\varepsilon I>0$であるから$(A+\varepsilon I)^p\succeq (B+\varepsilon I)^p$である. よって両辺$\varepsilon\rightarrow+0$とすれば$A^p\succeq B^p.$ //

$\!*1)\ \mathbb{Q}_r\coloneqq\Bigl\{\dfrac{m}{2^n}\in[0,1]:m,n\in\mathbb{Z},\,n>0\Bigr\}$$[0,1]$で稠密であるという事実による.

$p>1$のときの反例

この不等式は一般に$p>1$のときは成り立たない. 例えば$A=\Bigl(\begin{smallmatrix} 3/2 & 0 \\ 0 & 3/4 \end{smallmatrix}\Bigr),\, B=\Bigl(\begin{smallmatrix} 1/2 & 1/2\\ 1/2 & 1/2 \end{smallmatrix}\Bigr)$が反例である.

メインの不等式も証明し終わったところで, その一般化であるFuruta inequalityについて述べて本稿を締めくくる.

Furuta inequality

$r\ge 0,\,p\ge 0,\,q\ge 1$$(1+2r)q\ge p+2r$を満たすとき, $A,B\in\mathbb{M}_n^{\mathrm{H}}$に対し$A\succeq B\ge 0\Rightarrow (B^rA^pB^r)^{1/q}\succeq B^{(p+2r)/q}.$

$r=0,\,q=1$とすればLöwner-Heinz inequalityが得られる.

最後に

$\cdot$ 全体を通して[3]を参照した. Löwner-Heinz inequalityの証明は[4]による. Furuta inequalityの証明は原論文[2]を見よ.

$\cdot$ 定理4の注釈で述べた事実については[1]を参照されたい.

本稿で紹介した不等式は行列解析においては基礎となる不等式であるから, 興味がある人は調べてみると良いだろう.

参考文献

[2]
Takayuki FURUTA, A\ge B\ge 0 ASSURES (B^rA^pB^r)^{1/q}\ge B^{(p+2r)/q} FOR r\ge 0, p\ge 0, q\ge 1 WITH (1+2r)q\ge p+2r, American Mathematical Society
[3]
Fumio HIAI, Matrix Analysis: Matrix Monotone Functions, Matrix Means, and Majorization, Interdisciplinary Information Sciences
[4]
Xingzhi Zhan, Matrix Inequalities, Lecture Notes in Mathematics, Springer, 2002
投稿日:1030
更新日:1030
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

枕詞
枕詞
3
968
数学科B2/いろいろつまみ食いしながら勉強してます

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中