1

マルコフスペクトラムの意味を直観的に解釈してみる

166
0
$$$$

こんにちは、ロダンです。現在上海の地下鉄にいて、終電ギリギリのバトルをしています。乗り換えで迷ったら一発アウトのヒリヒリ状態です。それはそれとして電車の中ではやることがないので記事を執筆しています。
さて、今回はマルコフスペクトラムと呼ばれる概念について解説します。これは1880年ごろにMarkovが導入し、マルコフ方程式$x^2+y^2+z^2=3xyz$の正整数解に現れる数(マルコフ数)との関係性を明らかにしました。本記事ではマルコフ数による記述については立ち入らず、マルコフスペクトラムという概念がどういうものなのかについて解説したいと思います。

追記:上海終電チャレンジには勝ちました。

マルコフスペクトラムの定義とその解釈

さて本題ですが、マルコフスペクトラム は次の集合として定義されます。
\begin{align} \mathcal{M} = \left\{ \sup_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} \frac{\sqrt{D}}{|Q(x,y)|} \;\middle|\; Q(x,y) = ax^2 + bxy + cy^2,\; a,b,c \in \mathbb R,\;D = b^2 - 4ac > 0 \right\}, \end{align}
これは1880年頃にマルコフによって研究された概念です。この値
\begin{align} \sup_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} \frac{\sqrt{D}}{|Q(x,y)|} \end{align}
のは一体何者なのか?その直観的な解釈を説明しましょう。まずは一旦、$\sup$の中身の分子と分母をひっくり返した
\begin{align} \ell_M(x,y):=\frac{|Q(x,y)|}{\sqrt{D}} \end{align}
の値についてみていきたいと思います。判別式$D$が正なので、$Q(x,y)=0$は実数係数の範囲で因数分解できて
\begin{align} \left(x-\frac{-b+\sqrt{D}}{2a}y\right)\left(x-\frac{-b-\sqrt{D}}{2a}y\right)=0 \end{align}
となります。以下、$\alpha:=\frac{-b+\sqrt{D}}{2a}$, $\beta:=\frac{-b-\sqrt{D}}{2a}$と書くことにします。 すなわち、方程式$Q(x,y)=0$は2本の直線
\begin{align*} \ell_1\colon x-\alpha y=0,\quad \ell_2\colon x-\beta y=0 \end{align*}
を表しています。

一旦、格子点$(x_0,y_0)\in \mathbb Z^2$を取ってこの格子点の各直線$\ell_1,\ell_2$からのユークリッド距離を考えてみることにしましょう。するとそれぞれ、
\begin{align*} \frac{|x_0 - \alpha y_0|}{\sqrt{\alpha^2+1}}, \quad \frac{|x_0 - \beta y_0|}{\sqrt{\beta^2+1}} \end{align*}
を得ます。さて、この値のはどういう意味を持つでしょうか?ひとつは、2つの直線と格子点$(x_0,y_0)$の「近さ」を1つの値で測る際の値として使えそうだということです。その格子点が2つの直線のどちらとも距離的に近ければ値が小さくなるし、どちらとも遠ければ大きくなります。また、どちらかの直線に含まれていればこの値は0になり、これをもって「最も近くの位置にいる」といっても良さそうです。実際にこの値を計算してみると、
\begin{align} \ell_{E}(x_0,y_0):=\frac{|a x_0^2 + b x_0y_0 + c y_0^2|}{|a|\sqrt{(\alpha^2+1)(\beta^2+1)}}. \end{align}
となります。ここで分子に$|Q(x_0,y_0)|$の値が出てきました。分母は全然違う値ですが、解釈を与えたい
\begin{align} \ell_M(x_0,y_0):=\frac{|Q(x_0,y_0)|}{\sqrt{D}} \end{align}
と比較してみると、どちらの分母にも$x_0,y_0$が含まれていないので両者は$x,y$の関数としてみた時に定数倍の関係性にあるといえます。ということは、$\ell_M(x_0,y_0)$は大まかにいうと2次形式$Q(x,y)$から与えられる二つの直線$\ell_1,\ell_2$からのある種の近さを測っていると言えそうです。ただし単純なユークリッド距離積と比較すると定数倍という「補正」がかかっている。では、この補正はなんのためにかかっているのか?というのが次に気になりますね。$\ell_M$を記述するために選ばれているのが$\sqrt D$なのですが、ではこれは何を考慮した結果そうなっているといえるでしょうか?

 まず結論から言うと、ここで測りたい「格子点の近さ」の尺度が、その格子点がどちらかの直線の極端に近い場合にはもう片方の直線の影響を除外して「近い」という判定を与えたいということなのではないかと思います。$\ell_E(x_0,y_0)$$\ell_M(x_0,y_0)$も、2直線のどちらかの上に格子点$x_0,y_0$がある場合は値が$0$であり、これは最大限近いことを意味していますが、このときの値には格子点が含まれない方の直線の寄与は一切ありません。これを基準として見ると、片方の直線に極端に近い場合はその直線との近さのみを使った値としたいところです。
ユークリッド距離積がこれを達成できているといえるでしょうか?それを考えるため、片方の直線が共通であるような2つの2次形式を考えます。
共通の直線の近くに格子点$(x_0,y_0)$があるとしましょう。このとき、格子点の各2直線の「近さ」の指標はこの共通の直線と格子点$(x_0,y_0)$の情報のみを使って決めたいわけです。すなわち、各々の2次形式と格子点の間の「近さ」は、だいたい同じ数値であって欲しい。ところが、ユークリッド距離積で測ろうとするとそれはうまくいかないということがわかります。実際、もう片方の直線が90°に近い角度でその直線と交わっているときは、もう片方の直線は格子点から遠いところにあることになるので$\ell_E$の値は大きく、逆に2直線が平行に近い角度で交わっているときは$\ell_E$の値は小さくなってしまいます。これはつまり、ユークリッド距離積で格子点と直線の「近さ」を測ろうとすると、本当は勘定に入れたくない格子点に遠い方の直線が、「格子点に近い方の直線との位置関係」という情報を介して大きく介入してきてしまっている状態になっているということです。

ではあらためて、これを取り除きたいときにどうすればいいのか。そこで、$\sqrt{D}$が登場します。実際に、$(x_0,y_0)$が直線$x-\alpha y=0$に極端に近い場合に$\frac{|Q(x_{0},y_{0})|}{\sqrt{D}}$の値を計算して実際にこの影響が取り除けていることを確認してみましょう。
まず$|Q(x_0,y_0)|$
\begin{align} |Q(x_0,y_0)|=|a|{|x_0 - \alpha y_0||x - \beta y_0|}=|a||x_0 - \alpha y_0||x_0 - \alpha y_0+(\beta-\alpha)y_0| \end{align}
と変形できます。ここで$(x_0,y_0)$が直線$x-\alpha y=0$に近いときは$x_0-\alpha y_0$は極端に小さいので、これを微少量$\varepsilon$とおくことにします。$|x_0 - \alpha y_0+(\beta-\alpha)y_0|$における$x_0 - \alpha y_0=\varepsilon$の影響は$(\beta-\alpha)y_0$に比べて無視できるくらい小さいので、
\begin{align} |x_0 - \alpha y_0+(\beta-\alpha)y_0|\approx|\beta-\alpha||y_0| \end{align}
で近似します。いま$\sqrt{D}=|a||\alpha-\beta|$なので、
\begin{align} \frac{|Q(x_0,y_0)|}{\sqrt {D}}\approx\frac{|a||\varepsilon||\beta-\alpha||y_0|}{|a||\beta-\alpha|}=|\varepsilon||y_0| \end{align}
となります。この式の右辺は$(x_0,y_0)$の情報と$\varepsilon$という格子点の直線$x-\alpha y_0=0$からの近さの情報のみで構成されているので、もう片方の直線$x-\beta y=0$に依存しない量になっています。ちなみに$|a|$でも割る理由は全く別のところにあります。$|a|$で割っておかないと、2次形式を定数倍したときに与えられる直線は同じなのに近さの値が変わってしまい、値として意味のないものになってしまうからです(いわゆる「正規化」のための手続きです)。以上から、
\begin{align} \ell_M(x_0,y_0):=\frac{|Q(x_0,y_0)|}{\sqrt{D}} \end{align}
は「二次形式が与える2直線と格子点$(x_0,y_0)$の距離の近さを測る指標で、片方の直線に近づくともう片方の直線の寄与がなくなっていくようなもの」という解釈ができることがわかりました。

ちなみに、$\ell_{M}$をユークリッド距離積$\ell_{E}$に補正をかけたものと捉えた時に、その補正値は具体的にどういう意味を持っているのかということについても少しみておきましょう。そのために、まず補正の値である$\frac{\ell_M(x_0,y_0)}{\ell_E(x_0,y_0)}$計算してみましょう。$\sqrt{D}=\frac{|\alpha-\beta|}{a}$を使うことで、
\begin{align} \frac{\ell_M(x_0,y_0)}{\ell_E(x_0,y_0)}=\frac{\sqrt{(\alpha^2+1)(\beta^2+1)}}{|\alpha-\beta|} \end{align}
となります。この表記、何か妙に見覚えがありませんか?2直線$\ell_1,\ell_2$の方向ベクトルはそれぞれ$u=(1,\alpha),v=(1,\beta)$であることを踏まえると、$\theta$を2次形式が与える2直線の交角だとしたときに
\begin{align} \sin\theta=\frac{|u\times v|}{||u||\,||v||}=\frac{|\alpha-\beta|}{\sqrt{(\alpha^2+1)(\beta^2+1)}} \end{align}
がなりたちます(ただし分母の$|u\times v|$$u=(1,\alpha,0),v=(1,\beta,0)$とみなしたときの外積です)。したがってさっきの値はこの$\sin\theta$の逆数であり、
\begin{align} \ell_M(x_0,y_0)=\frac{1}{\sin\theta}\ell_E(x_0,y_0), \end{align}
すなわち$\ell_M(x_0,y_0)$はユークリッド距離積$\ell_E(x_0,y_0)$に、2直線の交角の$\sin$の逆数をかけて補正した値だったのです!確かにこれなら、2つの角の開きが小さく平行に近い場合は値が大きめに補正されますし、逆に90°に近ければ補正の幅は小さくなって、先ほどの考察に合致した形の補正になっています。

さて、話はだいたい終わっているのですが最後に細かいところを詰めておきましょう。元々はこの値の逆数の$\sup$を取った値
\begin{align} \sup_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} \frac{\sqrt{D}}{|Q(x,y)|} \end{align}
がマルコフスペクトラムの元でした。逆数のまま考えたいので、これも逆数をとって
\begin{align} \inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} \frac{|Q(x,y)|}{\sqrt{D}} \end{align}
としてしまいましょう。後でもう一回逆数をとります。$\sup$$\inf$になることに注意します。ここで、$(x,y)=(0,0)$ならば常に$Q(0,0)=0$なのでこれを含めてしまうと全体が常に0になって意味のない値になります。したがって$(0,0)$は除外されていますが、この値の意味するところは「$(0,0)$を除く格子点のうち、$Q(x,y)=0$で与えられる2直線に(先の意味で)最も近い点を考えたときの、その近さ」です。正確には$\inf$なので、一番近い格子点がバシッと決まらない場合には極限を取らなければいけないのですが、大まかにいうとそういうことになります。2直線の傾きが有理数である場合、すなわち$\sqrt{D}$が有理数になる場合は2直線は$(0,0)$以外にも直線が格子点を通るのでこの値は$0$になります。また、リウヴィル数などのどこまでも有理数大して良い近似が取れるような超越数も存在し、この場合も値が$0$になりますが、例えば2次無理数の場合などは値が$0$ではありません。
最後にもう一回逆数を取って
\begin{align} \sup_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} \frac{\sqrt{D}}{|Q(x,y)|} \end{align}
を考える理由は、この値が「格子点が直線にどれくらい近づけるかの度合い」を表したいからだと思われます。つまり、値が大きければ大きいほど近いことにしたいからでしょう。逆数のまま考えても本質的な差はないと思われます。

ということで、
マルコフスペクトラムの元は「格子点が与えられた2次形式にどれくらい近づけるかの度合い」、マルコフスペクトラムはその結果の集合と結論づけることができました。

おわりに

今回マルコフスペクトラムを仕事で扱うことになったので、今一度立ち止まってその意味を考えてみることにしました。今まであまりまともに触れたことのある概念ではなかったので理解するのが大変でしたが、ChatGPTくんを2日間質問攻めすることによってその輪郭を掴むことができました。人に自分がやっている数学を理解してもらうためにはこういう勉強も大切だなあとしみじみ思いました。

投稿日:95
更新日:98
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

rodin_math
236
46018

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中