こんにちは、ロダンです。今回は、最近arXivに投稿された論文Gyodaの解説を行っていきたいと思います。この論文の中身は、ざっくりいうと「マルコフスペクトラムと呼ばれる実数(と$\{\infty\}$の和集合)の部分集合に含まれる値を最新テクノロジー(?)でいっぱい計算しましたよ」という感じの内容のようです。マルコフスペクトラムとマルコフの定理を知っている方向けに、先にこの記事で一番紹介したい定理を述べておきます。
$\mathcal M$をマルコフスペクトラムとする。非負整数$k_1,k_2,k_3$に対し、$(k_1,k_2,k_3)$-GM方程式を
\begin{align}
x^2+y^2+z^2+k_1yz+k_2zx+k_3xy=(3+k_1+k_2+k_3)xyz
\end{align}
と定め、この方程式の正整数解に現れる数を$(k_1,k_2,k_3)$-GM数と定義する。このとき、
\begin{align}
\mathcal M_{k_1,k_2,k_3}:=\left\{ \frac{\sqrt{((3+k_1+k_2+k_3)m-k_i)^2-4}}{m}\ \middle|\begin{aligned}
&m\text{:$(k_1,k_2,k_3)$-GM数、} \\
&i\text{:$m$を含む$(k_1,k_2,k_3)$-GM方程式}\\
&\text{ の正整数解における$m$が現れる位置}\end{aligned}\right\}
\end{align}
とおくと$\mathcal M_{k_1,k_2,k_3}\subset\mathcal M$が成立する。
あれ?でも…と思ったこの分野のエキスパートの方、その話は最後の方にするので安心してください。意味わからんという方、詳しいことが知りたいよという方はこの後の文章を読んでいただければ幸いです。
さて、まず今回扱うことになるマルコフスペクトラム$\mathcal M$は次の集合として定義されます。
\begin{align}
\mathcal{M} = \left\{ \frac{\sqrt{D}}{\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|} \,\middle|\, Q(x,y) = ax^2 + bxy + cy^2,\, a,b,c \in \mathbb R,\,D = b^2 - 4ac > 0 \right\},
\end{align}
これは1880年頃にマルコフによって研究が始められた(Markov1,Markov2)概念です。ここでは
\begin{align}
\mathcal{M}(Q) := \frac{\sqrt{D}}{\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|}
\end{align}
と置いてこれを$Q$のマルコフスペクトラム値と呼ぶことにします。この値の直観的な意味は
こちらのページ
で詳しく解説しています。簡単にいうと、不定値二次形式$Q(x,y)$の零点がどれだけ格子点に近づくことができるかという尺度を元とする集合です。さて、本稿で取り扱うメインテーマを確認しておきましょう。
マルコフスペクトラム値としてとりうる値と、それを与える$Q$を計算しよう!
ということで、まずはこの値を定義から直接計算することを考えてみます。分子の$\sqrt D$は$Q(x,1)$の判別式のことなので簡単に計算できますが、分母の$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|$は一般の場合について簡単には計算できなさそうですね。
とりあえず、$Q(x,y)=ax^2+bxy+cy^2$について、$a\neq0$かつ$a,b,c$が整数の場合に限定して考えてみることにしましょう。$(x,y)$に代入する値は整数なので、この場合は$|Q(x,y)|$として取りうる値が非負整数となり$\mathcal{M}(Q)$の中の$\inf$は$\min$になっていくらか考えやすそうです。
まず、$ |Q(x,y)|=0$となる$(0,0)$でない格子点$(x,y)$が存在する$Q$を考えます。当然この場合は$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|=0$なので$\mathcal{M}(Q)=\infty$で値が確定します。このケースを満たす$Q$を決定することは簡単です。
\begin{align}
Q(x,y)=ax^2+bxy+cy^2=0
\end{align}
を$x$について解くことで
\begin{align}
x=\frac{-b\pm\sqrt{D}}{2a}y
\end{align}
を得るので、$D$が平方数であれば$\left(-b\pm\sqrt D,2a\right)$が格子点となり、この値を代入すれば$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|=0$であることがわかります。逆に$D$が平方数でないならば$(x,y)$が整数のとき常に$|Q(x,y)|\neq0$なので、$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|\neq0$であることがわかります。
したがって、$Q(x,y)=ax^2+bxy+cy^2$の係数$a,b,c$が整数であり$a\neq0$であるという条件下では$D$が平方数であることと$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|=0$であることは同値になります。$a,b,c$を有理数に拡張しても同じようなことが言えます。2次形式$Q$を定数倍しても$\mathcal M(Q)$の値は変わらないので、定数倍して各係数の分母を払って整数係数にしてから同じことをやるだけです。
再び$a,b,c$を整数として、次に$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|=1$のケースを考えてみることにしましょう。$(0,0)$以外の任意の格子点で$Q(x,y)\neq 0$であるため、上の議論から$D$は平方数ではないことになります。すなわち、$D$は平方数ではなく、かつ$|Q(x,y)|=1$となる格子点が存在すれば$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|=1$となり、この場合は$\mathcal M(Q)=\sqrt D$となります。このような2次形式には、例えば$a=\pm1$か$c=\pm1$を満たすようなものが考えられます。実際、このときは確実に$(x,y)=(0,\pm 1)$または$(x,y)=(\pm1,0)$が$|Q(x,y)|=1$を満たしてくれます。具体的には、
\begin{align}
Q(x,y)=x^2-2xy-2y^2
\end{align}
を考えると、$\sqrt D=2\sqrt 3$なので$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|\neq 0$であり、$(x,y)=(1,0)$で$Q(x,y)=1$なので$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|= 1$が確定し、したがってこのとき$\mathcal M(Q)=\sqrt D=2\sqrt 3$となります。
上記の方法で$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|= 1$となる$Q$をいくつか探すことはできましたが、$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|= 1$となる$Q$を完全に決定することは可能なのでしょうか?少なくとも、私はこれについて情報を持ち合わせていません(もしあるならぜひ教えてください)。また$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|$が2以上の特定の値となるような$Q$は、その見つけ方すらよくわからないという状態です。
さらに、今まで$a,b,c$が整数(有理数)であることを仮定して考察をしましたが、有理数でない実数係数の場合も$\mathcal M$には含まれており、そういう場合には上記のような戦術は全く通用しません(ちなみに、今回は有理数でない実数係数の場合については取り扱いません)。与えられた$Q$に対して$\mathcal M(Q)$を計算することは定義通りにやろうとすると結構難しいのです。
このように定義からは一見計算が難しそうなマルコフスペクトラム値ですが、1921年にペロンにより画期的な計算方法が与えられましたPerron。それを説明するためにまず、2次形式の$GL(2,\mathbb Z)$同値の概念を導入します。
不定値2次形式$Q$と$R$に対して、ある$\begin{bmatrix}p&q\\r&s\end{bmatrix}\in GL(2,\mathbb Z)$が存在して、任意の$x,y\in\mathbb R^2$に対して$R(x,y)=Q(px+qy,rx+sy)$となるとき、2次形式$Q$と$R$は$ GL(2,\mathbb Z)$同値であるという。
$Q(px+qy,rx+sy)$はまず$(x,y)$を列ベクトル $\begin{bmatrix}x\\y\end{bmatrix}$とみなし、ここに$\begin{bmatrix}p&q\\r&s\end{bmatrix}$をかけてから$Q$を作用させていると捉えられるので、$Q\cdot \begin{bmatrix}p&q\\r&s\end{bmatrix}(x,y)$で表すこととします。この表示だと2次形式$Q$に$ \begin{bmatrix}p&q\\r&s\end{bmatrix}$をかけているように見えるので、この状態を$Q$に$\begin{bmatrix}p&q\\r&s\end{bmatrix}$を右から作用させると呼ぶことにします。つまり、2つの2次形式$Q,R$が$GL(2,\mathbb Z)$同値であるとは、ある$\begin{bmatrix}p&q\\r&s\end{bmatrix}\in GL(2,\mathbb Z)$が存在して
\begin{align}
R=Q\cdot\begin{bmatrix}p&q\\r&s\end{bmatrix}
\end{align}
であることを意味します。
さて、2つの2次形式が$GL(2,\mathbb Z)$同値であれば、対応するマルコフスペクトラム値が同じ値になることが直接計算によりわかります。
$Q(x,1)$の行列式を$D_Q$のように書くとすると、$Q(x,1)=ax^2+bx+c$であるとき
\begin{align}
R(x,1)&=Q(px+q,rx+s)=a(px+q)^2+b(px+q)(rx+s)+c(rx+s)^2\\
&=(ap^2+bpr+cr^2)x^2+(2apq+bps+bqr+2crs)x+aq^2+bqs+cs^2
\end{align}
なので、
\begin{align}
D_R&=(2apq+bps+bqr+2crs)^2-4(ap^2+bpr+cr^2)(aq^2+bqs+cs^2)\\
&=(ps-qr)^2(b^2-4ac)=b^2-4ac=D_Q
\end{align}
となって行列式が一致し(最後から2番目の等式は$\begin{bmatrix}p&q\\r&s\end{bmatrix}\in GL(2,\mathbb Z)$であることを利用)、さらに$(x,y)\mapsto(px+qy,rx+sy)$は$(0,0)$を$(0,0)$に移し、さらに格子点の間の全単射を与えるので
\begin{align}
\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |R(x,y)|=\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(px+qy,rx+sy)|=\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|
\end{align}
がなりたつ。したがって
\begin{align}
\mathcal{M}(R) = \frac{\sqrt{D_R}}{\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |R(x,y)|} = \frac{\sqrt{D_Q}}{\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|} =\mathcal M(Q)
\end{align}
となる。
すると、マルコフスペクトラム値を計算するためには、2次形式を$GL(2,\mathbb Z)$同値類で分けてその中で計算しやすい代表元を取ってくれば良いではないかという発想になりますね。そこで登場するのが既約性の概念です。
不定値2次形式$Q$が既約であるとは、$Q(x,1)$の2つの根$\alpha,\beta$(ただし$\alpha> \beta$であるとする)に対して次の不等式が成り立つことをいう。
\begin{align}
\alpha\geq 1,\quad -1<\beta\leq0.
\end{align}
実は次の定理が成り立ちます。
$Q(x,1)$2つの根が無理数であるような不定値2次形式$Q$に対して、$GL(2,\mathbb Z)$同値であり、$R(x,1)$の2つの根が無理数であるような既約不定値2次形式$R$が存在する。
これを証明するために、次の補題を先に示しておきましょう。
$\begin{bmatrix}p&q\\r&s\end{bmatrix}\in GL(2,\mathbb Z)$とする。不定値2次形式$Q$について、$Q(x,1)$の根が$\alpha,\beta$であるとき$Q\cdot\begin{bmatrix}p&q\\r&s\end{bmatrix}^{-1}(x,1)$の根は$\frac{p\alpha+q}{r\alpha+s}, \frac{p\beta+q}{r\beta+s}$である。
まず
\begin{align}
Q\cdot\begin{bmatrix}p&q\\r&s\end{bmatrix}^{-1}(x,1)&=Q\cdot\begin{bmatrix}s&-q\\-r&p\end{bmatrix}(x,1)=Q(sx-q,-rx+p)\\&=\frac{1}{(-rx+p)^2}Q\left(\frac{sx-q}{-rx+p},1\right)
\end{align}
である。ここで、$Q(\alpha,1)=0$なので、$\alpha=\frac{sx-q}{-rx+p}$ならば$Q\cdot\begin{bmatrix}p&q\\r&s\end{bmatrix}^{-1}(x,1)=0$を満たす。$\alpha=\frac{sx-q}{-rx+p}$を変形すると$x=\frac{p\alpha+q}{r\alpha+s}$なので、これは$Q\cdot\begin{bmatrix}p&q\\r&s\end{bmatrix}^{-1}(x,1)=0$の解である。
これを踏まえて、定理2を示します。
$Q(x,1)$の根を$\alpha,\beta$(ただし$\alpha>\beta$とする)とし、それぞれの正則連分数展開を$\alpha=[a_0,\dots], \beta=[b_0,\dots]$とする。$a_i\neq b_i$を満たす最小の$i$を$m$とおく。$\alpha>\beta> 0$であるとき、次の手順で$Q$と$GL(2,\mathbb Z)$同値な2次形式$Q'$であって$Q'(x,1)$の根$\alpha',\beta'$が$\alpha'>0>\beta'$であるようなものが取れる。まず$m=0$の場合、$a_0>b_0$なので$\alpha-a_0>0>\beta-a_0$となる。 $\alpha-a_0,\beta-a_0$が根となるような$Q'(x,1)$は、補題3より$Q'(x,1)=Q\cdot \begin{bmatrix}1&-a_0\\0&1\end{bmatrix}^{-1}(x,1)$とすることで得られる。したがって、$Q'=Q\cdot\begin{bmatrix}1&-a_0\\0&1\end{bmatrix}^{-1}$で目的の$Q'$を得る。次に、$m\neq 0$である場合を考える。このとき、$Q_1(x,1):=Q\cdot\begin{bmatrix}0&1\\1&-a_0\end{bmatrix}^{-1}(x,1)$とすると、$Q_1(x,1)$の根が$\alpha_1:=[a_1,\dots], \beta_1:=[b_1,\dots]$となる。したがって、$Q$を$GL(2,\mathbb Z)$同値な$Q_1:=Q\cdot\begin{bmatrix}0&1\\1&-a_0\end{bmatrix}^{-1}$に置き換えることで、$m$の値を$1$以上減らすことができる。同様の置換操作を$m=0$になるまで行えば、あとは$m=0$の場合と同じ方法で$Q'$を構成することができる。この2次形式$Q'$について$Q'(x,1)$の根が2つとも無理数であることは、元々$Q(x,1)$の根が2つとも無理数であることと、$GL(2,\mathbb Z)$変形で使用した行列に対して$(1,1)$成分か$(2,1)$成分のどちらかが常に$0$であることから従う。
以上の議論から、必要に応じて$Q$を$GL(2,\mathbb Z)$同値な$Q'$に置き換えることで$Q$について$Q(x,1)$の根$\alpha,\beta$が$\alpha>0>\beta$であることを仮定してよい。$|\alpha|$が1より大きく$|\beta|$が$1$より小さければ$R=Q$として目的の2次形式を得る。$|\alpha|,|\beta|$がどちらも$1$より大きければ、$-1<\beta+h<0$を満たす整数$h$をとって$R=Q\cdot\begin{bmatrix}1&h\\0&1\end{bmatrix}^{-1}$とすれば目的の2次形式が取れる。$|\alpha|,|\beta|$がどちらも$1$より小さいならば$\tilde{Q}:=Q\cdot\begin{bmatrix}0&1\\1&0\end{bmatrix}^{-1}$を取ると、$\tilde{Q}(x,1)$の根は$\frac1\alpha,\frac1\beta$になるので上のケースに帰着できる。$|\alpha|$が1より小さく、$|\beta|$が$1$より大きければ$R=\tilde Q$が目的の2次形式となる。
以上から、不定値2次形式$Q$であって$Q(x,1)$の根がどちらも無理数をとるようなものに対して、マルコフスペクトラム値が等しい既約不定値2次形式を取ることができることがわかりました。となれば、既約な2次形式に関するマルコフスペクトラム値の計算方法があればありがたいわけですが、それがこの節の冒頭でふれたペロンの公式です。定理を述べる前に、連分数の記法を確認しておきましょう。$[a_1,a_2,\dots]$とかいたら
\begin{align}
[a_1,a_2,\dots] := a_1 + \frac{1}{a_2 + \frac{1}{\ddots}}
\end{align}
を表すことにします。
既約な不定値2次形式$Q$に対し、$Q(x,1)$の2つの根が無理数$\alpha,\beta$である(ただし$\alpha>\beta$とする)とし、$\alpha,\beta$の正則連分数展開がそれぞれ
\begin{align}
\alpha=[b_0,b_1,b_2,...],\quad
\beta=-[0,b_{-1},b_{-2},b_{-3},...]
\end{align}
であるとする。このとき、
\begin{align}
\mathcal M(Q)=\sup_{k\in\mathbb Z}([b_k,b_{k+1},\dots]+[0,b_{k-1},b_{k-2},...]).
\end{align}
が成立する。
証明は省略します。原論文とされているPerronを入手して確認してみたところ、この論文では定理4について証明もなく1行でその中身が述べられていただけでしたので、詳細が知りたい人はLimaのAppendix Cを参照してください。こっちには証明がちゃんと書いてあります(ここにある主張がダイレクトに書かれているわけではないのですが、読むと上記の主張が成り立つことがわかるようになっています)。
さて、この定理のおかげで計算が楽になった…ようには一見思えませんが、2次形式が特定のケースではこの公式を適用することでマルコフスペクトラム値を計算するためにいくつかの候補を比較するだけで良くなる場合があります。これを説明しましょう。
以下、2次形式$Q$の係数が有理数係数であるような場合を考えます。このとき、$Q(x,1)$の2つの根は、その片方が無理数であるならば、互いに2次共役な2次無理数になります。さらに、2次無理数の連分数展開について、次が成り立つことが知られています。
古典的事実ですので証明は省略します。証明は例えば木田の定理6.18,命題6.20などに書いてあります。
定理5 (2),(3)を利用すると、既約2次形式$Q$に対する$Q(x,1)$の根を使って与えられる定理4の計算に必要な両側無限数列$(\dots b_{-2},b_{-1},b_0,b_1,b_2,\dots)$は、正の根$\alpha=[\overline{a_0,a_1,\dots,a_n}]$を用いて
\begin{align}
(\dots,a_0,a_1,\dots,a_n,a_0,\dots,a_n,a_0,\dots)
\end{align}
と、$a_0,a_1,\dots,a_n$が右にも左にも無限に展開するような列として与えられることがわかります。すると、マルコフスペクトラム値
\begin{align}
\mathcal M(Q)=\sup_{k\in\mathbb Z}([b_k,b_{k+1},\dots]+[0,b_{k-1},b_{k-2},...]).
\end{align}
において、とくに右辺の$\sup$の中身$[b_k,b_{k+1},\dots]+[0,b_{k-1},b_{k-2},...]$が異なる値を与えるような$k$のバリエーションは有限個になります。実際、$b_k=a_i$(ただし$i=0,1,\dots,n$)の$n+1$個のケースが考えられ、$\mathcal M(Q)$を計算するためにはその$n+1$個の$\sup$(実際には$ \max$)を計算すればいいので、これで無限個のケースを計算するような事態が回避できるわけです。
実際にこれを使って計算してみることにしましょう。まずは先ほど直接計算した $Q(x,y)=x^2-2xy-2y^2$のマルコフスペクトラム値をペロンの公式から導出してみることにします。2つの解は$\alpha=\sqrt 3+1$, $\beta=-\sqrt 3+1$なので$\alpha\geq 1$かつ$-1<\beta\leq 0$となり、これは既約2次形式です。$\alpha=\sqrt 3+1$を連分数展開すると、
\begin{align}
\sqrt 3+1=2+(\sqrt 3-1)=2+\frac{1}{\frac{1}{2}(\sqrt 3+1)}=2+\frac{1}{1+\frac{1}{2}(\sqrt{3}-1)}=2+\frac{1}{1+\frac{1}{\sqrt{3}+1}}
\end{align}
となって以下繰り返しなので、$\sqrt 3+1=[\overline{2,1}]$となります。このときペロンの公式を適用すると
\begin{align}
\mathcal M(Q)=\max\{[\overline{2,1}]+[0,\overline{1,2}],[\overline{1,2}]+[0,\overline{2,1}]\}=\max\{2\sqrt 3,\sqrt 3\}=2\sqrt 3
\end{align}
となって先ほどの計算と一致することがわかります。これなら$ Q(x,y)$が有理数係数でさえあれば、定理1の証明中にある手順で$GL(2,\mathbb Z)$同値な既約2次形式を計算してペロンの公式を適用することで$\inf_{(x,y)\in \mathbb{Z}^2 \setminus \{0\}} |Q(x,y)|\geq 2$のケースでも問題なく$\mathcal M(Q)$を計算することができます。
マルコフスペクトラム値が小さいものは格子点から「遠い」2次形式であり、ディオファントス近似理論の観点では有理数近似しにくい性質を持つ2次形式として重要な意味を持っています。実は、小さい値を持つ2次形式はこれから紹介する定理によりある意味「完全に理解」されています。定理を述べる前に、マルコフ数と呼ばれる数を導入します。
マルコフ方程式$x^2+y^2+z^2=3xyz$を満たす正整数解に現れる数をマルコフ数という。
$(1,2,5)$はマルコフ方程式の解なので、$1,2,5$はマルコフ数である。
このとき、以下の定理が成り立つことをマルコフが証明しています。
集合$\mathcal M_d$,$\mathcal M_{<3}$を
\begin{align}
\mathcal M_{d}:=\left\{ \frac{\sqrt{9m^2-4}}{m}\ \middle|\text{$n$:マルコフ数}\right\},\quad \mathcal M_{<3}:=\mathcal M\cap [0,3)
\end{align}
とおく。このとき、次が成り立つ。
(1) $\mathcal M_d\subset \mathcal M$が成り立つ。特に$\mathcal M_d\subset \mathcal M_{<3}$が成り立つ。
(2) $\mathcal M_{<3}\subset\mathcal M_d$が成り立つ。
したがって、とくに$\mathcal M_d=\mathcal M_{<3}$である。
この定理はかなり強烈です。今まで格子点と2次形式の話をしていたのに、なぜか突然マルコフ数とかいう、方程式の正整数解に現れる謎の数が出てきて、しかもこの数が3以下のマルコフスペクトラム値をコントロールしていると言っているのです。
あとびっくりするのは証明された年。個人的に、数学の研究において得られた研究結果にダイレクトに影響している重要な先行研究は大体直近10〜20年くらい、古くてもせいぜい50〜60年前くらいのものという感じがするんですが、この論文の出版は145年前です。他にもこれが実は確率論で有名なアンドレイ・マルコフの修士論文だったり、とにかく驚きは尽きないのですがそれはさておき、この領域は$\mathcal M_d$の定義から$\mathbb R$の標準的位相において離散的なので、よく「マルコフスペクトラムの離散部分」などと呼ばれたりします。本稿では離散マルコフスペクトラムと呼ぶことにします。
さて、今し方$\mathcal M_{<3}$がマルコフ数でコントロールされるという事実を紹介したわけですが、どの整数がマルコフ数なのかを知る方法がないと、定理としてはなんだか物足りませんね。「実はマルコフ数はほんの数個しかなくて、特に関連性もなくたまたま一致してるだけでした」みたいな面白くない可能性も現時点では排除できていません。そこで、まずはマルコフ数を見つける方法を紹介しましょう。次のようなツリーを用意します。
次のルールで帰納的に定まる二分木$\mathrm {M}\mathbb T$を考える。
(1) 最初の頂点は$(1,2,1)$
(2) 各$(a,b,c)$は以下のような2つの子を持つ。
\begin{align*}
\begin{xy}(0,0)*+{(a,b,c)}="1",(40,-20)*+{\left(b,\frac{b^2+c^2}{a},c\right).}="2",(-40,-20)*+{\left(a,\frac{a^2+b^2}{c},b\right)}="3", \ar@{-}"1";"2"\ar@{-}"1";"3"
\end{xy}
\end{align*}
このツリーについて次が成り立ちます。
マルコフツリー$\mathrm {M}\mathbb T$について、次のことが成り立つ。
証明はたとえばAignerのSection 3などにあります。最初のいくつかの頂点を見てみましょう。
\begin{align}
\begin{xy}(0,0)*+{(1,2,1)}="1",(25,16)*+{(2,5,1)}="2",(25,-16)*+{(1,5,2)}="3", (50,24)*+{(5,13,1)}="4",(50,8)*+{(2,29,5)}="5",(50,-8)*+{(5,29,2)}="6",(50,-24)*+{(1,13,5)}="7", (85,28)*+{(13,34,1)\dots}="8",(85,20)*+{(5,194,13)\dots}="9",(85,12)*+{(29,433,5)\dots}="10",(85,4)*+{(2,169,29)\dots}="11",(85,-4)*+{(29,169,2)\dots}="12",(85,-12)*+{(5,433,29)\dots}="13",(85,-20)*+{(13,194,5)\dots}="14",(85,-28)*+{(1,34,13)\dots}="15",\ar@{-}"1";"2"\ar@{-}"1";"3"\ar@{-}"2";"4"\ar@{-}"2";"5"\ar@{-}"3";"6"\ar@{-}"3";"7"\ar@{-}"4";"8"\ar@{-}"4";"9"\ar@{-}"5";"10"\ar@{-}"5";"11"\ar@{-}"6";"12"\ar@{-}"6";"13"\ar@{-}"7";"14"\ar@{-}"7";"15"
\end{xy}
\end{align}
このツリーは真ん中を挟んで対称的な形になっているので、任意のマルコフ数を探そうとする場合どちらか半分の領域だけをみれば十分であることに注意してください。
定理7により、ここには任意のマルコフ数が現れること、そしてここに現れる全ての整数はマルコフ数であることがわかっています。また、このツリーの各頂点の第2成分の値の大きさは、頂点の位置が深くなればなるほど大きくなっています。以上を踏まえると、「マルコフ数は無限個あるが、ある数が与えられた時にその数がマルコフ数かどうかを判定することが理論上有限時間で可能」であることがわかります。
さて、定理6の(1)と(2)はどちらも結構証明が込み入っているのですが、今回は(1)の$\mathcal M_d\subset \mathcal M$にフォーカスします。これを示すためには、各マルコフ数$m$に対して$\mathcal M(Q)=\frac{\sqrt{9m^2-4}}{m}$を満たす2次形式$Q$を見つければ十分です。ここからはこの$Q$を見つける手法を説明することにしましょう。ただしここでは、Gyodaによって最近与えられた、従来から知られているものとは異なる手法を紹介することにします。
まず、ファレイツリーと呼ばれる既約分数のツリーを導入します。
次のルールで帰納的に定まる二分木$\mathrm{F}\mathbb{T}$を考える。
(1) 最初の頂点は$
\left(\frac{0}{1},
\frac{1}{1}
,\frac{1}{0}\right)$、
(2) 各頂点$\left(\frac{a}{b},
\frac{c}{d}
,\frac{e}{f}\right)$は以下のような2つの子を持つ。
\begin{align}
\begin{xy}(0,0)*+{\left(\frac{a}{b},
\frac{c}{d}
,\frac{e}{f}\right)}="1",(-40,-15)*+{\left(\frac{a}{b},
\frac{a+c}{b+d}
,\frac{c}{d}\right)}="2",(40,-15)*+{\left(\frac{c}{d},
\frac{c+e}{d+f}
,\frac{e}{f}\right)}="3", \ar@{-}"1";"2"\ar@{-}"1";"3"
\end{xy}
\end{align}
最初の方はこんな感じになります。
\begin{align*}
\begin{xy}(0,0)*+{\left(\frac{0}{1},\frac{1}{1},\frac{1}{0}\right)}="1",(20,-21)*+{\left(\frac{0}{1},\frac{1}{2},\frac{1}{1}\right)}="2",(20,21)*+{\left(\frac{1}{1},\frac{2}{1},\frac{1}{0}\right)}="3",
(55,-36)*+{\left(\frac{0}{1},\frac{1}{3},\frac{1}{2}\right)}="4",(55,-12)*+{\left(\frac{1}{2},\frac{2}{3},\frac{1}{1}\right)}="5",(55,12)*+{\left(\frac{1}{1},\frac{3}{2},\frac{2}{1}\right)}="6",(55,36)*+{\left(\frac{2}{1},\frac{3}{1},\frac{1}{0}\right)}="7",(90,-42)*+{\left(\frac{0}{1},\frac{1}{4},\frac{1}{3}\right)}="8",(90,-30)*+{\left(\frac{1}{3},\frac{2}{5},\frac{1}{2}\right)}="9",(90,-18)*+{\left(\frac{1}{2},\frac{3}{5},\frac{2}{3}\right)}="10",(90,-6)*+{\left(\frac{2}{3},\frac{3}{4},\frac{1}{1}\right)}="11",(90,6)*+{\left(\frac{1}{1},\frac{4}{3},\frac{3}{2}\right)}="12",(90,18)*+{\left(\frac{3}{2},\frac{5}{3},\frac{2}{1}\right)}="13",(90,30)*+{\left(\frac{2}{1},\frac{5}{2},\frac{3}{1}\right)}="14",(90,42)*+{\left(\frac{3}{1},\frac{4}{1},\frac{1}{0}\right)}="15",\ar@{-}"1";"2"\ar@{-}"1";"3"\ar@{-}"2";"4"\ar@{-}"2";"5"\ar@{-}"3";"6"\ar@{-}"3";"7"\ar@{-}"4";"8"\ar@{-}"4";"9"\ar@{-}"5";"10"\ar@{-}"5";"11"\ar@{-}"6";"12"\ar@{-}"6";"13"\ar@{-}"7";"14"\ar@{-}"7";"15"
\end{xy}
\end{align*}
このツリーについて、次の定理が成り立ちます。
全ての正の既約分数に対して、その分数を第2成分にもつ$\mathrm{F}\mathbb{T}$の頂点が一意的に存在する。
証明は例えばAignerのTheorem 3.9を参照してください(この本ではツリーを制限して$(0,1)$に属する既約分数のみに限って証明していますが、一般化は容易です)。
以上の事実を用いて、$\mathrm{M}\mathbb{T}$の頂点の各成分たちに、ファレイツリー$\mathrm{F}\mathbb{T}$の既約分数を使ってラベリングしていきます。例えば、$\mathrm{M}\mathbb{T}$の最初の頂点は$(1,2,1)$ですが、ここに$\mathrm{F}\mathbb{T}$の最初の頂点$\left(\frac{0}{1}, \frac{1}{1},\frac{1}{0}\right)$の同じ位置にある分数をつかってラベル付けします。マルコフ数$1$には既約分数$\frac01$と$\frac10$、$2$には既約分数$\frac11$、というように。ここで、ラベルとマルコフ数は1対1の関係ではないことに注意してください。続いて、各々の世代ルールを使って生まれてくる新しいマルコフ数と新しい既約分数を順番に対応させていきます。$\mathrm{M}\mathbb{T}(k)$において最初の頂点の左の子は$(1,5,2)$であり、$\mathrm{F}\mathbb{T}$の最初の頂点の左の子は$\left(\frac{0}{1}, \frac{1}{2},\frac{1}{1}\right)$なので、新しく出てきた$5$に既約分数$\frac{1}{2}$をラベリングします(既出の第1成分、第3成分のマルコフ数と既約分数の対応はすでにラベリングしたものになっていることに注意してください)。この操作を続けていくことで、任意のマルコフ数に既約分数がラベリングされます。既約分数$t$がラベリングされているマルコフ数を$m_{t}$と書くことにします。例えば$m_{\frac01}=1$,$m_{\frac11}=2$,$m_{\frac12}=5$です。定理8は、この対応$t\mapsto m_t$が写像としてwell-definedであることと、始集合が正の既約分数全体(と$\infty=\frac{1}{0}$)になることを保証しています。
このラベリングを使って、既約分数$t$から対応するマルコフ数$m_t$を使ったマルコフスペクトラム値を持つ二次形式$Q$を構成していきます。
唐突ですが、$\mathbb R^2$を傾き$0,-1,\infty$の整数格子点$\mathbb Z^2$を通る直線たちで三角形分割します。この三角形分割された2次元平面を$\widetilde{\mathbb R^2}$とかくことにします。
正の既約分数$t\in(0,\infty)$を1つ取ります($0=\frac{0}{1}$と$\infty=\frac{1}{0}$については後で別途考えます)。傾きが$t$の線分$L_t$を$ \widetilde{\mathbb R^2}$上にとります。ここで、この線分$L_t$の端点はどちらも整数格子点上にあって、$L_t$はそれ以外の整数格子点を通らないようなものとします。例えば$t=\frac32$のときは下図のような図形が描けています。
線分$L_{\frac32}$
次に、$L_t$を全体的にわずかに左側にずらします。ここでの「わずかにずらす」の意味は、$\widetilde{\mathbb R^2}$の各辺と$L_t$の交点が、ずらしたことによって$\widetilde{\mathbb R^2}$の辺の中点をまたぐことがない程度にずらす、という意味です。最初から辺の中点にある場合も留めずに左側にずらします。$L_t$にこの操作を行った後の線分を$\overline{L_t}$と書きます。次の図は$t=\frac32$のときの$\overline{L_t}$をデフォルメした図です。格子点を回避しているところはそれを強調するために半円で描いていますが、実際は直線です。
線分$\overline{L_{\frac32}}$
ただし注意として、$\overline{L_{\frac32}}$の左端は$\widetilde{\mathbb R^2}$の水平辺と「通過する」扱い、右端は$\widetilde{\mathbb R^2}$の水平辺の中に「留まる」扱いとします。この微妙な差はここではそんなに気にしなくていいのですが、後で一般化の文脈を考える時に大事になってきます。
次に、$\overline{L_t}$が交わる$\widetilde{\mathbb R^2}$の各辺に次の三角形通過ルールで符号$\{+,-\}$を配置します。線分$\overline{L_t}$に左下から右上方向への向きを定めておきます。
$\overline{L_t}$が通過する$\widetilde{\mathbb R^2}$における最小単位の直角三角形について:
$-$を配置する三角形
$+$を配置する三角形
このルールに従って$\overline L_{t}$と交わる$\widetilde{\mathbb R^2}$の三角形に符号を付加し、これを$\overline L_{t}$の向きを辿るように順番に並べた符号列を考えます。$t=\frac32$のときは三角形に付加された符号は次の図のようになっています。
$\overline L_{\frac32}$による符号
この時の符号列は$\{-,-,+,+,-,-,+,+,-,+\}$となります。次に得られた符号列によって数列$s(t)$を、同符号が連続している数を用いて構成します。例えば、$t=\frac32$なら$s(\frac32)=(2,2,2,2,1,1)$です。これを$t$に付随する強許容数列と呼びます。ファレイツリーに出てきた分数の中で、$t=\frac{0}{1},\frac{1}{0}$については上記の操作による$s(t)$が与えられていませんでしたが、ここでは$s(\frac01)=s(\frac10)=(1,1)$と定義します。
このとき、次が成立することが知られています。
既約分数$t\in [0,\infty]$に対して、その強許容数列$s(t)$を考える。このとき、$\alpha=[\overline{s(t)}]$, $\beta$を$\alpha$の2次共役とし、$Q_{s(t)}(x,y):=(x-\alpha y)(x-\beta y)$とする。このとき、
\begin{align}
\mathcal M(Q_{s(t)})=\frac{\sqrt{9m_t^2-4}}{m_t}
\end{align}
が成り立つ。ただし、$m_t$は$t$に対応するマルコフ数である。
したがってとくに$\frac{\sqrt{9m_t^2-4}}{m_t}\in \mathcal M$である。
この定理の証明はしませんが、成り立っていることを実感するために具体例を見て、そこから大雑把な証明方針の説明を試みることにします。
$t=\frac{3}{2}$で計算してみましょう。先ほどの通り$s(\frac{3}{2})=(2,2,2,2,1,1)$なので、$\alpha=[\overline{2,2,2,2,1,1}]$としてこれを解にもつ方程式を計算すると
\begin{align}
\alpha=[2,2,2,2,1,1,\alpha]=\frac{70\alpha+41}{29\alpha+17}
\end{align}
となるので、これを整理することで$29\alpha^2-53\alpha-41=0$となります。したがって$Q_{s(\frac32)}(x,y)=x^2-\frac{53}{29}xy-\frac{41}{29}y^2$です($Q_{s(t)}$は$x^2$についての係数が$1$になるように定義しているのでこのような表示になっていますが、定数倍しても$\mathcal M(Q)$の値に変化はないので$29x^2-53xy-41y^2$でも構いません)。このとき、ペロンの公式から$\mathcal M(Q_{s(\frac13)})$は
\begin{align}
\max\{&[\overline{2,2,2,2,1,1}]+[0,\overline{1,1,2,2,2,2}],\\
&[\overline{2,2,2,1,1,2}]+[0,\overline{2,1,1,2,2,2}],\\
&[\overline{2,2,1,1,2,2}]+[0,\overline{2,2,1,1,2,2}],\\
&[\overline{2,1,1,2,2,2}]+[0,\overline{2,2,2,1,1,2}],\\
&[\overline{1,1,2,2,2,2}]+[0,\overline{2,2,2,2,1,1}],\\
&[\overline{1,2,2,2,2,1}]+[0,\overline{1,2,2,2,2,1}]\}
\end{align}
です。少し頑張って計算すると、
\begin{align}
\max\left\{\frac{\sqrt{7565}}{29},\frac{\sqrt{7565}}{31},\frac{\sqrt{7565}}{31},\frac{\sqrt{7565}}{29},\frac{\sqrt{7565}}{41},\frac{\sqrt{7565}}{41}\right\}=\frac{\sqrt{7565}}{29}
\end{align}
であることがわかります。一方、$\mathrm{F}\mathbb T$と$\mathrm{M}\mathbb T$の対応を見ると$m_{\frac32}=29$なので、対応する値は$\frac{\sqrt{9\cdot 29^2-4}}{29}=\frac{\sqrt{7565}}{29}$となってペロンの公式による計算結果とマルコフ数を使った計算結果が一致することがわかります。
この計算例をよく眺めてみると、ペロンの公式によって与えられたマルコフスペクトラム値の候補となる6つの分数は全て分子(根号部分)が等しく、分数としての大小関係は分母の大小関係に依存していることがわかります。 ここでいきなりですが、6つの候補の計算式
\begin{align}
&[\overline{2,2,2,2,1,1}]+[0,\overline{1,1,2,2,2,2}],\\
&[\overline{2,2,2,1,1,2}]+[0,\overline{2,1,1,2,2,2}],\\
&[\overline{2,2,1,1,2,2}]+[0,\overline{2,2,1,1,2,2}],\\
&[\overline{2,1,1,2,2,2}]+[0,\overline{2,2,2,1,1,2}],\\
&[\overline{1,1,2,2,2,2}]+[0,\overline{2,2,2,2,1,1}],\\
&[\overline{1,2,2,2,2,1}]+[0,\overline{1,2,2,2,2,1}]
\end{align}
の各第1項における循環部分の有限数列(これは定義から$s(\frac{3}{2})$をローテーションしたものになっています)の、先頭の数字を除外した5つの数字をつかって連分数を作ってみましょう。有限連分数なので答えは有理数になります。
\begin{align}
&[2,2,2,1,1]=\textcolor{red}{29}/12,\\
&[2,2,1,1,2]=\textcolor{red}{31}/13,\\
&[2,1,1,2,2]=\textcolor{red}{31}/12,\\
&[1,1,2,2,2]=\textcolor{red}{29}/17,\\
&[1,2,2,2,2]=\textcolor{red}{41}/29,\\
&[2,2,2,2,1]=\textcolor{red}{41}/17.\\
\end{align}
赤く強調した分子の部分とペロンの公式を使って計算したものを見比べると、なにやら6つの候補の分母に一致していますね。さらに、この中で$s(\frac{2}{3})=(2,2,2,2,1,1)$の先頭1文字を抜いた$(2,2,2,1,1)$に対応する連分数の分子が最小になっており、しかもこれがマルコフ数$m_{\frac32}=29$に一致しています。以上の考察から、定理9を証明するためには次のことが証明できれば良さそうです。
マルコフの定理を取り扱う現代的なテキスト(今回取り上げているGyodaも含めて)では、細かい差異はありますが大体がこれらの主張を証明することにより定理8を証明しています。まず(1)と(2)は、1955年にコーンによって導入されたコーン行列と呼ばれる行列と強許容数列$s(t)$から定まる無限連分数$[\overline{s(t)}]$の関係性をみて証明する方法が広く知られています。(3)の証明方法はテキストによってまちまちですが、今回紹介している論文Gyodaではマルコフ距離と呼ばれる距離の最小性定理(Lee, Theorem 3.5)を使って分母の最小性を証明する方法をとっています。この方法をとっているテキストは、おそらくGyoda以外にはないと思います。Leeは2023年(プレプリントでも2020年公開)の論文ですし...
なお、従来のテキストのほとんどは、上述のコーン行列と強許容数列をどちらもクリストッフェルワードというワードを使って構成しています。このワードを使って2つの概念を構成する利点は、構成の出発点が同じであるという事実がコーン行列と強許容数列の関係性に対して効果的に働き、特に上述の(1)と(2)の証明が簡単になる点にあります。それにもかかわらずGyodaで強許容数列をクリストッフェルワードではなく線分$\overline{L_t}$を使って定義している最大の理由は、後述する一般化の文脈においてはこの手法が全く通用しないからです。一般化された状況においても、主張の証明には「コーン行列の一般化」「強許容数列の一般化」(後者は次の節で登場します)が必要になるのですが、そのどちらもクリストッフェルワードから構成することができません。ちなみに(3)の証明も、従来のテキストではほとんどがこのワードを使う形なので、これもそのまま一般化することは不可能です。今回紹介している論文は、クリストッフェルワードを用いた従来の手法の部分を、この$\overline{L_t}$を使って構成される蛇グラフと呼ばれるグラフを使った手法に置き換えています。蛇グラフの方がクリストッフェルワードよりも包含する情報量が多いので、その恩恵によりこの後紹介する一般化定理を与えることに成功しています。
さて、ここからはGyodaによる完全に新しい結果です。前節で見たように、マルコフ数が特定の2次形式のマルコフスペクトラムの値をコントロールしていることがすでに広く知られていますが、ここで「他の方程式の解に現れる数で、同じようなことができるものはあるのか?」という疑問が湧きます。これから紹介するのは、その疑問への1つのアンサーとなります。まず、次のようなマルコフ数の一般化を導入します。
非負整数$k_1,k_2,k_3$を固定する。$(k_1,k_2,k_3)$一般化マルコフ方程式
\begin{align}
x^2+y^2+z^2+k_1yz+k_2zx+k_3xy=(3+k_1+k_2+k_3)xyz
\end{align}
を満たす正整数解に現れる数を$(k_1,k_2,k_3)$一般化マルコフ数という。
$(1,4,17)$は$(1,2,0)$一般化マルコフ方程式の正整数解なので、$1,4,17$は$(1,2,0)$一般化マルコフ数である(成り立っていることをチェックせよ)。
以下、長いので「一般化マルコフ〜」を「GM〜」と略すことにします。この節ではこの数がコントロールするマルコフスペクトラム値を見ていくことにしましょう。$k_1=k_2=k_3=0$のとき、GM数はマルコフ数に一致します。したがって、この節の結果は前節で述べた結果を特別な場合として内包します。さて、いよいよ本稿の主定理です。次の定理が成り立つことが新たに証明されました。
非負整数$k_1,k_2,k_3$をとり固定する。このとき、
\begin{align}
\mathcal M_{k_1,k_2,k_3}:=\left\{ \frac{\sqrt{((3+k_1+k_2+k_3)m-k_i)^2-4}}{m}\ \middle|\begin{aligned}
&m\text{:$(k_1,k_2,k_3)$-GM数、} \\
&i\text{:$m$を含む$(k_1,k_2,k_3)$-GM方程式}\\
&\text{ の正整数解における$m$が現れる位置}\end{aligned}\right\}
\end{align}
とおくと$\mathcal M_{k_1,k_2,k_3}\subset\mathcal M$が成立する。
明らかに$\mathcal M_{0,0,0}=\mathcal M_d$なので、この定理はマルコフの定理の(1)の一般化になっています。また$\mathcal M_d$の元は全て値が3以下ですが、$\mathcal M_{k_1,k_2,k_3}$に含まれる元は$k_1,k_2,k_3$を大きく取れば取るほど大きくすることができます。この定理は、前節で与えたマルコフ数の場合のスペクトラム値を与える2次形式$Q$を見つける手法を一般化することで示すことができます。ここでも数学的な正当化は行わず、2次形式$Q$を見つける手法をどう一般化するかという点に絞って説明していきたいと思います。
まずは、GM数を漏れなく見つける方法の一般化から行なっていきます。今回はいくつか付加情報が必要になります。
非負整数$k_1,k_2,k_3$と、集合$\{1,2,3\}$上の自己全単射$\sigma$を固定する。このとき、次のルールで帰納的に定まる二分木$\mathrm {M}\mathbb T(k_1,k_2,k_3,\sigma)$を考える。
(1) 最初の頂点は$((1,\sigma(1)),(k_{\sigma(2)}+2,\sigma(2),(1,\sigma(3)))$
(2) 各$((a,\sigma(h)),(b,\sigma(i)),(c,\sigma(j)))$は以下のような2つの子を持つ。
\begin{align*}
\begin{xy}(0,0)*+{((a,\sigma(h)),(b,\sigma(i)),(c,\sigma(j)))}="1",(50,-20)*+{\left((b,\sigma(i)),\left(\frac{b^2+k_{\sigma(h)}bc+c^2}{a},\sigma(h)\right),(c,\sigma(j))\right).}="2",(-50,-20)*+{\left((a,\sigma(h)),\left(\frac{a^2+k_{\sigma(j)}ab+b^2}{c},\sigma(j)\right),(b,\sigma(i))\right)}="3", \ar@{-}"1";"2"\ar@{-}"1";"3"
\end{xy}
\end{align*}
このツリーについて補足説明しておこうと思います。まずこれらのツリーは$(k_1,k_2,k_3)$を固定するごとに、$\sigma$のバリエーションの個数分、つまり6個のツリーができます。なぜかこんなことをしなければいけないかというと、これは$(k_1,k_2,k_3)$-GM方程式が対称式ではないことに原因があります。マルコフ方程式は対称式なので、$(a,b,c)$が解である場合その順番違いも解になり、それらは$(a,b,c)$を含めて全部で6つ存在していますが、マルコフツリーはこの6つの解を同一視して処理しています。一方$(k_1,k_2,k_3)$-GM方程式は対称式ではないので順番違いは解にならず、その代わりにその6つに対応する解が全部値の違う解になっています。したがって、それらを同一視して処理することができないのでツリーを6つに分けているのです。
また、一般化のツリーは整数の3つ組ではなく整数のペアの3つ組を頂点に持っています。これらのペアは、それぞれ第1成分にGM数、第2成分に正整数解におけるそのGM数の位置の情報を持っています。GM方程式の新たな正整数解は、マルコフ方程式と同様に既に与えられている解に含まれる3つのうちの1つの数を入れ替えて得ることができるのですが、対称式ではない関係上、どこの成分を入れ替えるかで新たな解を得るための計算式が変わってしまいます。そのうえ、このツリーはファレイツリーとの対応の整合性を取るために、1つ下に降りるごとに3つの成分の位置をローテーションしなければいけません。したがって、新しい解を計算するためには、「このGM数は正整数解においては$i$番目の位置にある数ですよ」という情報をGM数と一緒に保持しておかなければならないのです。これが整数のペアの3つ組を考えている理由です。
さて、マルコフ方程式と同様、次の定理が成り立ちます。
GMツリー$\mathrm {M}\mathbb T(k_1,k_2,k_3,\sigma)$について、次のことが成り立つ。
長々説明しましたが、具体例を見てもらうのが一番このツリーを理解するのに手っ取り早いと思います。次のツリーは、$\sigma$を恒等写像としたときの$\mathrm {M}\mathbb T(1,2,0,\sigma)$です。
\begin{align*}
\begin{xy}
(10,0)*+{((1,1),(4,2),(1,3))}="1",
(30,16)*+{((4,2),(21,1),(1,3))}="2",
(30,-16)*+{((1,1),(17,3),(4,2))}="3",
(80,24)*+{((21,1),(121,2),(1,3))}="4",
(80,8)*+{((4,2),(457,3),(21,1))}="5",
(80,-8)*+{((17,3),(373,1),(4,2))}="6",
(80,-24)*+{((1,1),(81,2),(17,3))}="7",
(140,28)*+{((121,2),(703,1),(1,3))\cdots}="8",
(140,20)*+{((21,1),(15082,3),(121,2))\cdots}="9",
(140,12)*+{((457,0),(57121,2),(21,1))\cdots}="10",
(140,4)*+{((4,2),(10033,1),(457,3))\cdots}="11",
(140,-4)*+{((373,1),(8185,3),(4,2))\cdots}="12",
(140,-12)*+{((17,3),(38025,2),(373,1))\cdots}="13",
(140,-20)*+{((81,2),(8227,1),(17,3))\cdots}="14",
(140,-28)*+{((1,1),(386,3),(81,2))\cdots}="15",
\ar@{-}"1";"2"\ar@{-}"1";"3"
\ar@{-}"2";"4"\ar@{-}"2";"5"
\ar@{-}"3";"6"\ar@{-}"3";"7"
\ar@{-}"4";"8"\ar@{-}"4";"9"
\ar@{-}"5";"10"\ar@{-}"5";"11"
\ar@{-}"6";"12"\ar@{-}"6";"13"
\ar@{-}"7";"14"\ar@{-}"7";"15"
\end{xy}
\end{align*}
例えばこのツリーには$((4,2),(457,3),(21,1))$という頂点がありますが、定理10により、$4$を第2成分、$457$を第3成分、$21$を第1成分に置いた$(21,4,457)$が$(1,2,0)$-GM方程式、すなわち
\begin{align}
x^2+y^2+z^2+yz+2zx=6xyz
\end{align}
の解になっています(直接チェックしてみましょう)。また$(1,2,0)$-GMトリプルはこのツリーに現れているもので全部というわけではなく、別の解が$\sigma$を別の写像に取り替えることで構成されるツリーにも現れます。ただし、どんな$(1,2,0)$-GMトリプルも$\sigma$としてとり得る6つの写像から定まるツリーのどこかには必ずあります。
さて、ここからは定理9で与えられている
\begin{align}
\mathcal M_{k_1,k_2,k_3}\subset\mathcal M
\end{align}
を示す概略についてみていくことにします。これを証明するためには、各$(k_1,k_2,k_3)$GM数$m$とその位置情報$i$に対して,$\mathcal M(Q)=\frac{\sqrt{((3+k_1+k_2+k_3)m-k_i)^2-4}}{m}$を満たす2次形式$Q$を見つける必要があります。
そのために、ファレイツリー$\mathrm F\mathbb T$を再び使います。スクロールで戻って確認するのも面倒でしょうから、再度ここにご登場願いましょう。
\begin{align*}
\begin{xy}(0,0)*+{\left(\frac{0}{1},\frac{1}{1},\frac{1}{0}\right)}="1",(20,-21)*+{\left(\frac{0}{1},\frac{1}{2},\frac{1}{1}\right)}="2",(20,21)*+{\left(\frac{1}{1},\frac{2}{1},\frac{1}{0}\right)}="3",
(55,-36)*+{\left(\frac{0}{1},\frac{1}{3},\frac{1}{2}\right)}="4",(55,-12)*+{\left(\frac{1}{2},\frac{2}{3},\frac{1}{1}\right)}="5",(55,12)*+{\left(\frac{1}{1},\frac{3}{2},\frac{2}{1}\right)}="6",(55,36)*+{\left(\frac{2}{1},\frac{3}{1},\frac{1}{0}\right)}="7",(90,-42)*+{\left(\frac{0}{1},\frac{1}{4},\frac{1}{3}\right)}="8",(90,-30)*+{\left(\frac{1}{3},\frac{2}{5},\frac{1}{2}\right)}="9",(90,-18)*+{\left(\frac{1}{2},\frac{3}{5},\frac{2}{3}\right)}="10",(90,-6)*+{\left(\frac{2}{3},\frac{3}{4},\frac{1}{1}\right)}="11",(90,6)*+{\left(\frac{1}{1},\frac{4}{3},\frac{3}{2}\right)}="12",(90,18)*+{\left(\frac{3}{2},\frac{5}{3},\frac{2}{1}\right)}="13",(90,30)*+{\left(\frac{2}{1},\frac{5}{2},\frac{3}{1}\right)}="14",(90,42)*+{\left(\frac{3}{1},\frac{4}{1},\frac{1}{0}\right)}="15",\ar@{-}"1";"2"\ar@{-}"1";"3"\ar@{-}"2";"4"\ar@{-}"2";"5"\ar@{-}"3";"6"\ar@{-}"3";"7"\ar@{-}"4";"8"\ar@{-}"4";"9"\ar@{-}"5";"10"\ar@{-}"5";"11"\ar@{-}"6";"12"\ar@{-}"6";"13"\ar@{-}"7";"14"\ar@{-}"7";"15"
\end{xy}
\end{align*}
まず$k_1,k_2,k_3$と$\sigma$を固定します。先ほどと同じように、ファレイツリー$\mathrm F\mathbb T$の各成分に含まれる既約分数$t$を$\mathrm M\mathbb T(k_1,k_2,k_3,\sigma)$の同じ位置にあるペアと対応させます。
この対応を$t\mapsto (m_t,i_t)$と書くことにしましょう。添字には反映されていませんが、この対応は$k_1,k_2,k_3$と$\sigma$の選び方が異なると変わることに注意してください。例えば、$(k_1,k_2,k_3,\sigma)=(1,2,0,\mathrm{id})$($\mathrm{id}$:恒等写像)のときは上のGMツリーを使って例えば$(m_{\frac01},i_{\frac01})=(1,1)$,$(m_{\frac11},i_{\frac11})=(4,2)$,$(m_{\frac12},i_{\frac12})=(17,3)$です。
さて、ここで再び$\overline{L_t}$に登場してもらうことにしましょう。既約分数$t$の傾きの格子点を結んだ線分を、左に少しずらしたものでした。$t=\frac{3}{2}$の具体例を置いておきますので、ルールを思い出してください。
線分$\overline{L_{\frac32}}$
さて、マルコフ数の時は$\overline{L_t}$を用いた三角形通過ルールで符号を定めましたが、今回はこのルールに加えて新しいルールである辺通過ルールも適用し、$\widetilde{\mathbb R^2}$の辺にも符号を振っていきます。辺通過ルールを定義するついでに、再び使う三角形通過ルールも思い出しておきましょう。
$\overline{L_t}$に左下から右上に向かう向きを入れておく。
(三角形通過ルール)$\overline{L_t}$が通過する$\widetilde{\mathbb R^2}$における最小単位の直角三角形について:
$-$を配置する三角形
$+$を配置する三角形
(辺通過ルール)$\overline{L_t}$が通過する$\widetilde{\mathbb R^2}$における辺について:
$-$を配置する線分
$+$を配置する線分
$k_1=k_2=k_3=0$のとき、辺通過ルールによって付加される符号の個数は全て0個になるのでこのルールは無視され、三角形通過ルールだけが残って前節で与えた符号ルールに一致します。したがって、「三角形通過ルール & 辺通過ルール」は、前節の三角形通過ルールの一般化となります。
あとは前節と同様、このルールに従って$\overline L_{t}$と交わる$\widetilde{\mathbb R^2}$の三角形と辺に符号を付加し、これを$\overline L_{t}$の向きを辿るように順番に並べた符号列を考えます。$k_1=1,k_2=2,k_3=0,\sigma=\mathrm{id}$で$t=\frac32$のときは三角形に付加された符号は次の図のようになっています。
$\overline L_{\frac32}$による符号
ここで注意すべき点として、上の図で最も(左)下にある辺を$\overline{L_t}$は「通過」しているのに対して、最も(右)上にある辺では通過せず辺の中で留まっているとみなします。したがって、右上の辺を含む三角形に対しては三角形通過ルールが適用されて符号が振られますが、右上の辺には辺通過ルールが適用されず符号も振られないことに注意してください。また、デフォルメされた図で$\overline{L_t}$が中央を通っているように見える辺がありますが、実際はわずかに左側にずれているので符号$+$がその辺に対応します。
この時の符号列を、同符号が連続している数を用いて数列$s(t)$を構成します(前節と同じ記号を流用します)。例えば上記のケースなら$s(\frac32)=(5,4,5,5,3,1)$です。これを$(k_1,k_2,k_3,\sigma)$一般化強許容数列と呼ぶことにしましょう。$t=\frac{0}{1},\frac{1}{0}$については$s(\frac01)=(1+k_{\sigma(2)}+k_{\sigma(3)},1)$,$s(\frac10)=(1+k_{\sigma(1)}+k_{\sigma(2)},1)$とそれぞれ定義します。
このとき、次が成立することがGyodaによって証明されました。
非負整数$k_1,k_2,k_3$と全単射$\sigma:\{1,2,3\}\to\{1,2,3\}$を固定する。既約分数$t\in [0,\infty]$に対して、その$(k_1,k_2,k_3,\sigma)$一般化強許容数列$s(t)$を考える。ここで$\alpha=[\overline{s(t)}]$, $\beta$を$\alpha$の2次共役とおき、$Q_{s(t)}(x,y):=(x-\alpha y)(x-\beta y)$とする。このとき、
\begin{align}
\mathcal M(Q_{s(t)})=\frac{\sqrt{((3+k_1+k_2+k_3)m_t-k_{i_{t}})^2-4}}{m_t}
\end{align}
が成り立つ。ただし、$(m_t,i_t)$は$t$に対応する位置にある$\mathrm{M}\mathbb T(k_1,k_2,k_3,\sigma)$の頂点に含まれるペアである。
したがってとくに$\frac{\sqrt{((3+k_1+k_2+k_3)m_t-k_{i_{t}})^2-4}}{m_t}\in \mathcal M$である。
例によって証明は省略しますが、具体例を見てみることにしましょう。$(k_1,k_2,k_3,\sigma)=(1,2,0,\mathrm{id})$とし、$t=\frac{3}{2}$で計算してみます。$s(\frac{3}{2})=(5,4,5,5,3,1)$なので、$\alpha=[\overline{5,4,5,5,3,1}]$としてこれを解にもつ2次形式を計算すると
\begin{align}
\alpha=[5,4,5,5,3,1,\alpha]=\frac{2394\alpha+1823}{457\alpha+348}
\end{align}
となるので、これを整理することで$457\alpha^2-2046\alpha-1823=0$となります。したがって$Q_{s(\frac32)}(x,y)=x^2-\frac{2046}{457}xy-\frac{1823}{457}y^2$です。このとき、ペロンの公式から$\mathcal M(Q_{s(\frac13)})$は
\begin{align}
\max\{&[\overline{5,4,5,5,3,1}]+[0,\overline{1,3,5,5,4,5}],\\
&[\overline{4,5,5,3,1,5}]+[0,\overline{5,1,3,5,5,4}],\\
&[\overline{5,5,3,1,5,4}]+[0,\overline{4,5,1,3,5,5}],\\
&[\overline{5,3,1,5,4,5}]+[0,\overline{5,4,5,1,3,5}],\\
&[\overline{3,1,5,4,5,5}]+[0,\overline{5,5,4,5,1,3}],\\
&[\overline{1,5,4,5,5,3}]+[0,\overline{3,5,5,4,5,1}]\}
\end{align}
です。かなり頑張って計算すると、
\begin{align}
\max\left\{\frac{28\sqrt{9590}}{457},\frac{28\sqrt{9590}}{628},\frac{28\sqrt{9590}}{505},\frac{28\sqrt{9590}}{503},\frac{28\sqrt{9590}}{680},\frac{28\sqrt{9590}}{1823}\right\}=\frac{28\sqrt{9590}}{457}
\end{align}
であることがわかります。一方、$\mathrm{F}\mathbb T$と$\mathrm{M}\mathbb T$の対応を見ると$(m_{\frac32},i_{\frac32})=(457,3)$なので、対応する値は$\frac{\sqrt{((3+1+2+0)\cdot 457-0)^2-4}}{457}=\frac{\sqrt{7518560}}{457}=\frac{28\sqrt{9590}}{457}$となって、やはりペロンの公式による計算結果とGM数を使った計算結果が一致することがわかります。 一般化のケースも証明方針はマルコフの場合と同じで、
の3つを示すことで与えられています。これらの証明に必要なツール(マルコフの場合に使うツールの一般化)は、ここ2年ほどで急速に発展したGM方程式に関する理論の中でほとんどが揃っており、(3)の証明に使用される、マルコフ距離の一般化概念であるGM距離の最小性定理(Banaian, Proposition 2 & Lemma 9)が2025年12月に示されたことで全てが揃いました。
ということで、GM数を使うことでマルコフスペクトラム値を計算できる2次形式を大量に見つけることができるようになりました!ちなみに、この記事の一番最初に計算した$Q(x,y)=x^2-2xy-2y^2$のマルコフスペクトラム値$\mathcal M(Q)=2\sqrt 3$は$\mathcal M_{0,0,1}$に含まれており、値が$3$以上の$\cup_{(k_1,k_2,k_3)\in \mathbb Z_{\geq 0}^3}\mathcal M_{k_1,k_2,k_3}$の元の中では最小の値になります。
前節で見たように定理12によりマルコフスペクトラム値を計算できる2次形式が大量に見つかったことで、$\mathcal M$に含まれている値を大量に知ることができました(これが定理9の主張するところです)。どれくらい大量かというと、非負整数$k_1,k_2,k_3$を任意に固定するごとに可算無限個の値があり、しかも$k_1,k_2,k_3$のバリエーションも可算無限個なので、そりゃもうたくさんです。しかも$k_1,k_2,k_3$を大きくすればマルコフスペクトラム値もどんどん大きくすることができます。新しく計算できた値がこれだけ大量かつ広範散らばっていれば、$\mathcal M$という集合も先述の定理によってだいぶわかったといえるような気がしてきて、「もしかしてこれは大仕事なのでは?」と思いたくなるところです。しかし、現実はあまりにも非情でした。次の定理が成り立つことが1970年代にはすでにわかっていました。
フレイマン定数$c_F$を
\begin{align}
c_F:=\frac{2221564096 + 283748 \sqrt{462}}{491993569}
\end{align}
とする。このとき、$[c_F,\infty)\subset \mathcal M$であり、さらに$c_F$は$[a,\infty)\subset \mathcal M$を満たすような$a$の中で最小の値である。
なんてこった。ある定数$c_F$以上の実数が全部$\mathcal M$に入っていることが、すでに知られていたのです。ということはつまり、たかだか可算無限個しか列挙できていない定理9なんかでは、到底$\mathcal M$全体を覆うことなどできないのです。しかもこの定理は「$c_F$より大きい値のゾーンで新しいマルコフスペクトラム値を見つけたとしても、それは新発見の値ではない」という現実も突きつけています。あまりにも残酷すぎる。
しかしまだ希望はあります。$3$以上の値でこの$c_F$より小さい値についてはまだ$\mathcal M$に含まれていることが知られていない領域があるはずだから、この$c_F$が途方もなく大きな値ならその間の値にある値はほとんど新発見ということに…!!一体、$c_F$の近似値はどれくらいなんでしょうか!!
\begin{align}
c_F\approx 4.5278295661\dots,
\end{align}
終わりました。まだ人類が知らないマルコフスペクトラム値は、$3$と$4.52...$の間の、幅$1.5$ちょいの狭い区間にしかないようです。もっとも、定理12では$[c_F,\infty)$の各値をとる2次形式$Q$の存在を示唆しているだけであり、定理11のように具体的な$Q$を構成できているわけではないはずなので、仮に今回発見した値が全部$[c_F,\infty)$に含まれているとしても定理に意味がなくなるわけではありませんが、研究していてこれを知ったときは正直ショックを受けましたよ…。ちなみに、無限大方向に伸びる半直線が$\mathcal M$に含まれることを発見した(Hall)ホールの名前を取って、$[c_F,\infty)$はホールの半直線と呼ばれるようです。下限$c_F$を発見したのはフレイマンというまた別の人であり、$c_F$のフレイマン定数という名前はここから取られているようです。
しかしながら、まだ可能性は残されています。マルコフ数もホールの半直線も支配していない$[3,c_F)$という領域に、新しく発見されたマルコフスペクトラム値は必ずあるはず…!ということで泣きそうになりながら示されたのが次の定理です。
集合$\mathcal M'$を
\begin{align}
\mathcal M':=\bigcup_{(k_1,k_2,k_3)\in \mathbb Z^3_{\geq 0}}\mathcal M_{k_1,k_2,k_3}.
\end{align}
と定義する。このとき、
\begin{align}
\mathcal M'\cap [3,c_F)=(\mathcal M_{0,0,1}\setminus\{\sqrt 5\})\cup\{2\sqrt 5\}.
\end{align}
が成立する。
よかった。新発見のマルコフスペクトラム値は可算無限個ありました。この定理によると、$\mathcal M_{k_1,k_2,k_3}$に含まれる値のなかで$[3,c_F)$に含まれているものは、ほとんどが$\mathcal M_{0,0,1}$に由来するもののようです。こうなる理由は簡単です。$\mathcal M'$に含まれるマルコフスペクトラム値
\begin{align}
\frac{\sqrt{((3+k_1+k_2+k_3)m_t-k_{i_{t}})^2-4}}{m_t}
\end{align}
を眺めてみると、一般には$k_{i_t}$や$4$と比べてGM数$m_t$の値が圧倒的に大きいので、全体としてこの値は$3+k_1+k_2+k_3$よりわずかに小さいところに集中することになります。したがって、$[3,c_F)$の内部に含まれる唯一の整数である$4$よりも少し小さいところにある値がそれに該当するわけですが、$3+k_1+k_2+k_3=4$を満たす$(k_1,k_2,k_3)$は$(0,0,1)$とその順番違いしかありません。$\mathcal M_{k_1,k_2,k_3}$は定義から$ k_1,k_2,k_3$が順番違いのときは全て同じ集合になるので、結果的に上記の現象が起こります。$c_F$の整数部分が$3$じゃなくてよかった…
ちなみに異なる2つの$\mathcal M_{k_1,k_2,k_3}$は共通部分を持つ場合があり、$\sqrt{5}$は$\mathcal M_{0,0,0}(=\mathcal M_d)$にも$\mathcal M_{0,0,1}$にも含まれています。$2\sqrt 5$は$[3,c_F)$に含まれていて$\mathcal M_{0,0,1}$に含まれない唯一の$\mathcal M'$の元であり、これは$\mathcal M_{0,0,2}$の元として与えられます。ただし、この$\mathcal M'\cap [3,c_F)$が$[3,c_F)$に含まれるマルコフスペクトラム値を全てをカバーしているわけではないこともすでにわかっています。2次形式の係数を有理数係数に制限しても反例は存在し、例えば、$Q(x,y)=841x^2-986xy-551y^2$とすると
\begin{align}
\mathcal M(Q)=\frac{4\sqrt{210}}{19}\approx3.05081615709...
\end{align}であり、これは$[3,c_F)$に含まれる$\mathcal M$の値ですが$\mathcal M'$には含まれていません(前節の最後で述べたように、$\mathcal M'\cap[3,c_F)$の最小値は$2\sqrt{3}\approx3.4641...$です)。まだまだマルコフスペクトラム完全制覇までの道のりは遠いということです。
さて、今回紹介した一連の研究には、まだ解決しなければいけない問題が残っています。それは、マルコフの定理の(2)の一般化です。
定理5 (2)の主張$\mathcal M_{<3}\subset \mathcal M_d$は一般化離散マルコフスペクトラムの文脈ではどのように一般化されるか?
つまり、各$\mathcal M_{k_1,k_2,k_3}$あるいはその和集合を特徴づける$\mathcal M$の部分集合を、$\mathcal M_{<3}$のような綺麗な条件でとることができますか?という問題です。この問題が解けたとき初めて、マルコフの定理の一般化が完成するといえるでしょう。この記事をここまで読み切った手練のあなたにもこの問題に挑戦してほしいなと思っています。ぜひどうぞ。
途中から主観的なことを言いまくってるせいでバレバレなのですが、今回紹介した論文も筆者の結果です。もともとGM方程式とGM数を定義し、その話を研究集会でしはじめた3年くらい前から、整数論の研究者の方々に「オリジナルのマルコフ数みたいに、マルコフスペクトラムにおける対応物があったりしませんかね?」とよく訊かれており、その度に「今は見当もつかないですね、すいません」と答えていて歯痒い思いをしていました。しばらくは本当に何の構想もなかったのですが、2025年1月にマルコフの定理の証明について本格的に学ぶ勉強会を友人と一緒に行ったことがきっかけで頭が整理されたのか、2025年8月に$\overline{L_t}$と$s(t)$を使って別の論文を執筆しようとした際に本稿の結果が堰を切ったようにドワーっと頭の中に降りてきて、書く内容を完全に方向転換してこの論文を執筆しました。ここで述べた結果は私が一般化マルコフ数を研究し続ける上でずっと気になっていた話でしたので、今回このように論文を発表できてよかったなと思います。ということで、今回はここらへんで締めようと思います。長い長い記事をここまで読んでくださり本当にありがとうございました。