$e^\pi$ が超越数であることを証明
の最後の記事となる。
前回
までに、$e^\pi$ が超越数であることを証明するために、
$$0\leq r, s< N^3, 0\leq\lambda< N^4, 0\leq\mu< N$$
となる整数 $r, s, \lambda, \mu$ に対して
$$a_{\lambda, \mu}^{(r, s)}(x)=(r+si)^\lambda ((-1)^r x^s)^\mu$$
とし、
$$a_{\lambda, \mu}^{(r, s)}(e^\pi)=(r+si)^\lambda ((-1)^r e^{\pi s})^\mu=(r+si)^\lambda e^{-\mu\pi i(r+si)}$$
を $(rN^3+s, \lambda N+\mu)$ 成分にもつ $N^6\times N^5$ 行列 $M$ を構成し、前回
$$\rank M=N^5\ \ \ \ (2)$$
を証明した。
よって $(r_j, s_j) (1\leq j\leq N^5)$ をうまく選んだとき、$\Xi(x)$ を
$$a_{\lambda, \mu}^{(r_j, s_j)}(x)=(r_j+s_j i)^\lambda ((-1)^{r_j} x^{s_j})^\mu$$
を $(j, \lambda N+\mu)$ 成分にもつ $N^5\times N^5$ 行列の行列式とすると $\Xi(x)$ は $x$ の多項式で $\Xi(e^\pi)=\Delta\neq 0$ となる。
第1回の記事に述べたように (2) と
$$\deg \Xi\leq N^9, \textrm{h}(\Xi)\leq N^{4N^9}, \abs{\Delta}\leq e^{-N^{10}} \ \ \ \ \cdots (3)$$
を示せば、$e^\pi$ が超越数であることが示せることができる。そこで、今回 (3) を証明し、 $e^\pi$ が超越数であることの証明を完結させる。
$0\leq r_j, s_j< N^3, 0\leq \mu< N$ であるから、各成分の次数は $N^4$ より小さいので $\deg \Xi\leq N^9$ はすぐにわかる。また各成分は単項式で、係数の大きさは
$$\abs{r_j+s_j i}^\lambda<(r_j^2+s_j^2)^{N^4/2}<(N^3 \sqrt{2})^{N^4/2}$$
により評価できるから、$N$ が大きいとき
$$\textrm{h}(\Xi)<(N^5)! (N^3\sqrt{2})^{N^9/2}< N^{5N^5} (N^4)^{N^9/2}=N^{4N^9/2+5N^5}< N^{4N^9}$$
となる。
したがって、残るは $\abs{\Delta}\leq e^{-N^{10}}$ を証明するのみとなる。
$\zeta_j=r_j+s_j i, f_{\lambda N+\mu}(z)=z^\lambda e^{-\pi i\mu \zeta_j}$ とおくと $f_0(z)=1$ かつ
$$a_{\lambda, \mu}^{(r_j, s_j)}(e^\pi)=(r_j+s_j i)^\lambda ((-1)^{r_j} e^{\pi s_j})^\mu=\zeta_j^\lambda e^{-\pi i \mu \zeta_j}=f_{\lambda N+\mu}(\zeta_j)$$
となる。
よって、
$$f_{\lambda N+\mu}(\zeta_j z)=(\zeta_j z)^\lambda e^{-\pi i \mu \zeta_j z}=((r_j+s_j i)z)^\lambda ((-1)^{r_j z} e^{s_j \pi z})^\mu$$
を $(j, \lambda N+\mu)$ 成分にもつ $N^5\times N^5$ 行列を $\Omega(z)$ とおくと
$$\Delta=\wenvert{\Omega(1)}$$
とあらわされる。
そこで $\wenvert{\Omega(1)}$ の大きさを評価するために $\wenvert{\Omega(z)}$ であらわされる $z$ の関数の性質を考察する。
まず $0\leq j< N^5, 0\leq k=\lambda N+\mu< N^5$ に対して
$$f_k(\zeta_j z)=(\zeta_j z)^\lambda \left(1-\pi i\mu (\zeta_j z)+\frac{(-\pi i\mu \zeta_j z)^2}{2!}+\frac{(-\pi i\mu \zeta_j z)^3}{3!}+\cdots\right)=c_{k, 0}+c_{k, 1} (\zeta_j z)+\cdots $$
とべき級数展開できる。また $f_0(z)=1$ である。
$f_0^{(1)}(z)=f_0(z)=1$ とする。よって $\Omega(z)$ の第 $0$ 列は
$$\begin{pmatrix} f_0^{(1)}(\zeta_1 z) \\ f_0^{(1)}(\zeta_2 z) \\ \vdots \\ f_0^{(1)}(\zeta_{N^5-1} z)\end{pmatrix}=\begin{pmatrix} 1 \\ 1 \\ \vdots \\ 1\end{pmatrix}$$
となる。また $\Omega(z)$ の第 $k$ 列の成分 $f_k(\zeta_j z)$ のべき級数展開の定数項はすべて $c_{k, 0}$ であるから、第 $k$ 列から第 $0$ 列の $c_{k, 0}$ 倍を引いて、
$f_k(z)-c_{k, 0}$ に置き換えることで各列のべき級数展開の定数項を消すことができる。
つまり $1\leq k\leq N^5-1$ のとき $f_k^{(1)}(z)=f_k(z)-c_{k, 0}$ とおき $f_k^{(1)}(\zeta_j z)$ を第 $(j, k)$ 成分とする行列を $\Omega_1(z)$ とおくと、
$$\wenvert{\Omega_1(z)}=\wenvert{\Omega(z)}$$
となる。また
$$\Omega_1(z)=\begin{pmatrix}
1 & c_{1, 1}(\zeta_1 z)+c_{1, 2}(\zeta_1 z)^2+\cdots & c_{2, 1}(\zeta_1 z)+c_{2, 2}(\zeta_1 z)^2+\cdots & \cdots & c_{N^5-1, 1}(\zeta_1 z)+c_{N^5-1, 2}(\zeta_1 z)^2+\cdots \\
1 & c_{1, 1}(\zeta_2 z)+c_{1, 2}(\zeta_2 z)^2+\cdots & c_{2, 1}(\zeta_2 z)+c_{2, 2}(\zeta_2 z)^2+\cdots & \cdots & c_{N^5-1, 1}(\zeta_2 z)+c_{N^5-1, 2}(\zeta_2 z)^2+\cdots \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & c_{1, 1}(\zeta_{N^5} z)+c_{1, 2}(\zeta_{N^5} z)^2+\cdots & c_{2, 1}(\zeta_{N^5} z)+c_{2, 2}(\zeta_{N^5} z)^2+\cdots & \cdots & c_{N^5-1, 1}(\zeta_{N^5} z)+c_{N^5-1, 2}(\zeta_{N^5} z)^2+\cdots \\
\end{pmatrix}$$
とあらわされる。
つぎに第 $1$ 列から第 $N^5-1$ 列までのうち、$f_k^{(1)}(z), (1\leq k\leq N^5-1)$ のうち、べき級数展開に現れる係数が$0$でない項の次数の最も低いものをとって、その添え字 $k$ を $k_1$、係数が $0$ でない最初の項の次数を $\ell_1$ とすると
$$f_{k_1}^{(1)}(z)=c_{k_1, \ell_1} z^{\ell_1}+c_{k_1, \ell_1+1} z^{\ell_1 +1}\cdots$$
と展開され
$$\Omega_1(z)=\begin{pmatrix}
1 & c_{1, \ell_1}(\zeta_1 z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+\cdots & c_{2, \ell_1}(\zeta_1 z)^{\ell_1}+c_{2, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+\cdots & \cdots & c_{N^5-1, \ell_1}(\zeta_1 z)^{\ell_1}+c_{N^5-1, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+\cdots \\
1 & c_{1, \ell_1}(\zeta_2 z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+\cdots & c_{2, \ell_1}(\zeta_2 z)^{\ell_1}+c_{2, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+\cdots & \cdots & c_{N^5-1, \ell_1}(\zeta_2 z)^{\ell_1}+c_{N^5-1, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+\cdots \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & c_{1, \ell_1}(\zeta_{N^5} z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_{N^5} z)^{\ell_1 +1}+\cdots & c_{2, \ell_1}(\zeta_{N^5} z)^{\ell_1}+c_{2, \ell_1 +1}(\zeta_{N^5} z)^{\ell_1 +1}+\cdots & \cdots & c_{N^5-1, \ell_1}(\zeta_{N^5} z)^{\ell_1}+c_{N^5-1, \ell_1 +1}(\zeta_{N^5} z)^{\ell_1 +1}+\cdots \\
\end{pmatrix}$$
とあらわされる。
$k\neq 0, k_1$ のとき $f_k^{(1)}(z)$ のべき級数展開の、係数が $0$ でない最初の項の次数はすべて $\ell_1$ 以上だから複素数 $c^\prime$ をうまくとれば $f_k^{(1)}(z)-c^\prime f_{k_1}^{(1)}(z)$ のべき級数展開の、係数が $0$ でない最初の項の次数は $\ell_1$ より大きくなる。そこで、$f_k^{(1)}(z)$ を $f_k^{(1)}(z)-c^\prime f_{k_1}^{(1)}(z)$ に置き換える。さらに、$f_k^{(1)}$ の添え字を並び替えて $k_1$ を $1$ に並び替える。ただし $f_0^{(1)}$ はそのままとする。このようにして新たに得られたものを $f_k^{(2)}(z)$ とおくと
$$f_0^{(2)}(z)=1,$$
$$f_1^{(2)}(z)=c_{k_1, \ell_1} z^{\ell_1}+\cdots$$
となり、 $k\geq 2$ のとき $f_k^{(2)}$ のべき級数展開の、係数が $0$ でない最初の項の次数は $\ell_1$ より大きくなる。そして $f_k^{(2)}(\zeta_j z)$ を第 $(j, k)$ 成分とする行列を $\Omega_2(z) $とおくと
$$\wenvert{\Omega_2(z)}=\wenvert{\Omega_1(z)}=\wenvert{\Omega(z)}$$
となる。また
$$\Omega_2(z)=\begin{pmatrix}
1 & c_{1, \ell_1}(\zeta_1 z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+\cdots & c_{2, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+c_{2, \ell_1 +2}(\zeta_1 z)^{\ell_1 +2}+\cdots & \cdots & c_{N^5-1, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+c_{N^5-1, \ell_1 +2}(\zeta_1 z)^{\ell_1 +2}+\cdots \\
1 & c_{1, \ell_1}(\zeta_2 z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+\cdots & c_{2, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+c_{2, \ell_1 +2}(\zeta_2 z)^{\ell_1 +2}+\cdots & \cdots & c_{N^5-1, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+c_{N^5-1, \ell_1 +2}(\zeta_2 z)^{\ell_1 +2}+\cdots \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & c_{1, \ell_1}(\zeta_{N^5} z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_{N^5} z)^{\ell_1 +1}+\cdots & c_{2, \ell_1+1}(\zeta_{N^5} z)^{\ell_1 +1}+c_{2, \ell_1 +2}(\zeta_{N^5} z)^{\ell_1 +2}+\cdots & \cdots & c_{N^5-1, \ell_1 +1}(\zeta_{N^5} z)^{\ell_1 +1}+c_{N^5-1, \ell_1 +2}(\zeta_{N^5} z)^{\ell_1 +2}+\cdots \\
\end{pmatrix}$$
とあらわされる。
さらに一般に $2\leq n\leq N^5-2$ について $f_k^{(n)} (k=0, 1, \ldots, N^5-1)$ が関数の列で、$k=0, 1, \ldots, n-1$ について $f_k^{(n)}$ のべき級数展開の、係数が $0$ でない最初の項の次数を $\ell_k$ とおくと
$$\ell_0<\ell_1<\cdots<\ell_{n-1},$$
かつ $k\geq n$ のとき$f_k^{(n)}$ のべき級数展開の、係数が $0$ でない最初の項の次数は $\ell_{n-1}$ より大きいとする。
このとき $f_k^{(n)} (n\leq k\leq N^5-1)$ のうち、べき級数展開に現れる係数が$0$でない項の次数の最も低いものをとって、その添え字 $k$ を $k_n$、係数が $0$ でない最初の項の次数を $\ell_n$ とすると
$$f_{k_n}^{(n)}(z)=c_{k_n, \ell_n}^{(n)} z^{\ell_n}+c_{k_n, \ell_n +1}^{(n)} z^{\ell_n +1}\cdots$$
と展開される。 $k\geq n$ かつ $k\neq k_n$ のとき $f_k^{(n)}(z)$ のべき級数展開の、係数が $0$ でない最初の項の次数はすべて $\ell_n$ 以上だから複素数 $c^\prime$ をうまくとれば $f_k^{(n)}(z)-c^\prime f_{k_n}^{(n)}(z)$ のべき級数展開の、係数が $0$ でない最初の項の次数は $\ell_n$ より大きくなる。そこで、$f_k^{(n)}(z)$ を $f_k^{(n)}(z)-c^\prime f_{k_1}^{(n)}(z)$ に置き換える。さらに、$f_k^{(n)} (n\leq k\leq N^5-1)$ の添え字を並び替えて $k_n$ を $n$ に並び替え、新たに得られたものを $f_k^{(n+1)}(z)$ とおくと $k=0, 1, \ldots, n$ について $f_k^{(n)}$ のべき級数展開の、係数が $0$ でない最初の項の次数は $\ell_k$ で、$0=\ell_0<\ell_1<\cdots<\ell_n$ となる。さらに $f_k^{(n)}(\zeta_j z)$ を第 $(j, k)$ 成分とする行列を ${\Omega_n(z)}$ とおくと
$$\wenvert{\Omega_n(z)}=\cdots =\wenvert{\Omega_1(z)}=\wenvert{\Omega(z)}$$
となる。
このようにして得られる $f_k^{(N^5-1)}(\zeta_j)$ を第 $(j, k)$ 成分とする行列 $\Omega_{N^5-1}(z)$ は
$$\Omega_{N^5-1}(z)=\begin{pmatrix}
1 & c_{1, \ell_1}(\zeta_1 z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_1 z)^{\ell_1 +1}+\cdots & c_{2, \ell_2}(\zeta_1 z)^{\ell_2}+c_{2, \ell_2 +1}(\zeta_1 z)^{\ell_2 +1}+\cdots & \cdots & c_{N^5-1, \ell_{N^5-1}}(\zeta_1 z)^{\ell_{N^5-1}}+c_{N^5-1, \ell_{N^5-1}+1}(\zeta_1 z)^{\ell_{N^5-1}+1}+\cdots \\
1 & c_{1, \ell_1}(\zeta_2 z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_2 z)^{\ell_1 +1}+\cdots & c_{2, \ell_2}(\zeta_2 z)^{\ell_2}+c_{2, \ell_2 +1}(\zeta_2 z)^{\ell_2 +1}+\cdots & \cdots & c_{N^5-1, \ell_{N^5-1}}(\zeta_2 z)^{\ell_{N^5-1}}+c_{N^5-1, \ell_{N^5-1}+1}(\zeta_2 z)^{\ell_{N^5-1}+1}+\cdots \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & c_{1, \ell_1}(\zeta_{N^5} z)^{\ell_1}+c_{1, \ell_1 +1}(\zeta_{N^5} z)^{\ell_1 +1}+\cdots & c_{2, \ell_2}(\zeta_{N^5} z)^{\ell_2}+c_{2, \ell_2 +1}(\zeta_{N^5} z)^{\ell_2 +1}+\cdots & \cdots & c_{N^5-1, \ell_{N^5-1}}(\zeta_{N^5} z)^{\ell_{N^5-1}}+c_{N^5-1, \ell_{N^5-1}+1}(\zeta_{N^5} z)^{\ell_{N^5-1}1}+\cdots \\
\end{pmatrix}$$
とあらわされる。そして
$$\wenvert{\Omega_{N^5-1}(z)}=\wenvert{\Omega(z)}$$
となり、とくに
$$\wenvert{\Omega_{N^5-1}(1)}=\wenvert{\Omega(1)}=\Delta$$
が成り立つ。
ここで注目すべきは $f_k^{(N^5-1)}(z) (k=0, 1, \ldots, N^5-1)$ のべき級数展開の、最初に現れる項の次数は $\ell_k$ だが
$$0=\ell_0<\ell_1<\cdots<\ell_{N^5-1}$$
だから $\ell_k\geq k$ となることである。よって $\Omega_{N^5-1}(z)$ の第 $k$ 列 $f_k^{(N^5-1)}(\zeta_j z) (k=0, 1, \ldots, N^5-1)$ のべき級数展開の、最初に現れる項の次数は少なくとも $k$ となるから
$$\wenvert{\Omega(z)}=u_{N^5(N^5-1)/2} z^{N^5(N^5-1)/2}+\cdots$$
とべき級数展開される。このことは $\wenvert{\Omega(z)}/z^{N^5(N^5-1)/2}$ が正則であることを意味している。
このことから $\Delta=\wenvert{\Omega(1)}$ の大きさを評価するために、最大値の原理を用いることができる。
$\abs{z}=e^3$ のとき
$$\abs{f_{\lambda N+\mu}(\zeta_j z)}=\abs{((r_j+s_j i)z)^\lambda e^{-\pi i \mu \zeta_j z}}<(N^3\abs{z}\sqrt{2})^\lambda e^{\pi \mu N^3\abs{z}\sqrt{2}}$$
となる。よって $N>e^{2+\pi e^3\sqrt{2}}, \abs{z}=e^3$ ならば
$$\abs{f_{\lambda N+\mu}(\zeta_j z)}<(eN^3\sqrt{2})^{N^4} e^{\pi N (eN)^3 \sqrt{2}}=N^{3N^4} e^{2N^4+\pi e^3 \sqrt{2} N^4}< N^{4N^4}$$
となるので
$$\abs{\frac{\wenvert{\Omega(z)}}{z^{N^5(N^5-1)/2}}}<\frac{(N^5 N^{4N^4})^{N^5}}{e^{-3N^5(N^5-1)/2}}<\frac{N^{4N^9+5N^5}}{e^{-3N^5(N^5-1)/2}}$$
となる。$N$ が十分大きいとき $(4N^9+5N^5)\log N+3N^5/2< N^{10}/2$ となるから
$$\abs{\frac{\wenvert{\Omega(z)}}{z^{N^5(N^5-1)/2}}}< e^{-N^{10}}$$
となる。最大値の原理から、これは $\abs{z}\leq e^3$ となるすべての $z$ について成り立つ。よって
$$\abs{\Delta}=\abs{\det \Omega(1)}< e^{-N^{10}}$$
となる。これによって (3) の条件がすべて確かめられ、$e^\pi$ が超越数であることが証明された。
ある点 $z_0$ において領域 $D$ で収束するべき級数展開が与えられている関数 $f(z)$ について、領域 $D$ に関する最大値の原理はつぎのようにしてすぐにわかる。$z_1$ を $D$ の内部の点とし、$z_1$ で $f(z)$ が領域 $D$ における最大値をとり $z=z_0$ におけるべき級数展開
$$f(z)=a_0+a_1(z-z_0)+a_2(z-z_0)^2+\cdots$$
において $a_1, a_2, \cdots$ の少なくともひとつは $0$ ではないと仮定する。$z=z-(z_1-z_0)$ を代入すれば $z=z_1$ におけるべき級数展開
$$f(z)=b_0+b_1(z-z_1)+b_2(z-z_1)^2+\cdots$$
が得られる。また $b_1, b_2, \cdots$ の、少なくともひとつは $0$ ではない。
そこで $b_k\neq 0, k>0$ となる最小の $k$ をとることができる。$\theta=(\arg (b_0/b_k))/k$、$\delta>0$ を十分小さい数とすると $z_2=z_1+\delta e^{\theta i}$ は $D$ の内部に含まれ、かつ $\abs{z-z_1}=\delta$ が十分小さいので
$$\abs{b_{k+1}(z_2-z_1)+b_{k+2}(z_2-z_1)^2+\cdots}<\frac{\abs{b_1}}{2}$$
つまり
$$\abs{b_{k+1}(z_2-z_1)^{k+1}+b_{k+2}(z_2-z_1)^{k+2}+\cdots}<\frac{\abs{b_k (z_2-z_1)^k}}{2}=\frac{\abs{b_k} \delta^k}{2}$$
となる。
$b_0+b_k(z_2-z_1)^k=b_0+b_k \delta^k e^{\theta k i}$ であるが $\theta$ の定義から $\arg e^{\theta k i}=\arg(b_0/b_k)$ なので $\arg (b_k \delta^k e^{\theta k i})=\arg b_0$ である。よって
$$\abs{b_0+b_k(z_2-z_1)^k}=\abs{b_0}+\abs{b_k} \delta^k$$
となる。したがって
$$\begin{split}
\abs{f(z_2)}\geq & \abs{b_0+b_k(z_2-z_1)^k}-\abs{b_{k+1}(z_2-z_1)^{k+1}+b_{k+2}(z_2-z_1)^{k+2}+\cdots} \\
> & \abs{b_0}+\abs{b_k \delta^k}-\frac{\abs{b_k} \delta^k}{2} \\
= & \abs{b_0}+\frac{\abs{b_k} \delta^k}{2}>\abs{f(z_1)}
\end{split}$$
となり、$z_1$ で $f(z)$ が領域 $D$ における最大値をとると仮定したことに矛盾する。よって $f(z)$ の $z=z_0$ におけるべき級数展開において、定数項以外の係数は $0$ でなければならない。
つまり、 $f(z)$ が、ある点 $z_0$ で定数ではないべき級数展開をもち、それがある領域 $D$ で収束しているとき、 $f(z)$ の $D$ における最大値は、 $D$ の境界でしかとられないのである。
Laurent, Mignotte, Nesterenko の共著論文 [2] は、この記事で紹介したNesterenkoの方法を用いて$2$つの代数的数の対数の$1$次形式
$$b_1\log\alpha_1+b_2\log\alpha_2$$
の大きさの評価を行っている。さらに Bennett, Blass, Glass, Meronk, Steiner [3] や Mignotte [4] は、この方法を$3$つの代数的数の対数の$1$次形式
$$b_1\log\alpha_1+b_2\log\alpha_2+b_3\log\alpha_3$$
の大きさの評価に拡張している。ただし、これには、補助多項式を構成するための行列式が消滅しないことを証明するために代数幾何学の高度な手法([5]を参照)を用いている。