それらの相加平均と相乗平均の間にある素数の分散が 10 であるような、和が素数である二つの素数を求めよ。
定式化すると、次のようになる。
$$
\exists p,q, p+q \in \mathbb{P}; \;V = \left\{ r \in \mathbb{P} \,\middle|\, \sqrt{pq} < r < \frac{p+q}{2} \right\}, \, n= \left\| V \right\| , \, \mu = \frac{1}{n}\sum_{r \in V}r ,\, \sigma^2 = \frac{1}{n}\sum_{r \in V}(r-\mu)^2=10
$$
ここで $\mathbb{P} $ は素数の集合。
もっと効率のいい解きかたがあるかもしれないが。
$p$と$q$が等しいと $V$ は空集合になってしまうので、$p$ と $q$ は等しくない。
ここで $q < p$ と置いても一般性を失わない。
$p$,$q$ がともに奇素数だとすると、その和は偶数になってしまうので、どちらか一方は偶数でなければならない。
すなわち $q=2$。$p$ は双子素数の小さいほうである。
$q=2$ を代入すると、$V$ は次のようになる。
$$
V = \left\{ r \in \mathbb{P} \,\middle|\, \sqrt{2p} < r < \frac{p}{2}+1 \right\}.
$$
ところで、$V$ の元は $n$ 個あるが、これを小さいほうから $r_1, r_2, \cdots, r_n$ とする。
つまり、$p\geq3 $ に注意すると、
$$
2 = \sqrt{2\cdot 2} < \sqrt{2\cdot 3} \leq \sqrt{2p} < r_1 < r_2 <\cdots < r_n < \frac{p}{2}+1 .
$$
したがって、$r$ は $3$ 以上の素数である。
まず、$n=1$ では $\sigma^2 = 0 \neq 10$ なので、 $n\geq2$.
$n=2$ と仮定すると、$r_1, r_2$ の平均はそれらの中央にくる、すなわち、それらの平均との差は等しくなる。したがって、その差の $2$ 乗が分散となるが、$10$ は平方数でないので、これを満たす $r_1,r_2$は存在しない。
すなわち、$n\geq3$.
$n=3$と仮定する。
ここで、
$$
S= \sum_{r \in V} r, \; D=\sum_{r \in V} r^2,
$$
とすると、分散の定義より、
$$
\sigma^2 = \frac{D}{n} - \left\{\frac{S}{n}\right\}^2,
$$
と書ける。
両辺に $n^2$ を掛けて整理すると、
$$
S^2 = n(D-n\sigma^2),
$$
となる。
$n=3$ の場合は、$S^2=3(D-30)$ となる。
定義から明らかなように $S$ も $D$ も自然数であるから、この式が成り立つには $S,D$ ともに $3$ を素因子に含まなければならない。
三つの自然数の和と自乗和がともに 3 の倍数ということは、$3$を法として「三つとも $0$ に合同 (この場合、$r_2,r_3$は素数になりえないが)」「三つとも $1$ に合同」「三つとも $-1$ に合同」のいずれか、ということである。つまり、$r_2-r_1 \equiv r_3-r_1 \equiv 0 \pmod{3} $ である。また、これらがすべて奇数であることを考えると、$r_2-r_1 \equiv r_3-r_1 \equiv 0 \pmod{6} $ となる。
このような三つの自然数の組み合わせで分散が最小になるものは、差が $6$ ごとの三数である。このとき、三数の平均は $r_2$で、$r_1,r_3$ との差は $6$ であるから、分散は $\sigma^2 = \frac{2\cdot6^2}{3} = 24$ である。
つまり、$n=3$のときは、$V$の分散 $\sigma$ は整数なら $24$ 以上になるので、$10$にはなりえない。
したがって $n\neq3$。
$n=4$と仮定する。
すると、$ S^2=4(D-40)$ となる。
奇素数の和、あるいは自乗和であるから、$S,D$ はともに偶数である。つまり、$s,d$を自然数として、$S=2s, D=2d$ と書ける。
すると、$s^2=2d-40=2(d-20)$となるので、$s,d$ともに $2$ を素因子に持たなければならない。
つまり、$S,D$ ともに $4$ の倍数である。
四つの $r_i$ は、いずれも奇素数であるから、$r_i \equiv 1 \pmod{4}$ もしくは $r_i \equiv -1 \pmod{4}$ である。このとき総和 $S$ が $4$ の倍数になるパターンは、$4$を法として、「四つとも $-1$に合同」「四つとも $1$ に合同」「二つが $1$ に合同で二つが $-1$ に合同」のいずれかである。
前者二つのパターン、すなわち、$4$を法として合同な異なる四つ自然数で分散が最小になるのは、差が $4$ ごとの四数になる。このとき、四数の平均からの差は $6,2,2,6$ となり、分散は$\sigma^2 = \frac{2\cdot(2^2+6^2)}{4} = 20$ である。
(しかも、差が $4$ ごとの四数は、どれかが $3$ の倍数となってしまうので、すべてが奇素数という制限を加えるともっと分散が大きい組合せになってしまう。)
つまり、$\sigma^2 = 10$ にはなりえない。
残るは「二つが $1$ に合同で二つが $-1$ に合同」というパターンであるが、これを満たす分散が最小の組合せは、いわゆる四つ子素数 $
r_1,r_2=r_1+2,r_3=r_1+6,r_4=r_1+8$ である。このとき、四数の平均からの差は $4,2,2,4$ となり、分散は$\sigma^2 = \frac{2\cdot(2^2+4^2)}{4} = 10$ である。
「二つが $1$ に合同で二つが $-1$ に合同」というパターンで四つ子素数でない場合は、分散が $10$ より大きくなってしまう。
したがって、$n=4$ ならば $r_i$ は四つ子素数である。
$n=4$ を調べたときに示唆されていたが、$n\geq5$ では $\sigma^2 > 10$ である。
まず、$n=5$ で分散が最小になるのは明らかに $V=\left\{3,5,7,11,13\right\}$ であるが、このときの平均$\mu$と分散$\sigma^2$は、
$$
\begin{eqnarray}
\mu &=& \frac{3+5+7+11+13}{5} = 7.8, \\
\sigma^2 &=& \frac{4.8^2+2.8^2+0.8^2+3.2^2+5.2^2}{5} = 13.76 > 10
\end{eqnarray}
$$
となる。つまり、$n=5$ では $\sigma^2 > 10$ である。
$n\geq6$では $n=5$ よりも分散が大きくなるので、常に$\sigma^2 > 10$ である。
問題を満たす $n=4$ のときで、$V$ の要素はいわゆる四つ子素数である。
まず、$p$に対して定まる自然数の範囲 $A=\left\{ m \in \mathbb{Z} \,\middle|\, \sqrt{2p} < m < \frac{p+2}{2} \right\} $ を考える。
$V$ は $A$ の元のうち素数のものをすべて含む、$A$ の部分集合ということになり、$r_1$ が $A$ に含まれる最小の素数、$r_4$ が $A$ に含まれる最大の素数、ということになる。
ここで、
$$
f(x)=\frac{x+2}{2}-\sqrt{2x}
$$
という関数を考えると、集合の包含関係から次が言える。
$$
f(p) \geq \left\| A \right\|\geq \left\| V \right\| = n.
$$
$p$ の増加に対し、$\left\| A \right\|$ や $\left\| V \right\|$ は単調に増加するわけではないが、$f(x)$ は $x>2$ で単調増加する。よって、ある定数 $a$ (ただし$a>2$) において $f(a) \leq b$ であれば、すくなくとも $a< p$ でないと $f(p) > b$ にならないと言える。
ところで、$\forall i ; r_i \in A $ より、$\left\| A \right\| > r_4 - r_1 - 1 = 7 $ であるから、
$$
f(p) > 7,
$$
でなければならないが、
$$
f(24.5) = f(\frac{7^2}{2}) = \frac{49+4}{4}-\sqrt{7^2} = \frac{53-28}{4} = \frac{25}{4} = 6.25 < 7,
$$
であるから、$p>24.5$ でなければならない。
$p$ は素数なので、$ p \geq 29$。
一方、
$$
r_1 > \sqrt{2p} \geq \sqrt{2\cdot 29} = \sqrt{58} > \sqrt{49} = 7,
$$
より、$r_1 > 7$。
(これにより、$(r_1,r_2,r_3,r_4) = (5,7,11,13)$ の四つ子素数は解にならないことがわかる。)
ベルトラン・チェビシェフの定理を用い、$r_1$ の範囲を絞っていく。
任意の自然数 $m$ に対して、$m$ より大きく $2m$ 以下の素数が存在する。
$r_1$ は奇素数なので、$\frac{r_1-1}{2}$は自然数である。
よって、$\frac{r_1-1}{2}$ より大きく $r_1-1$ より小さい素数が存在することになる。
もし、$\sqrt{2p} \leq \frac{r_1-1}{2}$ であれば、 $r_1$ より小さいその素数が $V$ に含まれることになってしまうので、$\sqrt{2p} > \frac{r_1-1}{2}$ 。
これを $p$ について解くと $ \frac{(r_1-1)^2}{8} < p$。
一方、ベルトラン・チェビシェフの定理より、$r_4$ より大きく $2r_4$ より小さい素数も存在する。
もし、$2r_4 \leq \frac{p+2}{2}$ であれば、 $r_4$ より小さいその素数が $V$ に含まれることになってしまうので、$2r_4 = 2(r_1 + 8) > \frac{p+2}{2}$ 。
これを $p$ について解くと $ p < 4r_1 + 30$。
先の結果と合わせると、
$$\frac{(r_1-1)^2}{8} < p < 4r_1 + 30\;.
$$
もし、$\frac{(r_1-1)^2}{8}$ が $4r_1 + 30$ より小さくなければ、そもそもこの式を満たす $p$ は存在しないので、
$$
g(x) = (4x + 30) - \frac{(x-1)^2}{8} ,
$$
として、$g(x)>0$となる条件を調べる。
$$
g(x) = -\frac{1}{8}(x^2-34x-239) = -\frac{1}{8}((x-17)^2-\sqrt{528}^2) = -\frac{1}{8}(x-(17-\sqrt{528}))(x-(17+\sqrt{528})),
$$
なので、$g(x)$ は $x=17$ で極大値をとる上に凸な関数で、$17\pm\sqrt{528}$ が二つの $0$ 点である。
$\sqrt{528} = \sqrt{529-1} = \sqrt{23^2-1}$ であるから、$-6 < 17-\sqrt{528} < -5$、$39 < 17+\sqrt{528} < 40$である。
したがって、$r_1 > 17+\sqrt{528}$ だと $g(r_1) < 0$ となってしまうため、$r_1 \leq 39$ でなければならない。
$r_1$ は素数なので、$r_1 \leq 37$。
以上の議論から、$r_1$ は $7 < r_1 \leq 37$ を満たす素数であるが、この条件を満たす四つ子素数は $(r_1,r_2,r_3,r_4) = (11,13,17,19)$ しか存在しない。
$19$ の次の素数は $23$ であり、$V$に$19$ が含まれていて、かつ $23$ が含まれていないことから、
$$
19 < \frac{p+2}{2} < 23,
$$
すなわち、
$$
36 < p < 44,
$$
となる。これを満たす素数 $p$ は、$37,41,43 $ であるが、双子素数の小さいほう、という条件を満たすのは $41$ だけである。
問題の答えの二つの素数とは、$2$と $41$ である。
$\begin{eqnarray} (p,q)&=&(41,2), \\ \sqrt{pq}&=&\sqrt{41\cdot2}= \sqrt{82} > \sqrt{81} = 9, \;\;\therefore 9<\sqrt{pq}<10, \\ \frac{p+q}{2}&=&\frac{43}{2}= 21.5, \\ V&=&\left\{ r \in \mathbb{P} \,\middle|\, 9 < r < 21.5 \right\} = \left\{ 11,13,17,19 \right\},\\ \mu&=&(11+13+17+19)/4 = 15,\\ \sigma^2&=&\frac{(11-15)^2+(13-15)^2+(17-15)^2+(19-15)^2}{4}=\frac{16+4+4+16}{4} = 10\;. \end{eqnarray}$