素数も平方数も等しく無限にあります。
なので、日常的な文脈での"個数"はどちらも無限個であって、どっちが多いというのは荒唐無稽であるとも言えるでしょう。
しかし、比べる術がないという訳ではありません。
例えば、$X=\left\{1,2,3\right\}$という集合の要素の個数は、3個です。
では、$Y=\left\{1,2,3,\cdots\right\}$という集合の要素の個数はいくつでしょうか?
$X$よりも多いことはわかりますが、これでは個数というものを計れません。
$X$のような有限個の要素からなる集合(有限集合)の要素の個数を、もっと一般の集合に対して定義し、$Y$のような要素を無限に持つ集合(無限集合)についても考えられるようにしたものが、集合の濃度1です。
集合$X$と$Y$について、濃度を$\left|X\right|$、$\left|Y\right|$と表す。
・$X$から$Y$への単射が存在するとき、$\left|X\right| \leq \left|Y\right|$とする。
・$X$から$Y$への全単射が存在するとき、$\left|X\right| = \left|Y\right|$とする。
($X$から$Y$への単射が存在し、かつ全単射が存在しないとき、$\left|X\right| \lt \left|Y\right|$とする。)
・特に$X$が要素を$n$個持つ有限集合のとき、$\left|X\right|=n$とする。
※単射・全単射についての説明は冗長になるので、 ヨビノリさんの動画 に代えさせてもらいます。
さて、個数と大きな違いは、絶対評価ではなく相対評価であるところでしょう。
濃度の大小は、2つの集合を比べて初めてわかります。
ただし、有限集合の場合は濃度と個数が一致するので、絶対評価で大小を考えることができます。
ではさっそく素数、平方数の集合の濃度を考えてみましょう。
素数全体の集合は$\mathbb{P}$、平方数全体の集合は$\mathbb{S}$と表すことにします。
直接$\mathbb{P}$と$\mathbb{S}$に対して考えてもよいですが、簡単のために自然数全体の集合$\mathbb{N}$との濃度を比べていきます。
$\mathbb{P}$と$\mathbb{S}$は、以下のようにどちらも要素の小さい順に番号を一つずつ振っていくことができます。
$\mathbb{N}$ | 1 | 2 | 3 | 4 | 5 | $\cdots$ |
---|---|---|---|---|---|---|
$\mathbb{P}$ | 2 | 3 | 5 | 7 | 11 | $\cdots$ |
$\mathbb{S}$ | 0 | 1 | 4 | 9 | 16 | $\cdots$ |
これは$\mathbb{N}$からの全単射となっているので、
$\left|\mathbb{N}\right|=\left|\mathbb{P}\right|$であり、$\left|\mathbb{N}\right|=\left|\mathbb{S}\right|$。
よって$\left|\mathbb{P}\right|=\left|\mathbb{S}\right|$がわかります。
このように番号を振ることができる集合を可算集合といいます。
(数列を作ることを考えるとよい。)
実は整数全体の集合$\mathbb{Z}$や有理数全体の集合$\mathbb{Q}$も同じく可算集合です。
つまり、信じがたいですが$\left|\mathbb{N}\right|=\left|\mathbb{P}\right|=\left|\mathbb{S}\right|=\left|\mathbb{Z}\right|=\left|\mathbb{Q}\right|$です。
というわけで集合の濃度によれば、どちらも多くも少なくもないようです。
今度はちょっとトリッキーですが、逆数にして和を取ってみましょう。
つまり以下の2つの級数を考えます。
$$
\sum_{s\in\mathbb{S}}\frac{1}{s}=
\sum_{n=1}^{\infty}\frac{1}{n^2}
\space\space\space\space\space\space\space\space\space
\sum_{p\in\mathbb{P}}\frac{1}{p}=\frac{1}{2}+\frac{1}{3}+\frac{1}{5}+\frac{1}{7}+\cdots
$$
(しれっと$0 \notin \mathbb{S}$としてます。)
おっと?平方数の逆数の和といえば?バーゼル問題というやつですね。
$$
\sum_{n=1}^{\infty}\frac{1}{n^2}=\frac{{\pi}^2}{6}
$$
に収束することが知られています。
※バーゼル問題についての説明はそれだけでもう一本記事が書けるので、また
ヨビノリさんの動画
に代えさせてもらいます。
$$
\sum_{n=1}^{\infty}\frac{1}{n^2}=\frac{{\pi}^2}{6}
$$
では、素数の逆数の和2はどうでしょうか。
素数を小さい順に$p_1,p_2,\cdots$として、自然数$n$以下で最大の素数を$p_m$とします。
このとき、以下が成り立ちます。
$$
\sum_{k=1}^{n}\frac{1}{k}\leq\prod_{i=1}^{m}\left(1+\frac{1}{p_i}+\frac{1}{p_i^2}+\frac{1}{p_i^3}+\cdots\right)
$$
$$
=\left(1+\frac{1}{2}+\frac{1}{2^2}+\frac{1}{2^3}+\cdots\right)\left(1+\frac{1}{3}+\frac{1}{3^2}+\frac{1}{3^3}+\cdots\right)\left(1+\frac{1}{5}+\frac{1}{5^2}+\frac{1}{5^3}+\cdots\right)\cdots
$$
右辺を展開すると、少なくとも自然数の逆数はすべて出てきます。
$$
1+\frac{1}{p_i}+\frac{1}{p_i^2}+\frac{1}{p_i^3}+\cdots=\frac{1}{1-\frac{1}{p_i}}=1+\frac{1}{p_i-1}
$$
と、さらに両辺に自然対数を取って
$$
\log\left(\sum_{k=1}^{n}\frac{1}{k}\right)\leq\log\left\{\prod_{i=1}^{m}\left(1+\frac{1}{p_i-1}\right)\right\}=\sum_{i=1}^{m}\log\left(1+\frac{1}{p_i-1}\right)
$$
さらに、この右辺に$\log(1+x)\lt x\space\space(x\gt 0)$を適用して
$$
\log\left(\sum_{k=1}^{n}\frac{1}{k}\right)\leq\sum_{i=1}^{m}\log\left(1+\frac{1}{p_i-1}\right)\lt\sum_{i=1}^{m}\frac{1}{p_i-1}
$$
$p_i-1\geq p_{i-1}$であるから、
$$
\sum_{i=1}^{m}\frac{1}{p_i-1}=1+\sum_{i=2}^{m}\frac{1}{p_i-1}\leq1+\sum_{i=2}^{m}\frac{1}{p_{i-1}}=1+\sum_{j=1}^{m-1}\frac{1}{p_j}
$$
よって
$$
\log\left(\sum_{k=1}^{n}\frac{1}{k}\right)\lt1+\sum_{j=1}^{m-1}\frac{1}{p_j}
$$
が得られます。
この式において、$n\rightarrow\infty$とすると$m\rightarrow\infty$であり、
左辺の真数は、調和級数なので発散します。
よって、右辺も発散するので、
$$
\lim_{m\rightarrow\infty}\sum_{j=1}^{m-1}\frac{1}{p_j}=\sum_{p\in\mathbb{P}}\frac{1}{p}=\infty
$$
というわけで、素数の逆数の和が発散することがわかりました。
平方数の逆数の和は収束、素数の逆数の和は発散。
ここから、平方数より素数の方が多いといっていいかもしれません。
次は、ある数とその次の数の間隔を見てみましょう。
$s_n=n^2$の次の平方数は$s_{n+1}=(n+1)^2$なので、その間隔$g_s(n)$は
$$
g_s(n)=(n+1)^2-n^2=2n+1=2\sqrt{s_n}+1
$$
です。
では素数はどうでしょうか。
素数に関しては正確なことは言えませんが、もしリーマン予想が正しいなら、
$n$番目と$n+1$番目の素数の間隔$g_p(n)=p_{n+1}-p_n$が、
$$
g_p(n)=O\left((\log p_n)^2\right)
$$
であると予想3されています。$O(\space\space)$は
ランダウの記号
です。
つまり大体素数の間隔は$(\log p_n)^2$で表されるということです。
この2つの比の極限を考えると
$$
\lim_{n\rightarrow\infty}\frac{2\sqrt{s_n}+1}{(\log p_n)^2}=\lim_{ \begin{eqnarray}
s_n\rightarrow\infty \\ p_n\rightarrow\infty
\end{eqnarray} }\frac{2\sqrt{s_n}+1}{(\log p_n)^2}=\infty
$$
となり、素数より平方数の方が早く間隔が広がるようです。
ここから、平方数より素数の方が多いといっていいかもしれません。
ちょうど素数と平方数について、高名な予想があります。
それがルジャンドル予想です。
任意の自然数$n$について
$n^2$と$(n+1)^2$の間には必ず素数が存在する。
これは予想ですが、もし正しいと証明されれば少なくとも16以下の素数は6個、平方数は5個なので、次の平方数25以下の素数は少なくとも7個あり、対して平方数は6個。
これを以後繰り返すことにより、どれだけ平方数の数が増えようと、それまでにそれより多くの素数が存在します。
ここから、平方数より素数の方が多いといっていいかもしれません。
$n$以下の素数の数$\pi(n)$は、$n$が十分大きいとき
$$
\space\space\space\space\space\space\frac{n}{\log n}
$$
で近似できる。
また、$n$以下の平方数の数$\sigma(n)$は、
$$
\sigma(n)=\left\lfloor \sqrt{n} \right\rfloor +1
$$
と表せます。(※$\left\lfloor x \right\rfloor$は$x$以下の最大の整数。)
定義から、$x-1\lt\left\lfloor x \right\rfloor\leq x$なので
十分大きな$n$で
$$
\frac{n}{\left(\sqrt{n} +1\right)\log n}\leq\frac{\pi(n)}{\sigma(n)}$$
となる。
$$
\lim_{n\rightarrow\infty}\frac{n}{\left(\sqrt{n} +1\right)\log n}=\lim_{n\rightarrow\infty}\frac{\sqrt{n}}{\left(1+\frac{1}{\sqrt{n}}\right)\log n}=\infty
$$
より、
$$
\lim_{n\rightarrow\infty}\frac{\pi(n)}{\sigma(n)}=\infty
$$
ここから、平方数より素数の方が多いといっていいかもしれません。
ちゃんと答えるなら、「有限でないからどっちが多いとか少ないとかないよ~」が答えになりますが、他の観点で見ると素数の方が多いって言ってもいいかも?