皆さんこんにちは.残暑が猛威を振るっておりますが,如何お過ごしでしょうか.私は夏期講習が終わって統計を学習しておりました.さて,夏と言えば色々なものがございますが,その中からサマージャンボ宝くじを思い浮かべる方も多いでしょう.そして,このブログを見るような皆さんは宝くじに関して,「宝くじは期待値を計算すれば損をしていることは明白だ.よって損得で見るのであれば宝くじを買うべきではない.」というようなことを聞いたことはないでしょうか.かくいう筆者も高校時代に塾で期待値を求めさせられて「これが数学の応用というものか」と思ったものです.しかし,統計をしっかり学習し計算をしてみれば実はこれはほとんど誤った主張であって,私たちが宝くじを購入する際には,別に期待値を意識する意味や必要性は基本的にはありません.本稿は,数学(統計学?)界でトップレベルに勘違いされている,「宝くじは期待値で見れば損をする」について正しい説明を行う記事です.
前提知識は期待値と分散の定義及びその感覚とします.そのため本稿ではそれらの定義を与えないため,知らない方は統計学の成書(数学Bの教科書で構いません)を座右に置きながらご覧になってください.
[注意]この記事は2025年8月13日に表現や構成などを大幅に変更いたしました.
まず本題に入る前に,簡単な例で期待値は恒にはあてにならないという感覚を皆さんに与えましょう.そのために以下のようなゲームを考えます.本節では数学的になぜこれで期待値が当てにならないかについて,深く追及することはしません.なのであまりじっくり考えず「まぁ確かにそうだな」くらいの気持ちで読んでください.状況も摩訶不思議ですから.
$0.0000001$%の確率で1000億円,
$99.9999999$%の確率で0円をもらえるゲームがある.
これの期待値は10000円だが,1000円を払ってこのゲームに参加するか?
極端な例ですが,このようなゲームを考えた際,ほとんどの人はお金を払ってまで参加しないと思います.その理由は恐らく皆さんの感覚が語っていることでしょう.いくら期待値が1万円だといっても,ほんの数十回数百回やったくらいじゃ当たる見込みが全くなさそうだからです.
では,数学的に考えてみればなぜこれは期待値が当てにならなさそうなのか,そのキーとなる概念が「分散」なのです.これを次節以降で詳細に考察していきましょう.
本節ではいよいよタイトルの回収へ入ります.その前に本記事で利用する重要な定理を2つ挙げておきます.証明は与えませんから,気になる方は最後に提示してある参考文献にあたってください.
先ず,説明に用いる重要な定理を二つほど紹介しておきます.証明は与えません.
確率変数$X$に対し,平均$\mu = E[X],$分散$\sigma^2 = \textrm{Var[X]}$がそれぞれ存在するとき,任意の正数$k$に対し,次の不等式が成立する.
\begin{equation}
P(|X-\mu| \ge k)\leq \dfrac{\sigma^2}{k^2}
\end{equation}
$X_1,X_2,..., i.i.d. \sim (\mu, \sigma^2) $とし,$\sigma^2 = \textrm{Var[X]} \lt \infty $とする.このとき,$\bar{X}$は$\mu$に確率収束する.
ここに,確率収束するとは以下のことを指す.
確率変数の列$\lbrace U_n \rbrace _{n \in \mathbb{N}}$がある確率変数$U$に確率収束するとは,任意の $\varepsilon \in \mathbb{R}^{+}$ に対し,
\begin{equation}
\lim_{n \to \infty}P(\lvert U_n - U \rvert \ge \varepsilon) = 0
\end{equation}
が成立すること.記号は$U_n \to_P U$.
大数の弱法則は恐らく皆さんも聞いたことがあるでしょう.示唆していることは難しくはなく,端的に言えば「大量の試行に対しては,標本平均(今回でいえば宝くじの結果の平均)はいずれ,本来の期待値に完全に一致する.」ということです.これが先ほど感じたおかしな感覚の一つの数学的定式化でありまして,つまり「数十回数百回程度やっても当たりそうにない」というのは「少ない試行ではあまり期待値の話までたどり着かない」ということであって,逆説的に言えば「大量の試行を行えば期待できそう」ということなのです.これが大数の法則の感覚です.
つまり,一般向けのこの記事の答えというのは期待値というのは大量の試行を以て初めて考えられるものであるから,一般人が買う程度の少ない試行では全く期待値なんぞ参考にはならないという風になります.
次にChebyshev不等式について補足しましょう.
定理1に出てくる実数$k$というのは,期待値からのズレを表しています.例えば$k = 100$として,$P(|X-\mu| \ge 100)\leq \dfrac{1}{2}$ とあれば,期待値からの許容できる差が100以上である確率が50%以下であるということを表しています.
また,Chebyshev不等式を用いれば以下の式が成立することがわかります.本記事ではこの式を積極的に用いていきます.
$P(|X-\mu| \ge k)\leq \dfrac{\textrm{E}[(X - \mu)^2]}{k^2} = \dfrac{\sigma^2}{nk^2}$
本説では本題への準備②として,2025年に行われたサマージャンボ宝くじの具体的な期待値及び分散について計算していきましょう.下は,公式とありますが公式ではありません.目立つような囲み枠が欲しかっただけです.
2025年度のサマージャンボの期待値,2乗モーメント,分散をそれぞれ$\textrm{E}[X],\textrm{E}[X^2],\textrm{Var}[X]$とすれば,
$\textrm{E}[X] = \dfrac{1}{10000000}(500000000\cross 1 + 100000000\cross 2+ 100000\cross99 + 1000000\cross100 + 10000\cross 100+ 30000 \cross 100000 + 300 \cross 10000000)$
$= \dfrac{15099}{100}
\simeq 151$
$\textrm{E}[X^2] = \dfrac{1}{10000000}(500000000 ^2\cross 1 + 100000000^2\cross 2+ 100000^2\cross99 + 1000000^2\cross100 + 10000^2\cross 100+ 30000^2 \cross 100000 + 300^2 \cross 10000000)$ $= 27010298000 $
$ \textrm{Var}[X] =\textrm{E}[X^2] - (\textrm{E}[X])^2 = 27010275199$
よって期待値は(約)151円,分散が27010275199円(約270億円)となりますね.因みに,分散がとんでもないことになっていますが,これの平方根をとればだいたい標準偏差が16万円程度に落ち着くので,そこまで感覚的に変でもありません.
雑談
恥ずかしながら私はこの記事を書くまで宝くじのユニットについて知りませんでした.なんで全部の賞について23の倍数本なんだろうと思って計算していたらおかしいことになっていたので確認したらそうでした.
また,筆者は上の計算をすべてGeoGebraのみで行っています.もしどこかで間違ってたらごめんなさい.
以上にて準備や補足が終了しました.それでは,この節では実際にChebyshev不等式を用いることによって具体的な確率等の評価を行っていきます.準備①のラストで提示した式に$\mu = 150, \sigma^2 = 17000000000$ を代入した式
$P(|X-150| \ge k)\leq \dfrac{27000000000}{nk^2}$
を考えます.いま,この式に$k = 150$を代入してみれば,
$P(|X-150| \ge 150)\leq \dfrac{27000000000}{150^2n} = \dfrac{1200000}{n}$
を得ますが,この式は期待値からのズレが150円,つまり標本平均が0円から300円の間に収まる確率は右辺以下だと言っているわけです.この式を見たら答えがわかったでしょうか.上の式は$n = 10$程度だったら結局確率は1以下だとしか言っていませんが,そんなの数式を使わなくたってわかりますよね.分散が大きすぎるとき,大量の試行を与えなければ確率は1以下だという自明な不等式が得られるだけなのです.因みに,この確率を50%以下にしたいのであれば2万4千枚買わなければなりませんが(これだけ買ってまだ五分五分!),個人でそれほど購入する人はほとんどいないと考えます.
またこれとは逆に,もし枚数をそこまで多く買いたくないのなら,期待値からのズレをある程度犠牲しなくてはなりません.もし50枚くらいで済ませたいのであれば,4万6千円程度のズレを覚悟しなくてはなりませんね.流石に幅が広すぎて参考になることはないかと思います.これがこの記事が伝えたかった事実です.
以上を総括しましょう.
結論として,宝くじは皆さん個人が購入する程度では期待値なんてものはまったくもって参考にならない.それは,大数の弱法則から説明ができて,分散が大きすぎる者に対してはあまり参考にできない.やはり,宝くじは夢を見るくらいに留めておいたほうがいいと,「数学的に」説明できる.(なので,恐らくパチンコ程度なら期待値を信用してもいいと思いますが,筆者はパチンコをやったことがないのであまりわかりません.)
因みに,この世には宝くじシミュレータというものがありまして,検索して30分程度でも計算しながら試してみると驚くほど現実が映し出されますよ.私は運悪く初手の500回で3等を当ててしまったためちょっとブレてしまいましたが.
ということで,今回はかなりお話しベースでしたが,皆さんの期待値の誤解を少しでも解けたなら本稿の目的は十分に達されたと思います.お読みいただきありがとうございました.最後に参考程度の表を載せておきます.気になる方はどうぞ.
| 許容誤差(±) | 五分五分になるまでの回数 |
|---|---|
| 500円 | 21万6千回 |
| 1000円 | 5万4千回 |
| 1500円 | 2万4千回 |
| 2000円 | 1万5千回 |
| 2500円 | 8640回 |
| 3000円 | 6千回 |
| 3500円 | 4400回 |
| 4000円 | 3375回 |
| 4500円 | 2666回 |
| 5000円 | 2060回 |