誤解とギャップがありませんように、はじめに事前知識についてお話します。
世間一般的にモンティ・ホール問題を考えるときは、組合せなどなどで確率を計算していくことを目標にしていて、「条件付き確率」や「ベイズの定理」あたりはよく見られると思いますが、特に「ナントカ分野の予備知識が必要!!」とはあまりならないと思います。ですので、普通、ラフにモンティ・ホール問題の話題を楽しむためには以下述べるような知識が必ずしも必要というわけでないと思いますので、ご安心ください。Webでモンティ・ホール問題を検索いただくと、何となく雰囲気を感じ取れると思います。
しかし、この記事では「モンティ・ホール問題から構造を考えてみよう!」という少々マニアックな方向で話をしていきますので、主に以下のような大学数学科3年次あたりで解析学好きな方が遭遇するような事前知識を想定しています。
これら踏まえていただいて、お読みいただけますとギャップは少ないと思います。
この記事は、モンティ・ホール問題の確率計算について、確率変数を与えてその分布を調べることで計算してみよう、という簡単な測度論を使用した頭の体操的な遊びを備忘録としてまとめたものです。
そのついでに、それらの確率変数を実現できるような確率空間を具体的に構築できないか考えてみました。すると、格子点上に個数測度をベースとした確率空間を設定し、その上の3つの独立な確率変数を組み合わせたり、測度自体も修正したりして調整すると上手く計算できたようなので、嬉しくなった次第です。
この手のものは、やりつくされていると思いますが、私はリサーチ能力が乏しく、記事内の主張が正しいというエビデンスは見つけられていません。ですので、気が付かずに致命的な欠陥が発生している可能性もありますし、トンデモナイ感じになってる可能性もありますが、そのあたりご了承のうえ、暇つぶし程度に眺めていただければ幸いです。誤植等もありましたら、すみません。
今回は数式でもりもり進んでいく形で書いているのですが、今後暇があって気が向けばシミュレーションをしてチェックしてみたいなあ、なんてことを考えています。
「確率おもしろいね」的な会話をしていると、モンティ・ホール問題の話題が襲来することが多い気がします。そんな話をしているときは大抵ちょっとした立ち話くらいのラフなノリの場だったりして、毎度「なんでだろう?」など考えたりするのもなかなか難しく思うのです。なので、時間があるときに一度もにょもにょと考えてみようという算段です。
最終的にいろいろ計算できてうれしい反面、セッティングなどなどややこしくなりまして、立ち話をどうしましょう?という課題は解決されませんでした。まあ、良しとしておきましょう。
もとの問題は有名なので、Webで調べると大量に歴史的な背景や諸々の計算がヒットします。そちらを調査してまとめるのも一苦労なので、ここでは書きません。気になる方はぜひ調べてみてください。
今回は単純に、今考えたい問題を定義して進めていきます。
この前提のもと、以下ステップのゲームを考える
これらの設定のもとで、以下問題を考える
本来、モンティ・ホール問題ではN=3の場合を考えますが、感覚的な説明をしたいときに『1億枚のドアから選ぶとしたら?』というノリの話が持ち出されることが(私の周りだと)よくあります。なので、もののついでにドアの個数はN個にして考えます。
さて、上の問題を考えるための確率変数を、分布を与える形でセッティングしていきます。確率変数をセッティングするうえで、都合のいい確率空間
よく高校数学の確率の問題などですと、N個の選択肢があって「あたり」が1個であるクジ引き問題では、「あたり」を引く確率は
このとき、当然「あたり」を選ぶ確率は
N個のドアを
N個のドアのうち、「あたり」のドアを確率変数
N個のドアのから、挑戦者が選んだドアを確率変数
さて、上のように確率変数
より独立になります。また、「あたり」のドアが選ばれる確率は
より
これらは、ゲーム進行の操作の感覚とは大きく乖離しないと思います。一方で挑戦者の人間らしさみたいなものは表現できません。この手のゲームで挑戦者が「あたり」がどれであるか知ってしまった場合、つまり、イカサマをした場合は必ず「あたり」を選びたくなるだろうと考えられます。これを確率測度の言葉で表すと条件付き確率を考えて
と書けますが、
となり、「あたり」がどれであるか知ってしまっても無作為にドアを選ぶ挑戦者となります。「あたり」を知ってからドアを選択するシチュエーションを考えることはありませんし、イカサマを考慮すると以下で説明する問題が発生してゲームが崩壊するため、ゲーム会場において挑戦者が「あたり」を知ったとしても無作為にドアを選ぶ仕組みが備わっているものとして進めていきます。
では、イカサマを考慮してみます。同時分布を与えないで、各
より
となり、
では、モンティ・ホール問題のポイントとも言える『司会進行が選択した2個のドア』を表す確率変数をセッティングしていきます。
以上でゲームに対応する確率変数たちをセッティングできました。特に
不思議なことに、これまでの定義において
次の項目では、これまで定義した確率変数を使用して、問題となっていた確率を算出していきます。
問題となる確率を得るためには、何を計算すればよいしょうか?ゲームの流れを確率変数の言葉で書き直して、注目したいポイントを整理すると次が考えられます:
[1]と[2]では
つまり、問題への回答を得るためには、『「Xのもと決定された
上のような多段階の条件付き確率は以下の補題でややこしさを回避することができます。
一般に確率空間
と定義する。このとき、以下が成立する:
上の補題のおかげで『「
を計算すればよいということになります。ようやく目標が定まりました。嬉しいですね。
さて、条件となっている
各
ここで
また、
この解釈としては、単純に
これで準備ができましたので、目標の確率を計算しましょう。
各
特にこの分布により、挑戦者が選んだドアがそのまま「あたり」である確率よりも、司会進行が選んだもう片方のドアが「あたり」である確率の方が大きい。
ここで
さて
次に
(余事象の確率計算を考えてもよいでしょう)
以上で問題が解決されました。めでたしめでたし。
さて、これまで理想の確率変数を好き放題作ってきましたが、これらの具体的な実態に迫っていきたいと思います。個人的に二つ気になることがあります。
このあたりを議題として、以降のセクションを考えてみたいと思います。
このセクションでは確率変数
ゲームのステップに立ち返ると、司会進行は必ず挑戦者が選んだドアを残します。つまり、
次に、ゲームのステップから、「あたり」のドアと挑戦者のドアが一致しているか否かで
さて、
一般に集合
と定義する。これを定義関数と呼ぶ。
記号の簡略化ために
とすると具合が良さそうです。以上合わせて
上で定義した
と定義すると、上でモンティ・ホール問題解決に使用した
「確率変数として一致する」までは言い切れない。なぜなら、もとの
ちなみに、後々のセクションで分布を実現するための確率空間を二つ構築する。定義域の異なる確率変数で分布が一致するので、やはり確率変数として一意的とは言えないでしょう。
上の予想を確かめてみましょう。ゴールを確認してみると
各
をチェックすれば良さそうです。
早速確認していきましょう
ここで、
ですから
となります。さらにこれより
次に
ですから、
となります。以上から予想通り、
上手くいって嬉しい反面、正直疲れてきたので、これまでのまとめをして、このセクションを終了したいと思います。事後分布などからいろいろ確率変数を定義してきましたが、同時分布を与えてしまえば勝ちです。ですので、以下の様に説明できるでしょう。
とする。このとき、確率変数
を持つものと仮定して、
とする。つまり、
として、
以上のとき、各
である。
まとめるとすっきりしていい感じですね。何も知らずにこれだけ見せられてもモンティ・ホール問題感が全くないのが逆にいいですね。次のセクションでは上のまとめを参考に、確率空間
さてさて、これまで確率空間や確率変数を調子よく設定してきましたが、これらを具体的に構築できないものか?と気になるところです。つまり、上のまとめの仮定を満たす
では早速考えていきますが、あまり複雑で抽象的なものを考えるのは難しいので、個数測度をベースとして確率空間を表していくことを目標にしてみます。
一般に有限集合
ここに
よく見慣れた場合の数を考える確率測度ですので、命題の証明は省略します。
都合の良いことに、上のまとめにある同時分布を眺めているとそのまま数え上げからセッティングできそうな感じがします。ここに同時分布の仮定を再掲します:
これの場合分けの条件を考えると、
を眺めれば良さそうな感じがします。確率変数の形を見ると、この集合の射影を考えれば、上の分布を再現できそうです。つまり、
とそのまま全体集合として定義して、
を考えると具合が良さそうな感じがしています。
さて、勢いで確率空間と確率変数を定義しましたが、これらがモンティ・ホール問題を考えていたときの
まずは
となります。調子がいいですね。つまり、確率測度
これから同時分布を計算していきましょう。
とできますので、
と計算できまして、
となりますので、同時分布が計算できました。つまり、
とする。また確率空間
とする。確率変数
とする。このとき、同時分布は
となる。また、
とする。つまり、
として、
以上のとき、各
である。
いい具合に書き下せたような感じがします。やっとフワフワ感のない形の命題に落ち着いたのかなと思います。この記事のメイン命題の一つ目までたどり着きましたので、ひと段落といった感触です。次のセクションでは、このメイン命題をもう少し改造を試みてみましょう。
さて、上でモンティ・ホール問題の解決に必要な構造を一つ与えました。何となく気になるのが、
個数測度をもとにした確率測度の条件付き確率測度について、以下の補題を準備します。
一般に
このとき、
以上の時、
加法族がそれぞれ冪集合であるから、
ここでメイン命題1の確率空間
に対して、確率空間
で定義すると、上の補題から
となります。この
で定義しますと、これらは確率測度
となりますので、独立となります。また、これらの
をチェックしてみたいのですが、上の補題のおかげで
となりまして、事後分布がメイン命題1の同時分布と一致します。また、条件付き確率測度
と書けます。ここに、
以上から、「格子点
【余談】
特に
いろいろ考えましたが、式としてはメイン命題1よりごちゃごちゃしていますし、確率空間も必要以上に大きくなっているので美しくないかもしれません。正直モンティ・ホール問題感はありませんので、ゲームを理解するならメイン命題1のままの方が良いかもしれませんね。
さて、上の計算をまとめると以下のようになります。
とする。このとき
である。また確率変数
とする。このとき、これらは
である。また、
とする。つまり、
として、
以上のとき、各
である。
ここで気を付けておきたいことは、一つの確率分布を実現するための確率空間の構成は、まったく一意でないということです。少なくとも「メイン命題1」の
ここまでお読みいただき、ありがとうございます。だらだらと深夜のテンションで書いていましたので、かなり読みづらかったと思います。
いろいろ考えてきましたが、大変疲れましたので、今回はこのあたりまでにしたいと思います。冒頭でもお話ししましたが、ものすごく暇で気が向いたときに、シミュレーションして確認してみたいと思います。シミュレーションしてみて全然違う確率になると、これまでの議論はほぼ水の泡です。怖いですね。
メイン命題1の確率空間を考えると、お絵描きと数え上げで確率が計算できます。下の写真は
お絵描き