3

モンティ・ホール問題と確率変数と格子点

418
1

はじめに

想定している事前知識

 誤解とギャップがありませんように、はじめに事前知識についてお話します。

 世間一般的にモンティ・ホール問題を考えるときは、組合せなどなどで確率を計算していくことを目標にしていて、「条件付き確率」や「ベイズの定理」あたりはよく見られると思いますが、特に「ナントカ分野の予備知識が必要!!」とはあまりならないと思います。ですので、普通、ラフにモンティ・ホール問題の話題を楽しむためには以下述べるような知識が必ずしも必要というわけでないと思いますので、ご安心ください。Webでモンティ・ホール問題を検索いただくと、何となく雰囲気を感じ取れると思います。

 しかし、この記事では「モンティ・ホール問題から構造を考えてみよう!」という少々マニアックな方向で話をしていきますので、主に以下のような大学数学科3年次あたりで解析学好きな方が遭遇するような事前知識を想定しています。

  • 測度論と確率論の入り口部分の知識:
    • 測度空間と確率空間の定義。特に有限集合での測度空間を考えます。
    • 可測関数と確率変数の定義。可測関数同士の合成関数について。

これら踏まえていただいて、お読みいただけますとギャップは少ないと思います。

この記事について

 この記事は、モンティ・ホール問題の確率計算について、確率変数を与えてその分布を調べることで計算してみよう、という簡単な測度論を使用した頭の体操的な遊びを備忘録としてまとめたものです。

 そのついでに、それらの確率変数を実現できるような確率空間を具体的に構築できないか考えてみました。すると、格子点上に個数測度をベースとした確率空間を設定し、その上の3つの独立な確率変数を組み合わせたり、測度自体も修正したりして調整すると上手く計算できたようなので、嬉しくなった次第です。

 この手のものは、やりつくされていると思いますが、私はリサーチ能力が乏しく、記事内の主張が正しいというエビデンスは見つけられていません。ですので、気が付かずに致命的な欠陥が発生している可能性もありますし、トンデモナイ感じになってる可能性もありますが、そのあたりご了承のうえ、暇つぶし程度に眺めていただければ幸いです。誤植等もありましたら、すみません。

 今回は数式でもりもり進んでいく形で書いているのですが、今後暇があって気が向けばシミュレーションをしてチェックしてみたいなあ、なんてことを考えています。

(余談)モチベーション

 「確率おもしろいね」的な会話をしていると、モンティ・ホール問題の話題が襲来することが多い気がします。そんな話をしているときは大抵ちょっとした立ち話くらいのラフなノリの場だったりして、毎度「なんでだろう?」など考えたりするのもなかなか難しく思うのです。なので、時間があるときに一度もにょもにょと考えてみようという算段です。

 最終的にいろいろ計算できてうれしい反面、セッティングなどなどややこしくなりまして、立ち話をどうしましょう?という課題は解決されませんでした。まあ、良しとしておきましょう。

問題の設定

 もとの問題は有名なので、Webで調べると大量に歴史的な背景や諸々の計算がヒットします。そちらを調査してまとめるのも一苦労なので、ここでは書きません。気になる方はぜひ調べてみてください。
 今回は単純に、今考えたい問題を定義して進めていきます。

問題の定義
  • 前提
    1. N個のドアを考える(N3
      1. そのうちどれか1個のドアが「あたり」で、開くと賞品がある
      2. その他のドアは「はずれ」で、開いても賞品はない
    2. 登場人物は二人で、一人は挑戦者、もう一人は司会進行

この前提のもと、以下ステップのゲームを考える

  • ステップ
    1. 挑戦者がドアを1個選ぶ
    2. 司会進行が『挑戦者が選んだドア』と『「あたり」のドア』がどれであるか確認し、以下ルールで2個のドアを選び、それ以外のドアを開く
      1. 『挑戦者が選んだドア』が『「あたり」のドア』でないとき、『挑戦者が選んだドア』と『「あたり」のドア』を選ぶ
      2. 『挑戦者が選んだドア』が『「あたり」のドア』であるとき、『挑戦者が選んだドア』(=『「あたり」のドア』)を選び、それ以外の『「はずれ」のドア』から無作為にもう1個のドアを選ぶ
    3. 挑戦者には再度ドアを選ぶ権利が与えられ、司会進行が選んだ2個のドア(つまり、挑戦者が最初に選んだドアか、司会進行が残したもう1個のドア)から1個を選ぶことができる
    4. 最終的に挑戦者が選んだドアを開き、「あたり」であれば賞品を手に入れられる

これらの設定のもとで、以下問題を考える

  • 問題
    • ステップ3において、挑戦者は再度ドアを選ぶことができるが、どちらのドアが「あたり」である確率が高いか?

 本来、モンティ・ホール問題ではN=3の場合を考えますが、感覚的な説明をしたいときに『1億枚のドアから選ぶとしたら?』というノリの話が持ち出されることが(私の周りだと)よくあります。なので、もののついでにドアの個数はN個にして考えます。

確率変数のセッティング

 さて、上の問題を考えるための確率変数を、分布を与える形でセッティングしていきます。確率変数をセッティングするうえで、都合のいい確率空間(Ω,F,P)が存在すると仮定して、都合のいい分布の条件から調子よく変数を定義していき、終盤のセクションで具体的な確率空間と確率変数の構成を探します。つまり、途中までお気持ち数学で突き進んでいきます

 よく高校数学の確率の問題などですと、N個の選択肢があって「あたり」が1個であるクジ引き問題では、「あたり」を引く確率は1Nだというように一気に計算することが多いと思いますが、クジを引く操作を分解して『N個のうち「あたり」がランダムに1個決まり、さらに挑戦者もN個の選択肢から1個選ぶ。それらが一致しているときに「あたり」を引いたと判断する。』という形に分解して考えてみます。

 このとき、当然「あたり」を選ぶ確率は1Nになるのですが、それは確率変数を定義した後で、実際に計算して確かめてみます。

 N個のドアを1,2,,Nと番号付けしておくことにします。

「あたり」を表す確率変数・挑戦者が選んだドアの確率変数
  • N個のドアのうち、「あたり」のドアを確率変数Tで表すことにして、それぞれのドアが「あたり」である確率は等しいこととする:各k=1,2,,Nに対して
    P(T=k)=1N

  • N個のドアのから、挑戦者が選んだドアを確率変数Xで表すことにして、それぞれのドアを選ぶ確率は等しいこととする:各l=1,2,,Nに対して
    P(X=l)=1N

  • TXの選び方は素直にN2パターン存在して等確率に選ばれるものとする:各k,l=1,2,,Nに対して同時分布が
    P(T=k, X=l)=1N2

 
 さて、上のように確率変数T,Xを定義すると
P(T=k, X=l) = 1N1N = P(T=k)P(X=l)
より独立になります。また、「あたり」のドアが選ばれる確率は
P(T=X) = k=1NP(T=k, X=k) = k=1N1N2 = 1N
より1Nとなります。

 これらは、ゲーム進行の操作の感覚とは大きく乖離しないと思います。一方で挑戦者の人間らしさみたいなものは表現できません。この手のゲームで挑戦者が「あたり」がどれであるか知ってしまった場合、つまり、イカサマをした場合は必ず「あたり」を選びたくなるだろうと考えられます。これを確率測度の言葉で表すと条件付き確率を考えて
P(X=k | T=k)=1
と書けますが、T,Xが独立である場合
P(X=k | T=k)=P(X=k)=1N
となり、「あたり」がどれであるか知ってしまっても無作為にドアを選ぶ挑戦者となります。「あたり」を知ってからドアを選択するシチュエーションを考えることはありませんし、イカサマを考慮すると以下で説明する問題が発生してゲームが崩壊するため、ゲーム会場において挑戦者が「あたり」を知ったとしても無作為にドアを選ぶ仕組みが備わっているものとして進めていきます

 では、イカサマを考慮してみます。同時分布を与えないで、各kについてP(X=k | T=k)=1という条件によってT,Xの関係を与えた場合
1 = P(X=k | T=k)  = P(X=k, T=k)P(T=l) = NP(X=k, T=k)
より
P(T=X) = k=1NP(X=k, T=k) = k=1N1N = 1
となり、T=X a.s.だから、常に「あたり」を選ぶエスパー挑戦者ができあがるためゲームになりません。

 では、モンティ・ホール問題のポイントとも言える『司会進行が選択した2個のドア』を表す確率変数をセッティングしていきます。

司会進行が選んだ2個のドアを表す確率変数
  • 2個のドアの組み合わせを値にとる確率変数を考える。つまり
    Π:={{s,t} | st (s,t=1,2,,N)}
    としてY:ΩΠなる確率変数を定義する。Πには加法族2Πが備わっているとする。
    司会進行の行動はT,Xを把握した後の行動に注意する必要があるため、Yに事後分布を与えて定義する:各s,t,k,l=1,2,,N(st)に対して
    P(Y={s,t} | T=k, X=l)={1(kl, {k,l}={s,t})0(kl, {k,l}{s,t})1N1(k=l, k{s,t})0(k=l, k{s,t})
    と定義する。上二段は「あたり」と挑戦者のドアが異なる場合で、この場合は司会進行は必ず「あたり」と挑戦者のドアを選ぶ。下二段は「あたり」と挑戦者のドアが一致する場合で、司会進行は挑戦者のドアの他に、余ったN-1個のドアから1個を無作為に選ぶ。

 
 以上でゲームに対応する確率変数たちをセッティングできました。特にYがモンティ・ホール問題において、重要な役割を果たします。

 不思議なことに、これまでの定義においてT,Xの各条件は対称的でして、ゲームの役割的に「あたり」のドア・挑戦者のドアという対応を与えていますが、入れ替えてしまっても数学的に差し支えありません。面白いですね。

 次の項目では、これまで定義した確率変数を使用して、問題となっていた確率を算出していきます。

問題の解決

 問題となる確率を得るためには、何を計算すればよいしょうか?ゲームの流れを確率変数の言葉で書き直して、注目したいポイントを整理すると次が考えられます:

  1. TXの値が決定される
  2. [1]で決定されたT,Xに依存してYの組合せが決定される
  3. Yで選ばれた2個のドアに対して、Tはどのように分布しているか?
  4. さらに[3]の前提として、Yの組のうち片方がXであることが事前にわかっている

[1]と[2]ではTの条件でYが決定されていますが、[3]では逆転してYの条件下でのTに興味を持っています。これは条件付き確率の役割を反転させているため、ベイズの定理を使うと上手く理解できそうな気がします。しかし厄介なことに、[3]のYの事前情報としてXが組み込まれています。

 つまり、問題への回答を得るためには、『「Xのもと決定されたY」のもと決定されるTの事後分布を計算する必要があります。この多段階の事後分布を考えるためには、『「Xで条件付けられる確率測度」においてYに条件付けられるTの事後分布』を計算すると上手くいきそうな感じがします。

 上のような多段階の条件付き確率は以下の補題でややこしさを回避することができます。

「多段階な条件付き確率」は「積事象による1段階の条件付き確率」

一般に確率空間(Ω,F,P)に対して、A,B,CFP(BC)>0ととり、同じ可測空間に確率測度QC
QC(  )=P(  | C )
と定義する。このとき、以下が成立する:
QC(A | B )=P(A | BC )

QC(A | B ) = QC(AB)QC(B) = P(AB|C)P(B|C) = P(ABC)P(C)(P(BC)P(C))1 = P(ABC)P(BC) = P(A | BC)

 上の補題のおかげで『「Xで条件付けられる確率測度」においてYに条件付けられるTの事後分布』X,Yによって条件付けられるTの事後分布』となりまして
P(T=k | Y={s,t}, X=l)
を計算すればよいということになります。ようやく目標が定まりました。嬉しいですね。

 さて、条件となっているX,Yの同時分布を計算しましょう。もちろん、確率が0である事象のもとで、上記の条件付き分布を定義することはできないので注意が必要です。

X,Yの同時分布

s,t,l=1,2,,N(st)に対して
P(Y={s,t}, X=l)={1N(N1)(l{s,t})0(l{s,t})

P(Y={s,t}, X=l) = k=1NP(Y={s,t}, X=l, T=k) = k=1NP(Y={s,t} | X=l, T=k)P(X=l, T=k) = 1N2{P(Y={s,t} | X=l, T=l)+klP(Y={s,t} | X=l, T=k)}  ()
ここでl{s,t}であるとき、Yの定義から上の確率はすべて0となる。
また、l{s,t}であるとき、s=lとして一般性は失わず、 Yの定義から
() = 1N2{P(Y={l,t} | X=l, T=l)+P(Y={l,t} | X=l, T=t)} = 1N2{1N1+1} = 1N2NN1 = 1N(N1)

 
 この解釈としては、単純にXを一つ決めるごとに、X以外のN-1個の候補から一つピックアップされる確率となっています。YXと全く独立でないこともわかりました。

 これで準備ができましたので、目標の確率を計算しましょう。

問題の確率分布

s,t,k,l=1,2,,N(st, l{s,t})に対して
P(T=k | Y={s,t}, X=l)={1N(k{s,t}, k=l)11N(k{s,t}, kl)0(k{s,t})
特にこの分布により、挑戦者が選んだドアがそのまま「あたり」である確率よりも、司会進行が選んだもう片方のドアが「あたり」である確率の方が大きいNが大きければ大きいほどこの差は顕著に表れる。

(ベイズの定理っぽく、TYの役割を入れ替える)

P(T=k | Y={s,t}, X=l) = P(T=k, Y={s,t}, X=l)P(Y={s,t}, X=l) = P(Y={s,t} | T=k, X=l)P(T=k, X=l)P(Y={s,t}, X=l) = 1N2P(Y={s,t} | T=k, X=l)P(Y={s,t}, X=l)  ()
ここでk{s,t}のとき、Yの定義より()=0となる。
さてk{s,t}であるとする。k=lであるとき、分子についてはYの定義から、分母については上で紹介した命題から
() = 1N21N1(1N(N1))1 = 1N
次にklであるとき、こちらも上の様に計算して
() = 1N21(1N(N1))1 = N1N = 11N
(余事象の確率計算を考えてもよいでしょう)

 
 以上で問題が解決されました。めでたしめでたし。
 さて、これまで理想の確率変数を好き放題作ってきましたが、これらの具体的な実態に迫っていきたいと思います。個人的に二つ気になることがあります。

  1. 一つは確率変数Yについてです。確率分布のチカラを借りて定義してきましたが、どうも計算していると、T,Xのみに完全に決められる部分とY自身が持っている確率的な性質が混ざっている部分とで、ある程度分けられそうな気がします。
  2. もう一つは、すべて離散型の確率変数で、値の組合せも爆発的に多いわけではないので、うまいことすると確率空間を具体的に作って、その上の確率変数の具体的な形も与えられるのではないか。

このあたりを議題として、以降のセクションを考えてみたいと思います。

確率変数Yの分解

 このセクションでは確率変数YT,Xの値によって決まる部分と、T,Xの値のみでは決定しきれない部分に分解していけるものか、考えていきたいと思います。

 ゲームのステップに立ち返ると、司会進行は必ず挑戦者が選んだドアを残します。つまり、Yの組合せのうち、片方がXですからY={X,Y¯}と表せそうです。Yの定義の事後分布を満たすかどうかは、Y¯の表示を与えた後で確認します。

 次に、ゲームのステップから、「あたり」のドアと挑戦者のドアが一致しているか否かでY¯の値の決まり方が異なりますので場合分けが必要です。

  1. 「あたり」のドアと挑戦者のドアが異なるとき、すでにY={X,Y¯}で「あたり」のドアが組の一方になるのでY¯=Tとなります。
  2. 「あたり」のドアと挑戦者のドアが一致しているとき、「あたり」のドア(=挑戦者のドア)の他のN-1個のドアから無作為に1個選びます。これはシチュエーションωΩごとに{1,2,,N}\{T(ω)}から等確率で1個ドアを選ぶ確率変数で表せそうです。また、このようにTの値を基準にZを決めるとき、TXのときはZの値が何であろうとZを採用しないので、どんなXを与えられたとしても、それを無視してTの情報からZを選んでも問題ないでしょう。つまり確率変数Zを新たに
    P(Z=t | T=k, X=l)={1N1(tk, l)0(t=k, l)
    という分布で定義すると良さげな感じがします。TXの役割を交換しても大丈夫かもしれません。ちなみに、上のようにZを定義するとZXは独立になります。少し計算してみましょう。
    P(Z=t, X=l) = k=1NP(Z=t, T=k, X=l) = ktP(Z=t | T=k, X=l)P(T=k, X=l) = (N1)1N11N2 = 1NP(X=l)  ()
    となりまして、さらにこの()から
    P(Z=t) = p=1NP(Z=t, X=p) = p=1N1NP(X=p) = 1N  ()
    となりますのでZの分布が得られました。以上から(),()を合わせて
    P(Z=t, X=l)=P(Z=t)P(X=l)
    となりますので、ZXは独立になります。個人的には直感通りの性質を持っているなと思います。ついでにT,X,Zの同時分布も計算してしまいましょう。
    P(Z=t, T=k, X=l) = P(Z=t | T=k, X=l)P(T=k, X=l) = 1N2P(Z=t | T=k, X=l) = {1N2(N1)(tk, l)0(t=k, l)
    となりまして、同時分布がしっかりと計算できます。嬉しいですね。後々この同時分布を考えて確率空間とT,X,Zを具体的に構成します。

 さて、Yに話を戻します。この手の場合分けを分けずに一つの関数として表す便利アイテムとして、定義関数を使います。

定義関数

一般に集合Aの部分集合BAをとり、関数χB:ARxAに対して
χB(x)={1(xB)0(xB)
と定義する。これを定義関数と呼ぶ。

 記号の簡略化ために{T=X}:={ωΩ|T(ω)=X(ω)}, {TX}:={ωΩ|T(ω)X(ω)}などと書くとすると、各ωΩに対して
Y¯(ω)=T(ω)χ{TX}(ω)+Z(ω)χ{T=X}(ω)
とすると具合が良さそうです。以上合わせてYを以下で定義しても良さそうだと予想できます。

T,Xを組み込んだYの表示例

上で定義したZを用いて
Y:={X, Tχ{TX}+Zχ{T=X}}
と定義すると、上でモンティ・ホール問題解決に使用したYの定義を満みたすだろう。つまり、Yの事後分布がYの定義の事後分布と一致するはずである。

確率変数の一意性について

「確率変数として一致する」までは言い切れない。なぜなら、もとのYの取り方も一意的である保証はないうえ、Zと同分布であって、同じωΩZと異なる値をとる別の確率変数の存在について、これまでの議論では捨てきれないからである。
 ちなみに、後々のセクションで分布を実現するための確率空間を二つ構築する。定義域の異なる確率変数で分布が一致するので、やはり確率変数として一意的とは言えないでしょう。

 上の予想を確かめてみましょう。ゴールを確認してみると
s,t,k,l=1,2,,N(st)に対して
P(Y={s,t} | T=k, X=l)={1(kl, {k,l}={s,t})0(kl, {k,l}{s,t})1N1(k=l, k{s,t})0(k=l, k{s,t})
をチェックすれば良さそうです。
 早速確認していきましょう
P(Y={s,t} | T=k, X=l) = P({Y={s,t}}  {T=k, X=l})P(T=k, X=l) = N2P({{X, Tχ{TX}+Zχ{T=X}}={s,t}}  {T=k, X=l})  ()
 ここで、klの場合を考えます。この時、ω{T=k, X=l}に対して
{X(ω), T(ω)χ{TX}(ω)+Z(ω)χ{T=X}(ω)}={l,k}
ですから{T=k, X=l}{{X, Tχ{TX}+Zχ{T=X}}={l,k}}となり、{k,l}={s,t}のとき
()=N2P({T=k, X=l})=N21N2=1
となります。さらにこれより{k,l}{s,t}のとき()=0となります。
 次にk=lの場合を考えます。この時、ω{T=k, X=k}に対して
{X(ω), T(ω)χ{TX}(ω)+Z(ω)χ{T=X}(ω)}={k,Z(ω)}
ですから、k{s,t}のとき()の分子は空事象の確率になるため()=0となります。また、k{s,t}のとき、s=kとして一般性を失わずに議論ができまして、k=stに注意しますと
() = N2P({{k,Z}={k,t}}  {T=k, X=k}) = N2P(Z=t, T=k, X=k) = N21N2(N1) = 1N1
となります。以上から予想通り、YYの事後分布が同分布になることが確認できました。つまり、これまで上で議論してきたモンティ・ホール問題の計算はすべてYYに置き換えても成立します。分布は偉大ですね。

 上手くいって嬉しい反面、正直疲れてきたので、これまでのまとめをして、このセクションを終了したいと思います。事後分布などからいろいろ確率変数を定義してきましたが、同時分布を与えてしまえば勝ちです。ですので、以下の様に説明できるでしょう。

【まとめ】モンティ・ホール問題を解決するための確率変数たち
  • (Ω,F,P)を確率空間
  • Λ:={1,2,,N}, Π:={{s,t} | st (s,t=1,2,,N)}
  • (Λ,2Λ),(Π,2Π)を可測空間

とする。このとき、確率変数T,X,Z:ΩΛを同時分布
P(Z=u, T=k, X=l)={1N2(N1)(uk, l)0(u=k, l)
を持つものと仮定して、Y:ΩΠ
Y:={X, Tχ{TX}+Zχ{T=X}}={X, Tχ{(p,q)Λ2|pq}(T,X)+Zχ{(p,q)Λ2|p=q}(T,X)}
とする。つまり、(Λ3,2Λ3)を可測空間とし、可測関数f:Λ3Π
f(t,x,z):={ x,  tχ{(p,q)Λ2|pq}(t,x)+zχ{(p,q)Λ2|p=q}(t,x)}
として、Y=f(T,X,Z)とおく。
 以上のとき、各s,t,k,l=1,2,,N(st, l{s,t})に対して
P(T=k | Y={s,t}, X=l)={1N(k{s,t}, k=l)11N(k{s,t}, kl)0(k{s,t})
である。Tは「あたり」のドアに、Xは挑戦者のドアに、Yは司会進行のドアに、ZT,Xだけでは決まらないYのドアに、それぞれ対応している。

 
 まとめるとすっきりしていい感じですね。何も知らずにこれだけ見せられてもモンティ・ホール問題感が全くないのが逆にいいですね。次のセクションでは上のまとめを参考に、確率空間(Ω,F,P)と確率変数T,X,Zを具体的に構成してみましょう。さらにモンティ・ホール問題感がなくなっていく様が面白いです。

確率空間と確率変数の構築 ~メイン命題1~

 さてさて、これまで確率空間や確率変数を調子よく設定してきましたが、これらを具体的に構築できないものか?と気になるところです。つまり、上のまとめの仮定を満たす(Ω,F,P),T,X,Zを構築したいというお話です。これらが構築できますと、上で議論してきたお気持ち的な部分に裏付けを与えられるでしょう。

 では早速考えていきますが、あまり複雑で抽象的なものを考えるのは難しいので、個数測度をベースとして確率空間を表していくことを目標にしてみます。

個数測度からなる確率測度

一般に有限集合Aとその加法族2Aを考えたとき、次のP:Ω[0,1](A,2A,P)は確率空間となる:
P(B):=#B#A    (B2A)
ここに#A,#Bはそれぞれの集合の要素数を表す。ただし#=0である。
#は「個数測度」や「数え上げ測度」と呼んだりもする。

 よく見慣れた場合の数を考える確率測度ですので、命題の証明は省略します。
 
 都合の良いことに、上のまとめにある同時分布を眺めているとそのまま数え上げからセッティングできそうな感じがします。ここに同時分布の仮定を再掲します:
P( T=k, X=l, Z=u)={1N2(N1)(ku, l)0(k=u, l)
これの場合分けの条件を考えると、(k=u, l)の方は確率0なので、一旦は、この組を全く考えない集合をベースに確率空間を考えます。つまり、
{(k,l,u)Λ3 | ku}
を眺めれば良さそうな感じがします。確率変数の形を見ると、この集合の射影を考えれば、上の分布を再現できそうです。つまり、
Ω:={(k,l,u)Λ3 | ku}
とそのまま全体集合として定義して、(k,l,u)Ωに対して、各要素の射影
T(k,l,u):=kX(k,l,u):=lZ(k,l,u):=u
を考えると具合が良さそうな感じがしています。T,X,Z:ΩΛで可測空間(Ω,2Ω),(Λ,2Λ)を考えれば、当然これは可測関数になります。そして、Pを 「Ωを全体集合としたときに個数測度から作られる確率測度」として、(Ω,2Ω,P)を確率空間とします。

 さて、勢いで確率空間と確率変数を定義しましたが、これらがモンティ・ホール問題を考えていたときのT,X,Zの分布の与え方を満足するか確かめる必要があります。このためには、新しく定義した確率空間の計算から同時分布を確かめればよさそうです。

 まずは#Ωを確認しましょう。Ω={(k,l,u)Λ3 | ku}ですから(k,l,u)Ωの組合せは、Nパターンあるkを1個固定するごとにuN1パターンで選び、それに関係なくlNパターンありますので
#Ω={N(N1)}N=N2(N1)
となります。調子がいいですね。つまり、確率測度Pは次のように書けます:
P(A)=#AN2(N1)    (A2Ω)
これから同時分布を計算していきましょう。k,l,uΛに対して
P( T=k, X=l, Z=u)=#{(p,q,r)Ω | T(p,q,r)=k, X(p,q,r)=l, Z(p,q,r)=u}N2(N1)=#{(p,q,r)Ω | p=k, q=l, r=u}N2(N1)
とできますので、kuのとき
P( T=k, X=l, Z=u)=#{(k,l,u)}N2(N1)=1N2(N1)
と計算できまして、k=uのとき
P( T=k, X=l, Z=u)=#N2(N1)=0
となりますので、同時分布が計算できました。つまり、(Ω,2Ω,P),T,X,Zのセッティングはこれでうまくできたみたいです。以上をまとめますと、前セクションのモンティ・ホール問題のまとめは次のように書けます。

【メイン命題1】モンティ・ホール問題を解決するための確率変数たち
  • Λ:={1,2,,N}, Π:={{s,t} | st (s,t=1,2,,N)}
  • (Λ,2Λ),(Π,2Π)を可測空間

とする。また確率空間(Ω,2Ω,P)
Ω:={(k,l,u)Λ3 | ku},    P(A):=#A#Ω=#AN2(N1)  (A2Ω)
とする。確率変数T,X,Z:ΩΛ(k,l,u)Ωに対して、各要素の射影
T(k,l,u):=k,    X(k,l,u):=l,    Z(k,l,u):=u
とする。このとき、同時分布は
P( T=k, X=l, Z=u)={1N2(N1)(ku, l)0(k=u, l)
となる。また、Y:ΩΠ
Y:={X, Tχ{TX}+Zχ{T=X}}={X, Tχ{(p,q)Λ2|pq}(T,X)+Zχ{(p,q)Λ2|p=q}(T,X)}
とする。つまり、(Λ3,2Λ3)を可測空間とし、可測関数f:Λ3Π
f(t,x,z):={ x,  tχ{(p,q)Λ2|pq}(t,x)+zχ{(p,q)Λ2|p=q}(t,x)}
として、Y=f(T,X,Z)とおく。
 以上のとき、各s,t,k,l=1,2,,N(st, l{s,t})に対して
P(T=k | Y={s,t}, X=l)={1N(k{s,t}, k=l)11N(k{s,t}, kl)0(k{s,t})
である。Tは「あたり」のドアに、Xは挑戦者のドアに、Yは司会進行のドアに、ZT,Xだけでは決まらないYのドアに、それぞれ対応している。

 
 いい具合に書き下せたような感じがします。やっとフワフワ感のない形の命題に落ち着いたのかなと思います。この記事のメイン命題の一つ目までたどり着きましたので、ひと段落といった感触です。次のセクションでは、このメイン命題をもう少し改造を試みてみましょう。

確率空間の拡張改造 ~メイン命題2~

 さて、上でモンティ・ホール問題の解決に必要な構造を一つ与えました。何となく気になるのが、Zを射影で与えているため、Ωの条件を緩めて格子点に変えてあげると、T,Zの非独立な関係は測度側に押し付けられるのでは、と思うのです。

 個数測度をもとにした確率測度の条件付き確率測度について、以下の補題を準備します。

「全事象を制限した確率空間」はさらに広い「条件付き確率測度の確率空間」へ拡張できる

一般に(Ω,2Ω,P)を、有限集合Ωに個数測度をもとにした確率測度を与えた確率空間であるとする。
このとき、A2ΩP(A)>0としてとり、以下二つの確率空間を考える:

  • (Ω,2Ω,P(  |A))
  • (A,2A,PA):ここにPAAを全事象としたときの個数測度をもとにした確率測度

以上の時、B2Ωに対して
P(B|A)=PA(BA)=#(BA)#A

加法族がそれぞれ冪集合であるから、BA2Aに注意する。
P(B|A)=P(BA)P(A)=#(BA)#Ω(#A#Ω)1=#(BA)#A=PA(BA)

 ここでメイン命題1の確率空間(Ω,2Ω,PΩ)
Ω={(k,l,u)Λ3 | ku},    PΩ(A)=#A#Ω=#AN2(N1)  (A2Ω)
に対して、確率空間(Ω0,2Ω0,PΩ0)
Ω0:=Λ3,    PΩ0(A)=#A#Ω0=#AN3  (A2Ω0)
で定義すると、上の補題からA2Ω0に対して
PΩ0(A|Ω)=PΩ(AΩ)=#(AΩ)#Ω=#(AΩ)N2(N1)
となります。この(Ω0,2Ω0,PΩ0)TΩ0,XΩ0,ZΩ0:Ω0Λを射影
TΩ0(k,l,u):=k,    XΩ0(k,l,u):=l,    ZΩ0(k,l,u):=u
で定義しますと、これらは確率測度PΩ0のもとで独立になります。ほとんど自明ですが、一応確認しましょう。k,l,uΛに対して
PΩ0(TΩ0=k,XΩ0=l,ZΩ0=u)=#{(k,l,u)}N3=1N3=N2N3N2N3N2N3=#{(p,q,r)Ω0 | p=k}N3#{(p,q,r)Ω0 | q=l}N3#{(p,q,r)Ω0 | r=u}N3=PΩ0(TΩ0=k)PΩ0(XΩ0=l)PΩ0(ZΩ0=u)
となりますので、独立となります。また、これらのPΩ0での事後分布が、メイン命題1の同時分布と一致するか確認しましょう。つまり
PΩ0( TΩ0=k, XΩ0=l, ZΩ0=u | Ω)={1N2(N1)(ku, l)0(k=u, l)
をチェックしてみたいのですが、上の補題のおかげで
PΩ0( TΩ0=k, XΩ0=l, ZΩ0=u | Ω)=PΩ({ TΩ0=k, XΩ0=l, ZΩ0=u}Ω)=#[{(k,l,u)}{(p,q,r)Λ3 | pr}]N2(N1)={#{(k,l,u)}N2(N1)(ku, l)#N2(N1)(k=u, l)={1N2(N1)(ku, l)0(k=u, l)
となりまして、事後分布がメイン命題1の同時分布と一致します。また、条件付き確率測度QΩ0(  ):=PΩ0(  |Ω)と上の結果、さらに以前登場した補題『「多段階な条件付き確率」は「積事象による1段階の条件付き確率」』を合わせると、メイン命題1の結論は
PΩ(TΩ=k | YΩ={s,t}, XΩ=l)=QΩ0(TΩ0=k | YΩ0={s,t}, XΩ0=l)=PΩ0(TΩ0=k |{YΩ0={s,t}, XΩ0=l}Ω)
と書けます。ここに、TΩ,YΩ,XΩΩで定義され、YΩ0Ω0で定義された、メイン命題1に対応する確率変数です。

 以上から、「格子点Ω0」で個数測度をもとにした確率測度を考え、「射影からなる独立な確率変数」3つと「メイン命題1の全事象Ω」を組合わせることでメイン命題1の結論を達成できることが分かりました。

【余談】
 特にN=6のときは独立な3つのサイコロ投げを考えるときの確率空間と同じものになりますね。個人的にこういった感じで構造を抽象的にもにょもにょすると、別のゲームや現象と共通点が見出せるところに数学の一つの面白みを感じています。

 いろいろ考えましたが、式としてはメイン命題1よりごちゃごちゃしていますし、確率空間も必要以上に大きくなっているので美しくないかもしれません。正直モンティ・ホール問題感はありませんので、ゲームを理解するならメイン命題1のままの方が良いかもしれませんね。

 さて、上の計算をまとめると以下のようになります。

【メイン命題2】モンティ・ホール問題を解決するための確率空間を拡張改造
  • Λ:={1,2,,N}, Π:={{s,t} | st (s,t=1,2,,N)}
  • (Λ,2Λ),(Π,2Π)を可測空間
  • Ω0:=Λ3として、(Ω0,2Ω0,P)を個数測度をもとにした確率空間
  • Ω:={(k,l,u)Ω0 | ku}Ω0
  • Q(  ):=P(  |Ω)として、(Ω0,2Ω0,Q)を確率空間

とする。このとき
P(A)=#AN3,    Q(A)=#(AΩ)N2(N1)  (A2Ω0)
である。また確率変数T,X,Z:Ω0Λ(k,l,u)Ω0に対して、各要素の射影
T(k,l,u):=k,    X(k,l,u):=l,    Z(k,l,u):=u
とする。このとき、これらはPのもとで独立で、同時分布は
P( T=k, X=l, Z=u)=1N3  (k, l, u)Q( T=k, X=l, Z=u)={1N2(N1)(ku, l)0(k=u, l)
である。また、Y:Ω0Π
Y:={X, Tχ{TX}+Zχ{T=X}}={X, Tχ{(p,q)Λ2|pq}(T,X)+Zχ{(p,q)Λ2|p=q}(T,X)}
とする。つまり、(Λ3,2Λ3)を可測空間とし、可測関数f:Λ3Π
f(t,x,z):={ x,  tχ{(p,q)Λ2|pq}(t,x)+zχ{(p,q)Λ2|p=q}(t,x)}
として、Y=f(T,X,Z)とおく。
 以上のとき、各s,t,k,l=1,2,,N(st, l{s,t})に対して
Q(T=k | Y={s,t}, X=l)=P(T=k | {Y={s,t}, X=l}Ω)={1N(k{s,t}, k=l)11N(k{s,t}, kl)0(k{s,t})
である。Tは「あたり」のドアに、Xは挑戦者のドアに、Yは司会進行のドアに、ZT,Xだけでは決まらないYのドアに、それぞれ対応している。

一意性について

 ここで気を付けておきたいことは、一つの確率分布を実現するための確率空間の構成は、まったく一意でないということです。少なくとも「メイン命題1」(Ω,2Ω,P)「メイン命題2」(Ω0,2Ω0,Q)を考えると、別々の確率空間で同時分布が等しい確率変数の組が構築されていますし、これらに尽きないでしょう。

おわりに

 ここまでお読みいただき、ありがとうございます。だらだらと深夜のテンションで書いていましたので、かなり読みづらかったと思います。

 いろいろ考えてきましたが、大変疲れましたので、今回はこのあたりまでにしたいと思います。冒頭でもお話ししましたが、ものすごく暇で気が向いたときに、シミュレーションして確認してみたいと思います。シミュレーションしてみて全然違う確率になると、これまでの議論はほぼ水の泡です。怖いですね。

おまけ

 メイン命題1の確率空間を考えると、お絵描きと数え上げで確率が計算できます。下の写真はN=4です。
お絵描き お絵描き

 

投稿日:20231112
更新日:20241213
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

数学が好きです。趣味の数学をつぶやく社会人。何かの公式アカウント感が出ていますが、特段何もないです。リンク先のnoteには、PDF版勉強ノートを掲載。

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. 想定している事前知識
  3. この記事について
  4. (余談)モチベーション
  5. 問題の設定
  6. 確率変数のセッティング
  7. 問題の解決
  8. 確率変数Yの分解
  9. 確率空間と確率変数の構築 ~メイン命題1~
  10. 確率空間の拡張改造 ~メイン命題2~
  11. おわりに
  12. おまけ