0
応用数学解説
文献あり

ギャンブルにおいてどんな戦略も期待値の壁を越えられないことを証明する

130
0

はじめに

 ギャンブルには様々な戦略が考えられる。ここでいう戦略とは、ギャンブルの進行に応じて刻々と変化する状況に対して、賭け金を決めていく操作であるといえる。
 このうち、過去の賭けの結果のみから、次の賭け金を決める戦略を考える。例えば、前回負けた場合は1000円、前回買った場合は5000円賭けるようにする、倍々に賭け金を増やしていく(マルチンゲール法)、ある程度勝ったら賭けから降りる、等のような戦略が考えられる。直感的にはうまく行くような気がする。

 しかし、実際には、一回あたりの賭けの期待値が0より大きくない限り、上記のような方法で賭けを実施しても、儲けられないのである。一回当たりの賭けの期待値が0より大きい賭けというのは、胴元にとって不利な賭けであるから、現実世界には存在しないとみてよい。
 前述の命題は、後に述べるように数学的に証明できる。

 証明を述べていく前に、一旦上記の操作を数式で書き表そう。

問題設定

 ftt回目の賭けの賭け金、Utt回目の賭け終了時点での財産、確率変数stt回目の賭けの結果(より具体的には、t回目の賭けにおいて、賭け金の何倍戻って来たかを表す数値。勝てば1、負ければ-1という設定にすると、勝ったら賭け金と同額が戻ってきて、負けると賭け金がすべて失われる賭けとなる)とする。
 今、過去の賭けの結果のみから、次の賭け金を決める戦略を採用しているため、ftは次のように書ける。
ft=ft(s1,s2,,st1)
 stを右辺に含めてはならない。stを含めてしまうと、t回目の賭けの結果を使って、t回目の賭け金を予測することになってしまう。宝くじの結果を予め知ってから、宝くじを買うかどうか決めるようなものである。

 1回目の賭け金f1a(定数。一番最初の賭けは、前回までの賭けの結果情報が存在しないため、問題に応じて適当に定める)、初期財産U0=Cとすると、Ut

Ut=C+as1+f2(s1)s2+f3(s1,s2)s3++ft(s1,s2,,st1)st

となる。式は長いが、やっていることは単純で、初期財産に1回目の賭けの儲け、2回目の賭けの儲け、3回目の賭けの儲け……t回目の賭けの儲けを足しているだけである。

本題

定理

前節の問題設定において、一般に次の定理が成り立つ。
E(Ut+1|s1,s2,,st)=Ut  if E(st+1|s1,s2,,st)=0E(Ut+1|s1,s2,,st)<Ut  if E(st+1|s1,s2,,st)<0E(Ut+1|s1,s2,,st)>Ut  if E(st+1|s1,s2,,st)>0

特に、確率変数st+1と確率変数si1it)が、独立であるとき
E(Ut+1|s1,s2,,st)=Ut  if E(st+1)=0E(Ut+1|s1,s2,,st)<Ut  if E(st+1)<0E(Ut+1|s1,s2,,st)>Ut  if E(st+1)>0
が成り立ち、さらに確率変数sj1jt+1)が同分布である場合は、
E(Ut+1|s1,s2,,st)=Ut  if E(sa)=0E(Ut+1|s1,s2,,st)<Ut  if E(sa)<0E(Ut+1|s1,s2,,st)>Ut  if E(sa)>0
が成り立つ。ただし、aは1以上t+1以下の任意の自然数である。

定理の解説

定理の前半から一つずつ見ていこう。

定理の前提条件について

stというのは、賭けの結果を表す変数であった。これが独立ということは、前の賭けの結果が、現在の賭けの結果に影響を及ぼさないことを示している。10連敗しているから、次勝つ確率が高くなるとか、そういう事象は起きないと仮定している。

同分布であるというのは、1回目の賭けにおける当たる確率・賭けの配当金の組み合わせと、2回目の賭けにおける当たる確率・賭けの配当金の組み合わせが同じであると言っている。同分布でない場合も、t回目の賭けにおける当たる確率・賭けの配当金が分かれば、上記定理から一応求められる。もっとも、賭ける回数によって賭けのルールが変わるような賭けは、あまり存在しないと思われる。

定理そのものについて

条件付き期待値という概念に慣れていない人にとっては、難解な数式に感じるかもしれない。だが、一度理解してしまえば、そこまで難解な概念ではない。

定理の核となっているのは、E(Ut+1|s1,s2,,st)という式である。この式は、s1,s2,,stが与えられたときの、Ut+1の期待値を表している。s1,s2,,stは、今までの賭けの結果を表しているのであった。つまり、E(Ut+1|s1,s2,,st)とは、過去の賭けの結果から、次の賭け金を決める戦略を取った場合における、次の賭けが終わったときの財産の期待値を表している。もし、前述の値が、Utより大きければ、一般にギャンブル参加者が得をする賭けといえる。

E(sa)は、一回の賭けにおける期待値を表している。例を一つ挙げて解説する。

確率0.001で賭け金の100倍、確率0.02で賭け金の10倍、確率0.95で賭け金の-1倍(=賭けに負ける)得られる賭けの場合、stは100,10,-1のいずれかの値を取る。

E(st)

E(st)=0.001×100+0.02×10+0.95×(1)=0.65
となる。

定理を要約すると?

以上を踏まえると、上記の定理は

賭け一回の期待値が0以下の賭け(公平or不公平な賭け)において、過去の賭けの結果から上手く次の賭け金を決めて、次の賭け終了時の財産の期待値を大きくしようとしても、その財産の期待値は、今持っている財産より大きくなることはない。

という事実を述べている。期待値上不利な賭けは、どうこねくり回しても不利な賭けにしかなり得ないのだ。

定理の証明

証明に使用する期待値の性質

式変形には、以下の条件付き期待値に関する性質を利用する。

E(a1Y1+a2Y2|X)=a1E(Y1|X)+a2E(Y2|X)
・XとYが独立なときE(Y|X)=E(Y)

証明

E(Ut+1|s1,s2,,st)=E(Ut+ft+1(s1,s2,,st)st+1|s1,s2,,st)=E(Ut|s1,s2,,st)+E(ft+1(s1,s2,,st)st+1|s1,s2,,st)=E(Ut|s1,s2,,st)+ft+1(s1,s2,,st)E(st+1|s1,s2,,st)=Ut+ft+1(s1,s2,,st)E(st+1|s1,s2,,st)

E(Ut|s1,s2,,st)Utとなる。なぜなら、s1,s2,,stが与えられた時点で、Utは、Utの定義式より一つに定まるからである。期待値の定義より、100%の確率でUtになると考えれば、E(Ut|s1,s2,,st)=Utとなる。

E(Ut+1|s1,s2,,st)Utと等しくなるか、大きくなるか、小さくなるかを調べるためには、ft+1(s1,s2,,st)E(st+1|s1,s2,,st)の値がどうなるか調べればよい。

ft+1(s1,s2,,st)は、外から与えられる任意の正の実数である。よって、E(st+1|s1,s2,,st)=0のときE(Ut+1|s1,s2,,st)=UtE(st+1|s1,s2,,st)<0のときE(Ut+1|s1,s2,,st)<UtE(st+1|s1,s2,,st)>0のときE(Ut+1|s1,s2,,st)>Utが成立する。

なお、確率変数st+1と確率変数si1it)が、独立であるとき、E(st+1|s1,s2,,st)=E(st+1)であるから、

E(Ut+1|s1,s2,,st)=Ut+ft+1(s1,s2,,st)E(st+1)
が成り立つ。以降の議論は、先ほどと同様に進めればよい。

マルチンゲール

ちなみにUt
E(Ut+1|s1,s2,,st)=UtE(Ut+1|s1,s2,,st)UtE(Ut+1|s1,s2,,st)Ut
のような性質を持つとき、上から順に、Uts1,s2,,stに関してマルチンゲール(martingale)Uts1,s2,,stに関して優マルチンゲール(supermartingale)Uts1,s2,,stに関して劣マルチンゲール(submartingale)という。

現実世界に存在する賭け事の大半が、優マルチンゲールである。

参考文献

[1]
藤田岳彦・柳下翔太朗・吉田直広, ランダムウォークと確率解析[増補版] ギャンブルから数理ファイナンスへ
投稿日:20241030
更新日:20241030
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. 問題設定
  3. 本題
  4. 定理
  5. 定理の解説
  6. 定理の証明
  7. 証明に使用する期待値の性質
  8. 証明
  9. マルチンゲール
  10. 参考文献