文献あり

ギャンブルにおいてどんな戦略も期待値の壁を越えられないことを証明する

251

はじめに

　ギャンブルには様々な戦略が考えられる。ここでいう戦略とは、ギャンブルの進行に応じて刻々と変化する状況に対して、賭け金を決めていく操作であるといえる。
　このうち、過去の賭けの結果のみから、次の賭け金を決める戦略を考える。例えば、前回負けた場合は1000円、前回買った場合は5000円賭けるようにする、倍々に賭け金を増やしていく（マルチンゲール法）、ある程度勝ったら賭けから降りる、等のような戦略が考えられる。直感的にはうまく行くような気がする。

　しかし、実際には、一回あたりの賭けの期待値が0より大きくない限り、上記のような方法で賭けを実施しても、儲けられないのである。一回当たりの賭けの期待値が0より大きい賭けというのは、胴元にとって不利な賭けであるから、現実世界には存在しないとみてよい。
　前述の命題は、後に述べるように数学的に証明できる。

　証明を述べていく前に、一旦上記の操作を数式で書き表そう。

問題設定

　$f_t$を$t$回目の賭けの賭け金、$U_t$を$t$回目の賭け終了時点での財産、確率変数$s_t$を$t$回目の賭けの結果（より具体的には、$t$回目の賭けにおいて、賭け金の何倍戻って来たかを表す数値。勝てば1、負ければ-1という設定にすると、勝ったら賭け金と同額が戻ってきて、負けると賭け金がすべて失われる賭けとなる）とする。
　今、過去の賭けの結果のみから、次の賭け金を決める戦略を採用しているため、$f_t$は次のように書ける。
$$ f_t=f_t(s_1,s_2,\cdots,s_{t-1}) $$
　$s_t$を右辺に含めてはならない。$s_t$を含めてしまうと、$t$回目の賭けの結果を使って、$t$回目の賭け金を予測することになってしまう。宝くじの結果を予め知ってから、宝くじを買うかどうか決めるようなものである。

　1回目の賭け金$f_1$を$a$（定数。一番最初の賭けは、前回までの賭けの結果情報が存在しないため、問題に応じて適当に定める）、初期財産$U_0=C$とすると、$U_t$は

$$ U_t=C+as_1+f_2(s_1)s_2+f_3(s_1,s_2)s_3+\cdots+f_t(s_1,s_2,\cdots,s_{t-1})s_t $$

となる。式は長いが、やっていることは単純で、初期財産に1回目の賭けの儲け、2回目の賭けの儲け、3回目の賭けの儲け……$t$回目の賭けの儲けを足しているだけである。

本題

定理

前節の問題設定において、一般に次の定理が成り立つ。
$$ \begin{align*} E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t \space \space \text{if}\space E(s_{t+1}|s_1,s_2,\cdots,s_t)=0 \\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&< U_t \space \space \text{if}\space E(s_{t+1}|s_1,s_2,\cdots,s_t)<0 \\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&>U_t \space \space \text{if}\space E(s_{t+1}|s_1,s_2,\cdots,s_t)>0 \\ \end{align*} $$

特に、確率変数$s_{t+1}$と確率変数$s_i$（$1\le i \le t$）が、独立であるとき
$$ \begin{align*} E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t \space \space \text{if}\space E(s_{t+1})=0 \\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&< U_t \space \space \text{if}\space E(s_{t+1})<0 \\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&>U_t \space \space \text{if}\space E(s_{t+1})>0 \\ \end{align*} $$
が成り立ち、さらに確率変数$s_j$（$1\le j \le t+1$）が同分布である場合は、
$$ \begin{align*} E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t \space \space \text{if}\space E(s_a)=0 \\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&< U_t \space \space \text{if}\space E(s_a)<0 \\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&>U_t \space \space \text{if}\space E(s_a)>0 \\ \end{align*} $$
が成り立つ。ただし、$a$は1以上$t+1$以下の任意の自然数である。

定理の解説

定理の前半から一つずつ見ていこう。

定理の前提条件について

$s_t$というのは、賭けの結果を表す変数であった。これが独立ということは、前の賭けの結果が、現在の賭けの結果に影響を及ぼさないことを示している。10連敗しているから、次勝つ確率が高くなるとか、そういう事象は起きないと仮定している。

同分布であるというのは、1回目の賭けにおける当たる確率・賭けの配当金の組み合わせと、2回目の賭けにおける当たる確率・賭けの配当金の組み合わせが同じであると言っている。同分布でない場合も、$t$回目の賭けにおける当たる確率・賭けの配当金が分かれば、上記定理から一応求められる。もっとも、賭ける回数によって賭けのルールが変わるような賭けは、あまり存在しないと思われる。

定理そのものについて

条件付き期待値という概念に慣れていない人にとっては、難解な数式に感じるかもしれない。だが、一度理解してしまえば、そこまで難解な概念ではない。

定理の核となっているのは、$E(U_{t+1}|s_1,s_2,\cdots,s_t)$という式である。この式は、$s_1,s_2,\cdots,s_t$が与えられたときの、$U_{t+1}$の期待値を表している。$s_1,s_2,\cdots,s_t$は、今までの賭けの結果を表しているのであった。つまり、$E(U_{t+1}|s_1,s_2,\cdots,s_t)$とは、過去の賭けの結果から、次の賭け金を決める戦略を取った場合における、次の賭けが終わったときの財産の期待値を表している。もし、前述の値が、$U_t$より大きければ、一般にギャンブル参加者が得をする賭けといえる。

$E(s_a)$は、一回の賭けにおける期待値を表している。例を一つ挙げて解説する。

確率0.001で賭け金の100倍、確率0.02で賭け金の10倍、確率0.95で賭け金の-1倍（=賭けに負ける）得られる賭けの場合、$s_t$は100,10,-1のいずれかの値を取る。

$E(s_t)$は

$$ E(s_t)=0.001\times 100+0.02\times 10 + 0.95\times (-1) = -0.65 $$
となる。

定理を要約すると？

以上を踏まえると、上記の定理は

賭け一回の期待値が0以下の賭け（公平or不公平な賭け）において、過去の賭けの結果から上手く次の賭け金を決めて、次の賭け終了時の財産の期待値を大きくしようとしても、その財産の期待値は、今持っている財産より大きくなることはない。

という事実を述べている。期待値上不利な賭けは、どうこねくり回しても不利な賭けにしかなり得ないのだ。

定理の証明

証明に使用する期待値の性質

式変形には、以下の条件付き期待値に関する性質を利用する。

・$E(a_1Y_1+a_2Y_2|X)=a_1E(Y_1|X)+a_2E(Y_2|X)$
・XとYが独立なとき$E(Y|X)=E(Y)$

証明

$$ \begin{align*} E(U_{t+1}|s_1,s_2,\cdots,s_t)&=E(U_t+f_{t+1}(s_1,s_2,\cdots,s_t)s_{t+1}|s_1,s_2,\cdots,s_t)\\ &=E(U_t|s_1,s_2,\cdots,s_t)+E(f_{t+1}(s_1,s_2,\cdots,s_t)s_{t+1}|s_1,s_2,\cdots,s_t)\\ &=E(U_t|s_1,s_2,\cdots,s_t)+f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}|s_1,s_2,\cdots,s_t)\\ &=U_t+f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}|s_1,s_2,\cdots,s_t)\\ \end{align*} $$

$E(U_t|s_1,s_2,\cdots,s_t)$は$U_t$となる。なぜなら、$s_1,s_2,\cdots,s_t$が与えられた時点で、$U_t$は、$U_t$の定義式より一つに定まるからである。期待値の定義より、100%の確率で$U_t$になると考えれば、$E(U_t|s_1,s_2,\cdots,s_t)=U_t$となる。

$E(U_{t+1}|s_1,s_2,\cdots,s_t)$が$U_t$と等しくなるか、大きくなるか、小さくなるかを調べるためには、$f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}|s_1,s_2,\cdots,s_t)$の値がどうなるか調べればよい。

$f_{t+1}(s_1,s_2,\cdots,s_t)$は、外から与えられる任意の正の実数である。よって、$E(s_{t+1}|s_1,s_2,\cdots,s_t)=0$のとき$E(U_{t+1}|s_1,s_2,\cdots,s_t)=U_t$、$E(s_{t+1}|s_1,s_2,\cdots,s_t)<0$のとき$E(U_{t+1}|s_1,s_2,\cdots,s_t)< U_t$、$E(s_{t+1}|s_1,s_2,\cdots,s_t)>0$のとき$E(U_{t+1}|s_1,s_2,\cdots,s_t)>U_t$が成立する。

なお、確率変数$s_{t+1}$と確率変数$s_i$（$1\le i \le t$）が、独立であるとき、$E(s_{t+1}|s_1,s_2,\cdots,s_t)=E(s_{t+1})$であるから、

$$ E(U_{t+1}|s_1,s_2,\cdots,s_t)=U_t+f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}) $$
が成り立つ。以降の議論は、先ほどと同様に進めればよい。

マルチンゲール

ちなみに$U_t$が
$$ \begin{align*} E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t\\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&\leq U_t\\ E(U_{t+1}|s_1,s_2,\cdots,s_t)&\geq U_t\\ \end{align*} $$
のような性質を持つとき、上から順に、$U_t$は$s_1,s_2,\cdots ,s_t$に関してマルチンゲール(martingale)、$U_t$は$s_1,s_2,\cdots ,s_t$に関して優マルチンゲール(supermartingale)、$U_t$は$s_1,s_2,\cdots ,s_t$に関して劣マルチンゲール(submartingale)という。