ギャンブルには様々な戦略が考えられる。ここでいう戦略とは、ギャンブルの進行に応じて刻々と変化する状況に対して、賭け金を決めていく操作であるといえる。
このうち、過去の賭けの結果のみから、次の賭け金を決める戦略を考える。例えば、前回負けた場合は1000円、前回買った場合は5000円賭けるようにする、倍々に賭け金を増やしていく(マルチンゲール法)、ある程度勝ったら賭けから降りる、等のような戦略が考えられる。直感的にはうまく行くような気がする。
しかし、実際には、一回あたりの賭けの期待値が0より大きくない限り、上記のような方法で賭けを実施しても、儲けられないのである。一回当たりの賭けの期待値が0より大きい賭けというのは、胴元にとって不利な賭けであるから、現実世界には存在しないとみてよい。
前述の命題は、後に述べるように数学的に証明できる。
証明を述べていく前に、一旦上記の操作を数式で書き表そう。
$f_t$を$t$回目の賭けの賭け金、$U_t$を$t$回目の賭け終了時点での財産、確率変数$s_t$を$t$回目の賭けの結果(より具体的には、$t$回目の賭けにおいて、賭け金の何倍戻って来たかを表す数値。勝てば1、負ければ-1という設定にすると、勝ったら賭け金と同額が戻ってきて、負けると賭け金がすべて失われる賭けとなる)とする。
今、過去の賭けの結果のみから、次の賭け金を決める戦略を採用しているため、$f_t$は次のように書ける。
$$
f_t=f_t(s_1,s_2,\cdots,s_{t-1})
$$
$s_t$を右辺に含めてはならない。$s_t$を含めてしまうと、$t$回目の賭けの結果を使って、$t$回目の賭け金を予測することになってしまう。宝くじの結果を予め知ってから、宝くじを買うかどうか決めるようなものである。
1回目の賭け金$f_1$を$a$(定数。一番最初の賭けは、前回までの賭けの結果情報が存在しないため、問題に応じて適当に定める)、初期財産$U_0=C$とすると、$U_t$は
$$ U_t=C+as_1+f_2(s_1)s_2+f_3(s_1,s_2)s_3+\cdots+f_t(s_1,s_2,\cdots,s_{t-1})s_t $$
となる。式は長いが、やっていることは単純で、初期財産に1回目の賭けの儲け、2回目の賭けの儲け、3回目の賭けの儲け……$t$回目の賭けの儲けを足しているだけである。
前節の問題設定において、一般に次の定理が成り立つ。
$$
\begin{align*}
E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t \space \space \text{if}\space E(s_{t+1}|s_1,s_2,\cdots,s_t)=0 \\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&< U_t \space \space \text{if}\space E(s_{t+1}|s_1,s_2,\cdots,s_t)<0 \\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&>U_t \space \space \text{if}\space E(s_{t+1}|s_1,s_2,\cdots,s_t)>0 \\
\end{align*}
$$
特に、確率変数$s_{t+1}$と確率変数$s_i$($1\le i \le t$)が、独立であるとき
$$
\begin{align*}
E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t \space \space \text{if}\space E(s_{t+1})=0 \\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&< U_t \space \space \text{if}\space E(s_{t+1})<0 \\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&>U_t \space \space \text{if}\space E(s_{t+1})>0 \\
\end{align*}
$$
が成り立ち、さらに確率変数$s_j$($1\le j \le t+1$)が同分布である場合は、
$$
\begin{align*}
E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t \space \space \text{if}\space E(s_a)=0 \\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&< U_t \space \space \text{if}\space E(s_a)<0 \\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&>U_t \space \space \text{if}\space E(s_a)>0 \\
\end{align*}
$$
が成り立つ。ただし、$a$は1以上$t+1$以下の任意の自然数である。
定理の前半から一つずつ見ていこう。
$s_t$というのは、賭けの結果を表す変数であった。これが独立ということは、前の賭けの結果が、現在の賭けの結果に影響を及ぼさないことを示している。10連敗しているから、次勝つ確率が高くなるとか、そういう事象は起きないと仮定している。
同分布であるというのは、1回目の賭けにおける当たる確率・賭けの配当金の組み合わせと、2回目の賭けにおける当たる確率・賭けの配当金の組み合わせが同じであると言っている。同分布でない場合も、$t$回目の賭けにおける当たる確率・賭けの配当金が分かれば、上記定理から一応求められる。もっとも、賭ける回数によって賭けのルールが変わるような賭けは、あまり存在しないと思われる。
条件付き期待値という概念に慣れていない人にとっては、難解な数式に感じるかもしれない。だが、一度理解してしまえば、そこまで難解な概念ではない。
定理の核となっているのは、$E(U_{t+1}|s_1,s_2,\cdots,s_t)$という式である。この式は、$s_1,s_2,\cdots,s_t$が与えられたときの、$U_{t+1}$の期待値を表している。$s_1,s_2,\cdots,s_t$は、今までの賭けの結果を表しているのであった。つまり、$E(U_{t+1}|s_1,s_2,\cdots,s_t)$とは、過去の賭けの結果から、次の賭け金を決める戦略を取った場合における、次の賭けが終わったときの財産の期待値を表している。もし、前述の値が、$U_t$より大きければ、一般にギャンブル参加者が得をする賭けといえる。
$E(s_a)$は、一回の賭けにおける期待値を表している。例を一つ挙げて解説する。
確率0.001で賭け金の100倍、確率0.02で賭け金の10倍、確率0.95で賭け金の-1倍(=賭けに負ける)得られる賭けの場合、$s_t$は100,10,-1のいずれかの値を取る。
$E(s_t)$は
$$
E(s_t)=0.001\times 100+0.02\times 10 + 0.95\times (-1) = -0.65
$$
となる。
以上を踏まえると、上記の定理は
賭け一回の期待値が0以下の賭け(公平or不公平な賭け)において、過去の賭けの結果から上手く次の賭け金を決めて、次の賭け終了時の財産の期待値を大きくしようとしても、その財産の期待値は、今持っている財産より大きくなることはない。
という事実を述べている。期待値上不利な賭けは、どうこねくり回しても不利な賭けにしかなり得ないのだ。
式変形には、以下の条件付き期待値に関する性質を利用する。
・$E(a_1Y_1+a_2Y_2|X)=a_1E(Y_1|X)+a_2E(Y_2|X)$
・XとYが独立なとき$E(Y|X)=E(Y)$
$$ \begin{align*} E(U_{t+1}|s_1,s_2,\cdots,s_t)&=E(U_t+f_{t+1}(s_1,s_2,\cdots,s_t)s_{t+1}|s_1,s_2,\cdots,s_t)\\ &=E(U_t|s_1,s_2,\cdots,s_t)+E(f_{t+1}(s_1,s_2,\cdots,s_t)s_{t+1}|s_1,s_2,\cdots,s_t)\\ &=E(U_t|s_1,s_2,\cdots,s_t)+f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}|s_1,s_2,\cdots,s_t)\\ &=U_t+f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}|s_1,s_2,\cdots,s_t)\\ \end{align*} $$
$E(U_t|s_1,s_2,\cdots,s_t)$は$U_t$となる。なぜなら、$s_1,s_2,\cdots,s_t$が与えられた時点で、$U_t$は、$U_t$の定義式より一つに定まるからである。期待値の定義より、100%の確率で$U_t$になると考えれば、$E(U_t|s_1,s_2,\cdots,s_t)=U_t$となる。
$E(U_{t+1}|s_1,s_2,\cdots,s_t)$が$U_t$と等しくなるか、大きくなるか、小さくなるかを調べるためには、$f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1}|s_1,s_2,\cdots,s_t)$の値がどうなるか調べればよい。
$f_{t+1}(s_1,s_2,\cdots,s_t)$は、外から与えられる任意の正の実数である。よって、$E(s_{t+1}|s_1,s_2,\cdots,s_t)=0$のとき$E(U_{t+1}|s_1,s_2,\cdots,s_t)=U_t$、$E(s_{t+1}|s_1,s_2,\cdots,s_t)<0$のとき$E(U_{t+1}|s_1,s_2,\cdots,s_t)< U_t$、$E(s_{t+1}|s_1,s_2,\cdots,s_t)>0$のとき$E(U_{t+1}|s_1,s_2,\cdots,s_t)>U_t$が成立する。
なお、確率変数$s_{t+1}$と確率変数$s_i$($1\le i \le t$)が、独立であるとき、$E(s_{t+1}|s_1,s_2,\cdots,s_t)=E(s_{t+1})$であるから、
$$
E(U_{t+1}|s_1,s_2,\cdots,s_t)=U_t+f_{t+1}(s_1,s_2,\cdots,s_t)E(s_{t+1})
$$
が成り立つ。以降の議論は、先ほどと同様に進めればよい。
ちなみに$U_t$が
$$
\begin{align*}
E(U_{t+1}|s_1,s_2,\cdots,s_t)&=U_t\\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&\leq U_t\\
E(U_{t+1}|s_1,s_2,\cdots,s_t)&\geq U_t\\
\end{align*}
$$
のような性質を持つとき、上から順に、$U_t$は$s_1,s_2,\cdots ,s_t$に関してマルチンゲール(martingale)、$U_t$は$s_1,s_2,\cdots ,s_t$に関して優マルチンゲール(supermartingale)、$U_t$は$s_1,s_2,\cdots ,s_t$に関して劣マルチンゲール(submartingale)という。
現実世界に存在する賭け事の大半が、優マルチンゲールである。