確率の分野を学ぶ必要が出てきたので自分なりの解釈のかみ砕いてノートとしてまとめてみることにしました。だれかの役に立つといいなと思います。
さっそく本題に入ります。
確率はずばり「なんらかのアクションを起こすと結果がランダムに決まる」という状況で考える概念です。このとき「ランダム」とは偏りがある状況を含むことに注意します。この「アクション」を試行といい「結果」を標本点、標本点全体からなる集合を標本空間といいます。
偏りのない六面ダイスを例にとると、試行は「ダイスを振ること」で、
(標本空間)={(1の目が出る),(2の目が出る),...,(6の目が出る)}
となります。
このような状況で、確率とは標本空間の部分集合に対して「起こりやすさを0以上1以下の実数で評価したもの」です。ここで一つの標本点だけを含む一点集合も部分集合であることに注意。確率の与えられている部分集合を事象といいます。標本空間の部分集合すべてが「事象である(確率が与えられている)」必要はありませんが、事象の補集合や和集合は事象である必要があります。また、確率に対しても和の保存など、満たすべき条件が付いています。
標本空間を$\Omega$,事象全体の集合($\Omega$の部分集合からなる集合)を$\mathcal{F}$,確率測度($\mathcal{F}$の元に確率を与える関数)を$P$として,それぞれが満たすべき条件を挙げていきます.
標本空間$\Omega$;
$(\Omega.1)$ $\Omega\neq\varnothing$
事象全体の集合$\mathcal{F}\subseteq\mathcal{P}(\Omega)$;
$(\mathcal{F}.1)$ $\mathcal{F}\neq\varnothing$
$(\mathcal{F}.2)$ ${}^{\forall}A\in\mathcal{F}\;;\bigl[\;A^{\mathrm{C}}(:=\Omega\backslash A)\in\mathcal{F}\;\bigr]$
$(\mathcal{F}.3)$ ${}^{\forall}\{A_i\}_{i\in\mathbb{N}}\subseteq\mathcal{F}\;;\Bigl[\;\bigcup\limits_{i\in\mathbb{N}}A_i\in\mathcal{F}\;\Bigr]$
確率測度$P:\mathcal{F}\to[0,1]$;
$(P.1)$ $P(\Omega)=1$
$(P.2)$ ${}^{\forall}\{A_i\}_{i\in\mathbb{N}}\subseteq\mathcal{F}\;;\Bigl[\;A_{i\,\cap\,} A_j=\varnothing_{(i\neq j)}\Rightarrow P\bigl(\bigcup\limits_{i\in\mathbb{N}}A_i\bigr)=\sum\limits_{i\in\mathbb{N}}P(A_i)\;\Bigr]$
$\mathcal{F}$の三つ目の条件や$P$の二つ目の条件が少し複雑に見えるのは和集合をとる操作を有限回から可算無限回に拡張しているためです.これらの条件を満たす三つ組$(\Omega,\mathcal{F},P)$を確率空間といいます.
上で挙げた確率空間が満たすべき性質は確率空間の公理と呼ばれるもので確率空間のエッセンスとなるものです.ここでは日常的に考える確率の概念で成り立っていてほしい性質を確認していきます.
${}^{\forall}A,B\in\mathcal{F}\;;\bigl[\;P(A\,_{\cup}\,B)=P(A)+P(B)-P(A\,_{\cap}\,B)\;\bigr]$
まず$A,B$が事象であるとき$A\backslash B,A\,_{\cap}\,B,A\,_{\cup}\,B$も事象であることを示す.
$A\backslash B=\bigl(A^{\mathrm{C}}\,_{\cup}\,B\bigr)^{\mathrm{C}}$であり,事象の公理$(\mathcal{F}.2)$,$(\mathcal{F}.3)$を繰り返し適用することで$A\backslash B\in\mathcal{F}$を得る.De Morganの法則より$A\,_{\cap}\,B=\bigl(A^{\mathrm{C}}\,_{\cup}\,B^{\mathrm{C}}\bigr)^{\mathrm{C}}$であり,事象の公理$(\mathcal{F}.2)$,$(\mathcal{F}.3)$を繰り返し適用することで$A\,_{\cap}B\in\mathcal{F}$を得る.$A\,_{\cup}\,B\in\mathcal{F}$は$(\mathcal{F}.3)$より明らか.
以下$X:=A\backslash B,Y:=B\backslash A,Z:=A\,_{\cap}\,B$とする.これらは互いに排反であるので$(P.2)$より,
\begin{align*}
P(A\,_{\cup}\,B)&=P(X\,_{\cup}\,Y\,_{\cup}\,Z)\\
&=P(X\,_{\cup}\,Z)+P(Y)\\
&=P(X\,_{\cup}\,Z)+P(Y)+P(Z)-P(Z)\\
&=P(X\,_{\cup}\,Z)+P(Y\,_{\cup}\,Z)-P(Z)\\
&=P(A)+P(B)-P(A\,_{\cap}\,B)
\end{align*}
を得る.
${}^{\forall}A\in\mathcal{F}\;;\bigl[\;P(A)+P(A^{\mathrm{C}})=1\;\bigr]$
$(\mathcal{F}.2)$と$(P.2)$より明らか.
${}^{\forall}A,B\in\mathcal{F}\;;\bigl[\;A\subsetneq B\implies P(A)\le P(B)\;\bigr]$
加法公式の証明より$B\backslash A\in\mathcal{F}$であるため
\begin{align*}
P(B)-P(A)&=P\bigl(A\,_{\cup}\,(B\backslash A)\bigr)-P(A)\\
&=P(A)+P(B\backslash A)-P(A)\\
&=P(B\backslash A)\quad\ge0
\end{align*}
を得る.
$P(A)\neq0$である事象$A$が起こったもとで事象$B$も起こっている確率$P[B|A]$を以下で定義する.
\begin{equation*}
P[B|A]:=\dfrac{P(A\,_{\cap}\,B)}{P(A)}
\end{equation*}
${}^{\forall}A,B\in\mathcal{F}\;;\bigl[\;P(A)\neq0\implies P(A\,_{\cap}\,B)=P(A)P[B|A]\;\bigr]$
$P[B|A]$の定義より明らか.
\begin{multline} {}^{\forall}A,B\in\mathcal{F}\;;\biggl[\;P(A)\neq0\,_{\land}\,P(B)\neq0\,_{\land}\,P(A)\neq1\\ \implies P[A|B]=\dfrac{P(A)P[B|A]}{P(A)P[B|A]+P(A^{\mathrm{C}})P[B|A^{\mathrm{C}}]}\;\biggr] \end{multline}
定義より$P[A|B]=\dfrac{P(A\,_{\cap}\,B)}{P(B)}$だが,乗法公式より$P(A\,_{\cap}\,B)=P(A)P[B|A]$であり$(P.2)$と乗法公式より
\begin{align*}
P(B)&=P\bigl((A\,_{\cap}\,B)\,_{\cup}\,(A^{\mathrm{C}}\,_{\cap}\,B)\bigr)\\
&=P(A\,_{\cap}\,B)+P(A^{\mathrm{C}}\,_{\cap}\,B)\\
&=P(A)P[B|A]+P(A^{\mathrm{C}})P[B|A^{\mathrm{C}}]
\end{align*}
であるため上の公式を得る.
今回は
1.確率を考えることのできる状況、
2.確率の公理的定義、
3.確率の基本公式
に絞ってまとめてみました。事象全体の集合や確率測度に関する深い議論は集合代数やLebesgueの測度論で展開される内容なので興味があれば調べてみてください。また、誤植や本質的な間違いをはじめとするリアクションもお待ちしております。
次回は確率変数や確率分布についてまとめていきたいと思います。