試行を $1$ 回実行したときに生じうるすべての根元結果の集合を、その試行の標本空間という。
標本空間は通常 $\Omega$ で表す。
標本空間 $\Omega$ の元を標本点、または根元結果という。
試行とは、$1$ 回の実行ごとに標本空間 $\Omega$ の元がただ $1$ つ定まるようにモデル化される手続きまたは実験をいう。
例えば、硬貨を $1$ 回投げる試行を考える。
表が出ることを $H$、裏が出ることを $T$ で表すと、この試行の標本空間は
$$
\Omega=\{H,T\}
$$
である。
このとき、$H$ と $T$ が標本点、または根元結果である。
$ $
また、$6$ 面さいころを $1$ 回投げる試行を考える。
出る目をそのまま $1,2,3,4,5,6$ で表すと、この試行の標本空間は
$$
\Omega=\{1,2,3,4,5,6\}
$$
である。
このとき、$1,2,3,4,5,6$ が標本点、または根元結果である。
$ $
さらに、硬貨を $2$ 回投げることを $1$ 回の試行として考えるなら、標本空間は
$$
\Omega=\{HH,HT,TH,TT\}
$$
である。
ここで、例えば $HT$ は、$1$ 回目に表が出て、$2$ 回目に裏が出るという $1$ つの根元結果を表す。
したがって、標本点とは、試行全体の結果を $1$ つに確定させるものである。
標本空間 $\Omega$ を与えただけでは確率はまだ定義されない。
確率を定めるためには、$\Omega$ の部分集合族 $\mathcal F$ を $\Omega$ 上の $\sigma$-代数として定め、
さらに $\mathcal F$ 上の確率測度 $\mathbb P$ を与える必要がある。
$ $
このとき、$3$つ組
$$
(\Omega,\mathcal F,\mathbb P)
$$
を確率空間という。また、$\mathcal F$ の元を事象という(後述)。
$\Omega$ を空でない有限集合とし、
$$
|\Omega|=N,\qquad N\in\mathbb N_{>0}
$$
とする。また、
$$
\mathcal F=\mathcal P(\Omega)
$$
とする。このとき、任意の事象 $A\in\mathcal F$ に対して
$$
P(A):=\frac{|A|}{|\Omega|}
$$
で定められる写像
$$
P:\mathcal F\to[0,1]
$$
を、$\Omega$ 上の(古典的)確率、または一様確率という。
公平な $6$ 面さいころを $1$ 回投げる試行を考える。
出る目をそのまま $1,2,3,4,5,6$ で表すと、標本空間は
$$
\Omega=\{1,2,3,4,5,6\}
$$
である。
このとき、
$$
|\Omega|=6
$$
である。
また、事象族を
$$
\mathcal F=\mathcal P(\Omega)
$$
とする。
偶数の目が出るという事象を $A$ とおくと、
$$
A=\{2,4,6\}
$$
である。
したがって、
$$
|A|=3
$$
である。
よって、古典的確率の定義より、
$$
P(A)=\frac{|A|}{|\Omega|}=\frac{3}{6}=\frac{1}{2}
$$
である。
つまり、公平な $6$ 面さいころを $1$ 回投げるとき、偶数の目が出る確率は $\frac{1}{2}$ である。
公平な硬貨を $2$ 回投げることを $1$ 回の試行として考える。
表を $H$、裏を $T$ で表すと、標本空間は
$$
\Omega=\{HH,HT,TH,TT\}
$$
である。
このとき、
$$
|\Omega|=4
$$
である。
また、事象族を
$$
\mathcal F=\mathcal P(\Omega)
$$
とする。
$2$ 回とも表が出るという事象を $B$ とおくと、
$$
B=\{HH\}
$$
である。
したがって、
$$
|B|=1
$$
である。
よって、古典的確率の定義より、
$$
P(B)=\frac{|B|}{|\Omega|}=\frac{1}{4}
$$
である。
つまり、公平な硬貨を $2$ 回投げるとき、$2$ 回とも表が出る確率は $\frac{1}{4}$ である。
任意の $\omega\in\Omega$ に対して、$\{\omega\}\in\mathcal F$ かつ $|\{\omega\}|=1$ であるから、
$$
P(\{\omega\})=\frac{1}{|\Omega|}
$$
が成り立つ。つまり、古典的確率では、すべての標本点に同じ確率が割り当てられる。
$ $
裏を返すと、古典的確率
$$
P(A)=\frac{|A|}{|\Omega|}
$$
は、標本空間 $\Omega$ の各標本点が同じ確率で起こると考えられる場合に使う定義であるから、
さいころが公平でない場合や、各根元結果が同様に確からしいと仮定できない場合には、単に
$$
P(A)=\frac{|A|}{|\Omega|}
$$
と定めることはできない。
その場合には、各事象にどのような確率を割り当てるかを別に定める必要がある。
ラプラスの古典的定義において、任意の事象 $A\in\mathcal F$ について、その確率 $P(A)$ は常に $0$ 以上である。
$$
P(A)\ge 0
$$
実際、$\Omega$ を空でない有限集合とし、
$$
\mathcal F=\mathcal P(\Omega)
$$
とする。また、確率 $P:\mathcal F\to[0,1]$ が、任意の $A\in\mathcal F$ に対して
$$
P(A)=\frac{|A|}{|\Omega|}
$$
で定められているとする。
ここで
$$
r:=|A|,\qquad N:=|\Omega|
$$
とおく。
$A\in\mathcal P(\Omega)$ であるから $A\subseteq\Omega$ である。また、$\Omega$ は有限集合なので、$A$ も有限集合である。したがって、
$$
r\in\{0,1,2,\dots\}
$$
であり、特に
$$
r\ge 0
$$
である。
また、$\Omega$ は空でない有限集合なので、
$$
N\in\mathbb N,\qquad N\ge 1
$$
である。したがって、
$$
N>0
$$
である。
ゆえに、$0$ 以上の数 $r$ を正の数 $N$ で割った数は $0$ 以上であるから、
$$
P(A)=\frac{r}{N}\ge 0
$$
である。
以上より、任意の事象 $A\in\mathcal F$ について
$$
P(A)\ge 0
$$
が成り立つ。
$$ \Box$$
ラプラスの古典的定義において、全事象 $\Omega$ の確率は $1$ である。すなわち、
$$
P(\Omega)=1
$$
が成り立つ。
実際、$\Omega$ を空でない有限集合とし、
$$
\mathcal F=\mathcal P(\Omega)
$$
とする。また、確率 $P:\mathcal F\to[0,1]$ が、任意の事象 $A\in\mathcal F$ に対して
$$
P(A)=\frac{|A|}{|\Omega|}
$$
で定められているとする。
$\Omega\in\mathcal P(\Omega)=\mathcal F$ であるから、$A=\Omega$ とおくことができる。したがって、ラプラスの古典的定義より、
$$
P(\Omega)=\frac{|\Omega|}{|\Omega|}
$$
である。
ここで、$\Omega$ は空でない有限集合なので、
$$
|\Omega|=N,\qquad N\in\mathbb N_{>0}
$$
と書ける。特に、
$$
|\Omega|>0
$$
である。
したがって、
$$
P(\Omega)=\frac{|\Omega|}{|\Omega|}=1
$$
である。
以上より、
$$
P(\Omega)=1
$$
が成り立つ。
$$ \Box$$
ラプラスの古典的定義において、互いに排反な事象 $A$ と $B$ に対して、
$$
P(A\cup B)=P(A)+P(B)
$$
が成り立つ。
すなわち、
$$
A\cap B=\varnothing\ \Rightarrow\ P(A\cup B)=P(A)+P(B)
$$
が成り立つ。
実際、$\Omega$ を空でない有限集合とし、
$$
\mathcal F=\mathcal P(\Omega)
$$
とする。また、確率 $P:\mathcal F\to[0,1]$ が、任意の事象 $E\in\mathcal F$ に対して
$$
P(E)=\frac{|E|}{|\Omega|}
$$
で定められているとする。
いま、$A,B\in\mathcal F$ とし、
$$
A\cap B=\varnothing
$$
を仮定する。
このとき、$A$ と $B$ は互いに素な有限集合であるから、
$$
|A\cup B|=|A|+|B|
$$
が成り立つ。
したがって、ラプラスの古典的定義より、
$$
P(A\cup B)
=
\frac{|A\cup B|}{|\Omega|}
=
\frac{|A|+|B|}{|\Omega|}
=
\frac{|A|}{|\Omega|}+\frac{|B|}{|\Omega|}
=
P(A)+P(B)
$$
である。
以上より、
$$
A\cap B=\varnothing\ \Rightarrow\ P(A\cup B)=P(A)+P(B)
$$
が成り立つ。
$$ \Box$$
集合 $\Omega$ に対し、$\mathcal F$ が $\Omega$ 上の $\sigma$-代数であるとは、$\mathcal F\subseteq\mathcal P(\Omega)$ であり、次の $3$ 条件を満たすことをいう。
-このとき、$\mathcal F$ の元を $\Omega$ 上の可測集合という。確率論では、$\mathcal F$ の元を事象ともいう。
上の条件 $2$ と $3$ から、$\mathcal F$ は可算回の共通部分についても閉じている。
実際、$A_1,A_2,\dots\in\mathcal F$ とする。このとき、各 $n\in\mathbb N_{>0}$ に対して $A_n^c\in\mathcal F$ である。したがって、条件 $3$ より、
$$
\bigcup_{n=1}^{\infty}A_n^c\in\mathcal F
$$
である。さらに条件 $2$ より、
$$
\Bigl(\bigcup_{n=1}^{\infty}A_n^c\Bigr)^c\in\mathcal F
$$
である。ここで、ド・モルガンの法則より、
$$
\bigcap_{n=1}^{\infty}A_n
=
\Bigl(\bigcup_{n=1}^{\infty}A_n^c\Bigr)^c
$$
であるから、
$$
\bigcap_{n=1}^{\infty}A_n\in\mathcal F
$$
が従う。
条件 $1$ と $2$ から、$\varnothing\in\mathcal F$ が従う。
実際、条件 $1$ より、
$$
\Omega\in\mathcal F
$$
である。また、$\Omega$ の $\Omega$ に関する補集合は
$$
\Omega^c=\Omega\setminus\Omega=\varnothing
$$
である。したがって、条件 $2$ より、
$$
\varnothing\in\mathcal F
$$
が従う。
$\Omega$ を集合とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とする。
このとき、組
$$
(\Omega,\mathcal F)
$$
を可測空間という。
以下、$(\Omega,\mathcal F)$ を可測空間とする。
確率論の文脈では、$\Omega$ を標本空間とみなし、通常 $\Omega\neq\varnothing$ と仮定する。また、$\mathcal F$ の元を事象という。
すなわち、$\Omega$ は試行によって生じうる結果全体の集合であり、$\mathcal F$ は確率を割り当てる対象となる部分集合全体を集めた $\sigma$-代数である。
$\Omega\neq\varnothing$ を集合とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とする。
ここで、写像
$$
\mathbb P:\mathcal F\to[0,1]
$$
が $\mathcal F$ 上の確率測度であるとは、次の $2$ 条件を満たすことをいう。
-以上を満たすとき、$\mathbb P$ を $\mathcal F$ 上の確率測度という。
上の定義では $\mathbb P:\mathcal F\to[0,1]$ としているので、任意の $A\in\mathcal F$ に対して
$$
0\le \mathbb P(A)\le 1
$$
が自動的に成り立つ。
したがって、この定義のもとでは、非負性
$$
\mathbb P(A)\ge 0
$$
を別に公理として課す必要はない。
ただし、測度論では、一般に測度を非負値写像として定義するため、非負性を明示的に公理として述べる流儀もある。
$\Omega$ を標本空間とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とし、$\mathbb P$ を $\mathcal F$ 上の確率測度とする。
このとき、$3$ つ組
$$
(\Omega,\mathcal F,\mathbb P)
$$
を確率空間という。また、$\mathcal F$ の元を事象という。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$(A_n)_{n\in\mathbb N_{>0}}$ を $\mathcal F$ の元からなる列とする。
このとき、次のド・モルガンの法則が成り立つ。
$$
\begin{aligned}
\text{$1$.}\quad \left(\bigcup_{n=1}^{\infty} A_n\right)^c &= \bigcap_{n=1}^{\infty} A_n^c \\
\text{$2$.}\quad \left(\bigcap_{n=1}^{\infty} A_n\right)^c &= \bigcup_{n=1}^{\infty} A_n^c
\end{aligned}
$$
ただし、各補集合は $\Omega$ に関する補集合
$$
A_n^c:=\Omega\setminus A_n
$$
を表す。
-以上より、$1$ と $2$ が成り立つ。
$$ \Box$$
$\Omega$ を標本空間とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とし、$\mathbb P$ を $\mathcal F$ 上の確率測度とする。
このとき
$$
\mathbb P(\varnothing)=0
$$
が成り立つ。
$\mathcal F$ は $\Omega$ 上の $\sigma$-代数であるから、$\Omega\in\mathcal F$ である。また、$\mathcal F$ は補集合に関して閉じているので、
$$
\varnothing=\Omega^c\in\mathcal F
$$
である。
各 $n\in\mathbb N_{>0}$ に対して
$$
A_n:=\varnothing
$$
とおく。このとき、各 $n\in\mathbb N_{>0}$ に対して $A_n\in\mathcal F$ である。
また、任意の $i,j\in\mathbb N_{>0}$ について、$i\neq j$ ならば、
$$
A_i\cap A_j=\varnothing\cap\varnothing=\varnothing
$$
である。したがって、列 $(A_n)_{n\in\mathbb N_{>0}}$ は互いに排反である。
さらに、
$$
\bigcup_{n=1}^{\infty}A_n=\varnothing
$$
が成り立つ。
よって、確率測度の可算加法性より、
$$
\mathbb P(\varnothing)
=
\mathbb P\Bigl(\bigcup_{n=1}^{\infty}A_n\Bigr)
=
\sum_{n=1}^{\infty}\mathbb P(A_n)
=
\sum_{n=1}^{\infty}\mathbb P(\varnothing)
$$
を得る。
ここで、
$$
p:=\mathbb P(\varnothing)
$$
とおく。確率測度は $\mathbb P:\mathcal F\to[0,1]$ であるから、
$$
p\in[0,1]
$$
である。上の等式は
$$
p=\sum_{n=1}^{\infty}p
$$
と書ける。
もし $p>0$ ならば、
$$
\sum_{n=1}^{\infty}p=+\infty
$$
となる。しかし、左辺の $p$ は $[0,1]$ の元なので有限である。これは矛盾である。
したがって、$p>0$ ではない。一方で、$p\in[0,1]$ であるから $p\ge0$ である。ゆえに、
$$
p=0
$$
である。
すなわち、
$$
\mathbb P(\varnothing)=0
$$
が成り立つ。
$$ \Box$$
$\Omega$ を標本空間とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とし、$\mathbb P$ を $\mathcal F$ 上の確率測度とする。
このとき、任意の $A,B\in\mathcal F$ に対して
$$
A\cap B=\varnothing
$$
が成り立つならば
$$
\mathbb P(A\cup B)=\mathbb P(A)+\mathbb P(B)
$$
が成り立つ。
$A,B\in\mathcal F$ が
$$
A\cap B=\varnothing
$$
を満たしているとする。
$\mathcal F$ は $\Omega$ 上の $\sigma$-代数であるから、$\Omega\in\mathcal F$ である。また、$\mathcal F$ は補集合に関して閉じているので、
$$
\varnothing=\Omega^c\in\mathcal F
$$
である。
各 $n\in\mathbb N_{>0}$ に対して
$$
A_1:=A,\qquad A_2:=B,\qquad A_n:=\varnothing\quad(n\ge 3)
$$
と定める。
このとき、$A,B\in\mathcal F$ であり、また $\varnothing\in\mathcal F$ であるから、各 $n\in\mathbb N_{>0}$ に対して
$$
A_n\in\mathcal F
$$
が成り立つ。
次に、列 $(A_n)_{n\in\mathbb N_{>0}}$ が互いに排反であることを示す。
任意に $i,j\in\mathbb N_{>0}$ をとり、$i\neq j$ とする。
$i,j\in\{1,2\}$ ならば、$(i,j)=(1,2)$ または $(i,j)=(2,1)$ である。したがって、仮定より
$$
A_i\cap A_j=A\cap B=\varnothing
$$
または
$$
A_i\cap A_j=B\cap A=A\cap B=\varnothing
$$
である。
一方、$i,j$ の少なくとも一方が $3$ 以上ならば、$A_i$ または $A_j$ の少なくとも一方は $\varnothing$ である。したがって、
$$
A_i\cap A_j=\varnothing
$$
である。
以上より、任意の $i,j\in\mathbb N_{>0}$ について
$$
i\neq j\ \Rightarrow\ A_i\cap A_j=\varnothing
$$
が成り立つ。したがって、列 $(A_n)_{n\in\mathbb N_{>0}}$ は互いに排反である。
さらに、$n\ge 3$ ならば $A_n=\varnothing$ であるから、
$$
\bigcup_{n=1}^{\infty}A_n=A_1\cup A_2=A\cup B
$$
が成り立つ。
よって、確率測度の可算加法性より、
$$
\mathbb P(A\cup B)
=
\mathbb P\Bigl(\bigcup_{n=1}^{\infty}A_n\Bigr)
=
\sum_{n=1}^{\infty}\mathbb P(A_n)
$$
を得る。
ここで、$A_1=A,\ A_2=B,\ A_n=\varnothing\ (n\ge 3)$ であるから、
$$
\sum_{n=1}^{\infty}\mathbb P(A_n)
=
\mathbb P(A)+\mathbb P(B)+\sum_{n=3}^{\infty}\mathbb P(\varnothing)
$$
である。
すでに示したように、
$$
\mathbb P(\varnothing)=0
$$
であるから、
$$
\sum_{n=3}^{\infty}\mathbb P(\varnothing)
=
\sum_{n=3}^{\infty}0
=
0
$$
である。
したがって、
$$
\mathbb P(A\cup B)
=
\mathbb P(A)+\mathbb P(B)
$$
が成り立つ。
$$ \Box$$
確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B\in\mathcal F$ とする。このとき
$$
\mathbb P(A\cup B)=\mathbb P(A)+\mathbb P(B)-\mathbb P(A\cap B)
$$
が成り立つ。
次の $3$ つの集合を定める。
$$
C_1:=A\setminus B,\qquad C_2:=A\cap B,\qquad C_3:=B\setminus A
$$
確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B\in\mathcal F$ かつ
$$
A\subseteq B
$$
とする。このとき
$$
\mathbb P(A)\le \mathbb P(B)
$$
が成り立つ。
$A,B\in\mathcal F$ かつ $A\subseteq B$ とする。
-よって、
$$
\mathbb P(A)\le \mathbb P(B)
$$
が成り立つ。
$$ \Box$$
確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、任意の $A\in\mathcal F$ に対して
$$
\mathbb P(A)=1-\mathbb P(A^c)
$$
が成り立つ。ただし
$$
A^c:=\Omega\setminus A
$$
とする。
$A\in\mathcal F$ とする。
$\mathcal F$ は $\Omega$ 上の $\sigma$-代数であるから、補集合について閉じており、
$$
A^c\in\mathcal F
$$
が成り立つ。
また、補集合の定義より
$$
A\cup A^c=\Omega,\qquad A\cap A^c=\varnothing
$$
が成り立つ。
したがって、有限加法性より
$$
\mathbb P(\Omega)=\mathbb P(A\cup A^c)=\mathbb P(A)+\mathbb P(A^c)
$$
を得る。
ここで、確率測度の正規化より
$$
\mathbb P(\Omega)=1
$$
であるから、
$$
1=\mathbb P(A)+\mathbb P(A^c)
$$
が成り立つ。
よって、両辺から $\mathbb P(A^c)$ を引いて
$$
\mathbb P(A)=1-\mathbb P(A^c)
$$
を得る。
$$ \Box$$
$A,B\in\mathcal F$ とする。ド・モルガンの法則より
$$
(A\cap B)^c=A^c\cup B^c
$$
である。
したがって、補集合の確率公式より、
$$
\mathbb P(A^c\cup B^c)
=
\mathbb P((A\cap B)^c)
=
1-\mathbb P(A\cap B)
$$
である。
確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B\in\mathcal F$ とする。このとき
$$
\mathbb P(B\setminus A)=\mathbb P(B)-\mathbb P(A\cap B)
$$
が成り立つ。
$A,B\in\mathcal F$ とする。
特に事象 $A,B\in\mathcal F$ が
$$
A\subseteq B
$$
を満たすとき、$A\cap B=A$ であるから、
$$
\mathbb P(B\setminus A)=\mathbb P(B)-\mathbb P(A)
$$
が成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$A,B\in\mathcal F$ とする。
対称差を
$$
A\triangle B
:=
(A\setminus B)\cup(B\setminus A)
$$
で定義する。
このとき、
$$
|\mathbb P(A)-\mathbb P(B)|
\le
\mathbb P(A\triangle B)
$$
が成り立つ。
-したがって、
$$
\begin{aligned}
\mathbb P(A)-\mathbb P(B)
&=
\{\mathbb P(A\cap B)+\mathbb P(A\setminus B)\}
-
\{\mathbb P(A\cap B)+\mathbb P(B\setminus A)\}\\
&=
\mathbb P(A\setminus B)-\mathbb P(B\setminus A)
\end{aligned}
$$
である。
よって、
$$
|\mathbb P(A)-\mathbb P(B)|
=
|\mathbb P(A\setminus B)-\mathbb P(B\setminus A)|
$$
である。
ここで、確率の非負性より、
$$
\mathbb P(A\setminus B)\ge0,
\qquad
\mathbb P(B\setminus A)\ge0
$$
である。
任意の非負実数 $u,v\ge0$ に対して
$$
|u-v|\le u+v
$$
が成り立つので、
$$
|\mathbb P(A\setminus B)-\mathbb P(B\setminus A)|
\le
\mathbb P(A\setminus B)+\mathbb P(B\setminus A)
$$
である。
また、
$$
(A\setminus B)\cap(B\setminus A)=\varnothing
$$
であるから、確率の有限加法性より、
$$
\mathbb P(A\setminus B)+\mathbb P(B\setminus A)
=
\mathbb P((A\setminus B)\cup(B\setminus A))
$$
である。
対称差の定義より、
$$
(A\setminus B)\cup(B\setminus A)
=
A\triangle B
$$
である。
したがって、
$$
\begin{aligned}
|\mathbb P(A)-\mathbb P(B)|
&=
|\mathbb P(A\setminus B)-\mathbb P(B\setminus A)|\\
&\le
\mathbb P(A\setminus B)+\mathbb P(B\setminus A)\\
&=
\mathbb P((A\setminus B)\cup(B\setminus A))\\
&=
\mathbb P(A\triangle B)
\end{aligned}
$$
である。
以上より、
$$
|\mathbb P(A)-\mathbb P(B)|
\le
\mathbb P(A\triangle B)
$$
が成り立つ。
$$ \Box$$
$A\triangle B$ は、$A$ と $B$ のうち一方だけで起こる部分を集めた事象である。
したがって、$A$ と $B$ の確率の差は、両者が食い違う部分である $A\triangle B$ の確率を超えることはない。