試行を $1$ 回実行したときに生じうるすべての基本結果の集合を、その試行の標本空間という。
標本空間は通常 $\Omega$ で表す。
試行とは、$1$ 回の実行ごとに標本空間 $\Omega$ の元がただ $1$ つ定まるような手続きまたは実験をいう。
標本空間の元を標本点ともいう。
標本空間 $\Omega$ を与えただけでは確率はまだ定義されない。
確率を定めるためには、$\Omega$ の部分集合族 $\mathcal F$ を $\Omega$ 上の $\sigma$-代数として定め、
さらに $\mathcal F$ 上の確率測度 $\mathbb P$ を与える必要がある。
$ $
このとき、$3$つ組
$$
(\Omega,\mathcal F,\mathbb P)
$$
を確率空間という。また、$\mathcal F$ の元を事象という(後述)。
$\Omega$ を空でない有限集合(標本空間)とし、
$$
|\Omega|=N\quad (N\in\mathbb{N},\ N\ge 1)
$$
とする。
このとき、$\Omega$ の各根元結果に同じ重みを与える確率 $P$ を、任意の事象 $A\subseteq\Omega$ に対して
$$
P(A):=\frac{|A|}{|\Omega|}
$$
で定める。
任意の $\omega\in\Omega$ に対して、$|\{\omega\}|=1$であるから
$$
P(\{\omega\})=\frac{1}{|\Omega|}
$$
が成り立つ。
任意の事象 $A$ について、その確率 $P(A)$ は常に$0$以上である。
$$
P(A) \geq 0
$$
$ $
実際、ラプラスの古典的定義では、有限な標本空間 $\Omega$ に対して
$$
P(A)=\frac{|A|}{|\Omega|}
$$
である。ここで
$$
r:=|A|,\quad N:=|\Omega|
$$
とおくと $r$ は場合の数なので
$$
r\in\{0,1,2,\dots\}\quad\Rightarrow\quad r\ge 0
$$
また $\Omega$ は空でない有限集合なので
$$
N\in\mathbb{N},\ N\ge 1\quad\Rightarrow\quad N>0
$$
したがって、正の数 $N$ で $0$ 以上の数 $r$ を割ったものは $0$ 以上であるから
$$
P(A)=\frac{r}{N}\ge 0
$$
よって任意の事象 $A$ について
$$
P(A)\ge 0
$$
が成り立つ。
$$ \Box$$
全事象 $\Omega$ の確率は$1$である。すなわち、
$$
P(\Omega) = 1
$$
が成り立つ。
$ $
実際、ラプラスの古典的定義より、有限な標本空間 $\Omega$ に対して任意の事象 $A\subseteq\Omega$ について
$$
P(A)=\frac{|A|}{|\Omega|}
$$
である。特に $A=\Omega$ とすると
$$
P(\Omega)=\frac{|\Omega|}{|\Omega|}
$$
ここで $\Omega$ は空でない有限集合なので
$$
|\Omega|=N\quad (N\in\mathbb{N},\ N\ge 1)
$$
より $|\Omega|>0$ である。したがって
$$
P(\Omega)=\frac{|\Omega|}{|\Omega|}=1
$$
よって
$$
P(\Omega)=1
$$
が成り立つ。
$$ \Box$$
互いに排反な(同時に起こり得ない)事象 $A$ と $B$ に対して、
$A$ または $B$ が起こる確率 $P(A \cup B)$ は、$P(A)$ と $P(B)$ の和に等しい。
すなわち、
$$
P(A \cup B) = P(A) + P(B) \quad (\text{if } A \cap B = \emptyset)
$$
が成り立つ。
$ $
実際、(ラプラスの)古典的定義より、有限な標本空間 $\Omega$ において任意の事象 $E\subseteq\Omega$ について
$$
P(E)=\frac{|E|}{|\Omega|}
$$
で与えられる。いま事象 $A,B\subseteq\Omega$ が排反、すなわち
$$
A\cap B=\emptyset
$$
を満たすとする。
このとき、$A$ と $B$ は共通部分を持たないので、和集合の要素数は
$$
|A\cup B|=|A|+|B|
$$
が成り立つ。したがって
$$
P(A\cup B)=\frac{|A\cup B|}{|\Omega|}
=\frac{|A|+|B|}{|\Omega|}
=\frac{|A|}{|\Omega|}+\frac{|B|}{|\Omega|}
=P(A)+P(B)
$$
よって
$$
A\cap B=\emptyset \ \Rightarrow\ P(A\cup B)=P(A)+P(B)
$$
が成り立つ。
$$ \Box$$
集合 $\Omega$ に対し、$\mathcal F$ が $\Omega$ 上の $\sigma$-代数であるとは、$\mathcal F\subseteq \mathcal P(\Omega)$ であり、次の $3$ 条件を満たすことをいう。
-このとき、$\mathcal F$ の元を $\Omega$ 上の可測集合という。
上の条件 $2$ と $3$ から、$\mathcal F$ は可算回の共通部分についても閉じている。
実際、$A_1,A_2,\dots\in\mathcal F$ とすると、各 $n\in\mathbb N$ に対して $A_n^c\in\mathcal F$ である。したがって、
$$
\bigcup_{n=1}^{\infty}A_n^c\in\mathcal F
$$
であり、再び条件 $2$ より
$$
\Bigl(\bigcup_{n=1}^{\infty}A_n^c\Bigr)^c\in\mathcal F
$$
を得る。ここで、ド・モルガンの法則より
$$
\bigcap_{n=1}^{\infty}A_n
=
\Bigl(\bigcup_{n=1}^{\infty}A_n^c\Bigr)^c
$$
であるから、
$$
\bigcap_{n=1}^{\infty}A_n\in\mathcal F
$$
が従う。
また、条件 $1$ と $2$ から $\varnothing\in\mathcal F$ が従う。実際、
$$
\varnothing=\Omega^c
$$
であるから、$\Omega\in\mathcal F$ より $\varnothing\in\mathcal F$ である。
$\Omega\neq\varnothing$ を集合とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とする。
ここで、写像
$$
\mathbb P:\mathcal F\to [0,1]
$$
が $\mathcal F$ 上の確率測度であるとは、次の $2$ 条件を満たすことをいう。
-以上を満たすとき、$\mathbb P$ を $\mathcal F$ 上の確率測度という。
上の定義では $\mathbb P:\mathcal F\to[0,1]$ としているので、任意の $A\in\mathcal F$ に対して
$$
0\le \mathbb P(A)\le 1
$$
が自動的に成り立つ。したがって、非負性
$$
\mathbb P(A)\ge 0
$$
を別に公理として課す必要はない。
$\Omega$ を標本空間とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とし、$\mathbb P$ を $\mathcal F$ 上の確率測度とする。
このとき、$3$ つ組
$$
(\Omega,\mathcal F,\mathbb P)
$$
を確率空間という。また、$\mathcal F$ の元を事象という。
以下、$(\Omega,\mathcal F)$ を可測空間とする。
すなわち、$\Omega\neq\emptyset$ は空でない集合であり、$\mathcal F$ は $\Omega$ 上の $\sigma$-代数であるとする。
$ $
$\Omega$ を標本空間とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とし、$\mathbb P$ を $\mathcal F$ 上の確率測度とする。
このとき
$$
\mathbb P(\varnothing)=0
$$
が成り立つ。
各 $n\in\mathbb N$ に対して
$$
A_n:=\varnothing
$$
とおく。
-すなわち
$$
\mathbb P(\varnothing)=0
$$
が成り立つ。
$$ \Box$$
$\Omega$ を標本空間とし、$\mathcal F$ を $\Omega$ 上の $\sigma$-代数とし、$\mathbb P$ を $\mathcal F$ 上の確率測度とする。
このとき、任意の $A,B\in\mathcal F$ に対して
$$
A\cap B=\varnothing
$$
が成り立つならば
$$
\mathbb P(A\cup B)=\mathbb P(A)+\mathbb P(B)
$$
が成り立つ。
$A,B\in\mathcal F$ が
$$
A\cap B=\varnothing
$$
を満たしているとする。
-したがって
$$
\mathbb P(A\cup B)
=
\mathbb P(A)+\mathbb P(B)
$$
が成り立つ。
$$ \Box$$
確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B\in\mathcal F$ とする。このとき
$$
\mathbb P(A\cup B)=\mathbb P(A)+\mathbb P(B)-\mathbb P(A\cap B)
$$
が成り立つ。
次の $3$ つの集合を定める。
$$
C_1:=A\setminus B,\qquad C_2:=A\cap B,\qquad C_3:=B\setminus A
$$
確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B\in\mathcal F$ かつ
$$
A\subseteq B
$$
とする。このとき
$$
\mathbb P(A)\le \mathbb P(B)
$$
が成り立つ。
$A,B\in\mathcal F$ かつ $A\subseteq B$ とする。
確率空間 $(\Omega,\mathcal F,\mathbb{P})$ において、任意の $A\in\mathcal F$ に対して
$$
\mathbb{P}(A)=1-\mathbb{P}(A^c)
$$
が成り立つ。ただし
$$
A^c:=\Omega\setminus A
$$
とする。
$A\in\mathcal F$ とする。
$\mathcal F$ は $\Omega$ 上の $\sigma$-代数であるから、補集合について閉じており、
$$
A^c\in\mathcal F
$$
が成り立つ。
また、補集合の定義より
$$
A\cup A^c=\Omega,\qquad A\cap A^c=\varnothing
$$
が成り立つ。
したがって、有限加法性より
$$
\mathbb{P}(\Omega)=\mathbb{P}(A)+\mathbb{P}(A^c)
$$
を得る。
ここで、確率測度の正規化(定義)より
$$
\mathbb{P}(\Omega)=1
$$
であるから、
$$
1=\mathbb{P}(A)+\mathbb{P}(A^c)
$$
が成り立つ。
よって、両辺から $\mathbb{P}(A^c)$ を引いて
$$
\mathbb{P}(A)=1-\mathbb{P}(A^c)
$$
を得る。
$$ \Box$$
なお、ド・モルガンの法則より $(A \cap B)^c = A^c \cup B^c$ であるから、
$$
\mathbb{P}(A^c \cup B^c) = 1 - \mathbb{P}(A \cap B)
$$
である。
確率空間 $(\Omega,\mathcal F,\mathbb{P})$ において、$A,B\in\mathcal F$ とする。このとき
$$
\mathbb{P}(B\setminus A)=\mathbb{P}(B)-\mathbb{P}(A\cap B)
$$
が成り立つ。
$A,B\in\mathcal F$ とする。
特に事象 $A,B$ が
$$
A\subseteq B
$$
を満たすとき、$A\cap B=A$だから
$$
P(B\setminus A)=P(B)-P(A)
$$
が成り立つ。
ある決済サービスで、不正検知モデルを運用している。
$\Omega$ を $1$ 件の取引に関する標本空間とし、次の事象を考える。
$$
A:=\text{「その取引は実際に不正である」},\qquad
B:=\text{「モデルがその取引を不正としてアラートする」}
$$
次を、$\mathbb P(A)$、$\mathbb P(B)$、$\mathbb P(A\cap B)$ を用いて表せ。
$1$. 不正取引を正しくアラートできた事象の確率
$2$. 正常取引なのにアラートしてしまった事象の確率
$3$. 不正取引なのにアラートできなかった事象の確率
$4$. 「実際に不正である」または「モデルがアラートする」の少なくとも一方が起こる確率
$ $
1. 問①はそのまま
$$
\mathbb P(A\cap B)
$$
である。
2. 「正常取引なのにアラート」であるから $A^c\cap B=B\setminus A$ である。したがって
$$
\mathbb P(A^c\cap B)=\mathbb P(B\setminus A)=\mathbb P(B)-\mathbb P(A\cap B)
$$
3. 「不正取引なのに非アラート」であるから $A\cap B^c=A\setminus B$ である。したがって
$$
\mathbb P(A\cap B^c)=\mathbb P(A\setminus B)=\mathbb P(A)-\mathbb P(A\cap B)
$$
4. 包除公式より
$$
\mathbb P(A\cup B)=\mathbb P(A)+\mathbb P(B)-\mathbb P(A\cap B)
$$
ある工場で、設備の予知保全モデルを運用している。
$\Omega$ を $1$ 日の設備状態に関する標本空間とし、次の事象を考える。
$$
F:=\text{「その日に実際に設備異常が発生する」},\qquad
S:=\text{「センサ監視により異常兆候が検知される」}
$$
次を、$\mathbb P(F)$、$\mathbb P(S)$、$\mathbb P(F\cap S)$ を用いて表せ。
$1$. 異常発生日のうち、事前に兆候が検知されていた確率
$2$. 兆候は出たが、実際には異常が発生しなかった確率
$3$. 異常も兆候もどちらも起こらない確率
$ $
1. 問①はそのまま
$$
\mathbb P(F\cap S)
$$
である。
2. $S\setminus F=S\cap F^c$ であるから
$$
\mathbb P(S\setminus F)=\mathbb P(S)-\mathbb P(F\cap S)
$$
3. $(F\cup S)^c=F^c\cap S^c$ であるから
$$
\mathbb P(F^c\cap S^c)=1-\mathbb P(F\cup S)
$$
さらに包除公式より
$$
\mathbb P(F^c\cap S^c)=1-\mathbb P(F)-\mathbb P(S)+\mathbb P(F\cap S)
$$
画像による外観検査システムで、$2$ 種類の欠陥を監視している。
$\Omega$ を $1$ 個の製品に関する標本空間とし、
$$
D_1:=\text{「表面傷がある」},\qquad
D_2:=\text{「寸法不良がある」}
$$
とする。
次の事象の確率を、$\mathbb P(D_1)$、$\mathbb P(D_2)$、$\mathbb P(D_1\cap D_2)$ を用いて表せ。
$1$. 少なくともどちらか一方の欠陥がある
$2$. 表面傷のみがある
$3$. 寸法不良のみがある
$4$. 両方の欠陥が同時にある
$5$. 欠陥が全くない
$ $
1. 包除公式より
$$
\mathbb P(D_1\cup D_2)=\mathbb P(D_1)+\mathbb P(D_2)-\mathbb P(D_1\cap D_2)
$$
2. $D_1\setminus D_2$ であるから
$$
\mathbb P(D_1\setminus D_2)=\mathbb P(D_1)-\mathbb P(D_1\cap D_2)
$$
3. $D_2\setminus D_1$ であるから
$$
\mathbb P(D_2\setminus D_1)=\mathbb P(D_2)-\mathbb P(D_1\cap D_2)
$$
4. はそのまま
$$
\mathbb P(D_1\cap D_2)
$$
である。
5. $(D_1\cup D_2)^c$ であるから
$$
\mathbb P((D_1\cup D_2)^c)=1-\mathbb P(D_1\cup D_2)
$$
したがって
$$
\mathbb P((D_1\cup D_2)^c)=1-\mathbb P(D_1)-\mathbb P(D_2)+\mathbb P(D_1\cap D_2)
$$
プロダクト改善のために、$2$ つのUI案 $A$ 版と $B$ 版の A/B テストを行っている。
$\Omega$ を $1$ 人のユーザーに関する標本空間とし、次の事象を考える。
$$
T:=\text{「そのユーザーはテスト群に割り当てられる」},\qquad
C:=\text{「そのユーザーはコンバージョンする」}
$$
次を、$\mathbb P(T)$、$\mathbb P(C)$、$\mathbb P(T\cap C)$ を用いて表せ。
$1$. テスト群に割り当てられ、かつコンバージョンした確率
$2$. テスト群に割り当てられたがコンバージョンしなかった確率
$3$. コントロール群に割り当てられ、かつコンバージョンした確率
$4$. 「テスト群に割り当てられる」または「コンバージョンする」の少なくとも一方が起こる確率
$ $
1. 問①はそのまま
$$
\mathbb P(T\cap C)
$$
である。
2. $T\cap C^c=T\setminus C$ であるから
$$
\mathbb P(T\cap C^c)=\mathbb P(T)-\mathbb P(T\cap C)
$$
3. $T^c\cap C=C\setminus T$ であるから
$$
\mathbb P(T^c\cap C)=\mathbb P(C)-\mathbb P(T\cap C)
$$
4. 包除公式より
$$
\mathbb P(T\cup C)=\mathbb P(T)+\mathbb P(C)-\mathbb P(T\cap C)
$$
サブスクリプションサービスで、離反予測モデルを運用している。
$\Omega$ を $1$ 人の顧客に関する標本空間とし、次の事象を考える。
$$
L:=\text{「その顧客は翌月に離反する」},\qquad
H:=\text{「モデルがその顧客を高リスクと判定する」}
$$
次を、$\mathbb P(L)$、$\mathbb P(H)$、$\mathbb P(L\cap H)$ を用いて表せ。
$1$. 離反顧客を高リスクと判定できた確率
$2$. 高リスク判定だが実際には離反しない確率
$3$. 離反するのに高リスク判定されない確率
$4$. 離反しないかつ高リスク判定もされない確率
$ $
1. 問①はそのまま
$$
\mathbb P(L\cap H)
$$
である。
2. $H\setminus L$ であるから
$$
\mathbb P(H\setminus L)=\mathbb P(H)-\mathbb P(L\cap H)
$$
3. $L\setminus H$ であるから
$$
\mathbb P(L\setminus H)=\mathbb P(L)-\mathbb P(L\cap H)
$$
4. $(L\cup H)^c$ であるから
$$
\mathbb P(L^c\cap H^c)=1-\mathbb P(L\cup H)
$$
さらに
$$
\mathbb P(L^c\cap H^c)=1-\mathbb P(L)-\mathbb P(H)+\mathbb P(L\cap H)
$$
を得る。