確率空間 $(\Omega,\mathcal F,\mathbb{P})$ において、任意の事象 $A,B,C\in\mathcal F$ に対して
$$
\mathbb{P}(A\cup B\cup C)\le \mathbb{P}(A)+\mathbb{P}(B)+\mathbb{P}(C)
$$
が成り立つ。
すでに示した $2$つの事象に対する加法公式(
証明はこちら
)を、事象 $A\cup B$ と $C$ に適用すると
$$
\mathbb{P}(A\cup B\cup C)=\mathbb{P}(A\cup B)+\mathbb{P}(C)-\mathbb{P}((A\cup B)\cap C)
$$
を得る。
ここで、確率は常に $0$ 以上であるから
$$
\mathbb{P}((A\cup B)\cap C)\ge 0
$$
であり、したがって
$$
\mathbb{P}(A\cup B\cup C)\le \mathbb{P}(A\cup B)+\mathbb{P}(C)
$$
が成り立つ。
さらに、再び $2$つの事象に対する加法公式を $A,B$ に適用すると
$$
\mathbb{P}(A\cup B)=\mathbb{P}(A)+\mathbb{P}(B)-\mathbb{P}(A\cap B)
$$
である。ここで $\mathbb{P}(A\cap B)\ge 0$ であるから
$$
\mathbb{P}(A\cup B)\le \mathbb{P}(A)+\mathbb{P}(B)
$$
を得る。以上より
$$
\mathbb{P}(A\cup B\cup C)\le \mathbb{P}(A\cup B)+\mathbb{P}(C)\le \mathbb{P}(A)+\mathbb{P}(B)+\mathbb{P}(C)
$$
が従う。
$$ \Box$$
$3$つの事象 $A, B, C$ が互いに排反であるとき、
$$
\mathbb{P}(A \cup B \cup C) = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C)
$$
が成り立つ。
$ $
実際、有限個の事象の和集合の確率を求めるにあたって、包除原理を用いると、
$$
\mathbb{P}(A \cup B \cup C) = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C) - \mathbb{P}(A \cap B) - \mathbb{P}(A \cap C) - \mathbb{P}(B \cap C) + \mathbb{P}(A \cap B \cap C)
$$
という式が成り立つ。しかし、ここで事象 $A, B, C$ が排反であるため、
交差部分の確率は全て$0$となる。すなわち、
$$
\mathbb{P}(A \cap B) = \mathbb{P}(A \cap C) = \mathbb{P}(B \cap C) = \mathbb{P}(A \cap B \cap C) = 0
$$
が成り立つ。これらを上の式に代入すると、
$$
\mathbb{P}(A \cup B \cup C) = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C) - 0 - 0 - 0 + 0 = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C)
$$
となる。したがって、$3$つの排反事象 $A, B, C$ に対して、
$$
\mathbb{P}(A \cup B \cup C) = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C)
$$
が成り立つ。
証明の中で $A\cup B\in\mathcal F$ および $(A\cup B)\cap C\in\mathcal F$ である事を暗に使っている。
これは $\mathcal F$ が有限和と有限共通部分において閉じていることから正当化される。
この命題は実質的に有限個の場合の Boole の不等式である、
確率空間 $(\Omega,\mathcal F,\mathbb{P})$ において、$A,B,C\in\mathcal F$ とする。このとき
$$
\mathbb{P}(A\cap B\cap C)\ge 1-\mathbb{P}(A^c)-\mathbb{P}(B^c)-\mathbb{P}(C^c)
$$
が成り立つ。
ド・モルガンの法則より
$$
(A\cap B\cap C)^c=A^c\cup B^c\cup C^c
$$
である。
したがって、補集合の確率公式(
証明はこちら
)より
$$
\mathbb{P}(A\cap B\cap C)
=
1-\mathbb{P}\bigl((A\cap B\cap C)^c\bigr)
=
1-\mathbb{P}(A^c\cup B^c\cup C^c)
$$
が成り立つ。
ここで、和集合に対する不等式
$$
\mathbb{P}(X\cup Y\cup Z)\le \mathbb{P}(X)+\mathbb{P}(Y)+\mathbb{P}(Z)
$$
を $X=A^c,\ Y=B^c,\ Z=C^c$ に適用すると
$$
\mathbb{P}(A^c\cup B^c\cup C^c)\le \mathbb{P}(A^c)+\mathbb{P}(B^c)+\mathbb{P}(C^c)
$$
を得る。
よって
$$
\mathbb{P}(A\cap B\cap C)
=
1-\mathbb{P}(A^c\cup B^c\cup C^c)
\ge
1-\bigl(\mathbb{P}(A^c)+\mathbb{P}(B^c)+\mathbb{P}(C^c)\bigr)
$$
である。したがって
$$
\mathbb{P}(A\cap B\cap C)\ge 1-\mathbb{P}(A^c)-\mathbb{P}(B^c)-\mathbb{P}(C^c)
$$
が成り立つ。
$$ \Box$$
確率空間 $(\Omega,\mathcal F,\mathbb{P})$ において、次が成り立つ。
任意の $n\in\mathbb N$ と任意の事象 $A_1,\dots,A_n\in\mathcal F$ に対して
$$
\mathbb{P}\Bigl(\bigcup_{i=1}^n A_i\Bigr)\le \sum_{i=1}^n \mathbb{P}(A_i)
$$
が成り立つ。
$n\in\mathbb N$ に関する数学的帰納法を用いる。
-よって、数学的帰納法により、任意の $n\in\mathbb N$ と任意の事象 $A_1,\dots,A_n\in\mathcal F$ に対して
$$
\mathbb{P}\Bigl(\bigcup_{i=1}^{n} A_i\Bigr)\le \sum_{i=1}^{n} \mathbb{P}(A_i)
$$
が成り立つ。
$$ \Box$$
帰納法の途中で $\bigcup_{i=1}^k A_i\in\mathcal F$ であることを暗に使っている。
これは、$\sigma$-代数が可算和に閉じているので、特に有限和にも閉じていることから正当化される。
ある監視システムでは、$3$ 種類のアラートを出す。
$\Omega$ を $1$ 時点のシステム状態に関する標本空間とし、
$$
\begin{align}
E_1:&=\text{「通信異常アラートが出る」}\\
E_2:&=\text{「性能劣化アラートが出る」}\\
E_3:&=\text{「セキュリティ異常アラートが出る」}
\end{align}
$$
とする。さらに、$E_1,E_2,E_3$ は互いに素であり、
$$
E_1\cup E_2\cup E_3=\text{「何らかのアラートが出る」}
$$
とする。
このとき、「何らかのアラートが出る」事象の確率を $\mathbb P(E_1)$、$\mathbb P(E_2)$、$\mathbb P(E_3)$ を用いて表せ。
$ $
$E_1,E_2,E_3$ は互いに素であるから、有限加法性より
$$
\mathbb P(E_1\cup E_2\cup E_3)=\mathbb P(E_1)+\mathbb P(E_2)+\mathbb P(E_3)
$$
である。
ある推薦システムの評価で、ユーザーを次の $3$ 群に分けて考える。
$$
\begin{align}
S_1:&=\text{「新規ユーザー群に属する」}\\
S_2:&=\text{「休眠復帰ユーザー群に属する」}\\
S_3:&=\text{「既存アクティブユーザー群に属する」}
\end{align}
$$
これらは互いに素であり、
$$
S_1\cup S_2\cup S_3=\Omega
$$
を満たすとする。また、$R$ を「推薦枠をクリックした」という事象とする。
このとき、$R$ を $S_1,S_2,S_3$ に沿って分割し、$\mathbb P(R)$ を $\mathbb P(R\cap S_1)$、$\mathbb P(R\cap S_2)$、$\mathbb P(R\cap S_3)$ を用いて表せ。
$ $
まず
$$
R=R\cap\Omega
$$
であり、
$$
\Omega=S_1\cup S_2\cup S_3
$$
だから
$$
R=R\cap(S_1\cup S_2\cup S_3)
$$
分配法則より
$$
R=(R\cap S_1)\cup(R\cap S_2)\cup(R\cap S_3)
$$
を得る。さらに、$S_1,S_2,S_3$ は互いに素であるから、
$$
R\cap S_1,\qquad R\cap S_2,\qquad R\cap S_3
$$
も互いに素である。したがって
$$
\mathbb P(R)=\mathbb P(R\cap S_1)+\mathbb P(R\cap S_2)+\mathbb P(R\cap S_3)
$$
である。
製造ラインで、ある製品が不合格になる理由を次の $2$ つに分けて管理している。
$$
M:=\text{「機械加工に起因する不良」},\qquad
V:=\text{「画像検査で検出される外観不良」}
$$
このとき、現場から「不合格率は、機械加工不良率と外観不良率を足せばよいのではないか」という意見が出た。
この意見が一般にはそのまま正しくない理由を、確率の式で表せ。
$ $
一般には $M$ と $V$ は重なりうる。
すなわち、同じ製品が「機械加工に起因する不良」でもあり、同時に「画像検査で検出される外観不良」でもある場合がある。
したがって、不合格事象を $M\cup V$ とすると、その確率は単純に
$$
\mathbb P(M)+\mathbb P(V)
$$
ではなく、包除公式により
$$
\mathbb P(M\cup V)=\mathbb P(M)+\mathbb P(V)-\mathbb P(M\cap V)
$$
で表す必要がある。
つまり、単純な和では重複部分 $\mathbb P(M\cap V)$ を二重に数えてしまうため、そのままでは正しくない。
データ品質監視で、次の $2$ つの異常を考える。
$$
N:=\text{「null 値比率の異常がある」},\qquad
D:=\text{「分布ドリフトの異常がある」}
$$
運用担当者は「少なくとも $1$ つ異常があれば通知したい」と考えている。
通知対象事象を式で表し、その確率を $\mathbb P(N)$、$\mathbb P(D)$、$\mathbb P(N\cap D)$ を用いて表せ。
また、「どちらの異常もない」事象の確率も表せ。
$ $
通知対象事象は
$$
N\cup D
$$
である。その確率は包除公式より
$$
\mathbb P(N\cup D)=\mathbb P(N)+\mathbb P(D)-\mathbb P(N\cap D)
$$
である。また、「どちらの異常もない」事象は
$$
(N\cup D)^c=N^c\cap D^c
$$
であるから
$$
\mathbb P(N^c\cap D^c)=1-\mathbb P(N\cup D)
$$
したがって
$$
\mathbb P(N^c\cap D^c)=1-\mathbb P(N)-\mathbb P(D)+\mathbb P(N\cap D)
$$
である。
ある分析チームが、$1$ 件のユーザー行動ログについて、次の $3$ つの事象を考えている。
$$
A:=\text{「広告をクリックした」},\qquad
B:=\text{「商品詳細ページを見た」},\qquad
C:=\text{「購入した」}
$$
「広告をクリックした、または商品詳細ページを見た。ただし購入はしていない」という事象を、
包除公式が使いやすい形に変形し、その確率を式で表せ。
$ $
求める事象は
$$
(A\cup B)\cap C^c
$$
である。
分配法則により
$$
(A\cup B)\cap C^c=(A\cap C^c)\cup(B\cap C^c)
$$
と書ける。したがって、包除公式より
$$
\mathbb P((A\cup B)\cap C^c)=
\mathbb P(A\cap C^c)+\mathbb P(B\cap C^c)-\mathbb P(A\cap B\cap C^c)
$$
である。