0

確率空間 ③

12
0
$$$$

Introduction

Def.

条件付き確率

確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、事象 $A,B\in\mathcal F$ をとる。
$\mathbb P(A)>0$ のとき、$A$ を条件とする $B$ の条件付き確率 $\mathbb P(B\mid A)$
$$ \mathbb P(B\mid A):=\frac{\mathbb P(A\cap B)}{\mathbb P(A)} $$
で定める。

$\mathbb P(A)=0$ のとき、上の式の分母が $0$ になるので、この式によっては $\mathbb P(B\mid A)$ は定義されない。

$\mathbb P(A)>0$ のもとで、定義より
$$ \mathbb P(A\cap B)=\mathbb P(A)\,\mathbb P(B\mid A) $$
が成り立つ。

Prop & Proof

確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B,C\in\mathcal F$ とする。
さらに
$$ \mathbb P(B\cap C)>0 $$
と仮定する。このとき
$$ \mathbb P(A\cap B\cap C) = \mathbb P(A\mid B\cap C)\,\mathbb P(B\mid C)\,\mathbb P(C) $$
が成り立つ。

$\mathbb P(B\cap C)>0$ であるから、単調性( 詳しくはリンク先の命題④ )より
$$ 0<\mathbb P(B\cap C)\le \mathbb P(C) $$
であり、したがって
$$ \mathbb P(C)>0 $$
である。よって、条件付き確率の定義により
$$ \mathbb P(A\mid B\cap C)=\frac{\mathbb P(A\cap B\cap C)}{\mathbb P(B\cap C)} $$
および
$$ \mathbb P(B\mid C)=\frac{\mathbb P(B\cap C)}{\mathbb P(C)} $$
が成り立つ。したがって
$$ \begin{align} \mathbb P(A\mid B\cap C)\,\mathbb P(B\mid C)\,\mathbb P(C) &= \frac{\mathbb P(A\cap B\cap C)}{\mathbb P(B\cap C)} \cdot \frac{\mathbb P(B\cap C)}{\mathbb P(C)} \cdot \mathbb P(C) \\ &= \mathbb P(A\cap B\cap C) \end{align} $$
となる。ゆえに
$$ \mathbb P(A\cap B\cap C) = \mathbb P(A\mid B\cap C)\,\mathbb P(B\mid C)\,\mathbb P(C) $$
が成り立つ。
$$ \Box$$

ベイズの定理

確率空間 $(\Omega,\mathcal F,\mathbb P)$ において、$A,B\in\mathcal F$ とする。また、$\mathbb{P}(A)>0$かつ$\mathbb{P}(B)>0$を仮定する。
このとき
$$ \mathbb{P}(A\mid B)=\frac{\mathbb{P}(B\mid A)\,\mathbb{P}(A)}{\mathbb{P}(B)} $$
が成り立つ。

条件つき確率の定義より
$$ \begin{align} \mathbb{P}(A\mid B)&=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)} \ \because\ \mathbb{P}(B)>0\text{である。} \\ \mathbb{P}(B\mid A)&=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(A)} \ \because\ \mathbb{P}(A)>0\text{である。} \end{align} $$
よって
$$ \begin{align} \mathbb{P}(A\cap B) &=\mathbb{P}(B\mid A)\,\mathbb{P}(A) \ \because\ \mathbb{P}(B\mid A)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(A)}\text{である。} \end{align} $$
これを$\mathbb{P}(A\mid B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}$に代入して
$$ \begin{align} \mathbb{P}(A\mid B) &=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)} \\ &=\frac{\mathbb{P}(B\mid A)\,\mathbb{P}(A)}{\mathbb{P}(B)} \end{align} $$
を得る。
$$ \Box$$

全確率の公式

$A,B_1,\dots,B_n$を事象とする。$B_1,\dots,B_n$は互いに排反であり、
$$ \bigcup_{i=1}^n B_i=\Omega $$
を満たすとする。さらに、すべての$i$について$\mathbb{P}(B_i)>0$を仮定する。このとき、
$$ \mathbb{P}(A)=\sum_{i=1}^n \mathbb{P}(A\mid B_i)\,\mathbb{P}(B_i) $$
が成り立つ。

$\bigcup_{i=1}^n B_i=\Omega$より
$$ \begin{align} A &=A\cap\Omega\quad &&\because\ A\in\mathcal F\subseteq \mathcal P(\Omega)\text{ であるから }A\subseteq\Omega\\ &=A\cap\left(\bigcup_{i=1}^n B_i\right)\quad &&\because\ \bigcup_{i=1}^n B_i=\Omega\\ &=\bigcup_{i=1}^n\left(A\cap B_i\right)\quad &&\because\ \text{分配法則}\ A\cap\left(\bigcup_{i=1}^n B_i\right)=\bigcup_{i=1}^n(A\cap B_i) \end{align} $$
である。$B_i$は互いに排反なので、$A\cap B_i$も互いに排反である。

実際、$i\ne j$とする。すると
$$ \begin{align} (A\cap B_i)\cap(A\cap B_j) &=A\cap A\cap B_i\cap B_j \\ &=A\cap(B_i\cap B_j) \\ &=\varnothing \ \because\ B_i\cap B_j=\varnothing \end{align} $$
よって$i\ne j$ならば$(A\cap B_i)\cap(A\cap B_j)=\varnothing$であるから、$A\cap B_i$は互いに排反である。

したがって、
$$ \begin{align} A=\bigcup_{i=1}^n\left(A\cap B_i\right)\quad \end{align} $$
であるが、ここで確率の有限加法性より
$$ \begin{align} \mathbb{P}(A) &=\mathbb{P}\!\left(\bigcup_{i=1}^n(A\cap B_i)\right)\\ &=\sum_{i=1}^n \mathbb{P}(A\cap B_i)\ \because \text{有限加法性} \end{align} $$
が成り立つ。
$ $
$i$について$\mathbb{P}(B_i)>0$なので、条件つき確率の定義より
$$ \mathbb{P}(A\mid B_i)=\frac{\mathbb{P}(A\cap B_i)}{\mathbb{P}(B_i)} $$
であり、よって
$$ \mathbb{P}(A\cap B_i)=\mathbb{P}(A\mid B_i)\,\mathbb{P}(B_i) $$
が成り立つ。これを代入して
$$ \mathbb{P}(A)=\sum_{i=1}^n \mathbb{P}(A\mid B_i)\,\mathbb{P}(B_i) $$
を得る。
$$ \Box$$

ここで、$A_1,\dots,A_n$ が互いに排反であり、
$$ \bigcup_{i=1}^n A_i=\Omega $$
を満たし、さらに各 $i$ について $\mathbb P(A_i)>0$、および $\mathbb P(B)>0$ を仮定する。
このとき、ベイズの定理より
$$ \mathbb P(A_k\mid B)=\frac{\mathbb P(B\mid A_k),\mathbb P(A_k)}{\mathbb P(B)} $$
が成り立つ。一方、全確率の公式を事象 $B$ と分割 $A_1,\dots,A_n$ に適用すると
$$ \mathbb P(B)=\sum_{i=1}^n \mathbb P(B\mid A_i),\mathbb P(A_i) $$
を得る。したがって、この式を上の分母 $\mathbb P(B)$ に代入すれば
$$ \mathbb P(A_k\mid B)=\frac{\mathbb P(B\mid A_k),\mathbb P(A_k)}{\sum_{i=1}^n \mathbb P(B\mid A_i),\mathbb P(A_i)} $$
となる。すなわち、これはベイズの定理の分母 $\mathbb P(B)$ を、全確率の公式によって書き換えた形である。

Modeling

ある決済サービスで不正検知モデルを運用している。
$\Omega$$1$ 件の取引に関する標本空間とし、次の事象を考える。
$$ F:=\text{「その取引は実際に不正である」},\qquad H:=\text{「モデルがその取引を高リスクと判定する」} $$
$\mathbb P(F)>0$ かつ $\mathbb P(H)>0$ とするとき、次を式で表せ。
$1$. 実際に不正な取引が高リスクと判定される確率
$2$. 「実際に不正であり、かつ高リスクと判定される」確率
$3$. 高リスクと判定された取引が実際に不正である確率
$4$. 実際には不正だが、高リスクと判定されない確率

$ $

模範解答(クリック)


1. 条件付き確率そのものであるから
$$ \mathbb P(H\mid F) $$
である。
2. 条件付き確率の定義より
$$ \mathbb P(F\cap H)=\mathbb P(H\mid F)\mathbb P(F) $$
である。
3. ベイズの定理より
$$ \mathbb P(F\mid H)=\frac{\mathbb P(H\mid F)\mathbb P(F)}{\mathbb P(H)} $$
である。
4. この問では、
$$ F=(F\cap H)\cup(F\cap H^c) $$
かつ右辺は互いに排反であるから
$$ \mathbb P(F\cap H^c)=\mathbb P(F)-\mathbb P(F\cap H) $$
よって
$$ \mathbb P(F\cap H^c)=\mathbb P(F)-\mathbb P(H\mid F)\mathbb P(F) $$
である。


$ $

ある工場で設備の予知保全モデルを運用している。
$\Omega$$1$ 回の監視期間に関する標本空間とし、次の事象を考える。
$$ \begin{align} V:&=\text{「振動異常が検知される」}\\ T:&=\text{「温度異常が検知される」}\\ B:&=\text{「その後 $24$ 時間以内に設備停止が発生する」} \end{align} $$
$\mathbb P(V)>0$ かつ $\mathbb P(V\cap T)>0$ とするとき、次を式で表せ。
$1$. 振動異常と温度異常がともに起こり、さらにその後に設備停止が発生する確率
$2$. 振動異常が起きた条件のもとで、温度異常も起き、さらに設備停止も発生する確率

$ $

模範解答(クリック)


1. $3$つの 事象の積の分解より
$$ \mathbb P(B\cap T\cap V)=\mathbb P(B\mid T\cap V)\mathbb P(T\mid V)\mathbb P(V) $$
である。
2. 条件を $V$ に固定すると
$$ \mathbb P(B\cap T\mid V)=\frac{\mathbb P(B\cap T\cap V)}{\mathbb P(V)} $$
であり、上の式を代入して
$$ \mathbb P(B\cap T\mid V)=\mathbb P(B\mid T\cap V)\mathbb P(T\mid V) $$
である。


$ $

あるサブスクリプションサービスで離反予測を行っている。
顧客を次の $3$ 群に分ける。
$$ \begin{align} S_1:&=\text{「新規顧客」}\\ S_2:&=\text{「継続利用中の一般顧客」}\\ S_3:&=\text{「休眠傾向のある顧客」} \end{align} $$
これらは互いに排反であり、
$$ S_1\cup S_2\cup S_3=\Omega $$
を満たすとする。また
$$ L:=\text{「翌月に離反する」} $$
とする。各 $i=1,2,3$ について $\mathbb P(S_i)>0$ とする。
$1$. このとき、全体の離反確率 $\mathbb P(L)$ を、各セグメントごとの離反確率とセグメント比率を用いて表せ。
$2$. また、ある顧客が実際に翌月離反したことが分かったとする。
  このとき、その顧客が $S_3$、すなわち「休眠傾向のある顧客」であった確率を式で表せ。
  ただし $\mathbb P(L)>0$ とする。

$ $

模範解答(クリック)


1. 全確率の公式より
$$ \mathbb P(L) = \mathbb P(L\mid S_1)\mathbb P(S_1) + \mathbb P(L\mid S_2)\mathbb P(S_2) + \mathbb P(L\mid S_3)\mathbb P(S_3) $$
である。
2. ベイズの定理より
$$ \mathbb P(S_3\mid L) = \frac{\mathbb P(L\mid S_3)\mathbb P(S_3)}{\mathbb P(L)} $$
である。さらに、1. の全確率の公式を分母に代入すると
$$ \mathbb P(S_3\mid L) = \frac{\mathbb P(L\mid S_3)\mathbb P(S_3)} {\mathbb P(L\mid S_1)\mathbb P(S_1)+\mathbb P(L\mid S_2)\mathbb P(S_2)+\mathbb P(L\mid S_3)\mathbb P(S_3)} $$
である。


$ $

あるWebサービスでレコメンドUIの A/B テストを行っている。
$$ G_A:=\text{「ユーザーが $A$ 案に割り当てられる」},\qquad G_B:=\text{「ユーザーが $B$ 案に割り当てられる」} $$
とし、$G_A$$G_B$ は互いに排反で、
$$ G_A\cup G_B=\Omega $$
を満たすとする。また
$$ C:=\text{「そのユーザーがコンバージョンする」} $$
とする。$\mathbb P(G_A)>0$$\mathbb P(G_B)>0$$\mathbb P(C)>0$ とする。次を式で表せ。
$1$. 全体のコンバージョン確率
$2$. コンバージョンしたユーザーが $B$ 案に割り当てられていた確率

$ $

模範解答(クリック)


1. 全確率の公式より
$$ \mathbb P(C)=\mathbb P(C\mid G_A)\mathbb P(G_A)+\mathbb P(C\mid G_B)\mathbb P(G_B) $$
である。
2. ベイズの定理より
$$ \mathbb P(G_B\mid C)=\frac{\mathbb P(C\mid G_B)\mathbb P(G_B)}{\mathbb P(C)} $$
さらに 1. の式を用いれば
$$ \mathbb P(G_B\mid C) = \frac{\mathbb P(C\mid G_B)\mathbb P(G_B)} {\mathbb P(C\mid G_A)\mathbb P(G_A)+\mathbb P(C\mid G_B)\mathbb P(G_B)} $$
である。


$ $

ある画像検査システムで、不良品アラートの原因を次の $3$ 種類に分類している。
$$ \begin{align} R_1:&=\text{「照明条件の変動による誤反応」}\\ R_2:&=\text{「撮像位置ずれによる誤反応」}\\ R_3:&=\text{「実際の外観不良」} \end{align} $$
$R_1,R_2,R_3$ は互いに排反であり、
$$ R_1\cup R_2\cup R_3=\Omega $$
を満たすとする。また
$$ A:=\text{「検査システムがアラートを出す」} $$
とする。各 $i=1,2,3$ について $\mathbb P(R_i)>0$、さらに $\mathbb P(A)>0$ とする。
次を式で表せ。
$1$. システムがアラートを出す全体確率
$2$. アラートが出たとき、その原因が実際の外観不良である確率

$ $

模範解答(クリック)


1. 全確率の公式より
$$ \mathbb P(A) = \mathbb P(A\mid R_1)\mathbb P(R_1) + \mathbb P(A\mid R_2)\mathbb P(R_2) + \mathbb P(A\mid R_3)\mathbb P(R_3) $$
である。
2. ベイズの定理より
$$ \mathbb P(R_3\mid A)=\frac{\mathbb P(A\mid R_3)\mathbb P(R_3)}{\mathbb P(A)} $$
したがって、1. の式を用いると
$$ \mathbb P(R_3\mid A) = \frac{\mathbb P(A\mid R_3)\mathbb P(R_3)} {\mathbb P(A\mid R_1)\mathbb P(R_1)+\mathbb P(A\mid R_2)\mathbb P(R_2)+\mathbb P(A\mid R_3)\mathbb P(R_3)} $$
である。


$ $

ある広告配信の分析で、$1$ 人のユーザーについて次の事象を考える。
$$ \begin{align} I:&=\text{「広告が表示される」}\\ K:&=\text{「広告がクリックされる」}\\ P:&=\text{「最終的に購入する」} \end{align} $$
$\mathbb P(I)>0$ かつ $\mathbb P(I\cap K)>0$ とする。次を式で表せ。
$1$. 広告が表示され、クリックされ、さらに購入まで至る確率
$2$. 広告が表示されたという条件のもとで、クリックされ、さらに購入まで至る確率

$ $

模範解答(クリック)


1. $3$つの事象の積の分解より
$$ \mathbb P(P\cap K\cap I)=\mathbb P(P\mid K\cap I)\mathbb P(K\mid I)\mathbb P(I) $$
である。
2. 条件付き確率の定義より
$$ \mathbb P(P\cap K\mid I)=\frac{\mathbb P(P\cap K\cap I)}{\mathbb P(I)} $$
したがって 1. の式を代入して
$$ \mathbb P(P\cap K\mid I)=\mathbb P(P\mid K\cap I)\mathbb P(K\mid I) $$
である。


$ $

あるSaaSプロダクトで、障害アラートの発生源を次の $3$ つに分類している。
$$ \begin{align} M_1:&=\text{「アプリケーション層の異常」}\\ M_2:&=\text{「データベース層の異常」}\\ M_3:&=\text{「外部連携APIの異常」} \end{align} $$
これらは互いに排反であり、
$$ M_1\cup M_2\cup M_3=\Omega $$
を満たすとする。また
$$ N:=\text{「ユーザー影響を伴う重大アラートになる」} $$
とする。各 $i=1,2,3$ について $\mathbb P(M_i)>0$ とする。
次を式で表せ。
$1$. 重大アラートの全体確率
$2$. 重大アラートが起きたとき、その原因がデータベース層の異常である確率

$ $

模範解答(クリック)


1. 全確率の公式より
$$ \mathbb P(N) = \mathbb P(N\mid M_1)\mathbb P(M_1) + \mathbb P(N\mid M_2)\mathbb P(M_2) + \mathbb P(N\mid M_3)\mathbb P(M_3) $$
である。
2. ベイズの定理より
$$ \mathbb P(M_2\mid N)=\frac{\mathbb P(N\mid M_2)\mathbb P(M_2)}{\mathbb P(N)} $$
したがって
$$ \mathbb P(M_2\mid N) = \frac{\mathbb P(N\mid M_2)\mathbb P(M_2)} {\mathbb P(N\mid M_1)\mathbb P(M_1)+\mathbb P(N\mid M_2)\mathbb P(M_2)+\mathbb P(N\mid M_3)\mathbb P(M_3)} $$
である。


$ $

ある製造ラインで、ある加工品が最終的に不合格になる原因を次の $3$ つに分類している。
$$ \begin{align} Q_1:&=\text{「加工条件の不適切さによる不良」}\\ Q_2:&=\text{「工具摩耗による不良」}\\ Q_3:&=\text{「素材起因の不良」} \end{align} $$
これらは互いに排反であり、
$$ Q_1\cup Q_2\cup Q_3=\Omega $$
を満たすとする。また
$$ D:=\text{「最終検査で不合格になる」} $$
とする。各 $i=1,2,3$ について $\mathbb P(Q_i)>0$、さらに $\mathbb P(D)>0$ とする。次を式で表せ。
$1$. 不合格率 $\mathbb P(D)$
$2$. 不合格品が工具摩耗起因である確率

$ $

模範解答(クリック)


1. 全確率の公式より
$$ \mathbb P(D) = \mathbb P(D\mid Q_1)\mathbb P(Q_1) + \mathbb P(D\mid Q_2)\mathbb P(Q_2) + \mathbb P(D\mid Q_3)\mathbb P(Q_3) $$
である。
2. ベイズの定理より
$$ \mathbb P(Q_2\mid D)=\frac{\mathbb P(D\mid Q_2)\mathbb P(Q_2)}{\mathbb P(D)} $$
したがって
$$ \mathbb P(Q_2\mid D) = \frac{\mathbb P(D\mid Q_2)\mathbb P(Q_2)} {\mathbb P(D\mid Q_1)\mathbb P(Q_1)+\mathbb P(D\mid Q_2)\mathbb P(Q_2)+\mathbb P(D\mid Q_3)\mathbb P(Q_3)} $$
である。


$ $

投稿日:7日前
更新日:7日前
数学の力で現場を変える アルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

分野を問わず数学の証明が好きで、不定期に過去のノートも含めて更新しています。あとで自分が読み返してもきちんと理解できるノートを作ることを心がけています。定義や証明、命題などに誤りがございましたら、ご指摘いただけますと幸いです(2025年12月28日)。

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中