0

二項分布の期待値と分散を冗長に導く

6
0
$$$$

実数$p$と自然数$n$$ n\in\mathbb N,\ 0< p<1 $ を満たすとする。確率空間$(\Omega,\mathcal F,\mathbb P)$上の確率変数$X:\Omega\to\mathbb R$
$$ \mathbb P(X=k)= \begin{cases} \binom{n}{k}p^k(1-p)^{n-k} & (k\in\{0,1,\dots,n\}) \\ 0 & (k\notin\{0,1,\dots,n\}) \end{cases} $$
を満たすとき、$X$は二項分布$Bin(n,p)$に従うといい
$$ X\sim Bin(n,p) $$
と表す。

$n\in\mathbb N$$0< p<1$を満たすとする。確率変数$X$が二項分布$Bin(n,p)$に従うとき
$$ \mathbb E[X]=np $$
が成り立つ。

$X$ の期待値 $\mathbb{E}[X]$$X$ が可積分、すなわち
$$ \mathbb{E}[|X|]<\infty $$
が成り立つときに定義される。そこで、まずは事象$\{X=k\}$を考える。

事象 $\{X=k\}$ の可測性

確率変数$X:\Omega\to\mathbb R$ とは、任意のボレル集合$B\in\mathcal B(\mathbb R)$に対して
$$ X^{-1}(B)\in\mathcal F $$
が成り立つことをいう。ここで$\{k\}$$\mathbb R$の閉集合であるからボレル集合であり、すなわち
$$ \{k\}\in\mathcal B(\mathbb R) $$
が成り立つ。従って各$k\in\mathbb R$に対して
$$ \{X=k\}=X^{-1}(\{k\})\in\mathcal F $$
が成り立つ。

事象$\{X=k\}$$k=0,1,\dots,n$で互いに素であるから、
$$ \begin{align} \mathbb P(X\in\{0,1,\dots,n\}) &=\mathbb P\Bigl(\bigcup_{k=0}^n\{X=k\}\Bigr)\\ &=\sum_{k=0}^n\mathbb P(X=k)\\ &=\sum_{k=0}^n\binom{n}{k}p^k(1-p)^{n-k}\\ &=(p+(1-p))^n\ \because\ \text{二項定理}\\ &=1 \end{align} $$
が成り立つ。従って$X$はほとんど確実に$\{0,1,\dots,n\}$に値をとる。特に$|X|\le n$がほとんど確実に成り立つ。

$\{X=k\}$$k=0,1,\dots,n$で互いに素である

二項分布$Bin(n,p)$において、$n$は試行回数を表すパラメータである。
一般に確率変数$X$は「$n$回の試行で成功した回数」を表し、取り得る値は
$$ 0,1,\dots,n $$
である。つまり$X$は常に$0$以上で、最大でも$n$までである。
$ $
また、$k\ne \ell$ならば同時に$X=k$かつ$X=\ell$は起こり得ないから
$$ \{X=k\}\cap\{X=\ell\}=\varnothing $$
が成り立つ。従って$\{X=k\}$$k=0,1,\dots,n$で互いに素である。

(期待値は確率変数に対して定義されるから) $n$を定数確率変数$n\cdot 1_\Omega$とみなし、両辺の期待値をとると
$$ \mathbb E[|X|]\le n\mathbb P(\Omega)=n<\infty $$
であるから、二項分布に従う確率変数$X$の期待値は有限実数として定義される。

定数確率変数$c\cdot 1_\Omega$の期待値

事象$A\in\mathcal F$に対し、その指示関数$1_A:\Omega\to\mathbb R$
$$ 1_A(\omega)= \begin{cases} 1 & (\omega\in A)\\ 0 & (\omega\notin A) \end{cases} $$
で定める。このとき$1_A$は非負の可測関数であり、さらに$0\le 1_A\le 1$より可積分である。
$1_A$$\{0,1\}$$2$値しかとらない単関数であるから、単関数の積分の定義より
$$ \mathbb E[1_A]=\int_\Omega 1_A\,d\mathbb P =1\cdot \mathbb P(A)+0\cdot \mathbb P(\Omega\setminus A) =\mathbb P(A) $$
が成り立つ。
$ $
今回の場合、定数$c\in\mathbb R$に対し、定数確率変数$c\cdot 1_\Omega:\Omega\to\mathbb R$を考えると、
$1_\Omega$$\Omega$の指示関数であり、任意の$\omega\in\Omega$に対して
$$ 1_\Omega(\omega)=1 $$
が成り立つ。$1_\Omega$は可積分であり、指示関数の期待値の性質(上記)より
$$ \mathbb E[1_\Omega]=\mathbb P(\Omega) $$
が成り立つ。特に$\mathbb P$は確率測度であるから$\mathbb P(\Omega)=1$であり、
$$ \mathbb E[1_\Omega]=1 $$
である。従って、期待値の線形性より
$$ \mathbb E[c\cdot 1_\Omega]=c\,\mathbb E[1_\Omega]=c\,\mathbb P(\Omega)=c $$
が成り立つ。

また、殆ど全ての$\omega$に対して$X(\omega)\in\{0,1,\dots,n\}$であるから、指示関数$1_{\{X=k\}}$を用いれば
$$ X(\omega)=\sum_{k=0}^n k\,1_{\{X=k\}}(\omega)\ \text{がほとんど確実に成り立つ} $$
が成り立つ。

実際、ある$k_0\in\{0,1,\dots,n\}$が存在して$X(\omega)=k_0$であり、このとき
$$ 1_{\{X=k\}}(\omega)= \begin{cases} 1 & (k=k_0)\\ 0 & (k\ne k_0) \end{cases} $$
であるから
$$ \sum_{k=0}^n k\,1_{\{X=k\}}(\omega)=k_0=X(\omega) $$
となる。

ゆえに、
$$ X=\sum_{k=0}^n k\,1_{\{X=k\}}\ \text{がほとんど確実に成り立つ} $$
であり、ここで各$\{X=k\}$は事象であり$1_{\{X=k\}}$は可積分である。

実際、$0\le 1_{\{X=k\}}\le 1$より
$$ \mathbb E[\,|1_{\{X=k\}}|\,]=\mathbb E[1_{\{X=k\}}]\le 1<\infty $$
である。

従って期待値の線形性を用いることができ、
$$ \mathbb E[X] =\mathbb E\Bigl[\sum_{k=0}^n k\,1_{\{X=k\}}\Bigr] =\sum_{k=0}^n k\,\mathbb E[1_{\{X=k\}}] $$
が成り立つ。さらに指示関数の期待値はその事象の確率に等しいから
$$ \mathbb E[1_{\{X=k\}}]=\mathbb P(\{X=k\})=\mathbb P(X=k) $$
である。ゆえに
$$ \mathbb E[X]=\sum_{k=0}^n k\,\mathbb P(X=k)\cdots① $$
が従う。
$ $
以上より、二項分布に従う確率変数$X$の期待値は有限であり、①より
$$ \begin{align} \mathbb E[X] &=\sum_{k=0}^n k\binom{n}{k}p^k(1-p)^{n-k} &&\because \mathbb P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}.\\ &=\sum_{k=1}^n k\binom{n}{k}p^k(1-p)^{n-k} &&\because k=0\ \text{の項は}\ 0.\\ &=\sum_{k=1}^n n\binom{n-1}{k-1}p^k(1-p)^{n-k} &&\because k\binom{n}{k}=n\binom{n-1}{k-1}.\\ &=np\sum_{k=1}^n \binom{n-1}{k-1}p^{k-1}(1-p)^{n-k} &&\because p^k=p\cdot p^{k-1}.\\ &=np\sum_{j=0}^{n-1}\binom{n-1}{j}p^{j}(1-p)^{(n-1)-j} &&\because j=k-1\ \text{とおく}.\\ &=np\,(p+(1-p))^{n-1} &&\because \text{二項定理}.\\ &=np &&\because p+(1-p)=1. \end{align} $$
を得る。
$$ \Box$$

上で用いた恒等式$k\binom{n}{k}=n\binom{n-1}{k-1}$を示す。$k\in\{1,2,\dots,n\}$に対し
$$ \begin{align} k\binom{n}{k} &=k\cdot\frac{n!}{k!(n-k)!} &&\because \binom{n}{k}=\frac{n!}{k!(n-k)!}\\ &=\frac{n!}{(k-1)!(n-k)!} &&\because \frac{k}{k!}=\frac{1}{(k-1)!}\\ &=n\cdot\frac{(n-1)!}{(k-1)!(n-k)!} &&\because n!=n\cdot(n-1)!\\ &=n\binom{n-1}{k-1} &&\because \binom{n-1}{k-1}=\frac{(n-1)!}{(k-1)!(n-k)!} \end{align} $$
$$ \Box$$

$n\in\mathbb N$$0< p<1$を満たし、さらに$n\ge2$とする。
確率変数$X$が二項分布$Bin(n,p)$に従う。すなわち
$$ \mathbb P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}\qquad(k=0,1,\dots,n) $$
が成り立つ。このとき確率変数$X$の分散は
$$ \mathbb V(X)=np(1-p) $$
で与えられる。

$X$ の期待値 $\mathbb{E}[X]$ は、$X$ が可積分、すなわち
$$ \mathbb{E}[|X|]<\infty $$
が成り立つときに定義される。そこで、$\{X=k\}$$k=0,1,\dots,n$で互いに素であるから
$$ \begin{align} \mathbb P(X\in\{0,1,\dots,n\}) &=\mathbb P\Bigl(\bigcup_{k=0}^n\{X=k\}\Bigr)\\ &=\sum_{k=0}^n\mathbb P(X=k)\\ &=\sum_{k=0}^n\binom{n}{k}p^k(1-p)^{n-k}\\ &=(p+(1-p))^n\\ &=1 \end{align} $$
が成り立つ。従って$X$はほとんど確実に$\{0,1,\dots,n\}$に値をとる。特に$|X|\le n$がほとんど確実に成り立つ。
$n$を定数確率変数$n\cdot 1_\Omega$とみなし、両辺の期待値をとると
$$ \mathbb E[|X|]\le n\mathbb P(\Omega)=n<\infty $$
であるから、$\mathbb E[X]$は有限実数として定義される。同様に$|X|\le n$から両辺を$2$乗して
$$ 0\le X^2\le n^2\ \text{がほとんど確実に成り立つ} $$
が分かる。従って再び単調性より
$$ \mathbb E[X^2]\le \mathbb E[n^2\cdot 1_\Omega]=n^2\mathbb P(\Omega)=n^2<\infty $$
が従う。以上より$\mathbb E[X]$$\mathbb E[X^2]$はいずれも有限である。
$ $
そこで、分散公式より
$$ \mathbb V(X)=\mathbb E[X^2]-\mathbb E[X]^2 $$
で与えられる事と
$$ \mathbb E[X]=np $$
が成り立つことを用いると、残りは$\mathbb E[X^2]$を求めればよい。
$X^2=X(X-1)+X$である事を利用して
$$ \mathbb E[X^2]=\mathbb E[X(X-1)]+\mathbb E[X] $$
が成り立つ。よって$\mathbb E[X(X-1)]$を求めればよい。定義より
$$ \mathbb E[X(X-1)]=\sum_{k=0}^n k(k-1)\binom{n}{k}p^k(1-p)^{n-k} $$
である。$k=0,1$の項は$0$なので
$$ \mathbb E[X(X-1)]=\sum_{k=2}^n k(k-1)\binom{n}{k}p^k(1-p)^{n-k} $$
となる。ここで恒等式
$$ k(k-1)\binom{n}{k}=n(n-1)\binom{n-2}{k-2} $$
を用いる。すると
$$ \begin{align} \mathbb E[X(X-1)] &=\sum_{k=2}^n n(n-1)\binom{n-2}{k-2}p^k(1-p)^{n-k}\\ &=n(n-1)p^2\sum_{k=2}^n \binom{n-2}{k-2}p^{k-2}(1-p)^{n-k}\\ &=n(n-1)p^2\sum_{j=0}^{n-2}\binom{n-2}{j}p^{j}(1-p)^{(n-2)-j} \because j=k-2\ \text{とおく}.\\ &=n(n-1)p^2(p+(1-p))^{n-2} \because \text{二項定理}.\\ &=n(n-1)p^2 \because p+(1-p)=1. \end{align} $$
従って
$$ \mathbb E[X^2]=\mathbb E[X(X-1)]+\mathbb E[X]=n(n-1)p^2+np $$
である。よって
$$ \begin{align} \mathbb V(X) &=\mathbb E[X^2]-\mathbb E[X]^2\\ &=\bigl(n(n-1)p^2+np\bigr)-(np)^2\\ &=np+n(n-1)p^2-n^2p^2\\ &=np-np^2\\ &=np(1-p). \end{align} $$
以上より$\mathbb V(X)=np(1-p)$が成り立つ。
$$ \Box$$

上で用いた恒等式$k(k-1)\binom{n}{k}=n(n-1)\binom{n-2}{k-2}$を示す。$k\in\{2,3,\dots,n\}$に対し
$$ \begin{align} k(k-1)\binom{n}{k} &=k(k-1)\cdot\frac{n!}{k!(n-k)!} \because \binom{n}{k}=\frac{n!}{k!(n-k)!}.\\ &=\frac{n!}{(k-2)!(n-k)!} \because \frac{k(k-1)}{k!}=\frac{1}{(k-2)!}.\\ &=n(n-1)\cdot\frac{(n-2)!}{(k-2)!(n-k)!} \because n!=n(n-1)(n-2)!.\\ &=n(n-1)\binom{n-2}{k-2} \because \binom{n-2}{k-2}=\frac{(n-2)!}{(k-2)!(n-k)!}. \end{align} $$

二項分布 $ Bin(n, p) $ に従う確率変数 $ X $ の標準偏差$s$は、
$$ \sqrt{np(1 - p)} $$
である。既に示した通り、二項分布 $ Bin(n, p) $ に従う確率変数 $ X $ の分散は、
$$ \mathbb{V}(X) = np(1 - p) $$
である、ここで標準偏差$s$
$$ s:=\sqrt{\mathbb{V}(X)} $$
で定義されるから、二項分布 $ Bin(n, p) $ に従う確率変数 $ X $ の標準偏差$s$は、
$$ s=\sqrt{\mathbb{V}(X)}=\sqrt{np(1 - p)} $$
である。

投稿日:4時間前
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

昨年作成したノートを、内容の確認が取れたものから順次公開していきます。公開順は特に定めていません。命題の主張や証明に誤りがありましたら、ご指摘いただけますと幸いです。 ■ 本人確認用の文字列:技製ダ3蓄エ労生6現

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中