実数$p$と自然数$n$が $ n\in\mathbb N,\ 0< p<1 $ を満たすとする。確率空間$(\Omega,\mathcal F,\mathbb P)$上の確率変数$X:\Omega\to\mathbb R$が
$$
\mathbb P(X=k)=
\begin{cases}
\binom{n}{k}p^k(1-p)^{n-k} & (k\in\{0,1,\dots,n\}) \\
0 & (k\notin\{0,1,\dots,n\})
\end{cases}
$$
を満たすとき、$X$は二項分布$Bin(n,p)$に従うといい
$$
X\sim Bin(n,p)
$$
と表す。
$n\in\mathbb N$と$0< p<1$を満たすとする。確率変数$X$が二項分布$Bin(n,p)$に従うとき
$$
\mathbb E[X]=np
$$
が成り立つ。
$X$ の期待値 $\mathbb{E}[X]$ は $X$ が可積分、すなわち
$$
\mathbb{E}[|X|]<\infty
$$
が成り立つときに定義される。そこで、まずは事象$\{X=k\}$を考える。
確率変数$X:\Omega\to\mathbb R$ とは、任意のボレル集合$B\in\mathcal B(\mathbb R)$に対して
$$
X^{-1}(B)\in\mathcal F
$$
が成り立つことをいう。ここで$\{k\}$は$\mathbb R$の閉集合であるからボレル集合であり、すなわち
$$
\{k\}\in\mathcal B(\mathbb R)
$$
が成り立つ。従って各$k\in\mathbb R$に対して
$$
\{X=k\}=X^{-1}(\{k\})\in\mathcal F
$$
が成り立つ。
事象$\{X=k\}$は$k=0,1,\dots,n$で互いに素であるから、
$$
\begin{align}
\mathbb P(X\in\{0,1,\dots,n\})
&=\mathbb P\Bigl(\bigcup_{k=0}^n\{X=k\}\Bigr)\\
&=\sum_{k=0}^n\mathbb P(X=k)\\
&=\sum_{k=0}^n\binom{n}{k}p^k(1-p)^{n-k}\\
&=(p+(1-p))^n\ \because\ \text{二項定理}\\
&=1
\end{align}
$$
が成り立つ。従って$X$はほとんど確実に$\{0,1,\dots,n\}$に値をとる。特に$|X|\le n$がほとんど確実に成り立つ。
二項分布$Bin(n,p)$において、$n$は試行回数を表すパラメータである。
一般に確率変数$X$は「$n$回の試行で成功した回数」を表し、取り得る値は
$$
0,1,\dots,n
$$
である。つまり$X$は常に$0$以上で、最大でも$n$までである。
$ $
また、$k\ne \ell$ならば同時に$X=k$かつ$X=\ell$は起こり得ないから
$$
\{X=k\}\cap\{X=\ell\}=\varnothing
$$
が成り立つ。従って$\{X=k\}$は$k=0,1,\dots,n$で互いに素である。
(期待値は確率変数に対して定義されるから) $n$を定数確率変数$n\cdot 1_\Omega$とみなし、両辺の期待値をとると
$$
\mathbb E[|X|]\le n\mathbb P(\Omega)=n<\infty
$$
であるから、二項分布に従う確率変数$X$の期待値は有限実数として定義される。
事象$A\in\mathcal F$に対し、その指示関数$1_A:\Omega\to\mathbb R$を
$$
1_A(\omega)=
\begin{cases}
1 & (\omega\in A)\\
0 & (\omega\notin A)
\end{cases}
$$
で定める。このとき$1_A$は非負の可測関数であり、さらに$0\le 1_A\le 1$より可積分である。
$1_A$は$\{0,1\}$の$2$値しかとらない単関数であるから、単関数の積分の定義より
$$
\mathbb E[1_A]=\int_\Omega 1_A\,d\mathbb P
=1\cdot \mathbb P(A)+0\cdot \mathbb P(\Omega\setminus A)
=\mathbb P(A)
$$
が成り立つ。
$ $
今回の場合、定数$c\in\mathbb R$に対し、定数確率変数$c\cdot 1_\Omega:\Omega\to\mathbb R$を考えると、
$1_\Omega$は$\Omega$の指示関数であり、任意の$\omega\in\Omega$に対して
$$
1_\Omega(\omega)=1
$$
が成り立つ。$1_\Omega$は可積分であり、指示関数の期待値の性質(上記)より
$$
\mathbb E[1_\Omega]=\mathbb P(\Omega)
$$
が成り立つ。特に$\mathbb P$は確率測度であるから$\mathbb P(\Omega)=1$であり、
$$
\mathbb E[1_\Omega]=1
$$
である。従って、期待値の線形性より
$$
\mathbb E[c\cdot 1_\Omega]=c\,\mathbb E[1_\Omega]=c\,\mathbb P(\Omega)=c
$$
が成り立つ。
また、殆ど全ての$\omega$に対して$X(\omega)\in\{0,1,\dots,n\}$であるから、指示関数$1_{\{X=k\}}$を用いれば
$$
X(\omega)=\sum_{k=0}^n k\,1_{\{X=k\}}(\omega)\ \text{がほとんど確実に成り立つ}
$$
が成り立つ。
実際、ある$k_0\in\{0,1,\dots,n\}$が存在して$X(\omega)=k_0$であり、このとき
$$
1_{\{X=k\}}(\omega)=
\begin{cases}
1 & (k=k_0)\\
0 & (k\ne k_0)
\end{cases}
$$
であるから
$$
\sum_{k=0}^n k\,1_{\{X=k\}}(\omega)=k_0=X(\omega)
$$
となる。
ゆえに、
$$
X=\sum_{k=0}^n k\,1_{\{X=k\}}\ \text{がほとんど確実に成り立つ}
$$
であり、ここで各$\{X=k\}$は事象であり$1_{\{X=k\}}$は可積分である。
実際、$0\le 1_{\{X=k\}}\le 1$より
$$
\mathbb E[\,|1_{\{X=k\}}|\,]=\mathbb E[1_{\{X=k\}}]\le 1<\infty
$$
である。
従って期待値の線形性を用いることができ、
$$
\mathbb E[X]
=\mathbb E\Bigl[\sum_{k=0}^n k\,1_{\{X=k\}}\Bigr]
=\sum_{k=0}^n k\,\mathbb E[1_{\{X=k\}}]
$$
が成り立つ。さらに指示関数の期待値はその事象の確率に等しいから
$$
\mathbb E[1_{\{X=k\}}]=\mathbb P(\{X=k\})=\mathbb P(X=k)
$$
である。ゆえに
$$
\mathbb E[X]=\sum_{k=0}^n k\,\mathbb P(X=k)\cdots①
$$
が従う。
$ $
以上より、二項分布に従う確率変数$X$の期待値は有限であり、①より
$$
\begin{align}
\mathbb E[X]
&=\sum_{k=0}^n k\binom{n}{k}p^k(1-p)^{n-k}
&&\because \mathbb P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}.\\
&=\sum_{k=1}^n k\binom{n}{k}p^k(1-p)^{n-k}
&&\because k=0\ \text{の項は}\ 0.\\
&=\sum_{k=1}^n n\binom{n-1}{k-1}p^k(1-p)^{n-k}
&&\because k\binom{n}{k}=n\binom{n-1}{k-1}.\\
&=np\sum_{k=1}^n \binom{n-1}{k-1}p^{k-1}(1-p)^{n-k}
&&\because p^k=p\cdot p^{k-1}.\\
&=np\sum_{j=0}^{n-1}\binom{n-1}{j}p^{j}(1-p)^{(n-1)-j}
&&\because j=k-1\ \text{とおく}.\\
&=np\,(p+(1-p))^{n-1}
&&\because \text{二項定理}.\\
&=np
&&\because p+(1-p)=1.
\end{align}
$$
を得る。
$$ \Box$$
上で用いた恒等式$k\binom{n}{k}=n\binom{n-1}{k-1}$を示す。$k\in\{1,2,\dots,n\}$に対し
$$
\begin{align}
k\binom{n}{k}
&=k\cdot\frac{n!}{k!(n-k)!}
&&\because \binom{n}{k}=\frac{n!}{k!(n-k)!}\\
&=\frac{n!}{(k-1)!(n-k)!}
&&\because \frac{k}{k!}=\frac{1}{(k-1)!}\\
&=n\cdot\frac{(n-1)!}{(k-1)!(n-k)!}
&&\because n!=n\cdot(n-1)!\\
&=n\binom{n-1}{k-1}
&&\because \binom{n-1}{k-1}=\frac{(n-1)!}{(k-1)!(n-k)!}
\end{align}
$$
$$ \Box$$
$n\in\mathbb N$と$0< p<1$を満たし、さらに$n\ge2$とする。
確率変数$X$が二項分布$Bin(n,p)$に従う。すなわち
$$
\mathbb P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}\qquad(k=0,1,\dots,n)
$$
が成り立つ。このとき確率変数$X$の分散は
$$
\mathbb V(X)=np(1-p)
$$
で与えられる。
$X$ の期待値 $\mathbb{E}[X]$ は、$X$ が可積分、すなわち
$$
\mathbb{E}[|X|]<\infty
$$
が成り立つときに定義される。そこで、$\{X=k\}$は$k=0,1,\dots,n$で互いに素であるから
$$
\begin{align}
\mathbb P(X\in\{0,1,\dots,n\})
&=\mathbb P\Bigl(\bigcup_{k=0}^n\{X=k\}\Bigr)\\
&=\sum_{k=0}^n\mathbb P(X=k)\\
&=\sum_{k=0}^n\binom{n}{k}p^k(1-p)^{n-k}\\
&=(p+(1-p))^n\\
&=1
\end{align}
$$
が成り立つ。従って$X$はほとんど確実に$\{0,1,\dots,n\}$に値をとる。特に$|X|\le n$がほとんど確実に成り立つ。
$n$を定数確率変数$n\cdot 1_\Omega$とみなし、両辺の期待値をとると
$$
\mathbb E[|X|]\le n\mathbb P(\Omega)=n<\infty
$$
であるから、$\mathbb E[X]$は有限実数として定義される。同様に$|X|\le n$から両辺を$2$乗して
$$
0\le X^2\le n^2\ \text{がほとんど確実に成り立つ}
$$
が分かる。従って再び単調性より
$$
\mathbb E[X^2]\le \mathbb E[n^2\cdot 1_\Omega]=n^2\mathbb P(\Omega)=n^2<\infty
$$
が従う。以上より$\mathbb E[X]$と$\mathbb E[X^2]$はいずれも有限である。
$ $
そこで、分散公式より
$$
\mathbb V(X)=\mathbb E[X^2]-\mathbb E[X]^2
$$
で与えられる事と
$$
\mathbb E[X]=np
$$
が成り立つことを用いると、残りは$\mathbb E[X^2]$を求めればよい。
$X^2=X(X-1)+X$である事を利用して
$$
\mathbb E[X^2]=\mathbb E[X(X-1)]+\mathbb E[X]
$$
が成り立つ。よって$\mathbb E[X(X-1)]$を求めればよい。定義より
$$
\mathbb E[X(X-1)]=\sum_{k=0}^n k(k-1)\binom{n}{k}p^k(1-p)^{n-k}
$$
である。$k=0,1$の項は$0$なので
$$
\mathbb E[X(X-1)]=\sum_{k=2}^n k(k-1)\binom{n}{k}p^k(1-p)^{n-k}
$$
となる。ここで恒等式
$$
k(k-1)\binom{n}{k}=n(n-1)\binom{n-2}{k-2}
$$
を用いる。すると
$$
\begin{align}
\mathbb E[X(X-1)]
&=\sum_{k=2}^n n(n-1)\binom{n-2}{k-2}p^k(1-p)^{n-k}\\
&=n(n-1)p^2\sum_{k=2}^n \binom{n-2}{k-2}p^{k-2}(1-p)^{n-k}\\
&=n(n-1)p^2\sum_{j=0}^{n-2}\binom{n-2}{j}p^{j}(1-p)^{(n-2)-j}
\because j=k-2\ \text{とおく}.\\
&=n(n-1)p^2(p+(1-p))^{n-2}
\because \text{二項定理}.\\
&=n(n-1)p^2
\because p+(1-p)=1.
\end{align}
$$
従って
$$
\mathbb E[X^2]=\mathbb E[X(X-1)]+\mathbb E[X]=n(n-1)p^2+np
$$
である。よって
$$
\begin{align}
\mathbb V(X)
&=\mathbb E[X^2]-\mathbb E[X]^2\\
&=\bigl(n(n-1)p^2+np\bigr)-(np)^2\\
&=np+n(n-1)p^2-n^2p^2\\
&=np-np^2\\
&=np(1-p).
\end{align}
$$
以上より$\mathbb V(X)=np(1-p)$が成り立つ。
$$ \Box$$
上で用いた恒等式$k(k-1)\binom{n}{k}=n(n-1)\binom{n-2}{k-2}$を示す。$k\in\{2,3,\dots,n\}$に対し
$$
\begin{align}
k(k-1)\binom{n}{k}
&=k(k-1)\cdot\frac{n!}{k!(n-k)!}
\because \binom{n}{k}=\frac{n!}{k!(n-k)!}.\\
&=\frac{n!}{(k-2)!(n-k)!}
\because \frac{k(k-1)}{k!}=\frac{1}{(k-2)!}.\\
&=n(n-1)\cdot\frac{(n-2)!}{(k-2)!(n-k)!}
\because n!=n(n-1)(n-2)!.\\
&=n(n-1)\binom{n-2}{k-2}
\because \binom{n-2}{k-2}=\frac{(n-2)!}{(k-2)!(n-k)!}.
\end{align}
$$
二項分布 $ Bin(n, p) $ に従う確率変数 $ X $ の標準偏差$s$は、
$$
\sqrt{np(1 - p)}
$$
である。既に示した通り、二項分布 $ Bin(n, p) $ に従う確率変数 $ X $ の分散は、
$$
\mathbb{V}(X) = np(1 - p)
$$
である、ここで標準偏差$s$は
$$
s:=\sqrt{\mathbb{V}(X)}
$$
で定義されるから、二項分布 $ Bin(n, p) $ に従う確率変数 $ X $ の標準偏差$s$は、
$$
s=\sqrt{\mathbb{V}(X)}=\sqrt{np(1 - p)}
$$
である。