確率空間$(\Omega,\mathcal F,\mathbb P)$上の実数値確率変数$X_1,\dots,X_n$を考え、$n\ge2$とする。標本平均を
$$
\overline X_n:=\frac1n\sum_{i=1}^nX_i
$$
で定める。このとき、不偏分散$S_n^2$を
$$
S_n^2:=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X_n)^2
$$
で定める。
$X_1,\dots,X_n$が独立同分布で$\mathbb E[X_1^2]<\infty$を満たすとき、$S_n^2$は母分散$\mathbb V(X_1)$の不偏推定量である。
すなわち、
$$
\mathbb E[S_n^2]=\mathbb V(X_1)
$$
が成り立つ。この意味で$S_n^2$を不偏分散と呼ぶ。
確率空間$(\Omega,\mathcal F,\mathbb P)$上の確率変数列$X_n$と確率変数$X$について
$$
X_n\xrightarrow{p}X\qquad(n\to\infty)
$$
とは、任意の$\varepsilon>0$に対して
$$
\lim_{n\to\infty}\mathbb P(|X_n-X|>\varepsilon)=0
$$
が成り立つことをいう。
独立同分布な確率変数列$X_1,X_2,\dots$が
$$
\mathbb E[X_1]=\mu<\infty,\qquad \mathbb V(X_1)=\sigma^2<\infty,\qquad \mathbb V(X_1^2)<\infty\ (\text{※})
$$
を満たすとする。各$n\ge2$に対し
$$
\overline X_n:=\frac1n\sum_{i=1}^nX_i,\qquad
S_n^2:=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X_n)^2
$$
と定める。このとき
$$
S_n^2\xrightarrow{p}\sigma^2\qquad(n\to\infty)
$$
が成り立つ。
独立同分布な確率変数列 $X_1,X_2,\dots$ を考え、まず、標本分散を次のように分解する。
$$
\begin{align}
S_n^2
&=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X_n)^2
&&\because \text{定義より} \\
&=\frac1{n-1}\sum_{i=1}^n(X_i^2-2X_i\overline X_n+\overline X_n^2)
&&\because (a-b)^2=a^2-2ab+b^2 \\
&=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac{2\overline X_n}{n-1}\sum_{i=1}^nX_i+\frac1{n-1}\sum_{i=1}^n\overline X_n^2
&&\because \text{線形性より} \\
&=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac{2\overline X_n}{n-1}\,n\overline X_n+\frac{n}{n-1}\overline X_n^2
&&\because \sum_{i=1}^nX_i=n\overline X_n,\ \sum_{i=1}^n\overline X_n^2=n\overline X_n^2 \\
&=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac{n}{n-1}\overline X_n^2
&&\because -2n\overline X_n^2+n\overline X_n^2=-n\overline X_n^2 \\
&=\frac{n}{n-1}\Bigl(\frac1n\sum_{i=1}^nX_i^2-\overline X_n^2\Bigr)
&&\because \frac1{n-1}=\frac{n}{n-1}\cdot\frac1n
\end{align}
$$
次に今回の仮定は $\mathbb E[X_1]=\mu<\infty$ と $\mathbb V(X_1)=\sigma^2<\infty$ であるから、ここから $\mathbb E[X_1^2]<\infty$ を確認する。
まず、任意の実数 $a,b$ について
$$
(a+b)^2\le2a^2+2b^2
$$
が成り立つ。
$\forall x\in \mathbb{R}:x^2\ge 0 $より、任意の実数 $a,b$ について
$$
(a-b)^2\ge0
$$
が成り立つ。これを展開すると
$$
a^2-2ab+b^2\ge0
$$
である。従って
$$
2ab\le a^2+b^2
$$
が得られる。ここで
$$
(a+b)^2=a^2+2ab+b^2
$$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$
(a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2
$$
となる。
$$ \Box$$
これを $a=X_1-\mu$、$b=\mu$ に適用すると
$$
X_1^2=(X_1-\mu+\mu)^2\le2(X_1-\mu)^2+2\mu^2
$$
を得る。両辺の期待値をとれば
$$
\mathbb E[X_1^2]
\le2\mathbb E[(X_1-\mu)^2]+2\mu^2
$$
であるが、仮定より $\mathbb E[(X_1-\mu)^2]=\mathbb V(X_1)=\sigma^2<\infty$ なので
$$
\mathbb E[X_1^2]\le2\sigma^2+2\mu^2<\infty
$$
が従う。よって $\mathbb E[X_1^2]<\infty$ が確定する。以上を踏まえ、分散の定義
$$
\mathbb V(X_1)=\mathbb E[(X_1-\mathbb E[X_1])^2]
$$
に $\mathbb E[X_1]=\mu$ を代入すると
$$
\mathbb V(X_1)=\mathbb E[(X_1-\mu)^2]
$$
である。右辺を展開すると
$$
(X_1-\mu)^2=X_1^2-2\mu X_1+\mu^2
$$
であるから、期待値の線形性により
$$
\begin{align}
\mathbb V(X_1)
&=\mathbb E[X_1^2]-2\mu\mathbb E[X_1]+\mu^2 \\
&=\mathbb E[X_1^2]-2\mu\cdot\mu+\mu^2 \\
&=\mathbb E[X_1^2]-\mu^2
\end{align}
$$
となる。仮定 $\mathbb V(X_1)=\sigma^2$ より
$$
\sigma^2=\mathbb E[X_1^2]-\mu^2
$$
従って
$$
\mathbb E[X_1^2]=\sigma^2+\mu^2\cdots①
$$
が得られる。
また、仮定より(独立同分布な確率変数列$X_1,X_2,\dots$に対して) $\mathbb E[X_1]=\mu<\infty$であるから、大数の弱法則から
$$
\overline X_n=\frac1n\sum_{i=1}^nX_i\xrightarrow{p}\mu
$$
が成り立つ。
$X_1,X_2,\dots$ を独立同分布な確率変数列とし、$\mathbb E[X_1]=\mu<\infty$ かつ $\mathbb V(X_1)<\infty$ が成り立つとする。
このとき
$$
\overline X_n=\frac1n\sum_{i=1}^nX_i
$$
で定義される量において、
$$
\overline X_n\xrightarrow{p}\mu\qquad(n\to\infty)
$$
が成り立つ(大数の弱法則)。すなわち、任意の$\varepsilon>0$に対して
$$
\lim_{n\to\infty}\mathbb P\bigl(|\overline X_n-\mu|>\varepsilon\bigr)=0
$$
が成り立つ。実際、確率変数 $Z$ が $\mathbb E[Z]$ と $\mathbb V(Z)$(分散)が有限なら、任意の $\varepsilon>0$ について
$$
\mathbb P\bigl(|Z-\mathbb E[Z]|\ge \varepsilon\bigr)\le \frac{\mathbb V(Z)}{\varepsilon^2}
$$
が成り立つ。これは $\text{Chebyshev}$の不等式として知られているものである。
ここで、命題の条件
-を仮定すると、期待値の線形性より
$$
\mathbb E[\overline X_n]
=\mathbb E\Bigl[\frac1n\sum_{i=1}^n X_i\Bigr]
=\frac1n\sum_{i=1}^n \mathbb E[X_i]
=\frac1n\cdot n\mu
=\mu
$$
分散についても
$$
\mathbb V(\overline X_n)
=\mathbb V\Bigl(\frac1n\sum_{i=1}^n X_i\Bigr)
=\frac1{n^2}\mathbb V\Bigl(\sum_{i=1}^n X_i\Bigr)
$$
ここで、独立性より分散は加法的であるから
$$
\mathbb V\Bigl(\sum_{i=1}^n X_i\Bigr)
=\sum_{i=1}^n \mathbb V(X_i)
=n\sigma^2
$$
従って
$$
\mathbb V(\overline X_n)
=\frac1{n^2}\cdot n\sigma^2
=\frac{\sigma^2}{n}
$$
先ほどの$\text{Chebyshev}$の不等式に $Z=\overline X_n$ を代入すると、任意の $\varepsilon>0$ に対して
$$
\mathbb P\bigl(|\overline X_n-\mathbb E[\overline X_n]|\ge \varepsilon\bigr)
\le \frac{\mathbb V(\overline X_n)}{\varepsilon^2}
=\frac{\sigma^2/n}{\varepsilon^2}
=\frac{\sigma^2}{n\varepsilon^2}
$$
ここで $\mathbb E[\overline X_n]=\mu$ であるから
$$
\mathbb P\bigl(|\overline X_n-\mu|\ge \varepsilon\bigr)
\le \frac{\sigma^2}{n\varepsilon^2}
\xrightarrow[n\to\infty]{}0
$$
が従う。これはすなわち
$$
\lim_{n\to\infty}\mathbb P\bigl(|\overline X_n-\mu|>\varepsilon\bigr)=0
\qquad(\forall \varepsilon>0)
$$
であり(確率収束)、したがって
$$
\overline X_n\xrightarrow{p}\mu
$$
が成り立つ。
$$ \Box$$
また、$X_i^2$も独立同分布で、(①より) $\mathbb E[X_1^2]<\infty$である。また仮定より $\mathbb V(X_1^2)<\infty$であるから、
したがって、$X_i^2$ においても再び大数の弱法則を適用でき、
$$
\frac1n\sum_{i=1}^nX_i^2\xrightarrow{p}\mathbb E[X_1^2]=\sigma^2+\mu^2\quad \because①
$$
が成り立つ。
より一般に、独立同分布な確率変数列$X_1,X_2,\dots$ に (ボレル)可測な関数$g:\mathbb{R} \rightarrow \mathbb{R}$ を作用させた
確率変数列 $g(X_1),g(X_2),\dots,g(X_n)$ も独立同分布になる。
$ $
実際、独立性を示すため、任意の$k\in\mathbb N$と任意のボレル集合$B_1,\dots,B_k\in\mathcal B(\mathbb R)$をとる。
$g$が可測であるから各$i$について$g^{-1}(B_i)\in\mathcal B(\mathbb R)$である。
このとき
$$
\{g(X_i)\in B_i\}=\{X_i\in g^{-1}(B_i)\}
$$
が成り立つので、$X_1,\dots,X_k$の独立性より
$$
\begin{align}
\mathbb P\Bigl(\bigcap_{i=1}^k\{g(X_i)\in B_i\}\Bigr)
&=\mathbb P\Bigl(\bigcap_{i=1}^k\{X_i\in g^{-1}(B_i)\}\Bigr)\\
&=\prod_{i=1}^k\mathbb P\bigl(X_i\in g^{-1}(B_i)\bigr)\\
&=\prod_{i=1}^k\mathbb P\bigl(g(X_i)\in B_i\bigr)
\end{align}
$$
従って$g(X_1),\dots,g(X_k)$は独立である。$k$が任意であるから$g(X_1),g(X_2),\dots$は互いに独立である。
次に同分布性を示す。任意のボレル集合$B\in\mathcal B(\mathbb R)$について
$$
\mathbb P(g(X_i)\in B)=\mathbb P(X_i\in g^{-1}(B))
$$
が成り立つ。$X_i$は同分布であるから右辺は$i$によらず一定であり、従って左辺も$i$によらず一定である。
よって$g(X_i)$は同分布である。
$$ \Box$$
さらに$x\mapsto x^2$は連続であるから、標本平均$\overline X_n$を$2$乗した確率変数 $\overline X_n^2$ については、連続写像定理より
$$
\overline X_n^2\xrightarrow{p}\mu^2
$$
が成り立つ。
確率変数列$X_n$と確率変数$X$が
$$
X_n\xrightarrow{p}X\qquad(n\to\infty)
$$
を満たし、関数$g:\mathbb R\to\mathbb R$が$\mathbb R$上連続であるとする。このとき
$$
X_n\xrightarrow{p}X\Rightarrow g(X_n)\xrightarrow{p}g(X)
$$
が成り立つ。
$ $
今回の場合、$g(x)=x^2$とおき、$X_n:=\overline X_n$、$X:=\mu$とすると、$x\mapsto x^2$は$\mathbb R$上連続であるから
$$
\overline X_n\xrightarrow{p}\mu\Rightarrow \overline X_n^2\xrightarrow{p}\mu^2
$$
が得られる。
以上より、
$$
U_n:=\frac1n\sum_{i=1}^nX_i^2,\qquad V_n:=\overline X_n^2
$$
とおくと$U_n\xrightarrow{p}\sigma^2+\mu^2$かつ$V_n\xrightarrow{p}\mu^2$である。確率収束の基本事実として
$$
U_n\xrightarrow{p}u,\ V_n\xrightarrow{p}v\Rightarrow U_n-V_n\xrightarrow{p}u-v
$$
が成り立つので
$$
U_n-V_n=\frac1n\sum_{i=1}^nX_i^2-\overline X_n^2\xrightarrow{p}(\sigma^2+\mu^2)-\mu^2=\sigma^2
$$
を得る。
最後に定数列について
$$
\begin{align}
\frac{n}{n-1}
&=\frac{(n-1)+1}{n-1}
&&\because n=(n-1)+1.\\
&=\frac{n-1}{n-1}+\frac{1}{n-1}
&&\because \frac{a+b}{c}=\frac{a}{c}+\frac{b}{c}.\\
&=1+\frac{1}{n-1}
&&\because \frac{n-1}{n-1}=1.\\
&\to 1+0
&&\because \frac{1}{n-1}\to0\ (n\to\infty).\\
&=1.
\end{align}
$$
が成り立つ。よってSlutskyの定理より
$$
S_n^2=\frac{n}{n-1}(U_n-V_n)\xrightarrow{p}1\cdot\sigma^2=\sigma^2
$$
が従う。
$$ \Box$$
確率変数列$X_n,Y_n$と定数$a,b\in\mathbb R$が
$$
X_n\xrightarrow{p}a,\qquad Y_n\xrightarrow{p}b
$$
を満たすとする。このとき
$$
X_n+Y_n\xrightarrow{p}a+b,\qquad X_nY_n\xrightarrow{p}ab
$$
が成り立つ。さらに$b\ne0$ならば
$$
\frac{X_n}{Y_n}\xrightarrow{p}\frac{a}{b}
$$
が成り立つ。
一般によく知られている結果として、独立同分布な確率変数列 $X_1,X_2,\dots$ が
$$
\mathbb V(X_1)=\sigma^2<\infty
$$
を満たせば、不偏分散 $S_n^2$ は
$$
S_n^2\xrightarrow{p}\sigma^2
\qquad(n\to\infty)
$$
を満たす。すなわち、標本分散が母分散に確率収束するためには、$X_1$ の分散が有限であることだけで十分である。
$ $
一方で、本証明で紹介したWLLNは
$$
\frac1n\sum_{i=1}^n X_i^2\xrightarrow{p}\mathbb E[X_1^2]
$$
であることを $\text{Chebyshev}$の不等式を用いて示した。
このとき $\text{Chebyshev}$の不等式を適用するためには、確率変数 $X_1^2$ 自身の分散
$$
\mathbb V(X_1^2)
$$
が有限であることが必要になる。そのため、今回の仮定
$$
\mathbb V(X_1^2)<\infty
$$
は、結論 $S_n^2\xrightarrow{p}\sigma^2$ を得るだけを目的とするなら(本当は)強すぎるが、
$X_i^2$ の平均の収束も $\text{Chebyshev}$の不等式によって同じ枠組みで証明する、という目的に照らせば自然な仮定である。
$ $
しかしながら、証明の中で$\mathbb E[X_1^2]<\infty$である事を結果的に示したとは言うものの、
命題の仮定 $\mathbb V(X_1^2)<\infty$ より 暗に$\mathbb E[X_1^2]<\infty$ を仮定している点に注意が必要である。