1

サンプルサイズを大きくすれば標本分散(不偏分散)は母分散に確率収束する

45
0
$$$$

確率空間$(\Omega,\mathcal F,\mathbb P)$上の実数値確率変数$X_1,\dots,X_n$を考え、$n\ge2$とする。標本平均を
$$ \overline X_n:=\frac1n\sum_{i=1}^nX_i $$
で定める。このとき、不偏分散$S_n^2$
$$ S_n^2:=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X_n)^2 $$
で定める。

$X_1,\dots,X_n$が独立同分布で$\mathbb E[X_1^2]<\infty$を満たすとき、$S_n^2$は母分散$\mathbb V(X_1)$の不偏推定量である。
すなわち、
$$ \mathbb E[S_n^2]=\mathbb V(X_1) $$
が成り立つ。この意味で$S_n^2$を不偏分散と呼ぶ。

確率収束

確率空間$(\Omega,\mathcal F,\mathbb P)$上の確率変数列$X_n$と確率変数$X$について
$$ X_n\xrightarrow{p}X\qquad(n\to\infty) $$
とは、任意の$\varepsilon>0$に対して
$$ \lim_{n\to\infty}\mathbb P(|X_n-X|>\varepsilon)=0 $$
が成り立つことをいう。

独立同分布な確率変数列$X_1,X_2,\dots$
$$ \mathbb E[X_1]=\mu<\infty,\qquad \mathbb V(X_1)=\sigma^2<\infty,\qquad \mathbb V(X_1^2)<\infty\ (\text{※}) $$
を満たすとする。各$n\ge2$に対し
$$ \overline X_n:=\frac1n\sum_{i=1}^nX_i,\qquad S_n^2:=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X_n)^2 $$
と定める。このとき
$$ S_n^2\xrightarrow{p}\sigma^2\qquad(n\to\infty) $$
が成り立つ。

独立同分布な確率変数列 $X_1,X_2,\dots$ を考え、まず、標本分散を次のように分解する。
$$ \begin{align} S_n^2 &=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X_n)^2 &&\because \text{定義より} \\ &=\frac1{n-1}\sum_{i=1}^n(X_i^2-2X_i\overline X_n+\overline X_n^2) &&\because (a-b)^2=a^2-2ab+b^2 \\ &=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac{2\overline X_n}{n-1}\sum_{i=1}^nX_i+\frac1{n-1}\sum_{i=1}^n\overline X_n^2 &&\because \text{線形性より} \\ &=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac{2\overline X_n}{n-1}\,n\overline X_n+\frac{n}{n-1}\overline X_n^2 &&\because \sum_{i=1}^nX_i=n\overline X_n,\ \sum_{i=1}^n\overline X_n^2=n\overline X_n^2 \\ &=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac{n}{n-1}\overline X_n^2 &&\because -2n\overline X_n^2+n\overline X_n^2=-n\overline X_n^2 \\ &=\frac{n}{n-1}\Bigl(\frac1n\sum_{i=1}^nX_i^2-\overline X_n^2\Bigr) &&\because \frac1{n-1}=\frac{n}{n-1}\cdot\frac1n \end{align} $$
次に今回の仮定は $\mathbb E[X_1]=\mu<\infty$$\mathbb V(X_1)=\sigma^2<\infty$ であるから、ここから $\mathbb E[X_1^2]<\infty$ を確認する。
まず、任意の実数 $a,b$ について
$$ (a+b)^2\le2a^2+2b^2 $$
が成り立つ。

$(a+b)^2\le2a^2+2b^2$

$\forall x\in \mathbb{R}:x^2\ge 0 $より、任意の実数 $a,b$ について
$$ (a-b)^2\ge0 $$
が成り立つ。これを展開すると
$$ a^2-2ab+b^2\ge0 $$
である。従って
$$ 2ab\le a^2+b^2 $$
が得られる。ここで
$$ (a+b)^2=a^2+2ab+b^2 $$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$ (a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2 $$
となる。
$$ \Box$$

これを $a=X_1-\mu$$b=\mu$ に適用すると
$$ X_1^2=(X_1-\mu+\mu)^2\le2(X_1-\mu)^2+2\mu^2 $$
を得る。両辺の期待値をとれば
$$ \mathbb E[X_1^2] \le2\mathbb E[(X_1-\mu)^2]+2\mu^2 $$
であるが、仮定より $\mathbb E[(X_1-\mu)^2]=\mathbb V(X_1)=\sigma^2<\infty$ なので
$$ \mathbb E[X_1^2]\le2\sigma^2+2\mu^2<\infty $$
が従う。よって $\mathbb E[X_1^2]<\infty$ が確定する。以上を踏まえ、分散の定義
$$ \mathbb V(X_1)=\mathbb E[(X_1-\mathbb E[X_1])^2] $$
$\mathbb E[X_1]=\mu$ を代入すると
$$ \mathbb V(X_1)=\mathbb E[(X_1-\mu)^2] $$
である。右辺を展開すると
$$ (X_1-\mu)^2=X_1^2-2\mu X_1+\mu^2 $$
であるから、期待値の線形性により
$$ \begin{align} \mathbb V(X_1) &=\mathbb E[X_1^2]-2\mu\mathbb E[X_1]+\mu^2 \\ &=\mathbb E[X_1^2]-2\mu\cdot\mu+\mu^2 \\ &=\mathbb E[X_1^2]-\mu^2 \end{align} $$
となる。仮定 $\mathbb V(X_1)=\sigma^2$ より
$$ \sigma^2=\mathbb E[X_1^2]-\mu^2 $$
従って
$$ \mathbb E[X_1^2]=\sigma^2+\mu^2\cdots① $$
が得られる。
また、仮定より(独立同分布な確率変数列$X_1,X_2,\dots$に対して) $\mathbb E[X_1]=\mu<\infty$であるから、大数の弱法則から
$$ \overline X_n=\frac1n\sum_{i=1}^nX_i\xrightarrow{p}\mu $$
が成り立つ。

大数の弱法則【WLLN: Weak Law of Large Numbers】とは?

$X_1,X_2,\dots$ を独立同分布な確率変数列とし、$\mathbb E[X_1]=\mu<\infty$ かつ $\mathbb V(X_1)<\infty$ が成り立つとする。
このとき
$$ \overline X_n=\frac1n\sum_{i=1}^nX_i $$
で定義される量において、
$$ \overline X_n\xrightarrow{p}\mu\qquad(n\to\infty) $$
が成り立つ(大数の弱法則)。すなわち、任意の$\varepsilon>0$に対して
$$ \lim_{n\to\infty}\mathbb P\bigl(|\overline X_n-\mu|>\varepsilon\bigr)=0 $$
が成り立つ。実際、確率変数 $Z$$\mathbb E[Z]$$\mathbb V(Z)$(分散)が有限なら、任意の $\varepsilon>0$ について
$$ \mathbb P\bigl(|Z-\mathbb E[Z]|\ge \varepsilon\bigr)\le \frac{\mathbb V(Z)}{\varepsilon^2} $$
が成り立つ。これは $\text{Chebyshev}$の不等式として知られているものである。
ここで、命題の条件

  1. $X_1,X_2,\dots$ は独立同分布である。
  2. $\mathbb E[X_1]=\mu$ が成り立つ。
  3. $\mathbb V(X_1)=\sigma^2<\infty$ が成り立つ。

-を仮定すると、期待値の線形性より
$$ \mathbb E[\overline X_n] =\mathbb E\Bigl[\frac1n\sum_{i=1}^n X_i\Bigr] =\frac1n\sum_{i=1}^n \mathbb E[X_i] =\frac1n\cdot n\mu =\mu $$
分散についても
$$ \mathbb V(\overline X_n) =\mathbb V\Bigl(\frac1n\sum_{i=1}^n X_i\Bigr) =\frac1{n^2}\mathbb V\Bigl(\sum_{i=1}^n X_i\Bigr) $$
ここで、独立性より分散は加法的であるから
$$ \mathbb V\Bigl(\sum_{i=1}^n X_i\Bigr) =\sum_{i=1}^n \mathbb V(X_i) =n\sigma^2 $$
従って
$$ \mathbb V(\overline X_n) =\frac1{n^2}\cdot n\sigma^2 =\frac{\sigma^2}{n} $$
先ほどの$\text{Chebyshev}$の不等式に $Z=\overline X_n$ を代入すると、任意の $\varepsilon>0$ に対して
$$ \mathbb P\bigl(|\overline X_n-\mathbb E[\overline X_n]|\ge \varepsilon\bigr) \le \frac{\mathbb V(\overline X_n)}{\varepsilon^2} =\frac{\sigma^2/n}{\varepsilon^2} =\frac{\sigma^2}{n\varepsilon^2} $$
ここで $\mathbb E[\overline X_n]=\mu$ であるから
$$ \mathbb P\bigl(|\overline X_n-\mu|\ge \varepsilon\bigr) \le \frac{\sigma^2}{n\varepsilon^2} \xrightarrow[n\to\infty]{}0 $$
が従う。これはすなわち
$$ \lim_{n\to\infty}\mathbb P\bigl(|\overline X_n-\mu|>\varepsilon\bigr)=0 \qquad(\forall \varepsilon>0) $$
であり(確率収束)、したがって
$$ \overline X_n\xrightarrow{p}\mu $$
が成り立つ。
$$ \Box$$

また、$X_i^2$も独立同分布で、(①より) $\mathbb E[X_1^2]<\infty$である。また仮定より $\mathbb V(X_1^2)<\infty$であるから、
したがって、$X_i^2$ においても再び大数の弱法則を適用でき、
$$ \frac1n\sum_{i=1}^nX_i^2\xrightarrow{p}\mathbb E[X_1^2]=\sigma^2+\mu^2\quad \because① $$
が成り立つ。

$X_i^2$も独立同分布について

より一般に、独立同分布な確率変数列$X_1,X_2,\dots$ に (ボレル)可測な関数$g:\mathbb{R} \rightarrow \mathbb{R}$ を作用させた
確率変数列 $g(X_1),g(X_2),\dots,g(X_n)$ も独立同分布になる。
$ $
実際、独立性を示すため、任意の$k\in\mathbb N$と任意のボレル集合$B_1,\dots,B_k\in\mathcal B(\mathbb R)$をとる。
$g$が可測であるから各$i$について$g^{-1}(B_i)\in\mathcal B(\mathbb R)$である。
このとき
$$ \{g(X_i)\in B_i\}=\{X_i\in g^{-1}(B_i)\} $$
が成り立つので、$X_1,\dots,X_k$の独立性より
$$ \begin{align} \mathbb P\Bigl(\bigcap_{i=1}^k\{g(X_i)\in B_i\}\Bigr) &=\mathbb P\Bigl(\bigcap_{i=1}^k\{X_i\in g^{-1}(B_i)\}\Bigr)\\ &=\prod_{i=1}^k\mathbb P\bigl(X_i\in g^{-1}(B_i)\bigr)\\ &=\prod_{i=1}^k\mathbb P\bigl(g(X_i)\in B_i\bigr) \end{align} $$
従って$g(X_1),\dots,g(X_k)$は独立である。$k$が任意であるから$g(X_1),g(X_2),\dots$は互いに独立である。
次に同分布性を示す。任意のボレル集合$B\in\mathcal B(\mathbb R)$について
$$ \mathbb P(g(X_i)\in B)=\mathbb P(X_i\in g^{-1}(B)) $$
が成り立つ。$X_i$は同分布であるから右辺は$i$によらず一定であり、従って左辺も$i$によらず一定である。
よって$g(X_i)$は同分布である。
$$ \Box$$

さらに$x\mapsto x^2$は連続であるから、標本平均$\overline X_n$$2$乗した確率変数 $\overline X_n^2$ については、連続写像定理より
$$ \overline X_n^2\xrightarrow{p}\mu^2 $$
が成り立つ。

連続写像定理

確率変数列$X_n$と確率変数$X$
$$ X_n\xrightarrow{p}X\qquad(n\to\infty) $$
を満たし、関数$g:\mathbb R\to\mathbb R$$\mathbb R$上連続であるとする。このとき
$$ X_n\xrightarrow{p}X\Rightarrow g(X_n)\xrightarrow{p}g(X) $$
が成り立つ。
$ $
今回の場合、$g(x)=x^2$とおき、$X_n:=\overline X_n$$X:=\mu$とすると、$x\mapsto x^2$$\mathbb R$上連続であるから
$$ \overline X_n\xrightarrow{p}\mu\Rightarrow \overline X_n^2\xrightarrow{p}\mu^2 $$
が得られる。

以上より、
$$ U_n:=\frac1n\sum_{i=1}^nX_i^2,\qquad V_n:=\overline X_n^2 $$
とおくと$U_n\xrightarrow{p}\sigma^2+\mu^2$かつ$V_n\xrightarrow{p}\mu^2$である。確率収束の基本事実として
$$ U_n\xrightarrow{p}u,\ V_n\xrightarrow{p}v\Rightarrow U_n-V_n\xrightarrow{p}u-v $$
が成り立つので
$$ U_n-V_n=\frac1n\sum_{i=1}^nX_i^2-\overline X_n^2\xrightarrow{p}(\sigma^2+\mu^2)-\mu^2=\sigma^2 $$
を得る。
最後に定数列について
$$ \begin{align} \frac{n}{n-1} &=\frac{(n-1)+1}{n-1} &&\because n=(n-1)+1.\\ &=\frac{n-1}{n-1}+\frac{1}{n-1} &&\because \frac{a+b}{c}=\frac{a}{c}+\frac{b}{c}.\\ &=1+\frac{1}{n-1} &&\because \frac{n-1}{n-1}=1.\\ &\to 1+0 &&\because \frac{1}{n-1}\to0\ (n\to\infty).\\ &=1. \end{align} $$
が成り立つ。よってSlutskyの定理より
$$ S_n^2=\frac{n}{n-1}(U_n-V_n)\xrightarrow{p}1\cdot\sigma^2=\sigma^2 $$
が従う。
$$ \Box$$

Slutskyの定理

確率変数列$X_n,Y_n$と定数$a,b\in\mathbb R$
$$ X_n\xrightarrow{p}a,\qquad Y_n\xrightarrow{p}b $$
を満たすとする。このとき
$$ X_n+Y_n\xrightarrow{p}a+b,\qquad X_nY_n\xrightarrow{p}ab $$
が成り立つ。さらに$b\ne0$ならば
$$ \frac{X_n}{Y_n}\xrightarrow{p}\frac{a}{b} $$
が成り立つ。

最後に(※)について

一般によく知られている結果として、独立同分布な確率変数列 $X_1,X_2,\dots$
$$ \mathbb V(X_1)=\sigma^2<\infty $$
を満たせば、不偏分散 $S_n^2$
$$ S_n^2\xrightarrow{p}\sigma^2 \qquad(n\to\infty) $$
を満たす。すなわち、標本分散が母分散に確率収束するためには、$X_1$ の分散が有限であることだけで十分である。
$ $
一方で、本証明で紹介したWLLNは
$$ \frac1n\sum_{i=1}^n X_i^2\xrightarrow{p}\mathbb E[X_1^2] $$
であることを $\text{Chebyshev}$の不等式を用いて示した。
このとき $\text{Chebyshev}$の不等式を適用するためには、確率変数 $X_1^2$ 自身の分散
$$ \mathbb V(X_1^2) $$
が有限であることが必要になる。そのため、今回の仮定
$$ \mathbb V(X_1^2)<\infty $$
は、結論 $S_n^2\xrightarrow{p}\sigma^2$ を得るだけを目的とするなら(本当は)強すぎるが、
$X_i^2$ の平均の収束も $\text{Chebyshev}$の不等式によって同じ枠組みで証明する、という目的に照らせば自然な仮定である。
$ $
しかしながら、証明の中で$\mathbb E[X_1^2]<\infty$である事を結果的に示したとは言うものの、
命題の仮定 $\mathbb V(X_1^2)<\infty$ より 暗に$\mathbb E[X_1^2]<\infty$ を仮定している点に注意が必要である。

投稿日:8日前
更新日:7日前
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

昨年作成したノートを、内容の確認が取れたものから順次公開していきます。公開順は特に定めていません。命題の主張や証明に誤りがありましたら、ご指摘いただけますと幸いです。 ■ 本人確認用の文字列:技製ダ3蓄エ労生6現

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中