文献あり

古典的な中心極限定理について

この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。

Def.

分布収束

各 $n\in\mathbb N$ に対して、$(\Omega_n,\mathcal F_n,\mathbb P_n)$ を確率空間とし、
$$ X_n:(\Omega_n,\mathcal F_n)\to(\mathbb R,\mathcal B(\mathbb R)) $$
を実数値確率変数とする。
また、$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、
$$ X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B(\mathbb R)) $$
を実数値確率変数とする。
$ $
各 $n\in\mathbb N$ に対して、$X_n$ の分布関数を
$$ F_n(x) := \mathbb P_n(X_n^{-1}((-\infty,x])) = \mathbb P_n(\{\omega\in\Omega_n\mid X_n(\omega)\leq x\}) \quad (x\in\mathbb R) $$
で定める。
また、$X$ の分布関数を
$$ F(x) := \mathbb P(X^{-1}((-\infty,x])) = \mathbb P(\{\omega\in\Omega\mid X(\omega)\leq x\}) \quad (x\in\mathbb R) $$
で定める。

-このとき、$X_n$ が $X$ に分布収束するとは、$F$ の任意の連続点 $x\in\mathbb R$ に対して、
$$ \lim_{n\to\infty}F_n(x)=F(x) $$
が成り立つことをいう。このとき、
$$ X_n\overset{d}{\longrightarrow}X $$
または
$$ X_n\Rightarrow X $$
と書く。

ランダウのスモール $o$

$D\subset\mathbb R$ とし、$a\in\mathbb R$ は $D$ の集積点であるとする。また、$f,g:D\to\mathbb C$ を関数とする。
ある $\eta>0$ が存在して、任意の $x\in D$ に対して、
$$ 0<|x-a|<\eta \quad\Longrightarrow\quad g(x)\neq0 $$
が成り立つとする。
このとき、
$$ f(x)=o(g(x)) \quad (x\to a) $$
とは、
$$ \lim_{\substack{x\to a}} \frac{f(x)}{g(x)} = 0 $$
が成り立つことをいう。

$\varepsilon$ による同値な表現

同値に、任意の $\varepsilon>0$ に対して、ある $\delta>0$ が存在して、任意の $x\in D$ に対して、
$$ 0<|x-a|<\delta \quad\Longrightarrow\quad |f(x)|\leq \varepsilon |g(x)| $$
が成り立つことをいう。
このとき、必要なら $\delta$ を小さく取り直すことで、$0<\delta\leq\eta$ としてよい。

$x\to\infty$ の場合

ある $M_0\in\mathbb R$ が存在して、$f,g$ が $(M_0,\infty)$ 上で定義された複素数値関数であり、さらに十分大きい $x$ に対して $g(x)\neq0$ であるとする。
このとき、
$$ f(x)=o(g(x)) \quad (x\to\infty) $$
とは、
$$ \lim_{x\to\infty} \frac{f(x)}{g(x)} = 0 $$
が成り立つことをいう。
同値に、任意の $\varepsilon>0$ に対して、ある $M>0$ が存在して、任意の $x>M$ に対して、
$$ |f(x)|\leq \varepsilon |g(x)| $$
が成り立つことをいう。

数列の場合

数列 $\{a_n\}_{n=1}^{\infty}$ と $\{b_n\}_{n=1}^{\infty}$ に対して、十分大きい $n$ で $b_n\neq0$ とする。
このとき、
$$ a_n=o(b_n) \quad (n\to\infty) $$
とは、
$$ \lim_{n\to\infty} \frac{a_n}{b_n} = 0 $$
が成り立つことをいう。
同値に、任意の $\varepsilon>0$ に対して、ある $N\in\mathbb N$ が存在して、任意の $n\geq N$ に対して、
$$ |a_n|\leq \varepsilon |b_n| $$
が成り立つことをいう。

Prop&Proof

指数関数の二次近似の評価

任意の $v\in\mathbb R$ に対して、
$$ |e^{iv}-1-iv| \leq \frac{v^2}{2} $$
が成り立つ。

任意の $v\in\mathbb R$ をとる。まず、関数 $F:\mathbb R\to\mathbb C$ を
$$ F(s):=e^{is}-1-is $$
で定める。このとき、
$$ \begin{align} F'(s) &= ie^{is}-i\\ &= i(e^{is}-1) \end{align} $$
である。したがって、微積分の基本定理より、
$$ \begin{align} e^{iv}-1-iv &= F(v)-F(0)\\ &= \int_0^v F'(s)\,ds\\ &= \int_0^v i(e^{is}-1)\,ds \end{align} $$
である(補足を参照)。

ここで、$v=0$ の場合は明らかに
$$ |e^{iv}-1-iv|=0=\frac{v^2}{2} $$
である。
$ $
$v\geq0$ の場合、積分に対する三角不等式と $|i|=1$ より
$$ \begin{align} |e^{iv}-1-iv| &= \left| \int_0^v i(e^{is}-1)\,ds \right|\\ &\leq \int_0^v |i(e^{is}-1)|\,ds\\ &= \int_0^v |e^{is}-1|\,ds \end{align} $$
である。
$ $
一方、$v<0$ の場合、
$$ \int_0^v i(e^{is}-1)\,ds = -\int_v^0 i(e^{is}-1)\,ds $$
であるから、
$$ \begin{align} |e^{iv}-1-iv| &= \left| -\int_v^0 i(e^{is}-1)\,ds \right|\\ &= \left| \int_v^0 i(e^{is}-1)\,ds \right|\\ &\leq \int_v^0 |i(e^{is}-1)|\,ds\\ &= \int_v^0 |e^{is}-1|\,ds\ \because\ |i|=1 \end{align} $$
である。ここで、$v<0$ であるから、$a:=|v|$ とおくと、
$$ v=-a $$
である。したがって、
$$ \int_v^0 |e^{is}-1|\,ds = \int_{-a}^0 |e^{is}-1|\,ds $$
である。ここで、変数変換
$$ s=-r $$
を行う。すると、
$$ ds=-dr $$
である。また、積分区間の端点は次のように変わる。
$$ s=-a \quad\Longleftrightarrow\quad r=a $$
であり、
$$ s=0 \quad\Longleftrightarrow\quad r=0 $$
である。したがって、変数変換の公式より、
$$ \begin{align} \int_{-a}^{0}|e^{is}-1|\,ds &= \int_{a}^{0}|e^{-ir}-1|(-dr)\\ &= \int_{0}^{a}|e^{-ir}-1|\,dr \end{align} $$
である。ここで、$r\in\mathbb R$ に対して、
$$ e^{-ir} = \overline{e^{ir}} $$
である。よって、
$$ \begin{align} e^{-ir}-1 &= \overline{e^{ir}-1} \end{align} $$
である。複素数 $z$ に対して、
$$ |\overline z|=|z| $$
が成り立つので、
$$ \begin{align} |e^{-ir}-1| &= |\overline{e^{ir}-1}|\\ &= |e^{ir}-1| \end{align} $$
である。したがって、
$$ \begin{align} \int_{v}^{0}|e^{is}-1|\,ds &= \int_{-a}^{0}|e^{is}-1|\,ds\\ &= \int_{0}^{a}|e^{-ir}-1|\,dr\\ &= \int_{0}^{a}|e^{ir}-1|\,dr\\ &= \int_{0}^{|v|}|e^{ir}-1|\,dr \end{align} $$
である。

-したがって、$v\geq0$ の場合も $v<0$ の場合も、
$$ |e^{iv}-1-iv| \leq \int_0^{|v|}|e^{is}-1|\,ds $$
が成り立つ。
次に、$s\geq0$ に対して、
$$ e^{is}-1 = \int_0^s ie^{ir}\,dr $$
である(補足を参照)。よって、積分に対する三角不等式より、
$$ \begin{align} |e^{is}-1| &= \left|\int_{0}^{s}ie^{ir}\,dr\right|\\ &\leq \int_{0}^{s}|ie^{ir}|\,dr\\ &= \int_{0}^{s}|i||e^{ir}|\,dr\ \because\ \text{補足を参照} \\ &= \int_{0}^{s}1\,dr\\ &= s \end{align} $$
である。したがって、$0\leq s\leq |v|$ に対して、
$$ |e^{is}-1|\leq s $$
であるから、
$$ \begin{align} |e^{iv}-1-iv| &\leq \int_0^{|v|}|e^{is}-1|\,ds\\ &\leq \int_0^{|v|}s\,ds\\ &= \left[\frac{s^2}{2}\right]_0^{|v|}\\ &= \frac{|v|^2}{2}\\ &= \frac{v^2}{2} \end{align} $$
である。
よって、任意の $v\in\mathbb R$ に対して、
$$ |e^{iv}-1-iv| \leq \frac{v^2}{2} $$
が成り立つ。
$$ \Box$$

複素数値関数に対する微積分の基本定理

複素数値関数 $h:[a,b]\to\mathbb C$ が連続であり、複素数値関数 $H:[a,b]\to\mathbb C$ が微分可能で
$$ H'(s)=h(s) $$
を満たすとする。
このとき、実部と虚部に実数値関数の微積分の基本定理を適用することにより、
$$ \int_a^b h(s)\,ds = H(b)-H(a) $$
が成り立つ。

微積分学の基本定理より、区間上の連続関数 $f$ に対して、$F$ が $f$ の原始関数であるならば、任意の実数 $a,b$ に対して、
$$ \int_a^b f(s)\,ds = F(b)-F(a) $$
が成り立つ。
ここで、関数 $F:\mathbb R\to\mathbb C$ を
$$ F(s):=e^{is}-1-is $$
で定める。
このとき、$F$ は微分可能であり、
$$ \begin{align} F'(s) &= \frac{d}{ds}\left(e^{is}-1-is\right)\\ &= ie^{is}-i\\ &= i(e^{is}-1) \end{align} $$
である。
したがって、$F$ は関数 $s\mapsto i(e^{is}-1)$ の原始関数である。
よって、微積分学の基本定理より、任意の $v\in\mathbb R$ に対して、
$$ \begin{align} \int_{0}^{v}i(e^{is}-1)\,ds &= \int_{0}^{v}F'(s)\,ds\\ &= F(v)-F(0)\\ &= (e^{iv}-1-iv)-(e^{0}-1-i\cdot0)\\ &= (e^{iv}-1-iv)-(1-1)\\ &= e^{iv}-1-iv \end{align} $$
である。
ゆえに、
$$ e^{iv}-1-iv = \int_{0}^{v} i(e^{is}-1)\,ds $$
が成り立つ。

関数 $F:\mathbb R\to\mathbb C$ を
$$ F(r):=e^{ir} $$
で定める。
このとき、$F$ は微分可能であり、
$$ F'(r)=ie^{ir} $$
である。
したがって、$ie^{ir}$ の原始関数は $e^{ir}$ である。
よって、微積分の基本定理より、$s\geq0$ に対して、
$$ \begin{align} \int_{0}^{s}ie^{ir}\,dr &= \int_{0}^{s}F'(r)\,dr\\ &= F(s)-F(0)\\ &= e^{is}-e^{i\cdot0}\\ &= e^{is}-1 \end{align} $$
である。
したがって、
$$ e^{is}-1 = \int_{0}^{s}ie^{ir}\,dr $$
が成り立つ。

$r\in\mathbb R$ とする。
オイラーの公式より、
$$ e^{ir} = \cos r+i\sin r $$
である。
したがって、複素数の絶対値の定義より、
$$ \begin{align} |e^{ir}| &= |\cos r+i\sin r|\\ &= \sqrt{(\cos r)^2+(\sin r)^2}\\ &= \sqrt{\cos^2 r+\sin^2 r}\\ &= \sqrt{1}\\ &= 1 \end{align} $$
である。
ゆえに、
$$ |e^{ir}|=1 $$
である。

指数型極限の補題

$\{a_n\}_{n=1}^{\infty}$ を複素数列とし、$a\in\mathbb C$ とする。
$$ a_n\to a \quad (n\to\infty) $$
であるとする。このとき、
$$ \left(1+\frac{a_n}{n}\right)^n \to e^a \quad (n\to\infty) $$
が成り立つ。

$a_n\to a$ であるから、数列 $\{a_n\}_{n=1}^{\infty}$ は有界である。
したがって、ある $M>0$ が存在して、任意の $n\in\mathbb N$ に対して、
$$ |a_n|\leq M $$
が成り立つ。
各 $n\in\mathbb N$ に対して、
$$ z_n:=\frac{a_n}{n} $$
とおく。このとき、
$$ z_n\to0 \quad (n\to\infty) $$
である。また、十分大きい $n$ に対して、
$$ |z_n| = \left|\frac{a_n}{n}\right| \leq \frac{1}{2} $$
が成り立つ。
以下、$|z|\leq\frac{1}{2}$ とする。このとき、任意の $t\in[0,1]$ に対して、
$$ |tz| \leq \frac{1}{2} $$
であるから、
$$ \operatorname{Re}(1+tz) \geq 1-|tz| \geq \frac{1}{2} $$
である。したがって、$1+tz$ は $0$ ではなく、また負の実軸上にもない。
ゆえに、複素対数の主値 $\mathrm{Log}(1+tz)$ が定義される(補足を参照)。
ここで
$$ F(t):=\mathrm{Log}(1+tz) \quad (0\leq t\leq1) $$
とおく。このとき、$F$ は実変数 $t$ の複素数値関数である。
合成関数の微分法と、複素対数の主値の微分公式より、
$$ F'(t) = \frac{z}{1+tz} $$
である。したがって、微積分学の基本定理より、
$$ \int_0^1\frac{z}{1+tz}\,dt = \int_0^1F'(t)\,dt = F(1)-F(0) = \mathrm{Log}(1+z)-\mathrm{Log}(1) $$
である。ここで、$\mathrm{Log}(1)=0$ であるから、
$$ \mathrm{Log}(1+z) = \int_0^1\frac{z}{1+tz}\,dt $$
である。よって、
$$ \begin{align} \mathrm{Log}(1+z)-z &= \int_0^1 \left( \frac{z}{1+tz}-z \right)\,dt\\ &= \int_0^1 \frac{z-z(1+tz)}{1+tz}\,dt\\ &= -\int_0^1 \frac{tz^2}{1+tz}\,dt \end{align} $$
である。
また、任意の $t\in[0,1]$ に対して、
$$ |1+tz| \geq 1-|tz| \geq 1-|z| \geq \frac{1}{2} $$
である。したがって、
$$ \begin{align} |\mathrm{Log}(1+z)-z| &= \left| \int_0^1 \frac{tz^2}{1+tz}\,dt \right|\\ &\leq \int_0^1 \frac{t|z|^2}{|1+tz|}\,dt\\ &\leq \int_0^1 2t|z|^2\,dt\\ &= |z|^2 \end{align} $$
である。
これを $z=z_n$ に適用すると、十分大きい $n$ に対して、
$$ |\mathrm{Log}(1+z_n)-z_n| \leq |z_n|^2 $$
である。したがって、
$$ \begin{align} \left| n\bigl(\mathrm{Log}(1+z_n)-z_n\bigr) \right| &\leq n|z_n|^2\\ &= n\left|\frac{a_n}{n}\right|^2\\ &= \frac{|a_n|^2}{n}\\ &\leq \frac{M^2}{n} \to0 \end{align} $$
である。ゆえに、
$$ n\bigl(\mathrm{Log}(1+z_n)-z_n\bigr)\to0\cdots① $$
である。一方、
$$ nz_n = n\frac{a_n}{n} = a_n \to a\cdots② $$
である。そこで、
$$ \mathrm{Log}(1+z_n) = z_n+\bigl(\mathrm{Log}(1+z_n)-z_n\bigr) $$
と分解する。したがって、両辺に $n$ をかけると、
$$ n\mathrm{Log}(1+z_n) = nz_n+n\bigl(\mathrm{Log}(1+z_n)-z_n\bigr) $$
である。したがって式①,式②より
$$ \begin{align} n\mathrm{Log}(1+z_n) &= nz_n+n\bigl(\mathrm{Log}(1+z_n)-z_n\bigr)\\ &\to a+0\\ &= a \end{align} $$
である。
複素指数関数は連続であるから、
$$ \exp\bigl(n\mathrm{Log}(1+z_n)\bigr) \to e^a \quad (n\to\infty) $$
である。
また、十分大きい $n$ に対して $|z_n|\leq\frac{1}{2}$ であるから、$1+z_n$ は複素対数の主値の定義域に属する(補足を参照)。
よって、
$$ \exp(\mathrm{Log}(1+z_n)) = 1+z_n $$
である。したがって、
$$ \begin{align} \exp\bigl(n\mathrm{Log}(1+z_n)\bigr) &= \left(\exp(\mathrm{Log}(1+z_n))\right)^n\\ &= (1+z_n)^n\\ &= \left(1+\frac{a_n}{n}\right)^n \end{align} $$
である。
以上より、
$$ \left(1+\frac{a_n}{n}\right)^n \to e^a \quad (n\to\infty) $$
が成り立つ。
$$ \Box$$

複素対数の主値を用いる理由

複素対数はそのままでは多価関数であるため、証明の中で関数として扱うには、どの値を選ぶかを固定する必要がある。
ここでは、複素対数の主値 $\mathrm{Log}$ を用いる。
複素対数の主値 $\mathrm{Log}$ は、枝切りを負の実軸に取ることで、
$$ \mathbb C\setminus(-\infty,0] $$
上で一価の関数として定義される。したがって、複素数 $w$ が
$$ w\in\mathbb C\setminus(-\infty,0] $$
を満たすとき、$\mathrm{Log}(w)$ を主値対数として一意に定めることができる。
いま、$|z|\leq\frac{1}{2}$ とする。このとき、任意の $t\in[0,1]$ に対して、
$$ \operatorname{Re}(1+tz) = 1+t\operatorname{Re}(z) \geq 1-t|z| \geq 1-|z| \geq \frac{1}{2} > 0 $$
である。したがって、$1+tz$ は右半平面に属する。特に、$1+tz$ は $0$ ではなく、負の実軸上にもない。ゆえに、
$$ 1+tz\in\mathbb C\setminus(-\infty,0] $$
であり、$\mathrm{Log}(1+tz)$ が主値対数として定義される。
このため、関数
$$ t\mapsto\mathrm{Log}(1+tz) $$
を $0\leq t\leq1$ 上で考えることができる。さらに、この範囲では $\mathrm{Log}$ は正則関数として扱えるので、合成関数の微分法により、
$$ \frac{d}{dt}\mathrm{Log}(1+tz) = \frac{z}{1+tz} $$
が成り立つ。
また、この議論を $z=z_n$、$t=1$ に適用すれば、十分大きい $n$ に対して $1+z_n$ も $\mathrm{Log}$ の定義域に属する。したがって、
$$ \exp(\mathrm{Log}(1+z_n)) = 1+z_n $$
を用いることができる。

中心極限定理【リンデバーグ=レヴィ型】

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X_1,X_2,\ldots$ を実数値確率変数列とする。
$X_1,X_2,\ldots$ は独立同分布であり、
$$ \mathbb E[X_1]=\mu\in\mathbb R, \quad \operatorname{Var}(X_1)=\sigma^2\in(0,\infty) $$
を満たすとする。ただし、
$$ \sigma:=\sqrt{\operatorname{Var}(X_1)}>0 $$
とする。
各 $n\in\mathbb N$ に対して、
$$ \overline X_n := \frac{1}{n}\sum_{i=1}^{n}X_i $$
とおく。
このとき、
$$ \frac{\overline X_n-\mu}{\sigma/\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。

同値に、
$$ \frac{\sum_{i=1}^{n}X_i-n\mu}{\sigma\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。実際、
$$ \frac{\overline X_n-\mu}{\sigma/\sqrt n} = \frac{\sum_{i=1}^{n}X_i-n\mu}{\sigma\sqrt n} $$
である。

各 $i\in\mathbb N$ に対して、
$$ Y_i := \frac{X_i-\mu}{\sigma} $$
とおく。ここで、
$$ \sigma:=\sqrt{\operatorname{Var}(X_1)}>0 $$
であるから、$Y_i$ は定義される。
また、関数 $g:\mathbb R\to\mathbb R$ を
$$ g(x):=\frac{x-\mu}{\sigma} $$
で定めると、$g$ は連続関数であるからボレル可測である。したがって、
$$ Y_i=g(X_i) $$
は実数値確率変数である。
$X_1,X_2,\ldots$ は独立同分布であるから、$Y_1,Y_2,\ldots$ も独立同分布である(補足を参照)。
$ $
また、期待値の線形性( 証明はコチラ )より、
$$ \begin{align} \mathbb E[Y_i] &= \mathbb E\left[\frac{X_i-\mu}{\sigma}\right]\\ &= \frac{1}{\sigma}\mathbb E[X_i-\mu]\\ &= \frac{1}{\sigma}\bigl(\mathbb E[X_i]-\mu\bigr) \quad \because \mu\text{ は定数である}\\ &= \frac{1}{\sigma}(\mu-\mu)\\ &= 0 \end{align} $$
である。
さらに、分散の性質( 証明はコチラ )より、
$$ \begin{align} \operatorname{Var}(Y_i) &= \operatorname{Var}\left(\frac{X_i-\mu}{\sigma}\right)\\ &= \operatorname{Var}\left(\frac{1}{\sigma}X_i-\frac{\mu}{\sigma}\right)\\ &= \frac{1}{\sigma^2}\operatorname{Var}(X_i)\\ &= \frac{1}{\sigma^2}\sigma^2\\ &= 1 \end{align} $$
である。
したがって、分散公式( 証明はコチラ )より、
$$ \begin{align} \mathbb E[Y_i^2] &= \operatorname{Var}(Y_i)+\bigl(\mathbb E[Y_i]\bigr)^2\\ &= 1+0^2\\ &= 1 \end{align} $$
である。
$ $
また、
$$ \begin{align} \frac{\overline X_n-\mu}{\sigma/\sqrt n} &= \frac{\frac{1}{n}\sum_{i=1}^{n}X_i-\mu}{\sigma/\sqrt n}\\ &= \frac{\frac{1}{n}\sum_{i=1}^{n}X_i-\frac{1}{n}\sum_{i=1}^{n}\mu}{\sigma/\sqrt n}\\ &= \frac{\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)}{\sigma/\sqrt n}\\ &= \frac{\sqrt n}{\sigma}\cdot\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)\\ &= \frac{1}{\sigma\sqrt n}\sum_{i=1}^{n}(X_i-\mu)\\ &= \frac{1}{\sqrt n}\sum_{i=1}^{n}\frac{X_i-\mu}{\sigma}\\ &= \frac{1}{\sqrt n}\sum_{i=1}^{n}Y_i \end{align} $$
である。そこで、
$$ Z_n := \frac{1}{\sqrt n}\sum_{i=1}^{n}Y_i $$
とおく。上で示した等式より、
$$ Z_n = \frac{\overline X_n-\mu}{\sigma/\sqrt n} $$
である。したがって、中心極限定理の結論を示すためには、
$$ Z_n\overset{d}{\longrightarrow}\mathcal N(0,1) $$
を示せばよい。
$ $
$Y_1$ の特性関数の $0$ の近傍での展開を示す。
$Y_1$ の特性関数を
$$ \varphi(t) := \mathbb E[e^{itY_1}] \quad (t\in\mathbb R) $$
で定める。まず、
$$ \varphi(0) = \mathbb E[e^0] = \mathbb E[1] = 1 $$
である( 定数の期待値の証明はコチラ )。
ここで、任意の $v\in\mathbb R$ に対して、
$$ |e^{iv}-1-iv| \leq \frac{v^2}{2} $$
が成り立つ($2$つ上の補題)。
そこで、$u\neq0$ とする。各 $\omega\in\Omega$ に対して、補題を
$$ v=uY_1(\omega) $$
に適用すると、
$$ |e^{iuY_1(\omega)}-1-iuY_1(\omega)| \leq \frac{u^2Y_1(\omega)^2}{2} $$
である。
したがって、
$$ \begin{align} \left| \frac{e^{iuY_1(\omega)}-1-iuY_1(\omega)}{u^2} \right| &= \frac{|e^{iuY_1(\omega)}-1-iuY_1(\omega)|}{u^2}\\ &\leq \frac{1}{u^2}\cdot\frac{u^2Y_1(\omega)^2}{2}\\ &= \frac{Y_1(\omega)^2}{2} \end{align} $$
である。すなわち、確率変数として、
$$ \left| \frac{e^{iuY_1}-1-iuY_1}{u^2} \right| \leq \frac{Y_1^2}{2} $$
が成り立つ。
また、各 $\omega\in\Omega$ に対して、
$$ \lim_{u\to0} \frac{e^{iuY_1(\omega)}-1-iuY_1(\omega)}{u^2} = -\frac{Y_1(\omega)^2}{2} $$
である(補足を参照)。さらに、
$$ \begin{align} \mathbb E\left[\frac{Y_1^2}{2}\right] &= \frac{1}{2}\mathbb E[Y_1^2]\\ &= \frac{1}{2}\\ &< \infty \end{align} $$
である( 期待値の性質はコチラ )から、$\frac{Y_1^2}{2}$ は可積分な支配関数である。
ここで、任意の数列 $\{u_m\}_{m=1}^{\infty}$ を
$$ u_m\neq0, \quad u_m\to0 \quad (m\to\infty) $$
を満たすように取る。
すると、各 $\omega\in\Omega$ に対して、
$$ \frac{e^{iu_mY_1(\omega)}-1-iu_mY_1(\omega)}{u_m^2} \to -\frac{Y_1(\omega)^2}{2} $$
であり、さらに任意の $m\in\mathbb N$ に対して、
$$ \left| \frac{e^{iu_mY_1}-1-iu_mY_1}{u_m^2} \right| \leq \frac{Y_1^2}{2} $$
である。
したがって、ルベーグの優収束定理(補足を参照)より、
$$ \begin{align} \lim_{m\to\infty} \mathbb E\left[ \frac{e^{iu_mY_1}-1-iu_mY_1}{u_m^2} \right] &= \mathbb E\left[ \lim_{m\to\infty} \frac{e^{iu_mY_1}-1-iu_mY_1}{u_m^2} \right]\\ &= \mathbb E\left[-\frac{Y_1^2}{2}\right]\\ &= -\frac{1}{2}\mathbb E[Y_1^2]\\ &= -\frac{1}{2} \end{align} $$
である( 期待値の性質はコチラ )。
この極限は任意の数列 $u_m\to0$、$u_m\neq0$ に対して成り立つ。したがって、逐次的特徴づけにより、
$$ \lim_{u\to0} \mathbb E\left[ \frac{e^{iuY_1}-1-iuY_1}{u^2} \right] = -\frac{1}{2} $$
である。
ここで、$u\neq0$ に対して、期待値の線形性( 証明はコチラ )より、
$$ \begin{align} \mathbb E\left[ \frac{e^{iuY_1}-1-iuY_1}{u^2} \right] &= \frac{1}{u^2} \mathbb E\left[e^{iuY_1}-1-iuY_1\right]\\ &= \frac{1}{u^2} \left( \mathbb E[e^{iuY_1}] - \mathbb E[1] - iu\mathbb E[Y_1] \right)\\ &= \frac{1}{u^2} \left( \varphi(u)-1-iu\cdot0 \right)\\ &= \frac{\varphi(u)-1}{u^2} \end{align} $$
である。よって、
$$ \lim_{u\to0} \frac{\varphi(u)-1}{u^2} = -\frac{1}{2} $$
である。これは、
$$ \lim_{u\to0} \frac{\varphi(u)-1+\frac{u^2}{2}}{u^2} = 0 $$
と同値である(補足を参照)。したがって、
$$ \varphi(u)-1+\frac{u^2}{2} = o(u^2) \quad (u\to0) $$
である。ゆえに、
$$ \varphi(u) = 1-\frac{u^2}{2}+o(u^2) \quad (u\to0) $$
である。
$ $
$Z_n$ の特性関数を計算する。
$Z_n$ の特性関数を $\varphi_{Z_n}$ と書く。任意の $t\in\mathbb R$ に対して、
$$ \begin{align} \varphi_{Z_n}(t) &= \mathbb E[e^{itZ_n}]\\ &= \mathbb E\left[ \exp\left( it\frac{1}{\sqrt n}\sum_{i=1}^{n}Y_i \right) \right]\\ &= \mathbb E\left[ \exp\left( \sum_{i=1}^{n}i\frac{t}{\sqrt n}Y_i \right) \right]\\ &= \mathbb E\left[ \prod_{i=1}^{n} \exp\left( i\frac{t}{\sqrt n}Y_i \right) \right] \end{align} $$
である。
ここで、各 $i=1,\ldots,n$ に対して、
$$ W_i := \exp\left( i\frac{t}{\sqrt n}Y_i \right) $$
とおく。
関数 $y\mapsto \exp(i(t/\sqrt n)y)$ は連続関数であるからボレル可測である。
したがって、$W_i$ は $Y_i$ の可測関数である。
$ $
また、$Y_1,\ldots,Y_n$ は独立であるから、$W_1,\ldots,W_n$ も独立である(補足を参照)。
さらに、
$$ |W_i| = \left| \exp\left( i\frac{t}{\sqrt n}Y_i \right) \right| = 1 $$
である(補足を参照)から、$W_i$ は可積分である。
よって、独立性より、
$$ \begin{align} \varphi_{Z_n}(t) &= \mathbb E\left[ \prod_{i=1}^{n}W_i \right]\\ &= \prod_{i=1}^{n}\mathbb E[W_i]\\ &= \prod_{i=1}^{n} \mathbb E\left[ \exp\left( i\frac{t}{\sqrt n}Y_i \right) \right] \end{align} $$
である( 証明はコチラ )。
ここで、$Y_1,\ldots,Y_n$ は同分布であり、$\varphi$ は $Y_1$ の特性関数であるから、
任意の $i=1,\ldots,n$ に対して、
$$ \mathbb E\left[ \exp\left( i\frac{t}{\sqrt n}Y_i \right) \right] = \varphi\left(\frac{t}{\sqrt n}\right) $$
である。
したがって、
$$ \begin{align} \varphi_{Z_n}(t) &= \prod_{i=1}^{n} \varphi\left(\frac{t}{\sqrt n}\right)\\ &= \left( \varphi\left(\frac{t}{\sqrt n}\right) \right)^n \end{align} $$
である。
$ $
$\varphi_{Z_n}(t)$ の極限を求める。
$t\in\mathbb R$ を固定する。まず、$t=0$ の場合は、
$$ \varphi_{Z_n}(0) = \mathbb E[e^{0}] = 1 = \exp\left(-\frac{0^2}{2}\right) $$
である。
以下、$t\neq0$ とする。
すでに示した
$$ \varphi(u) = 1-\frac{u^2}{2}+o(u^2) \quad (u\to0) $$
より、ある関数 $R(u)$ が存在して、
$$ \varphi(u) = 1-\frac{u^2}{2}+R(u), \quad R(u)=o(u^2) \quad (u\to0) $$
と書ける。ここで、
$$ u=\frac{t}{\sqrt n} $$
とおくと、$n\to\infty$ のとき $u\to0$ であるから、
$$ R\left(\frac{t}{\sqrt n}\right) = o\left(\frac{t^2}{n}\right) \quad (n\to\infty) $$
である(補足を参照)。$t$ は固定されているので、
$$ o\left(\frac{t^2}{n}\right) = o\left(\frac{1}{n}\right) $$
である(証明要(後日更新))。したがって、
$$ r_n := R\left(\frac{t}{\sqrt n}\right) $$
とおくと、
$$ r_n=o\left(\frac{1}{n}\right) \quad (n\to\infty) $$
である。よって、
$$ \varphi\left(\frac{t}{\sqrt n}\right) = 1-\frac{t^2}{2n}+r_n $$
であり、
$$ nr_n\to0 \quad (n\to\infty) $$
である(補足を参照)。ここで、
$$ \begin{align} \varphi\left(\frac{t}{\sqrt n}\right) &= 1-\frac{t^2}{2n}+r_n\\ &= 1+\frac{1}{n}\left(-\frac{t^2}{2}+nr_n\right) \end{align} $$
であるから、
$$ a_n := -\frac{t^2}{2}+nr_n $$
とおくと、
$$ a_n\to-\frac{t^2}{2} \quad (n\to\infty) $$
である。そこで、補題
$$ a_n\to a \quad\Longrightarrow\quad \left(1+\frac{a_n}{n}\right)^n\to e^a $$
を用いる(証明済み)と、
$$ \begin{align} \varphi_{Z_n}(t) &= \left( \varphi\left(\frac{t}{\sqrt n}\right) \right)^n\\ &= \left( 1+\frac{a_n}{n} \right)^n\\ &\to \exp\left(-\frac{t^2}{2}\right) \end{align} $$
である。
以上より、任意の $t\in\mathbb R$ に対して、
$$ \lim_{n\to\infty}\varphi_{Z_n}(t) = \exp\left(-\frac{t^2}{2}\right) $$
が成り立つ。
$ $
レヴィの連続性定理を用いる。
$\xi\sim\mathcal N(0,1)$ とする。このとき、標準正規分布の特性関数は
$$ \varphi_{\xi}(t) = \mathbb E[e^{it\xi}] = \exp\left(-\frac{t^2}{2}\right) \quad (t\in\mathbb R) $$
である(証明要(後日更新))。
前段階より、任意の $t\in\mathbb R$ に対して、
$$ \varphi_{Z_n}(t) \to \exp\left(-\frac{t^2}{2}\right) = \varphi_{\xi}(t) \quad (n\to\infty) $$
である。
したがって、レヴィの連続性定理より、
$$ Z_n\overset{d}{\longrightarrow}\xi $$
である。すなわち、
$$ Z_n\overset{d}{\longrightarrow}\mathcal N(0,1) $$
である。
また、$Z_n$ の定義と $Y_i=(X_i-\mu)/\sigma$ より、
$$ \begin{align} Z_n &= \frac{1}{\sqrt n}\sum_{i=1}^{n}Y_i\\ &= \frac{1}{\sqrt n}\sum_{i=1}^{n}\frac{X_i-\mu}{\sigma}\\ &= \frac{1}{\sigma\sqrt n}\sum_{i=1}^{n}(X_i-\mu)\\ &= \frac{\sum_{i=1}^{n}X_i-n\mu}{\sigma\sqrt n}\\ &= \frac{\overline X_n-\mu}{\sigma/\sqrt n} \end{align} $$
である。したがって、
$$ \frac{\overline X_n-\mu}{\sigma/\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。
さらに、
$$ \frac{\overline X_n-\mu}{\sigma/\sqrt n} = \frac{\sum_{i=1}^{n}X_i-n\mu}{\sigma\sqrt n} $$
であるから、
$$ \frac{\sum_{i=1}^{n}X_i-n\mu}{\sigma\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
も成り立つ。
$$ \Box$$

$X_1,X_2,\ldots$ は独立同分布であるから、$Y_1,Y_2,\ldots$ も独立同分布

より一般に、$X_1,X_2,\ldots$ を独立同分布な実数値確率変数列とし、$g:\mathbb R\to\mathbb R$ をボレル可測関数とする。
このとき、
$$ g(X_1),g(X_2),\ldots $$
も独立同分布な実数値確率変数列である。

まず、独立性を示す。
任意の $k\in\mathbb N$、任意の相異なる添字 $i_1,\ldots,i_k\in\mathbb N$、任意のボレル集合 $B_1,\ldots,B_k\in\mathcal B(\mathbb R)$ を取る。
$g$ はボレル可測であるから、各 $j=1,\ldots,k$ に対して、
$$ g^{-1}(B_j)\in\mathcal B(\mathbb R) $$
である。
また、
$$ \{g(X_{i_j})\in B_j\} = \{X_{i_j}\in g^{-1}(B_j)\} $$
が成り立つ。
したがって、$X_1,X_2,\ldots$ の独立性より、
$$ \begin{align} \mathbb P\left( \bigcap_{j=1}^{k}\{g(X_{i_j})\in B_j\} \right) &= \mathbb P\left( \bigcap_{j=1}^{k}\{X_{i_j}\in g^{-1}(B_j)\} \right)\\ &= \prod_{j=1}^{k} \mathbb P\left(X_{i_j}\in g^{-1}(B_j)\right)\\ &= \prod_{j=1}^{k} \mathbb P\left(g(X_{i_j})\in B_j\right) \end{align} $$
である。
よって、$g(X_1),g(X_2),\ldots$ は互いに独立である。
$ $
次に、同分布性を示す。
任意の $i\in\mathbb N$ と任意のボレル集合 $B\in\mathcal B(\mathbb R)$ に対して、
$$ \mathbb P(g(X_i)\in B) = \mathbb P(X_i\in g^{-1}(B)) $$
である。
$X_1,X_2,\ldots$ は同分布であるから、右辺は $i$ によらない。したがって、
$$ \mathbb P(g(X_i)\in B) $$
も $i$ によらない。
よって、$g(X_1),g(X_2),\ldots$ は同分布である。

-以上より、$g(X_1),g(X_2),\ldots$ は独立同分布である。
$$ \Box$$

固定した $\omega\in\Omega$ に対して、
$$ y:=Y_1(\omega) $$
とおく。このとき、$y\in\mathbb R$ は固定された実数である。
指数関数の $0$ まわりのテイラー展開より、
$$ e^z = 1+z+\frac{z^2}{2}+o(z^2) \quad (z\to0) $$
である。
ここで、
$$ z=iuy $$
とおくと、$u\to0$ のとき $z\to0$ であるから、
$$ \begin{align} e^{iuy} &= 1+iuy+\frac{(iuy)^2}{2}+o\bigl((iuy)^2\bigr)\\ &= 1+iuy+\frac{i^2u^2y^2}{2}+o(u^2)\\ &= 1+iuy-\frac{u^2y^2}{2}+o(u^2) \end{align} $$
である。したがって、
$$ \begin{align} e^{iuy}-1-iuy &= -\frac{u^2y^2}{2}+o(u^2) \end{align} $$
である。
両辺を $u^2$ で割ると、
$$ \begin{align} \frac{e^{iuy}-1-iuy}{u^2} &= -\frac{y^2}{2}+\frac{o(u^2)}{u^2} \end{align} $$
である。
$o(u^2)$ の定義より、
$$ \lim_{u\to0}\frac{o(u^2)}{u^2}=0 $$
であるから、
$$ \begin{align} \lim_{u\to0} \frac{e^{iuy}-1-iuy}{u^2} &= -\frac{y^2}{2} \end{align} $$
である。
最後に $y=Y_1(\omega)$ を戻すと、
$$ \begin{align} \lim_{u\to0} \frac{e^{iuY_1(\omega)}-1-iuY_1(\omega)}{u^2} &= -\frac{Y_1(\omega)^2}{2} \end{align} $$
である。

ルベーグの優収束定理

$(S,\mathcal A,\mu)$ を測度空間とし、$f_1,f_2,\ldots$ を $S$ 上の実数値または複素数値可測関数列とする。
ある可測関数 $f:S\to\mathbb C$ が存在して、
$$ f_n(x)\to f(x) \quad (n\to\infty) $$
が $\mu$ ほとんど至るところで成り立つとする。
また、ある非負可積分関数 $g:S\to[0,\infty]$ が存在して、任意の $n\in\mathbb N$ に対して、
$$ |f_n(x)|\leq g(x) $$
が $\mu$ ほとんど至るところで成り立つとする。
このとき、$f$ は可積分であり、
$$ \lim_{n\to\infty}\int_S f_n\,d\mu = \int_S f\,d\mu $$
が成り立つ。
すなわち、
$$ \lim_{n\to\infty}\int_S f_n\,d\mu = \int_S \lim_{n\to\infty} f_n\,d\mu $$
と書ける。

直感的な意味

ルベーグの優収束定理は、極限と積分を交換するための十分条件を与える定理である。
ただし、単に
$$ f_n(x)\to f(x) $$
が成り立つだけでは、一般には
$$ \lim_{n\to\infty}\int_S f_n\,d\mu = \int_S f\,d\mu $$
とは限らない。
そこで、すべての $f_n$ が $1$ つの可積分関数 $g$ によって
$$ |f_n|\leq g $$
と一様に抑えられていることを仮定する。
この $g$ を支配関数という。
支配関数 $g$ が可積分であるため、$f_n$ たちは積分の意味で大きく暴れすぎない。
その結果、点wiseな極限操作を積分の外へ出すことができる。

極限の同値変形

次の極限が成り立っているとする。
$$ \lim_{u\to0} \frac{\varphi(u)-1}{u^2} = -\frac{1}{2} $$
これは、
$$ \frac{\varphi(u)-1}{u^2} $$
が $u\to0$ のとき $-\frac{1}{2}$ に近づくことを意味する。
したがって、極限の和の法則より、
$$ \begin{align} \lim_{u\to0} \left( \frac{\varphi(u)-1}{u^2} + \frac{1}{2} \right) &= \lim_{u\to0} \frac{\varphi(u)-1}{u^2} + \frac{1}{2}\\ &= -\frac{1}{2} + \frac{1}{2}\\ &= 0 \end{align} $$
である。
ここで、$u\neq0$ のもとでは、
$$ \frac{1}{2} = \frac{u^2}{2u^2} = \frac{\frac{u^2}{2}}{u^2} $$
である。よって、
$$ \begin{align} \frac{\varphi(u)-1}{u^2} + \frac{1}{2} &= \frac{\varphi(u)-1}{u^2} + \frac{\frac{u^2}{2}}{u^2}\\ &= \frac{\varphi(u)-1+\frac{u^2}{2}}{u^2} \end{align} $$
である。
したがって、
$$ \lim_{u\to0} \left( \frac{\varphi(u)-1}{u^2} + \frac{1}{2} \right) = 0 $$
は、
$$ \lim_{u\to0} \frac{\varphi(u)-1+\frac{u^2}{2}}{u^2} = 0 $$
と同じ意味である。
逆に、
$$ \lim_{u\to0} \frac{\varphi(u)-1+\frac{u^2}{2}}{u^2} = 0 $$
が成り立つとする。このとき、$u\neq0$ について、
$$ \begin{align} \frac{\varphi(u)-1+\frac{u^2}{2}}{u^2} &= \frac{\varphi(u)-1}{u^2} + \frac{1}{2} \end{align} $$
であるから、
$$ \lim_{u\to0} \left( \frac{\varphi(u)-1}{u^2} + \frac{1}{2} \right) = 0 $$
である。したがって、
$$ \lim_{u\to0} \frac{\varphi(u)-1}{u^2} = -\frac{1}{2} $$
が従う。
以上より、
$$ \lim_{u\to0} \frac{\varphi(u)-1}{u^2} = -\frac{1}{2} $$
と
$$ \lim_{u\to0} \frac{\varphi(u)-1+\frac{u^2}{2}}{u^2} = 0 $$
は同値である。

$R(u)=o(u^2)$ とは、
$$ \lim_{u\to0}\frac{R(u)}{u^2}=0 $$
という意味である。
いま、$t\neq0$ を固定し、
$$ u_n:=\frac{t}{\sqrt n} $$
とおく。このとき、$n\to\infty$ ならば $u_n\to0$ である。
したがって、
$$ \frac{R(u_n)}{u_n^2}\to0 \quad (n\to\infty) $$
である。
ここで、
$$ u_n^2 = \left(\frac{t}{\sqrt n}\right)^2 = \frac{t^2}{n} $$
であるから、
$$ \frac{R(u_n)}{u_n^2} = \frac{R\left(\frac{t}{\sqrt n}\right)}{\frac{t^2}{n}} $$
である。よって、
$$ \frac{R\left(\frac{t}{\sqrt n}\right)}{\frac{t^2}{n}} \to0 \quad (n\to\infty) $$
である。これは、スモール $o$ の定義より、
$$ R\left(\frac{t}{\sqrt n}\right) = o\left(\frac{t^2}{n}\right) \quad (n\to\infty) $$
を意味する。

$r_n=o\left(\frac{1}{n}\right)$ とは、スモール $o$ の定義より、
$$ \lim_{n\to\infty} \frac{r_n}{\frac{1}{n}} = 0 $$
が成り立つことを意味する。
ここで、
$$ \frac{r_n}{\frac{1}{n}} = nr_n $$
である。したがって、
$$ \lim_{n\to\infty}nr_n = 0 $$
である。
すなわち、
$$ nr_n\to0 \quad (n\to\infty) $$
である。

レヴィの連続性定理

$X_1,X_2,\ldots$ を実数値確率変数列とし、$X$ を実数値確率変数とする。
各 $n\in\mathbb N$ に対して、$X_n$ の特性関数を
$$ \varphi_{X_n}(t) := \mathbb E[e^{itX_n}] \quad (t\in\mathbb R) $$
で定める。また、$X$ の特性関数を
$$ \varphi_X(t) := \mathbb E[e^{itX}] \quad (t\in\mathbb R) $$
で定める。
このとき、任意の $t\in\mathbb R$ に対して、
$$ \varphi_{X_n}(t)\to\varphi_X(t) \quad (n\to\infty) $$
が成り立つならば、
$$ X_n\overset{d}{\longrightarrow}X \quad (n\to\infty) $$
が成り立つ。
つまり、確率変数列の特性関数が、ある確率変数 $X$ の特性関数に各点収束するならば、対応する確率変数列は $X$ に分布収束する。

二項分布の正規近似【ド・モアブル=ラプラスの定理】

$0< p<1$ とし、
$$ q:=1-p $$
とおく。各 $n\in\mathbb N$ に対して、
$$ X_n\sim\operatorname{Bin}(n,p) $$
とする。このとき、
$$ T_n := \frac{X_n-np}{\sqrt{npq}} $$
とおけば、
$$ T_n \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。ただし、$\mathcal N(\mu,\sigma^2)$ は平均 $\mu$、分散 $\sigma^2$ の正規分布を表す。

すなわち、$n$ が十分に大きいとき、$X_n$ の分布は標準化の意味で、平均 $np$、分散 $npq$ の正規分布
$$ \mathcal N(np,npq) $$
で近似できる。

$Z_1,Z_2,\ldots$ を独立同分布なベルヌーイ確率変数列であって、各 $i\in\mathbb N$ に対して、
$$ \mathbb P(Z_i=1)=p, \quad \mathbb P(Z_i=0)=q $$
を満たすものとする。
また、離散型確率変数の期待値の定義より、
$$ \begin{align} \mathbb E[Z_i] &= \sum_{z\in\{0,1\}}z\,\mathbb P(Z_i=z)\\ &= 0\cdot\mathbb P(Z_i=0) + 1\cdot\mathbb P(Z_i=1)\\ &= 0\cdot q+1\cdot p\\ &= p \end{align} $$
である。
また、$Z_i$ は $0$ または $1$ の値しかとらないので、
$$ Z_i^2=Z_i $$
である。したがって、
$$ \begin{align} \operatorname{Var}(Z_i) &= \mathbb E[Z_i^2]-\bigl(\mathbb E[Z_i]\bigr)^2\\ &= \mathbb E[Z_i]-p^2\\ &= p-p^2\\ &= p(1-p)\\ &= pq \end{align} $$
である( 分散公式の証明はコチラ )。
ここで、$0< p<1$ であるから、
$$ pq>0 $$
である。よって、$Z_1,Z_2,\ldots$ は平均 $p$、分散 $pq$ の独立同分布な確率変数列である。
ゆえに中心極限定理より、
$$ \frac{\sum_{i=1}^{n}Z_i-np}{\sqrt{npq}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。ここで、
$$ S_n:=\sum_{i=1}^{n}Z_i $$
とおく。
$S_n$ は $n$ 個の独立なベルヌーイ確率変数の和であるから、
$$ S_n\sim\operatorname{Bin}(n,p) $$
である。
一方、仮定より、
$$ X_n\sim\operatorname{Bin}(n,p) $$
である。
したがって、
$$ X_n\overset{d}{=}S_n $$
である。いま、写像 $h_n:\mathbb R\to\mathbb R$ を
$$ h_n(x):=\frac{x-np}{\sqrt{npq}} $$
で定める。$X_n\overset{d}{=}S_n$ であるから、
$$ h_n(X_n)\overset{d}{=}h_n(S_n) $$
である。すなわち、
$$ \frac{X_n-np}{\sqrt{npq}} \overset{d}{=} \frac{S_n-np}{\sqrt{npq}} = \frac{\sum_{i=1}^{n}Z_i-np}{\sqrt{npq}} $$
である。
したがって、分布が等しい確率変数列については分布収束の極限も同じであるから、
$$ \frac{X_n-np}{\sqrt{npq}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。
すなわち、
$$ T_n \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。
$$ \Box$$

二項分布を正規分布で近似するときの連続性補正

二項分布に従う確率変数 $X\sim\operatorname{Bin}(n,p)$ は、$0,1,\ldots,n$ の整数値のみをとる離散型確率変数である。
一方、正規分布に従う確率変数 $Y\sim\mathcal N(np,npq)$ は連続型確率変数であるため、任意の $k\in\mathbb Z$ に対して、
$$ \mathbb P(Y=k)=0 $$
である( 参考記事 )。
したがって、離散分布の点 $k$ に対応する確率を正規分布で近似するときは、点 $k$ そのものではなく、点 $k$ を中心とする幅 $1$ の区間
$$ \left(k-\frac{1}{2},k+\frac{1}{2}\right) $$
を用いる。
この考えにより、たとえば
$$ \mathbb P(X=k) \approx \mathbb P\left(k-\frac{1}{2}< Y< k+\frac{1}{2}\right) $$
と近似する。
同様に、累積確率については
$$ \mathbb P(X\leq k) \approx \mathbb P\left(Y\leq k+\frac{1}{2}\right) $$
と近似する。
また、右側確率については
$$ \mathbb P(X\geq k) \approx \mathbb P\left(Y\geq k-\frac{1}{2}\right) $$
と近似する。
連続型確率変数では端点の確率が $0$ であるため、上の不等号を $<$ や $>$ にしても確率の値は変わらない。
このように、離散的な整数点を連続分布上の区間に対応させることで、二項分布の確率質量と正規分布の面積をより自然に対応させる補正が連続性補正である。

中心極限定理のポアソン分布への適用

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X_1,X_2,\ldots$ を実数値確率変数列とする。
$\lambda>0$ とし、$X_1,X_2,\ldots$ は独立同分布であり、各 $i\in\mathbb N$ に対して、
$$ X_i\sim\operatorname{Poisson}(\lambda) $$
であるとする。各 $n\in\mathbb N$ に対して、
$$ \overline X_n := \frac{1}{n}\sum_{i=1}^{n}X_i $$
とおく。
このとき、
$$ \frac{\overline X_n-\lambda}{\sqrt{\lambda/n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。

同値に、
$$ \frac{\sum_{i=1}^{n}X_i-n\lambda}{\sqrt{n\lambda}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。

$X_i\sim\operatorname{Poisson}(\lambda)$ であるから、ポアソン分布の期待値と分散の公式より、任意の $i\in\mathbb N$ に対して、
$$ \mathbb E[X_i]=\lambda, \quad \operatorname{Var}(X_i)=\lambda $$
である( 証明はコチラ )。
また、仮定より $X_1,X_2,\ldots$ は独立同分布である。
さらに、$\lambda>0$ であるから、
$$ \operatorname{Var}(X_1)=\lambda\in(0,\infty) $$
である。
したがって、(独立同分布版の)中心極限定理を
$$ \mu=\lambda, \quad \sigma^2=\lambda, \quad \sigma=\sqrt{\lambda} $$
として適用できる。ゆえに、
$$ \frac{\overline X_n-\lambda}{\sqrt{\lambda}/\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。
ここで、
$$ \frac{\sqrt{\lambda}}{\sqrt n} = \sqrt{\frac{\lambda}{n}} $$
であるから、
$$ \frac{\overline X_n-\lambda}{\sqrt{\lambda/n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。
また、
$$ \begin{align} \frac{\overline X_n-\lambda}{\sqrt{\lambda/n}} &= \frac{\frac{1}{n}\sum_{i=1}^{n}X_i-\lambda}{\sqrt{\lambda/n}}\\ &= \frac{\frac{1}{n}\sum_{i=1}^{n}X_i-\frac{1}{n}n\lambda}{\sqrt{\lambda/n}}\\ &= \frac{\frac{1}{n}\left(\sum_{i=1}^{n}X_i-n\lambda\right)}{\sqrt{\lambda/n}}\\ &= \frac{\sum_{i=1}^{n}X_i-n\lambda}{n\sqrt{\lambda/n}}\\ &= \frac{\sum_{i=1}^{n}X_i-n\lambda}{\sqrt{n\lambda}} \end{align} $$
である。
したがって、
$$ \frac{\sum_{i=1}^{n}X_i-n\lambda}{\sqrt{n\lambda}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
も成り立つ。
$$ \Box$$

指数分布に従う独立同分布列に対する中心極限定理

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X_1,X_2,\ldots$ を実数値確率変数列とする。
$\lambda>0$ とし、$X_1,X_2,\ldots$ は独立同分布であり、各 $i\in\mathbb N$ に対して、
$$ X_i\sim\operatorname{Exp}(\lambda) $$
であるとする。各 $n\in\mathbb N$ に対して、
$$ \overline X_n := \frac{1}{n}\sum_{i=1}^{n}X_i $$
とおく。このとき、
$$ \frac{\overline X_n-\frac{1}{\lambda}}{\frac{1}{\lambda\sqrt n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。

同値に、
$$ \lambda\sqrt n \left( \overline X_n-\frac{1}{\lambda} \right) \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。

$X_i\sim\operatorname{Exp}(\lambda)$ であるから、指数分布の期待値と分散の公式( 証明はコチラ )より、
任意の $i\in\mathbb N$ に対して、
$$ \mathbb E[X_i]=\frac{1}{\lambda}, \quad \operatorname{Var}(X_i)=\frac{1}{\lambda^2} $$
である。
また、仮定より $X_1,X_2,\ldots$ は独立同分布である。
さらに、$\lambda>0$ であるから、
$$ \operatorname{Var}(X_1)=\frac{1}{\lambda^2}\in(0,\infty) $$
である。
したがって、独立同分布版の中心極限定理を
$$ \mu=\frac{1}{\lambda}, \quad \sigma^2=\frac{1}{\lambda^2}, \quad \sigma=\frac{1}{\lambda} $$
として適用できる。ゆえに、
$$ \frac{\overline X_n-\frac{1}{\lambda}}{\frac{1}{\lambda}/\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。ここで、
$$ \frac{\frac{1}{\lambda}}{\sqrt n} = \frac{1}{\lambda\sqrt n} $$
であるから、
$$ \frac{\overline X_n-\frac{1}{\lambda}}{\frac{1}{\lambda\sqrt n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。また、
$$ \begin{align} \frac{\overline X_n-\frac{1}{\lambda}}{\frac{1}{\lambda\sqrt n}} &= \lambda\sqrt n \left( \overline X_n-\frac{1}{\lambda} \right)\\ &= \lambda\sqrt n \left( \frac{1}{n}\sum_{i=1}^{n}X_i-\frac{1}{\lambda} \right)\\ &= \lambda\sqrt n \left( \frac{1}{n}\sum_{i=1}^{n}X_i-\frac{1}{n}\cdot\frac{n}{\lambda} \right)\\ &= \lambda\sqrt n \cdot \frac{1}{n} \left( \sum_{i=1}^{n}X_i-\frac{n}{\lambda} \right)\\ &= \frac{\lambda}{\sqrt n} \left( \sum_{i=1}^{n}X_i-\frac{n}{\lambda} \right)\\ &= \frac{\sum_{i=1}^{n}X_i-\frac{n}{\lambda}}{\frac{\sqrt n}{\lambda}} \end{align} $$
である。
したがって、
$$ \frac{\sum_{i=1}^{n}X_i-\frac{n}{\lambda}}{\frac{\sqrt n}{\lambda}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
も成り立つ。
$$ \Box$$

自由度 $n$ のカイ二乗分布の標準化極限

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$Z_1,Z_2,\ldots$ を実数値確率変数列とする。
$Z_1,Z_2,\ldots$ は独立同分布であり、各 $i\in\mathbb N$ に対して、
$$ Z_i\sim\mathcal N(0,1) $$
であるとする。各 $n\in\mathbb N$ に対して、
$$ X_n := \sum_{i=1}^{n}Z_i^2 $$
とおく。このとき、
$$ X_n\sim\chi^2(n) $$
であり、さらに、
$$ \frac{X_n-n}{\sqrt{2n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。

各 $i\in\mathbb N$ に対して、
$$ Y_i:=Z_i^2 $$
とおく。関数 $g:\mathbb R\to\mathbb R$ を
$$ g(x):=x^2 $$
で定めると、$g$ は連続関数であるからボレル可測である。
したがって、
$$ Y_i=g(Z_i) $$
は実数値確率変数である。
また、$Z_1,Z_2,\ldots$ は独立同分布であるから、可測関数の性質より、
$$ Y_1,Y_2,\ldots $$
も独立同分布である(補足を参照)。
$ $
次に、$Y_i$ の平均と分散を求める。
$Z_i\sim\mathcal N(0,1)$ であるから、標準正規分布のモーメント公式(証明要(後日更新))より、
$$ \mathbb E[Z_i^2]=1, \quad \mathbb E[Z_i^4]=3 $$
である。
したがって、
$$ \mathbb E[Y_i] = \mathbb E[Z_i^2] = 1 $$
である。
また、
$$ Y_i^2 = (Z_i^2)^2 = Z_i^4 $$
であるから、
$$ \mathbb E[Y_i^2] = \mathbb E[Z_i^4] = 3 $$
である。よって、
$$ \begin{align} \operatorname{Var}(Y_i) &= \mathbb E[Y_i^2]-\bigl(\mathbb E[Y_i]\bigr)^2\\ &= 3-1^2\\ &= 2 \end{align} $$
である( 分散公式の証明はコチラ )。
以上より、$Y_1,Y_2,\ldots$ は平均 $1$、分散 $2$ の独立同分布な実数値確率変数列である。
特に、
$$ \operatorname{Var}(Y_1)=2\in(0,\infty) $$
である。
$ $
したがって、独立同分布版の中心極限定理を
$$ \mu=1, \quad \sigma^2=2, \quad \sigma=\sqrt2 $$
として適用できる。
ゆえに、
$$ \frac{\frac{1}{n}\sum_{i=1}^{n}Y_i-1}{\sqrt2/\sqrt n} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。ここで、
$$ \begin{align} \frac{\frac{1}{n}\sum_{i=1}^{n}Y_i-1}{\sqrt2/\sqrt n} &= \frac{\frac{1}{n}\sum_{i=1}^{n}Y_i-\frac{1}{n}n}{\sqrt2/\sqrt n}\\ &= \frac{\frac{1}{n}\left(\sum_{i=1}^{n}Y_i-n\right)}{\sqrt2/\sqrt n}\\ &= \frac{\sum_{i=1}^{n}Y_i-n}{n\sqrt2/\sqrt n}\\ &= \frac{\sum_{i=1}^{n}Y_i-n}{\sqrt{2n}} \end{align} $$
である。したがって、
$$ \frac{\sum_{i=1}^{n}Y_i-n}{\sqrt{2n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
である。一方、$Y_i=Z_i^2$ であるから、
$$ \sum_{i=1}^{n}Y_i = \sum_{i=1}^{n}Z_i^2 = X_n $$
である。よって、
$$ \frac{X_n-n}{\sqrt{2n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。
$ $
最後に、$Z_1,\ldots,Z_n$ は互いに独立であり、各 $i=1,\ldots,n$ に対して $Z_i\sim\mathcal N(0,1)$ である。
したがって、カイ二乗分布の定義より、
$$ X_n = \sum_{i=1}^{n}Z_i^2 \sim \chi^2(n) $$
である。

-以上より、
$$ X_n\sim\chi^2(n) $$
であり、さらに、
$$ \frac{X_n-n}{\sqrt{2n}} \overset{d}{\longrightarrow} \mathcal N(0,1) \quad (n\to\infty) $$
が成り立つ。
$$ \Box$$

$X_1,X_2,\ldots$ は独立同分布であるから、$Y_1,Y_2,\ldots$ も独立同分布

まず、独立性を示す。
任意の $k\in\mathbb N$、任意の相異なる添字 $i_1,\ldots,i_k\in\mathbb N$、任意のボレル集合 $B_1,\ldots,B_k\in\mathcal B(\mathbb R)$ を取る。
$g$ はボレル可測であるから、各 $j=1,\ldots,k$ に対して、
$$ g^{-1}(B_j)\in\mathcal B(\mathbb R) $$
である。
また、
$$ \{g(X_{i_j})\in B_j\} = \{X_{i_j}\in g^{-1}(B_j)\} $$
が成り立つ。
したがって、$X_1,X_2,\ldots$ の独立性より、
$$ \begin{align} \mathbb P\left( \bigcap_{j=1}^{k}\{g(X_{i_j})\in B_j\} \right) &= \mathbb P\left( \bigcap_{j=1}^{k}\{X_{i_j}\in g^{-1}(B_j)\} \right)\\ &= \prod_{j=1}^{k} \mathbb P\left(X_{i_j}\in g^{-1}(B_j)\right)\\ &= \prod_{j=1}^{k} \mathbb P\left(g(X_{i_j})\in B_j\right) \end{align} $$
である。
よって、$g(X_1),g(X_2),\ldots$ は互いに独立である。
$ $
次に、同分布性を示す。
任意の $i\in\mathbb N$ と任意のボレル集合 $B\in\mathcal B(\mathbb R)$ に対して、
$$ \mathbb P(g(X_i)\in B) = \mathbb P(X_i\in g^{-1}(B)) $$
である。
$X_1,X_2,\ldots$ は同分布であるから、右辺は $i$ によらない。したがって、
$$ \mathbb P(g(X_i)\in B) $$
も $i$ によらない。
よって、$g(X_1),g(X_2),\ldots$ は同分布である。

-以上より、$g(X_1),g(X_2),\ldots$ は独立同分布である。
$$ \Box$$

参考文献

[1]

中心極限定理, 閲覧日 2026年5月16日, https://ja.wikipedia.org/wiki/%E4%B8%AD%E5%BF%83%E6%A5%B5%E9%99%90%E5%AE%9A%E7%90%86

[2]

久保川達也, 現代数理統計学の基礎, P96

投稿日：3日前

更新日：2日前

数学の力で現場を変えるアルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

Kagura

4872

■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。　　　　　　　　　 ----------------------------------------------- ■ ノート『数学概論』の読み方　　　　 STEP1：まずは定義を一通り理解し覚える。 STEP2：具体例を考えてみる。　　　 STEP3：各命題の主張を一通り理解する。 STEP4：証明を繰り返し読んで流れを掴む。 (まずはココまでで良い)　　　　　　　　 STEP5：何も見ずに定義に従って証明を創る。 STEP6：STEP5の他の証明方法を創ってみる。　　　 STEP7：自由に命題と証明を創ってみる　　

他の人のコメント

コメントはありません。

読み込み中

Kagura

古典的な中心極限定理について