$$$$
Def.
正規分布
$\mu\in\mathbb R$、$\sigma>0$ とする。
関数 $p_{\mu,\sigma^2}:\mathbb R\to[0,\infty)$ を
$$
p_{\mu,\sigma^2}(x)
:=
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
によって定める。
- 確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $X$ が、任意の実数 $a,b$ について、$a\leq b$ ならば
$$
\mathbb P(a\leq X\leq b)
=
\int_a^b p_{\mu,\sigma^2}(x)\,dx
$$
を満たすとき、$X$ はパラメータ $\mu,\sigma^2$ の正規分布に従うという。
$ $ - このことを
$$
X\sim\mathcal N(\mu,\sigma^2)
$$
または
$$
X\sim N(\mu,\sigma^2)
$$
と表す。
$ $ - 特に、確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が
$$
Z\sim\mathcal N(0,1)
$$
を満たすとき、$Z$ は標準正規分布に従うという。
正規分布の平均と分散
$X\sim\mathcal N(\mu,\sigma^2)$ ならば、
$$
\mathbb E[X]=\mu,\quad \operatorname{Var}(X)=\sigma^2
$$
である。
したがって、$\mu$ は平均を表し、$\sigma^2$ は分散を表す。また、$\sigma$ は標準偏差を表す。
標準正規分布の密度関数
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が
$$
Z\sim\mathcal N(0,1)
$$
を満たすとき、$Z$ の確率密度関数は
$$
\varphi(x)
:=
p_{0,1}(x)
=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{x^2}{2}\right)
$$
である。
累積分布関数
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B(\mathbb R))$ を実数値確率変数とする。
関数 $F_X:\mathbb R\to[0,1]$ を、各 $x\in\mathbb R$ に対して
$$
F_X(x):=\mathbb P(\{\omega\in\Omega\mid X(\omega)\le x\})
$$
によって定める。
この関数 $F_X$ を $X$ の累積分布関数、または分布関数という。
Prop&Proof.
ガウス積分
関数 $f:\mathbb R\to\mathbb R$ を
$$
f(x):=e^{-x^2}
$$
によって定める。
- このとき、広義リーマン積分
$$
\int_{-\infty}^{0}e^{-x^2}\,dx
\quad\text{および}\quad
\int_{0}^{\infty}e^{-x^2}\,dx
$$
はいずれも収束する。 - また、
$$
\int_{-\infty}^{\infty}e^{-x^2}\,dx
:=
\int_{-\infty}^{0}e^{-x^2}\,dx
+
\int_{0}^{\infty}e^{-x^2}\,dx
=
\sqrt{\pi}
$$
が成り立つ。
- $R>0$ とし、
$$
I_R:=\int_{-R}^{R}e^{-x^2}\,dx
$$
とおく。
ここで、関数 $(x,y)\mapsto e^{-(x^2+y^2)}$ は $[-R,R]^2$ 上連続であるから、リーマン積分可能である。
また、有限区間上の積分の積について、
$$
I_R^2
=
\left(\int_{-R}^{R}e^{-x^2}\,dx\right)
\left(\int_{-R}^{R}e^{-y^2}\,dy\right)
=
\int_{-R}^{R}\int_{-R}^{R}e^{-(x^2+y^2)}\,dy\,dx
$$
が成り立つ。
$ $ - ここで、
$$
D_R:=\{(x,y)\in\mathbb R^2\mid x^2+y^2\leq R^2\}
$$
とおくと、
$$
D_R\subseteq[-R,R]^2\subseteq D_{\sqrt{2}R}
$$
である(補足を参照)。
さらに、$e^{-(x^2+y^2)}\geq0$ であるから、積分の単調性より、
$$
\iint_{D_R}e^{-(x^2+y^2)}\,dx\,dy
\leq
I_R^2
\leq
\iint_{D_{\sqrt{2}R}}e^{-(x^2+y^2)}\,dx\,dy
$$
である。
閉円板 $D_R$ および $D_{\sqrt{2}R}$ は有界なジョルダン可測集合であり、
関数 $(x,y)\mapsto e^{-(x^2+y^2)}$ は連続であるから、これらの領域上でリーマンの意味で重積分可能である。
$D_R\subseteq[-R,R]^2\subseteq D_{\sqrt{2}R}$ の直観的なイメージ
半径 $R$ の閉円板 $D_R$ は、一辺の長さが $2R$ の正方形 $[-R,R]^2$ に含まれる。
また、正方形 $[-R,R]^2$ の中心から各頂点までの距離は $\sqrt{2}R$ であるから、正方形 $[-R,R]^2$ は半径 $\sqrt{2}R$ の閉円板 $D_{\sqrt{2}R}$ に含まれる。
$ $
3. i) 極座標変換 $x=r\cos\theta$、$y=r\sin\theta$ を用いる(補足を参照)。
このとき、$D_R$ は
$$
0\leq r\leq R,\quad 0\leq\theta\leq2\pi
$$
で表される。
また、ヤコビアンは
$$
\begin{align}
J
&=
\frac{\partial(x,y)}{\partial(r,\theta)}
\\
&=
\begin{vmatrix}
\dfrac{\partial x}{\partial r} & \dfrac{\partial x}{\partial\theta}
\\
\dfrac{\partial y}{\partial r} & \dfrac{\partial y}{\partial\theta}
\end{vmatrix}
\\
&=
\begin{vmatrix}
\cos\theta & -r\sin\theta
\\
\sin\theta & r\cos\theta
\end{vmatrix}
&&\because x=r\cos\theta,\ y=r\sin\theta
\\
&=
r\cos^2\theta+r\sin^2\theta
\\
&=
r
&&\because \cos^2\theta+\sin^2\theta=1
\end{align}
$$
である。したがって、$r\geq0$ より $|J|=r$ である。
ゆえに、
$$
\begin{align}
\iint_{D_R}e^{-(x^2+y^2)}\,dx\,dy
&=
\int_0^{2\pi}\int_0^R e^{-r^2}r\,dr\,d\theta
&&\because x^2+y^2=r^2,\ |J|=r
\\
&=
\int_0^{2\pi}
\left[-\frac{1}{2}e^{-r^2}\right]_{0}^{R}
\,d\theta
&&\because \int e^{-r^2}r\,dr=-\frac{1}{2}e^{-r^2}
\\
&=
\int_0^{2\pi}\frac{1}{2}(1-e^{-R^2})\,d\theta
&&\because \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{R}
=
\frac{1}{2}(1-e^{-R^2})
\\
&=
\frac{1}{2}(1-e^{-R^2})\int_0^{2\pi}1\,d\theta
&&\because \frac{1}{2}(1-e^{-R^2})\text{ は }\theta\text{ に依存しない}
\\
&=
\pi(1-e^{-R^2})
&&\because \int_0^{2\pi}1\,d\theta=2\pi
\end{align}
$$
である。
$ $
ii) 同様に、極座標変換 $x=r\cos\theta$、$y=r\sin\theta$ を用いると、
閉円板 $D_{\sqrt{2}R}$ は
$$
0\leq r\leq \sqrt{2}R,\quad 0\leq\theta\leq2\pi
$$
で表される。
また、ヤコビアンは
$$
\begin{align}
J
&=
\frac{\partial(x,y)}{\partial(r,\theta)}
\\
&=
\begin{vmatrix}
\dfrac{\partial x}{\partial r} & \dfrac{\partial x}{\partial\theta}
\\
\dfrac{\partial y}{\partial r} & \dfrac{\partial y}{\partial\theta}
\end{vmatrix}
\\
&=
\begin{vmatrix}
\cos\theta & -r\sin\theta
\\
\sin\theta & r\cos\theta
\end{vmatrix}
&&\because x=r\cos\theta,\ y=r\sin\theta
\\
&=
r\cos^2\theta+r\sin^2\theta
\\
&=
r
&&\because \cos^2\theta+\sin^2\theta=1
\end{align}
$$
である。したがって、$r\geq0$ より $|J|=r$ である。
ゆえに、
$$
\begin{align}
\iint_{D_{\sqrt{2}R}}e^{-(x^2+y^2)}\,dx\,dy
&=
\int_0^{2\pi}\int_0^{\sqrt{2}R} e^{-r^2}r\,dr\,d\theta
&&\because x^2+y^2=r^2,\ |J|=r
\\
&=
\int_0^{2\pi}
\left[-\frac{1}{2}e^{-r^2}\right]_{0}^{\sqrt{2}R}
\,d\theta
&&\because \int e^{-r^2}r\,dr=-\frac{1}{2}e^{-r^2}
\\
&=
\int_0^{2\pi}\frac{1}{2}(1-e^{-2R^2})\,d\theta
&&\because \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{\sqrt{2}R}
=
\frac{1}{2}(1-e^{-2R^2})
\\
&=
\frac{1}{2}(1-e^{-2R^2})\int_0^{2\pi}1\,d\theta
&&\because \frac{1}{2}(1-e^{-2R^2})\text{ は }\theta\text{ に依存しない}
\\
&=
\pi(1-e^{-2R^2})
&&\because \int_0^{2\pi}1\,d\theta=2\pi
\end{align}
$$
である。
以上より、
$$
\pi(1-e^{-R^2})
\leq
I_R^2
\leq
\pi(1-e^{-2R^2})
$$
である。
極座標変換 $x=r\cos\theta$、$y=r\sin\theta$ を用いる点
極座標表示は $r=0$ および $\theta=0,2\pi$ 上で重複をもつが、これらは面積 $0$ の境界部分であるため、
リーマン(重)積分の値には影響しない。
$ $
4. ここで、
$$
\lim_{R\to\infty}\pi(1-e^{-R^2})=\pi,
\quad
\lim_{R\to\infty}\pi(1-e^{-2R^2})=\pi
$$
であるから、はさみうちの原理より、
$$
\lim_{R\to\infty}I_R^2=\pi
$$
である。
また、任意の $R>0$ に対して $I_R>0$ であるから、
$$
I_R=\sqrt{I_R^2}
$$
である。
平方根関数 $\sqrt{x}$ は $[0,\infty)$ 上連続であるから、連続関数と極限の交換により、
$$
\lim_{R\to\infty}I_R
=
\lim_{R\to\infty}\sqrt{I_R^2}
=
\sqrt{\lim_{R\to\infty}I_R^2}
=
\sqrt{\pi}
$$
である。
$ $
5. さらに、$e^{-x^2}$ は偶関数であるから、任意の $R>0$ に対して
$$
I_R
=
2\int_0^R e^{-x^2}\,dx
$$
である。ゆえに、
$$
\lim_{R\to\infty}\int_0^R e^{-x^2}\,dx
=
\frac{\sqrt{\pi}}{2}
$$
である。
したがって、広義リーマン積分
$$
\int_0^\infty e^{-x^2}\,dx
$$
は収束し、
$$
\int_0^\infty e^{-x^2}\,dx
=
\frac{\sqrt{\pi}}{2}
$$
である。
$ $
6. また、任意の $R>0$ に対して、
$$
\int_{-R}^0 e^{-x^2}\,dx
=
\int_0^R e^{-u^2}\,du
$$
であることを示す。変数変換
$$
u=-x
$$
を用いる。このとき、
$$
x=-u
$$
であり、
$$
\frac{dx}{du}=-1
$$
である。また、積分区間の端点は、
$$
x=-R\quad\Longrightarrow\quad u=R
$$
および
$$
x=0\quad\Longrightarrow\quad u=0
$$
となる。
したがって、定積分の変数変換公式より、
$$
\begin{align}
\int_{-R}^0 e^{-x^2}\,dx
&=
\int_R^0 e^{-(-u)^2}(-1)\,du
&&\because u=-x,\ x=-u,\ dx=-du
\\
&=
-\int_R^0 e^{-u^2}\,du
&&\because (-u)^2=u^2
\\
&=
\int_0^R e^{-u^2}\,du
&&\because -\int_R^0 g(u)\,du=\int_0^R g(u)\,du
\end{align}
$$
である。
ここで、広義リーマン積分の定義より、
$$
\int_{-\infty}^0 e^{-x^2}\,dx
:=
\lim_{R\to\infty}\int_{-R}^0 e^{-x^2}\,dx
$$
である。
よって、上で示した等式から、
$$
\begin{align}
\int_{-\infty}^0 e^{-x^2}\,dx
&=
\lim_{R\to\infty}\int_{-R}^0 e^{-x^2}\,dx
\\
&=
\lim_{R\to\infty}\int_0^R e^{-u^2}\,du
\\
&=
\int_0^\infty e^{-u^2}\,du
\\
&=
\frac{\sqrt{\pi}}{2}
\end{align}
$$
である。ここで、積分変数は記号にすぎないので、
$$
\int_0^\infty e^{-u^2}\,du
=
\int_0^\infty e^{-x^2}\,dx
$$
である。したがって、
$$
\int_{-\infty}^0 e^{-x^2}\,dx
=
\int_0^\infty e^{-x^2}\,dx
=
\frac{\sqrt{\pi}}{2}
$$
である。
-以上より、
$$
\int_{-\infty}^{\infty}e^{-x^2}\,dx
:=
\int_{-\infty}^{0}e^{-x^2}\,dx
+
\int_{0}^{\infty}e^{-x^2}\,dx
=
\sqrt{\pi}
$$
である。
$$ \Box$$
正規分布の確率密度関数の全積分
$\mu\in\mathbb R$、$\sigma>0$ とする。
関数 $p_{\mu,\sigma^2}:\mathbb R\to[0,\infty)$ を
$$
p_{\mu,\sigma^2}(x)
:=
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
によって定める。
このとき、広義リーマン積分
$$
\int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx
$$
は収束し、
$$
\int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx
=
1
$$
である。
- $\sigma>0$ より、$\sqrt{\sigma^2}=\sigma$ である。したがって、
$$
p_{\mu,\sigma^2}(x)
=
\frac{1}{\sigma\sqrt{2\pi}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
である。
$ $ - 任意に $a,b\in\mathbb R$ を $a< b$ となるようにとる。このとき、
$$
\int_a^b p_{\mu,\sigma^2}(x)\,dx
=
\int_a^b
\frac{1}{\sigma\sqrt{2\pi}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\,dx
$$
である。ここで、
$$
u:=\frac{x-\mu}{\sigma}
$$
とおくと、$\sigma>0$ より、この変数変換は単調増加な $C^1$ 級の変数変換であり、
$$
dx=\sigma\,du
$$
である。また、$x=a$ のとき $u=\frac{a-\mu}{\sigma}$ であり、$x=b$ のとき $u=\frac{b-\mu}{\sigma}$ である。
したがって、有限区間上の変数変換により、
$$
\begin{align}
\int_a^b p_{\mu,\sigma^2}(x)\,dx
&=
\int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}}
\frac{1}{\sigma\sqrt{2\pi}}
e^{-u^2/2}\sigma\,du
\\
&=
\frac{1}{\sqrt{2\pi}}
\int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}}
e^{-u^2/2}\,du
\end{align}
$$
である。
ここで、$a\to-\infty$ とすると $\frac{a-\mu}{\sigma}\to-\infty$ であり、$b\to\infty$ とすると $\frac{b-\mu}{\sigma}\to\infty$ である。よって、
$$
\int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx
=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}e^{-u^2/2}\,du
$$
である。
$ $ - 次に、
$$
v:=\frac{u}{\sqrt{2}}
$$
とおくと、
$$
du=\sqrt{2}\,dv
$$
である。また、$u\to-\infty$ のとき $v\to-\infty$ であり、$u\to\infty$ のとき $v\to\infty$ である。
したがって、
$$
\begin{align}
\int_{-\infty}^{\infty}e^{-u^2/2}\,du
&=
\int_{-\infty}^{\infty}e^{-v^2}\sqrt{2}\,dv
\\
&=
\sqrt{2}\int_{-\infty}^{\infty}e^{-v^2}\,dv
\\
&=
\sqrt{2}\sqrt{\pi}
\\
&=
\sqrt{2\pi}
\end{align}
$$
である。ゆえに、
$$
\begin{align}
\int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx
&=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}e^{-u^2/2}\,du
\\
&=
\frac{1}{\sqrt{2\pi}}\sqrt{2\pi}
\\
&=
1
\end{align}
$$
である。
-したがって、
$$
\int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx
=
1
$$
である。
$$ \Box$$
正規分布の期待値
$\mu\in\mathbb R$、$\sigma>0$ とする。実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。
このとき、$X$ の期待値は存在し、
$$
\mathbb E[X]=\mu
$$
である。
$X\sim\mathcal N(\mu,\sigma^2)$ とする。
このとき、$X$ の確率密度関数 $p:\mathbb R\to[0,\infty)$ は
$$
p(x)
=
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
である。$\sigma>0$ より、$\sqrt{\sigma^2}=\sigma$ であるから、
$$
p(x)
=
\frac{1}{\sigma\sqrt{2\pi}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
である。
- まず、期待値の存在を示す。
任意に $a,b\in\mathbb R$ を $a< b$ となるようにとる。変数変換
$$
t=\frac{x-\mu}{\sigma}
$$
を用いると、
$$
x=\sigma t+\mu,\quad dx=\sigma\,dt
$$
である。
また、$x=a$ のとき $t=\frac{a-\mu}{\sigma}$ であり、$x=b$ のとき $t=\frac{b-\mu}{\sigma}$ である。
したがって、有限区間上の変数変換により、
$$
\begin{align}
\int_a^b |x|p(x)\,dx
&=
\int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}}
|\sigma t+\mu|
\frac{1}{\sigma\sqrt{2\pi}}
e^{-t^2/2}\sigma\,dt
\\
&=
\frac{1}{\sqrt{2\pi}}
\int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}}
|\sigma t+\mu|e^{-t^2/2}\,dt
\end{align}
$$
である。ここで、三角不等式より
$$
|\sigma t+\mu|
\leq
\sigma |t|+|\mu|
$$
であるから、
$$
|\sigma t+\mu|e^{-t^2/2}
\leq
\sigma |t|e^{-t^2/2}
+
|\mu|e^{-t^2/2}
$$
である。また、
$$
\begin{align}
\int_{-\infty}^{\infty}|t|e^{-t^2/2}\,dt
&=
\int_{-\infty}^{0}|t|e^{-t^2/2}\,dt
+
\int_{0}^{\infty}|t|e^{-t^2/2}\,dt
\quad
\because \text{広義積分を左右に分ける}
\\
&=
\int_{-\infty}^{0}(-t)e^{-t^2/2}\,dt
+
\int_{0}^{\infty}t e^{-t^2/2}\,dt
\quad
\because t<0\text{ では }|t|=-t,\ t>0\text{ では }|t|=t
\\
&=
\lim_{a\to-\infty}
\int_{a}^{0}(-t)e^{-t^2/2}\,dt
+
\int_{0}^{\infty}t e^{-t^2/2}\,dt
\quad
\because \int_{-\infty}^{0}\text{ は広義積分}
\\
&=
\lim_{a\to-\infty}
\int_{-a}^{0}u e^{-u^2/2}(-du)
+
\int_{0}^{\infty}t e^{-t^2/2}\,dt
\quad
\because u=-t,\ dt=-du
\\
&=
\lim_{a\to-\infty}
\int_{0}^{-a}u e^{-u^2/2}\,du
+
\int_{0}^{\infty}t e^{-t^2/2}\,dt
\quad
\because \text{積分区間の向きを入れ替える}
\\
&=
\int_{0}^{\infty}u e^{-u^2/2}\,du
+
\int_{0}^{\infty}t e^{-t^2/2}\,dt
\quad
\because a\to-\infty\text{ ならば }-a\to\infty
\\
&=
2\int_{0}^{\infty}t e^{-t^2/2}\,dt
\quad
\because \text{積分変数の名前は値に影響しない}
\\
&=
2\lim_{b\to\infty}
\int_{0}^{b}t e^{-t^2/2}\,dt
\quad
\because \int_{0}^{\infty}\text{ は広義積分である}
\\
&=
2\lim_{b\to\infty}
\left[-e^{-t^2/2}\right]_{0}^{b}
\quad
\because \frac{d}{dt}\left(-e^{-t^2/2}\right)=t e^{-t^2/2}
\\
&=
2\lim_{b\to\infty}
\left(-e^{-b^2/2}+1\right)
\quad
\because e^0=1
\\
&=
2
\quad
\because \lim_{b\to\infty}e^{-b^2/2}=0
\end{align}
$$
であり、ガウス積分(本記事内で証明済み)より、
$$
\int_{-\infty}^{\infty}e^{-t^2/2}\,dt
=
\sqrt{2\pi}
$$
である。したがって、
$$
\int_{-\infty}^{\infty}|t|e^{-t^2/2}\,dt<\infty,
\quad
\int_{-\infty}^{\infty}e^{-t^2/2}\,dt<\infty
$$
であるから、比較判定法(補足を参照)より、
$$
\int_{-\infty}^{\infty}
|\sigma t+\mu|e^{-t^2/2}\,dt<\infty
$$
である。ゆえに、$a\to-\infty$、$b\to\infty$ として、
$$
\int_{-\infty}^{\infty}|x|p(x)\,dx
=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}
|\sigma t+\mu|e^{-t^2/2}\,dt
<\infty
$$
である。
したがって、$\mathbb E[X]$ は存在し、
$$
\mathbb E[X]
=
\int_{-\infty}^{\infty}xp(x)\,dx
$$
が定義される。
$ $ - 次に、この値を計算する。変数変換
$$
t=\frac{x-\mu}{\sigma}
$$
を用いると、
$$
x=\sigma t+\mu,\quad dx=\sigma\,dt
$$
であり、$x\to-\infty$ のとき $t\to-\infty$、$x\to\infty$ のとき $t\to\infty$ である。
したがって、
$$
\begin{align}
\mathbb E[X]
&=
\int_{-\infty}^{\infty}
x\frac{1}{\sigma\sqrt{2\pi}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\,dx
\\
&=
\frac{1}{\sigma\sqrt{2\pi}}
\int_{-\infty}^{\infty}
(\sigma t+\mu)e^{-t^2/2}\sigma\,dt
\\
&=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}
(\sigma t+\mu)e^{-t^2/2}\,dt
\\
&=
\frac{\sigma}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}
t e^{-t^2/2}\,dt
+
\frac{\mu}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}
e^{-t^2/2}\,dt
\end{align}
$$
である。
ここで、前述の計算より
$$
\int_0^\infty t e^{-t^2/2}\,dt
=
\left[-e^{-t^2/2}\right]_0^\infty
=
1
$$
である。
また、変数変換 $u=-t$ により、
$$
\begin{align}
\int_{-\infty}^{0}t e^{-t^2/2}\,dt
&=
\lim_{a\to-\infty}\int_a^0 t e^{-t^2/2}\,dt
\quad
\because \int_{-\infty}^{0}\text{ は広義積分である}
\\
&=
\lim_{a\to-\infty}\int_{-a}^{0}(-u)e^{-u^2/2}(-du)
\quad
\because u=-t,\ dt=-du
\\
&=
\lim_{a\to-\infty}\int_{-a}^{0}u e^{-u^2/2}\,du
\\
&=
-\lim_{a\to-\infty}\int_0^{-a}u e^{-u^2/2}\,du
\quad
\because \int_{\alpha}^{\beta}f(u)\,du=-\int_{\beta}^{\alpha}f(u)\,du
\\
&=
-\int_0^\infty u e^{-u^2/2}\,du
\quad
\because a\to-\infty\text{ ならば }-a\to\infty
\\
&=
-1
\end{align}
$$
である。したがって、
$$
\int_{-\infty}^{\infty}t e^{-t^2/2}\,dt
=
\int_{-\infty}^{0}t e^{-t^2/2}\,dt
+
\int_0^\infty t e^{-t^2/2}\,dt
=
-1+1
=
0
$$
である。また、ガウス積分より、
$$
\int_{-\infty}^{\infty}
e^{-t^2/2}\,dt
=
\sqrt{2\pi}
$$
である。
よって、
$$
\begin{align}
\mathbb E[X]
&=
\frac{\sigma}{\sqrt{2\pi}}\cdot 0
+
\frac{\mu}{\sqrt{2\pi}}\cdot\sqrt{2\pi}
\\
&=
\mu
\end{align}
$$
である。
-以上より、
$$
\mathbb E[X]=\mu
$$
である。
$$ \Box$$
比較判定法について
広義積分の比較判定法とは、非負関数 $f,g$ について、ある区間上で
$$
0\leq f(t)\leq g(t)
$$
が成り立ち、さらに
$$
\int g(t)\,dt
$$
が収束するならば、
$$
\int f(t)\,dt
$$
も収束する、という判定法である。
正規分布の分散
$\mu\in\mathbb R$、$\sigma>0$ とする。実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。
このとき、$X$ の分散は存在し、
$$
\operatorname{Var}(X)=\sigma^2
$$
である。
$X\sim\mathcal N(\mu,\sigma^2)$ とする。
このとき、$X$ の確率密度関数 $p:\mathbb R\to[0,\infty)$ は
$$
p(x)
=
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
である。$\sigma>0$ より、$\sqrt{\sigma^2}=\sigma$ であるから、
$$
p(x)
=
\frac{1}{\sigma\sqrt{2\pi}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
である。また、既に示した命題より、
$$
\mathbb E[X]=\mu
$$
である。したがって、
$$
\int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx<\infty
$$
を示せば、$X$ の分散は存在し、
$$
\operatorname{Var}(X)
=
\int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx
$$
である。
- まず、この積分を計算する。変数変換
$$
t=\frac{x-\mu}{\sigma}
$$
を用いると、
$$
x-\mu=\sigma t,\quad dx=\sigma\,dt
$$
である。また、$x\to-\infty$ のとき $t\to-\infty$ であり、$x\to\infty$ のとき $t\to\infty$ である。
よって、
$$
\begin{align}
\int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx
&=
\int_{-\infty}^{\infty}
(x-\mu)^2
\frac{1}{\sigma\sqrt{2\pi}}
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\,dx
\\
&=
\int_{-\infty}^{\infty}
\sigma^2t^2
\frac{1}{\sigma\sqrt{2\pi}}
e^{-t^2/2}\sigma\,dt
\\
&=
\frac{\sigma^2}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
\end{align}
$$
である。
$ $ - 次に、
$$
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
$$
を求める。
関数 $t\mapsto t^2e^{-t^2/2}$ は非負であり、偶関数であるから、
$$
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
=
2\int_0^\infty t^2e^{-t^2/2}\,dt
$$
である。
ここで、$b>0$ とすると、部分積分により、
$$
\begin{align}
\int_0^b t^2e^{-t^2/2}\,dt
&=
\int_0^b t\cdot te^{-t^2/2}\,dt
\\
&=
\int_0^b t\cdot \left(-\frac{d}{dt}e^{-t^2/2}\right)\,dt
\quad
\because \frac{d}{dt}e^{-t^2/2}=-te^{-t^2/2}
\\
&=
\int_0^b t\cdot d\left(-e^{-t^2/2}\right)
\quad
\because d\left(-e^{-t^2/2}\right)=te^{-t^2/2}\,dt
\\
&=
\left[-te^{-t^2/2}\right]_0^b
-
\int_0^b \left(-e^{-t^2/2}\right)\cdot 1\,dt
\quad
\because \text{部分積分公式}
\\
&=
\left[-te^{-t^2/2}\right]_0^b
+
\int_0^b e^{-t^2/2}\,dt
\quad
\because -\left(-e^{-t^2/2}\right)=e^{-t^2/2}
\\
&=
\left(-be^{-b^2/2}\right)-0
+
\int_0^b e^{-t^2/2}\,dt
\quad
\because \left[-te^{-t^2/2}\right]_0^b=-be^{-b^2/2}-0
\\
&=
-be^{-b^2/2}
+
\int_0^b e^{-t^2/2}\,dt
\end{align}
$$
である。また、
$$
\lim_{b\to\infty}be^{-b^2/2}=0
$$
である(補足を参照)から、
$$
\int_0^\infty t^2e^{-t^2/2}\,dt
=
\int_0^\infty e^{-t^2/2}\,dt
$$
である。
よって、ガウス積分より、
$$
\int_{-\infty}^{\infty}e^{-t^2/2}\,dt
=
\sqrt{2\pi}
$$
であり、$e^{-t^2/2}$ は偶関数であるから、
$$
\int_0^\infty e^{-t^2/2}\,dt
=
\frac{\sqrt{2\pi}}{2}
$$
である。したがって、
$$
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
=
2\int_0^\infty t^2e^{-t^2/2}\,dt
=
2\int_0^\infty e^{-t^2/2}\,dt
=
\sqrt{2\pi}
$$
である。
$ $ - 以上より、
$$
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
=
\sqrt{2\pi}
$$
であるから、
$$
\int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx
=
\frac{\sigma^2}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
=
\sigma^2
<
\infty
$$
である。
したがって、$X$ の分散は存在する。また、既に示した命題より $\mathbb E[X]=\mu$ であるから、
$$
\begin{align}
\operatorname{Var}(X)
&=
\int_{-\infty}^{\infty}(x-\mathbb E[X])^2p(x)\,dx
\\
&=
\int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx
\\
&=
\frac{\sigma^2}{\sqrt{2\pi}}
\int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt
\\
&=
\frac{\sigma^2}{\sqrt{2\pi}}\sqrt{2\pi}
\\
&=
\sigma^2
\end{align}
$$
である。
-したがって、
$$
\operatorname{Var}(X)=\sigma^2
$$
である。
$$ \Box$$
極限 $\lim_{b\to\infty}be^{-b^2/2}=0$ について
$b>0$ とする。
指数関数の級数展開より、
$$
e^{b^2/2}
=
\sum_{n=0}^{\infty}\frac{(b^2/2)^n}{n!}
$$
である。各項は非負であるから、特に $n=2$ の項だけを取り出して、
$$
e^{b^2/2}
\geq
\frac{(b^2/2)^2}{2!}
=
\frac{b^4}{8}
$$
が成り立つ。
したがって、
$$
\begin{align}
0
\leq
be^{-b^2/2}
&=
\frac{b}{e^{b^2/2}}
\quad
\because e^{-b^2/2}=\frac{1}{e^{b^2/2}}
\\
&\leq
\frac{b}{b^4/8}
\quad
\because e^{b^2/2}\geq\frac{b^4}{8}
\\
&=
\frac{8}{b^3}
\end{align}
$$
である。
ここで、
$$
\lim_{b\to\infty}\frac{8}{b^3}=0
$$
であるから、はさみうちの原理より、
$$
\lim_{b\to\infty}be^{-b^2/2}=0
$$
である。
正規分布の標準化
$\mu\in\mathbb R$、$\sigma>0$ とする。
実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。すなわち、任意の $a,b\in\mathbb R$ に対して、$a\leq b$ ならば、
$$
\mathbb P(a\leq X\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{(x-\mu)^2}{2\sigma^2}
\right)
\,dx
$$
が成り立つとする。
このとき、
$$
Y:=\frac{X-\mu}{\sigma}
$$
とおけば、$Y$ は標準正規分布 $\mathcal N(0,1)$ に従う。すなわち、
$$
Y\sim\mathcal N(0,1)
$$
である。
- まず、$Y$ が実数値確率変数であることを確認する。
写像 $g:\mathbb R\to\mathbb R$ を
$$
g(x):=\frac{x-\mu}{\sigma}
$$
によって定める。
このとき、$g$ は $\mathbb R$ 上の連続関数である。したがって、$X$ が実数値確率変数であることから、
$$
Y=g(X)=\frac{X-\mu}{\sigma}
$$
も実数値確率変数である。
$ $ - 次に、$Y$ の区間確率を計算する。
任意に $a,b\in\mathbb R$ を $a\leq b$ を満たすようにとる。
任意の $\omega\in\Omega$ に対して、$\sigma>0$ より、
$$
\begin{align}
a\leq Y(\omega)\leq b
&\Longleftrightarrow
a\leq\frac{X(\omega)-\mu}{\sigma}\leq b
\\
&\Longleftrightarrow
\sigma a\leq X(\omega)-\mu\leq \sigma b
\\
&\Longleftrightarrow
\sigma a+\mu\leq X(\omega)\leq \sigma b+\mu
\end{align}
$$
である。
したがって、事象として、
$$
\{a\leq Y\leq b\}
=
\{\sigma a+\mu\leq X\leq \sigma b+\mu\}
$$
である。ゆえに、
$$
\mathbb P(a\leq Y\leq b)
=
\mathbb P(\sigma a+\mu\leq X\leq \sigma b+\mu)
$$
である。
また、$a\leq b$ かつ $\sigma>0$ であるから、
$$
\sigma a+\mu\leq \sigma b+\mu
$$
である。
よって、$X\sim\mathcal N(\mu,\sigma^2)$ より、
$$
\mathbb P(a\leq Y\leq b)
=
\int_{\sigma a+\mu}^{\sigma b+\mu}
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{(x-\mu)^2}{2\sigma^2}
\right)
\,dx
$$
である。
$ $ - 右辺の積分を変数変換によって計算する。
変数変換
$$
t:=\frac{x-\mu}{\sigma}
$$
を用いる。このとき、
$$
x=\sigma t+\mu,\quad dx=\sigma\,dt
$$
である。
また、積分区間の端点は、
$$
x=\sigma a+\mu
\quad\Longleftrightarrow\quad
t=a
$$
および
$$
x=\sigma b+\mu
\quad\Longleftrightarrow\quad
t=b
$$
に対応する。
さらに、$\sigma>0$ より、
$$
\sqrt{\sigma^2}=\sigma
$$
である。したがって、有限区間上の変数変換により、
$$
\begin{align}
\mathbb P(a\leq Y\leq b)
&=
\int_{\sigma a+\mu}^{\sigma b+\mu}
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{(x-\mu)^2}{2\sigma^2}
\right)
\,dx
\\
&=
\int_a^b
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{(\sigma t+\mu-\mu)^2}{2\sigma^2}
\right)
\sigma\,dt
\\
&=
\int_a^b
\frac{\sigma}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{\sigma^2t^2}{2\sigma^2}
\right)
\,dt
\\
&=
\int_a^b
\frac{1}{\sqrt{2\pi}}
\exp\left(
-\frac{t^2}{2}
\right)
\,dt
\end{align}
$$
である。
$ $ - 以上より、任意の $a,b\in\mathbb R$ に対して、$a\leq b$ ならば、
$$
\mathbb P(a\leq Y\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi}}
\exp\left(
-\frac{t^2}{2}
\right)
\,dt
$$
が成り立つ。
これは、$Y$ が平均 $0$、分散 $1$ の正規分布に従うことを意味する。
したがって、
$$
Y\sim\mathcal N(0,1)
$$
である。
-すなわち、
$$
\frac{X-\mu}{\sigma}\sim\mathcal N(0,1)
$$
である。
$$ \Box$$
標準化の意味
この命題は、平均 $\mu$、分散 $\sigma^2$ の正規分布に従う確率変数 $X$ から、平均を引き、標準偏差で割ると、標準正規分布に従うことを表している。
この変換
$$
Y=\frac{X-\mu}{\sigma}
$$
を、正規分布の標準化という。
標準正規分布の密度関数の偶関数性
標準正規分布の密度関数 $\varphi:\mathbb R\to[0,\infty)$ を
$$
\varphi(x):=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{x^2}{2}\right)
$$
によって定める。
このとき、$\varphi$ は偶関数である。すなわち、任意の $x\in\mathbb R$ に対して、
$$
\varphi(-x)=\varphi(x)
$$
が成り立つ。
任意に $x\in\mathbb R$ をとる。
標準正規分布の密度関数の定義より、
$$
\varphi(x)
=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{x^2}{2}\right)
$$
である。
したがって、
$$
\begin{align}
\varphi(-x)
&=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{(-x)^2}{2}\right)
\\
&=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{x^2}{2}\right)
\quad
\because (-x)^2=x^2
\\
&=
\varphi(x)
\end{align}
$$
である。
よって、任意の $x\in\mathbb R$ に対して、
$$
\varphi(-x)=\varphi(x)
$$
が成り立つ。
したがって、$\varphi$ は偶関数である。
$$ \Box$$
標準正規分布の累積分布関数の積分表示
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布に従うとする。
- すなわち、任意の実数 $a,b$ に対して、$a< b$ ならば、
$$
\mathbb P(a< Z\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
が成り立つとする。 - $Z$ の累積分布関数 $F_Z:\mathbb R\to[0,1]$ を
$$
F_Z(x):=\mathbb P(Z\leq x)
$$
によって定める。
-このとき、任意の $x\in\mathbb R$ に対して、
$$
F_Z(x)
=
\int_{-\infty}^{x}
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
が成り立つ。
任意に $x\in\mathbb R$ をとる。
関数 $\varphi:\mathbb R\to[0,\infty)$ を
$$
\varphi(t)
:=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{t^2}{2}\right)
$$
によって定める。
既に示したガウス積分と標準正規分布の密度関数の全積分より、
$$
\int_{-\infty}^{\infty}\varphi(t)\,dt=1
$$
である。したがって、任意の $x\in\mathbb R$ に対して、広義積分
$$
\int_{-\infty}^{x}\varphi(t)\,dt
$$
は収束する。
- 有限区間で近似するための事象を定める。
$N\in\mathbb N_{>0}$ を
$$
-N< x
$$
となるようにとる。
$n\geq N$ に対して、
$$
A_n:=\{\omega\in\Omega\mid -n< Z(\omega)\leq x\}
$$
と定める。
このとき、
$$
A_n
=
Z^{-1}((-n,x])
$$
である。区間 $(-n,x]$ は $\mathbb R$ のボレル集合であり、$Z$ は実数値確率変数であるから、
$$
A_n\in\mathcal F
$$
である。したがって、$A_n$ は事象である。
また、$n\geq N$ ならば $-n\leq -N< x$ であるから、
$$
-n< x
$$
である。
したがって、標準正規分布の定義より、
$$
\mathbb P(A_n)
=
\mathbb P(-n< Z\leq x)
=
\int_{-n}^{x}\varphi(t)\,dt
$$
である。
$ $ - 次に、事象列 $(A_n)_{n=N}^{\infty}$ が単調増加であることを示す。
$n,m\in\mathbb N$ が $N\leq n\leq m$ を満たすとする。このとき、
$$
-m\leq -n
$$
である。
任意に $\omega\in A_n$ をとる。このとき、$A_n$ の定義より、
$$
-n< Z(\omega)\leq x
$$
である。
一方で、$-m\leq -n$ であるから、
$$
-m\leq -n< Z(\omega)
$$
である。したがって、
$$
-m< Z(\omega)\leq x
$$
が成り立つ。
ゆえに、$A_m$ の定義より、
$$
\omega\in A_m
$$
である。
したがって、
$$
A_n\subseteq A_m
$$
である。
よって、$(A_n)_{n=N}^{\infty}$ は単調増加列である。
$ $ - 次に、事象列 $(A_n)_{n=N}^{\infty}$ の和集合を求める。
$$
\bigcup_{n=N}^{\infty}A_n
=
\{Z\leq x\}
$$
を示す。
i) まず、
$$
\bigcup_{n=N}^{\infty}A_n
\subseteq
\{Z\leq x\}
$$
を示す。
任意に
$$
\omega\in\bigcup_{n=N}^{\infty}A_n
$$
をとる。このとき、ある $n\geq N$ が存在して、
$$
\omega\in A_n
$$
である。したがって、$A_n$ の定義より、
$$
-n< Z(\omega)\leq x
$$
である。よって、
$$
Z(\omega)\leq x
$$
であるから、
$$
\omega\in\{Z\leq x\}
$$
である。
したがって、
$$
\bigcup_{n=N}^{\infty}A_n
\subseteq
\{Z\leq x\}
$$
である。
$ $
ii) 次に、
$$
\{Z\leq x\}
\subseteq
\bigcup_{n=N}^{\infty}A_n
$$
を示す。
任意に
$$
\omega\in\{Z\leq x\}
$$
をとる。このとき、
$$
Z(\omega)\leq x
$$
である。
また、$Z$ は実数値確率変数であるから、
$$
Z(\omega)\in\mathbb R
$$
である。したがって、アルキメデス性より、ある $n\in\mathbb N$ が存在して、
$$
n\geq N
\quad\text{かつ}\quad
n>-Z(\omega)
$$
が成り立つ。このとき、
$$
-n< Z(\omega)
$$
である。よって、
$$
-n< Z(\omega)\leq x
$$
であるから、$A_n$ の定義より、
$$
\omega\in A_n
$$
である。したがって、
$$
\omega\in\bigcup_{n=N}^{\infty}A_n
$$
である。
ゆえに、
$$
\{Z\leq x\}
\subseteq
\bigcup_{n=N}^{\infty}A_n
$$
である。
i)、ii) より、
$$
\bigcup_{n=N}^{\infty}A_n
=
\{Z\leq x\}
$$
である。
$ $ - 次に、確率の下からの連続性を用いる。
$(A_n)_{n=N}^{\infty}$ は単調増加列であり、
$$
\bigcup_{n=N}^{\infty}A_n
=
\{Z\leq x\}
$$
であるから、確率の下からの連続性(
証明はコチラ
)より、
$$
\mathbb P(Z\leq x)
=
\mathbb P\left(\bigcup_{n=N}^{\infty}A_n\right)
=
\lim_{n\to\infty}\mathbb P(A_n)
$$
である。
$ $ - 最後に、広義積分の定義を用いて結論を得る。
累積分布関数の定義より、
$$
F_Z(x)=\mathbb P(Z\leq x)
$$
である。したがって、
$$
\begin{align}
F_Z(x)
&=
\mathbb P(Z\leq x)
\\
&=
\lim_{n\to\infty}\mathbb P(A_n)
\\
&=
\lim_{n\to\infty}\mathbb P(-n< Z\leq x)
\\
&=
\lim_{n\to\infty}\int_{-n}^{x}\varphi(t)\,dt
\\
&=
\int_{-\infty}^{x}\varphi(t)\,dt
\end{align}
$$
である。最後の等号は広義積分の定義による。
-ゆえに、
$$
F_Z(x)
=
\int_{-\infty}^{x}
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
である。
$$ \Box$$
正規分布の累積分布関数
$\mu\in\mathbb R$、$\sigma>0$ とする。
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。
- $X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$ を、各 $x\in\mathbb R$ に対して
$$
F_X(x):=\mathbb P(X\leq x)
$$
によって定める。 - 標準正規分布の累積分布関数を $\Phi:\mathbb R\to[0,1]$ と書く。すなわち、各 $y\in\mathbb R$ に対して、
$$
\Phi(y)
=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{y}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
である。
-このとき、任意の $x\in\mathbb R$ に対して、
$$
F_X(x)
=
\Phi\left(\frac{x-\mu}{\sigma}\right)
$$
が成り立つ。すなわち、
$$
F_X(x)
=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\frac{x-\mu}{\sigma}}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
である。
任意に $x\in\mathbb R$ をとる。
$$
Z:=\frac{X-\mu}{\sigma}
$$
とおく。
正規分布の標準化より、
$$
Z\sim\mathcal N(0,1)
$$
である。
また、$\sigma>0$ より、任意の $\omega\in\Omega$ に対して、
$$
\begin{align}
X(\omega)\leq x
&\Longleftrightarrow
X(\omega)-\mu\leq x-\mu
\\
&\Longleftrightarrow
\frac{X(\omega)-\mu}{\sigma}\leq \frac{x-\mu}{\sigma}
\\
&\Longleftrightarrow
Z(\omega)\leq \frac{x-\mu}{\sigma}
\end{align}
$$
である。
したがって、事象として、
$$
\{X\leq x\}
=
\left\{Z\leq \frac{x-\mu}{\sigma}\right\}
$$
である。
ゆえに、
$$
\begin{align}
F_X(x)
&=
\mathbb P(X\leq x)
\\
&=
\mathbb P\left(Z\leq \frac{x-\mu}{\sigma}\right)
\\
&=
\Phi\left(\frac{x-\mu}{\sigma}\right)
\end{align}
$$
である。
さらに、標準正規分布の累積分布関数の積分表示(本記事内で証明済み)より、
$$
\Phi\left(\frac{x-\mu}{\sigma}\right)
=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\frac{x-\mu}{\sigma}}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
である。
したがって、
$$
F_X(x)
=
\frac{1}{\sqrt{2\pi}}
\int_{-\infty}^{\frac{x-\mu}{\sigma}}
\exp\left(-\frac{t^2}{2}\right)
\,dt
$$
である。
以上より、任意の $x\in\mathbb R$ に対して、
$$
F_X(x)
=
\Phi\left(\frac{x-\mu}{\sigma}\right)
$$
が成り立つ。
$$ \Box$$
標準正規分布の累積分布関数の対称性
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
$Z$ の累積分布関数 $F_Z:\mathbb R\to[0,1]$ を
$$
F_Z(x):=\mathbb P(Z\leq x)
$$
によって定める。
このとき、任意の $x\in\mathbb R$ に対して、
$$
F_Z(x)+F_Z(-x)=1
$$
が成り立つ。
標準正規分布の密度関数を
$$
\varphi(t):=
\frac{1}{\sqrt{2\pi}}
\exp\left(-\frac{t^2}{2}\right)
$$
とおく。
標準正規分布の累積分布関数の積分表示(本記事内で証明済み)より、任意の $x\in\mathbb R$ に対して、
$$
F_Z(x)=\int_{-\infty}^{x}\varphi(t)\,dt
$$
である。
また、$\varphi$ は偶関数である(本記事内で証明済み)。すなわち、任意の $t\in\mathbb R$ に対して、
$$
\varphi(-t)=\varphi(t)
$$
である。
任意に $x\in\mathbb R$ をとる。まず、
$$
F_Z(-x)
=
\int_{-\infty}^{-x}\varphi(t)\,dt
$$
である。
$a<-x$ とする。有限区間 $[a,-x]$ 上で変数変換
$$
u=-t
$$
を行うと、$t=-u$、$dt=-du$ であり、$t=a$ のとき $u=-a$、$t=-x$ のとき $u=x$ である。したがって、
$$
\begin{align}
\int_a^{-x}\varphi(t)\,dt
&=
\int_{-a}^{x}\varphi(-u)(-du)
\\
&=
\int_x^{-a}\varphi(-u)\,du
\\
&=
\int_x^{-a}\varphi(u)\,du
\end{align}
$$
である。最後の等号では、$\varphi$ が偶関数であることを用いた。
ここで、$a\to-\infty$ とすると、$-a\to\infty$ である。よって、広義積分の定義より、
$$
F_Z(-x)
=
\int_x^\infty \varphi(u)\,du
$$
である。
一方、標準正規分布の密度関数の全積分(本記事内で証明済み)より、
$$
\int_{-\infty}^{\infty}\varphi(u)\,du=1
$$
である。
したがって、広義積分の分割により、
$$
\begin{align}
1
&=
\int_{-\infty}^{\infty}\varphi(u)\,du
\\
&=
\int_{-\infty}^{x}\varphi(u)\,du
+
\int_x^\infty\varphi(u)\,du
\\
&=
F_Z(x)+F_Z(-x)
\end{align}
$$
である。
ゆえに、任意の $x\in\mathbb R$ に対して、
$$
F_Z(x)+F_Z(-x)=1
$$
が成り立つ。
$$ \Box$$
標準正規分布の右裾確率と左裾確率の対称性
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
このとき、任意の $x\in\mathbb R$ に対して、
$$
\mathbb P(Z\geq x)=\mathbb P(Z\leq -x)
$$
が成り立つ。
$Z$ の累積分布関数を
$$
F_Z(x):=\mathbb P(Z\leq x)
$$
とおく。
標準正規分布の累積分布関数の対称性(本記事内で証明済み)より、任意の $x\in\mathbb R$ に対して、
$$
F_Z(-x)=1-F_Z(x)
$$
である。
一方、累積分布関数の定義より、
$$
F_Z(x)=\mathbb P(Z\leq x)
$$
であるから、
$$
1-F_Z(x)=\mathbb P(Z>x)
$$
である。
また、標準正規分布の密度関数を $\varphi$ とおくと、標準正規分布の定義より、
$$
\mathbb P(Z=x)
=
\mathbb P(x\leq Z\leq x)
=
\int_x^x\varphi(t)\,dt
=
0
$$
である。
したがって、
$$
\mathbb P(Z\geq x)
=
\mathbb P(Z>x)+\mathbb P(Z=x)
=
\mathbb P(Z>x)
$$
である。ゆえに、
$$
\mathbb P(Z\geq x)
=
\mathbb P(Z>x)
=
1-F_Z(x)
$$
である。
また、累積分布関数の定義より、
$$
\mathbb P(Z\leq -x)=F_Z(-x)
$$
である。したがって、
$$
\mathbb P(Z\leq -x)
=
F_Z(-x)
=
1-F_Z(x)
$$
である。
以上より、
$$
\mathbb P(Z\geq x)
=
1-F_Z(x)
=
\mathbb P(Z\leq -x)
$$
である。
したがって、任意の $x\in\mathbb R$ に対して、
$$
\mathbb P(Z\geq x)=\mathbb P(Z\leq -x)
$$
が成り立つ。
$$ \Box$$
原点対称な分布について
この命題の本質は、標準正規分布が原点対称であることにある。
より一般に、確率変数 $Z$ と $-Z$ が同じ分布をもつならば、任意の $x\in\mathbb R$ に対して、
$$
\mathbb P(Z\geq x)
=
\mathbb P(Z\leq -x)
$$
が成り立つ。
実際、
$$
\{Z\geq x\}=\{-Z\leq -x\}
$$
であり、$Z$ と $-Z$ が同じ分布をもつならば、
$$
\mathbb P(Z\geq x)
=
\mathbb P(-Z\leq -x)
=
\mathbb P(Z\leq -x)
$$
である。
標準正規分布はその典型例である。
標準正規分布の両側確率
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
このとき、任意の $z>0$ に対して、
$$
\mathbb P(|Z|>z)
=
2\mathbb P(Z>z)
$$
が成り立つ。
任意に $z>0$ をとる。
まず、
$$
\{|Z|>z\}
=
\{Z<-z\}\cup\{Z>z\}
$$
である。
また、$z>0$ であるから、事象 $\{Z<-z\}$ と $\{Z>z\}$ は互いに排反である。
したがって、有限加法性(
詳しくはコチラ
)より、
$$
\mathbb P(|Z|>z)
=
\mathbb P(Z<-z)+\mathbb P(Z>z)
$$
である。
標準正規分布の密度関数を $\varphi$ とおく。標準正規分布の定義より、
$$
\mathbb P(Z=z)
=
\mathbb P(z\leq Z\leq z)
=
\int_z^z\varphi(t)\,dt
=
0
$$
であり、同様に、
$$
\mathbb P(Z=-z)=0
$$
である。
したがって、
$$
\mathbb P(Z>z)=\mathbb P(Z\geq z)
$$
であり、
$$
\mathbb P(Z<-z)=\mathbb P(Z\leq -z)
$$
である。
また、標準正規分布の右裾確率と左裾確率の対称性(本記事内で証明済み)より、
$$
\mathbb P(Z\geq z)
=
\mathbb P(Z\leq -z)
$$
である。
ゆえに、
$$
\mathbb P(Z<-z)
=
\mathbb P(Z\leq -z)
=
\mathbb P(Z\geq z)
=
\mathbb P(Z>z)
$$
である。
以上より、
$$
\begin{align}
\mathbb P(|Z|>z)
&=
\mathbb P(Z<-z)+\mathbb P(Z>z)
\\
&=
\mathbb P(Z>z)+\mathbb P(Z>z)
\\
&=
2\mathbb P(Z>z)
\end{align}
$$
である。
$$ \Box$$
両側確率と対称性
この命題は、標準正規分布が原点対称であることから、正の値 $z$ を超えて外側に出る確率が、右側確率の $2$ 倍になることを表している。
この性質は、両側検定、信頼区間の構成、$t$ 分布の理解などで基本的に用いられる。
標準正規分布の区間確率と累積分布関数
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
- 標準正規分布の累積分布関数 $\Phi:\mathbb R\to[0,1]$ を
$$
\Phi(x):=\mathbb P(Z\leq x)
$$
によって定める。 - 標準正規分布の累積分布関数の積分表示より、
$$
\Phi(x)
=
\int_{-\infty}^{x}
\frac{1}{\sqrt{2\pi}}e^{-t^2/2}\,dt
$$
である。
-このとき、任意の $a,b\in\mathbb R$ に対して、$a< b$ ならば、
$$
\mathbb P(a< Z< b)=\Phi(b)-\Phi(a)
$$
が成り立つ。
標準正規分布の密度関数を
$$
\varphi(t):=
\frac{1}{\sqrt{2\pi}}e^{-t^2/2}
$$
とおく。
標準正規分布は密度関数 $\varphi$ をもつので、任意の $c\in\mathbb R$ に対して、
$$
\mathbb P(Z=c)
=
\int_c^c\varphi(t)\,dt
=
0
$$
である。
任意に $a,b\in\mathbb R$ を $a< b$ となるようにとる。
このとき、事象として、
$$
\{Z\leq b\}
=
\{Z\leq a\}\cup\{a< Z< b\}\cup\{Z=b\}
$$
である。
また、右辺の $3$ つの事象は互いに排反である。したがって、確率の有限加法性(
詳しくはコチラ
)より、
$$
\mathbb P(Z\leq b)
=
\mathbb P(Z\leq a)
+
\mathbb P(a< Z< b)
+
\mathbb P(Z=b)
$$
である。
ここで、$\mathbb P(Z=b)=0$ であるから、
$$
\mathbb P(Z\leq b)
=
\mathbb P(Z\leq a)
+
\mathbb P(a< Z< b)
$$
である。ゆえに、
$$
\begin{align}
\mathbb P(a< Z< b)
&=
\mathbb P(Z\leq b)-\mathbb P(Z\leq a)
\\
&=
\Phi(b)-\Phi(a)
\end{align}
$$
である。
$$ \Box$$
累積分布関数を用いた標準正規分布の確率計算
確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
確率密度関数(PDF)では「ある区間に確率変数が収まる確率」を計算することは容易ではない(初等関数では表せない)。
しかし、累積分布関数(CDF: Cumulative Distribution Function)を使うことで、特定の範囲に含まれる確率を簡単に計算できる。
- 標準正規分布の累積分布関数 $\Phi(z)$
標準正規分布の累積分布関数 $\Phi:\mathbb R\to[0,1]$ は、各 $z\in\mathbb R$ に対して
$$
\Phi(z):=\mathbb P(Z\leq z)
$$
によって定められる。
標準正規分布の累積分布関数の積分表示より、
$$
\Phi(z)
=
\mathbb P(Z\leq z)
=
\int_{-\infty}^{z}
\frac{1}{\sqrt{2\pi}}e^{-t^2/2}\,dt
$$
である。
したがって、$\Phi(z)$ は、標準正規確率変数 $Z$ が $z$ 以下の値をとる確率を表す。
$ $ - 区間確率の計算
$a,b\in\mathbb R$、$a< b$ とする。
このとき、
$$
\{a< Z\leq b\}
=
\{Z\leq b\}\setminus\{Z\leq a\}
$$
である。
したがって、確率の差により、
$$
\mathbb P(a< Z\leq b)
=
\mathbb P(Z\leq b)-\mathbb P(Z\leq a)
=
\Phi(b)-\Phi(a)
$$
である。
また、標準正規分布は密度関数をもつ連続分布であるから、任意の $c\in\mathbb R$ に対して
$$
\mathbb P(Z=c)=0
$$
である。
したがって、
$$
\mathbb P(a< Z< b)
=
\mathbb P(a< Z\leq b)
=
\Phi(b)-\Phi(a)
$$
である(
詳しくはコチラ
)。
$ $ - 右側確率の計算
$z\in\mathbb R$ とする。
このとき、
$$
\{Z>z\}
=
\{Z\leq z\}^{c}
$$
である。
したがって、補集合の確率より、
$$
\mathbb P(Z>z)
=
1-\mathbb P(Z\leq z)
$$
である。
累積分布関数の定義より、$\mathbb P(Z\leq z)=\Phi(z)$ であるから、
$$
\mathbb P(Z>z)
=
1-\Phi(z)
$$
である。
$ $ - 確率密度関数と累積分布関数の使い分け
標準正規分布の確率密度関数は
$$
\varphi(t):=
\frac{1}{\sqrt{2\pi}}e^{-t^2/2}
$$
である。
確率密度関数を用いても、区間確率は
$$
\mathbb P(a< Z\leq b)
=
\int_a^b\varphi(t)\,dt
$$
によって表せる。
ただし、標準正規分布では、この積分は一般に初等関数では表せない。そのため、実際の確率計算では、累積分布関数 $\Phi$ を用いて
$$
\mathbb P(a< Z\leq b)
=
\Phi(b)-\Phi(a)
$$
と表す方が扱いやすい。
正規分布における代表的な確率
- $X\sim\mathcal N(\mu,\sigma^2)$ とする。このとき、確率変数の標準化
$$
Z:=\frac{X-\mu}{\sigma}
$$
により、
$$
Z\sim\mathcal N(0,1)
$$
である。
$ $ - ここで、標準正規分布の分布関数を $\Phi$ とおくと、任意の $k>0$ に対して、
$$
\begin{align}
\mathbb P(\mu-k\sigma\leq X\leq \mu+k\sigma)
&=
\mathbb P(-k\leq Z\leq k)
&&\because \ Z=\frac{X-\mu}{\sigma},\ \sigma>0
\\
&=
\Phi(k)-\Phi(-k)
&&\because \ Z\sim\mathcal N(0,1),\ \mathbb P(Z=-k)=0
\end{align}
$$
である。
さらに、標準正規分布の対称性より、
$$
\Phi(-k)=1-\Phi(k)
$$
であるから、
$$
\mathbb P(\mu-k\sigma\leq X\leq \mu+k\sigma)
=
2\Phi(k)-1
$$
である。
$ $ - 特に、
$$
\mathbb P(\mu-\sigma\leq X\leq \mu+\sigma)
\approx
0.6827
$$
$$
\mathbb P(\mu-2\sigma\leq X\leq \mu+2\sigma)
\approx
0.9545
$$
$$
\mathbb P(\mu-3\sigma\leq X\leq \mu+3\sigma)
\approx
0.9973
$$
である。
上記$3$つの数値は重要なので覚えておいて損はない(´・ω・`)b