大学数学基礎解説

ガウス積分から始める(標準)正規分布の基本

統計,確率,データサイエンス

この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。

正規分布の導出は記事〖正規分布を導出する〗を参照(´Д｀)
モーメント母関数から導かれる性質は記事〖モーメント母関数を使って正規分布の基本的な性質を順に示す〗を参照(´Д｀)

Def.

正規分布

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $X$ が、任意の実数 $a,b$ について、$a\leq b$ ならば
$$ \mathbb P(a\leq X\leq b) = \int_a^b p_{\mu,\sigma^2}(x)\,dx $$
を満たすとき、$X$ はパラメータ $\mu,\sigma^2$ の正規分布に従うという。
$ $
このことを
$$ X\sim\mathcal N(\mu,\sigma^2) $$
または
$$ X\sim N(\mu,\sigma^2) $$
と表す。
$ $
特に、確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が
$$ Z\sim\mathcal N(0,1) $$
を満たすとき、$Z$ は標準正規分布に従うという。

正規分布の平均と分散

$X\sim\mathcal N(\mu,\sigma^2)$ ならば、
$$ \mathbb E[X]=\mu,\quad \operatorname{Var}(X)=\sigma^2 $$
である。
したがって、$\mu$ は平均を表し、$\sigma^2$ は分散を表す。また、$\sigma$ は標準偏差を表す。

標準正規分布の密度関数

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が
$$ Z\sim\mathcal N(0,1) $$
を満たすとき、$Z$ の確率密度関数は
$$ \varphi(x) := p_{0,1}(x) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right) $$
である。

累積分布関数

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B(\mathbb R))$ を実数値確率変数とする。
関数 $F_X:\mathbb R\to[0,1]$ を、各 $x\in\mathbb R$ に対して
$$ F_X(x):=\mathbb P(\{\omega\in\Omega\mid X(\omega)\le x\}) $$
によって定める。
この関数 $F_X$ を $X$ の累積分布関数、または分布関数という。

Prop&Proof.

ガウス積分

関数 $f:\mathbb R\to\mathbb R$ を
$$ f(x):=e^{-x^2} $$
によって定める。

このとき、広義リーマン積分
$$ \int_{-\infty}^{0}e^{-x^2}\,dx \quad\text{および}\quad \int_{0}^{\infty}e^{-x^2}\,dx $$
はいずれも収束する。
また、
$$ \int_{-\infty}^{\infty}e^{-x^2}\,dx := \int_{-\infty}^{0}e^{-x^2}\,dx + \int_{0}^{\infty}e^{-x^2}\,dx = \sqrt{\pi} $$
が成り立つ。

$R>0$ とし、
$$ I_R:=\int_{-R}^{R}e^{-x^2}\,dx $$
とおく。
ここで、関数 $(x,y)\mapsto e^{-(x^2+y^2)}$ は $[-R,R]^2$ 上連続であるから、リーマン積分可能である。
また、有限区間上の積分の積について、
$$ I_R^2 = \left(\int_{-R}^{R}e^{-x^2}\,dx\right) \left(\int_{-R}^{R}e^{-y^2}\,dy\right) = \int_{-R}^{R}\int_{-R}^{R}e^{-(x^2+y^2)}\,dy\,dx $$
が成り立つ。
$ $
ここで、
$$ D_R:=\{(x,y)\in\mathbb R^2\mid x^2+y^2\leq R^2\} $$
とおくと、
$$ D_R\subseteq[-R,R]^2\subseteq D_{\sqrt{2}R} $$
である(補足を参照)。
さらに、$e^{-(x^2+y^2)}\geq0$ であるから、積分の単調性より、
$$ \iint_{D_R}e^{-(x^2+y^2)}\,dx\,dy \leq I_R^2 \leq \iint_{D_{\sqrt{2}R}}e^{-(x^2+y^2)}\,dx\,dy $$
である。
閉円板 $D_R$ および $D_{\sqrt{2}R}$ は有界なジョルダン可測集合であり、
関数 $(x,y)\mapsto e^{-(x^2+y^2)}$ は連続であるから、これらの領域上でリーマンの意味で重積分可能である。

$D_R\subseteq[-R,R]^2\subseteq D_{\sqrt{2}R}$ の直観的なイメージ

半径 $R$ の閉円板 $D_R$ は、一辺の長さが $2R$ の正方形 $[-R,R]^2$ に含まれる。
また、正方形 $[-R,R]^2$ の中心から各頂点までの距離は $\sqrt{2}R$ であるから、正方形 $[-R,R]^2$ は半径 $\sqrt{2}R$ の閉円板 $D_{\sqrt{2}R}$ に含まれる。

$ $
3. i) 極座標変換 $x=r\cos\theta$、$y=r\sin\theta$ を用いる(補足を参照)。
　このとき、$D_R$ は
$$ 0\leq r\leq R,\quad 0\leq\theta\leq2\pi $$
　で表される。
　また、ヤコビアンは
$$ \begin{align} J &= \frac{\partial(x,y)}{\partial(r,\theta)} \\ &= \begin{vmatrix} \dfrac{\partial x}{\partial r} & \dfrac{\partial x}{\partial\theta} \\ \dfrac{\partial y}{\partial r} & \dfrac{\partial y}{\partial\theta} \end{vmatrix} \\ &= \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} &&\because x=r\cos\theta,\ y=r\sin\theta \\ &= r\cos^2\theta+r\sin^2\theta \\ &= r &&\because \cos^2\theta+\sin^2\theta=1 \end{align} $$
　である。したがって、$r\geq0$ より $|J|=r$ である。
　ゆえに、
$$ \begin{align} \iint_{D_R}e^{-(x^2+y^2)}\,dx\,dy &= \int_0^{2\pi}\int_0^R e^{-r^2}r\,dr\,d\theta &&\because x^2+y^2=r^2,\ |J|=r \\ &= \int_0^{2\pi} \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{R} \,d\theta &&\because \int e^{-r^2}r\,dr=-\frac{1}{2}e^{-r^2} \\ &= \int_0^{2\pi}\frac{1}{2}(1-e^{-R^2})\,d\theta &&\because \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{R} = \frac{1}{2}(1-e^{-R^2}) \\ &= \frac{1}{2}(1-e^{-R^2})\int_0^{2\pi}1\,d\theta &&\because \frac{1}{2}(1-e^{-R^2})\text{ は }\theta\text{ に依存しない} \\ &= \pi(1-e^{-R^2}) &&\because \int_0^{2\pi}1\,d\theta=2\pi \end{align} $$
　である。
$ $
ii) 同様に、極座標変換 $x=r\cos\theta$、$y=r\sin\theta$ を用いると、
　閉円板 $D_{\sqrt{2}R}$ は
$$ 0\leq r\leq \sqrt{2}R,\quad 0\leq\theta\leq2\pi $$
　で表される。
　また、ヤコビアンは
$$ \begin{align} J &= \frac{\partial(x,y)}{\partial(r,\theta)} \\ &= \begin{vmatrix} \dfrac{\partial x}{\partial r} & \dfrac{\partial x}{\partial\theta} \\ \dfrac{\partial y}{\partial r} & \dfrac{\partial y}{\partial\theta} \end{vmatrix} \\ &= \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} &&\because x=r\cos\theta,\ y=r\sin\theta \\ &= r\cos^2\theta+r\sin^2\theta \\ &= r &&\because \cos^2\theta+\sin^2\theta=1 \end{align} $$
　である。したがって、$r\geq0$ より $|J|=r$ である。
　ゆえに、
$$ \begin{align} \iint_{D_{\sqrt{2}R}}e^{-(x^2+y^2)}\,dx\,dy &= \int_0^{2\pi}\int_0^{\sqrt{2}R} e^{-r^2}r\,dr\,d\theta &&\because x^2+y^2=r^2,\ |J|=r \\ &= \int_0^{2\pi} \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{\sqrt{2}R} \,d\theta &&\because \int e^{-r^2}r\,dr=-\frac{1}{2}e^{-r^2} \\ &= \int_0^{2\pi}\frac{1}{2}(1-e^{-2R^2})\,d\theta &&\because \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{\sqrt{2}R} = \frac{1}{2}(1-e^{-2R^2}) \\ &= \frac{1}{2}(1-e^{-2R^2})\int_0^{2\pi}1\,d\theta &&\because \frac{1}{2}(1-e^{-2R^2})\text{ は }\theta\text{ に依存しない} \\ &= \pi(1-e^{-2R^2}) &&\because \int_0^{2\pi}1\,d\theta=2\pi \end{align} $$
　である。
以上より、
$$ \pi(1-e^{-R^2}) \leq I_R^2 \leq \pi(1-e^{-2R^2}) $$
である。

極座標変換 $x=r\cos\theta$、$y=r\sin\theta$ を用いる点

極座標表示は $r=0$ および $\theta=0,2\pi$ 上で重複をもつが、これらは面積 $0$ の境界部分であるため、
リーマン(重)積分の値には影響しない。

$ $
4. ここで、
$$ \lim_{R\to\infty}\pi(1-e^{-R^2})=\pi, \quad \lim_{R\to\infty}\pi(1-e^{-2R^2})=\pi $$
であるから、はさみうちの原理より、
$$ \lim_{R\to\infty}I_R^2=\pi $$
である。
また、任意の $R>0$ に対して $I_R>0$ であるから、
$$ I_R=\sqrt{I_R^2} $$
である。
平方根関数 $\sqrt{x}$ は $[0,\infty)$ 上連続であるから、連続関数と極限の交換により、
$$ \lim_{R\to\infty}I_R = \lim_{R\to\infty}\sqrt{I_R^2} = \sqrt{\lim_{R\to\infty}I_R^2} = \sqrt{\pi} $$
である。
$ $
5. さらに、$e^{-x^2}$ は偶関数であるから、任意の $R>0$ に対して
$$ I_R = 2\int_0^R e^{-x^2}\,dx $$
である。ゆえに、
$$ \lim_{R\to\infty}\int_0^R e^{-x^2}\,dx = \frac{\sqrt{\pi}}{2} $$
である。
したがって、広義リーマン積分
$$ \int_0^\infty e^{-x^2}\,dx $$
は収束し、
$$ \int_0^\infty e^{-x^2}\,dx = \frac{\sqrt{\pi}}{2} $$
である。
$ $
6. また、任意の $R>0$ に対して、
$$ \int_{-R}^0 e^{-x^2}\,dx = \int_0^R e^{-u^2}\,du $$
であることを示す。変数変換
$$ u=-x $$
を用いる。このとき、
$$ x=-u $$
であり、
$$ \frac{dx}{du}=-1 $$
である。また、積分区間の端点は、
$$ x=-R\quad\Longrightarrow\quad u=R $$
および
$$ x=0\quad\Longrightarrow\quad u=0 $$
となる。
したがって、定積分の変数変換公式より、
$$ \begin{align} \int_{-R}^0 e^{-x^2}\,dx &= \int_R^0 e^{-(-u)^2}(-1)\,du &&\because u=-x,\ x=-u,\ dx=-du \\ &= -\int_R^0 e^{-u^2}\,du &&\because (-u)^2=u^2 \\ &= \int_0^R e^{-u^2}\,du &&\because -\int_R^0 g(u)\,du=\int_0^R g(u)\,du \end{align} $$
である。
ここで、広義リーマン積分の定義より、
$$ \int_{-\infty}^0 e^{-x^2}\,dx := \lim_{R\to\infty}\int_{-R}^0 e^{-x^2}\,dx $$
である。
よって、上で示した等式から、
$$ \begin{align} \int_{-\infty}^0 e^{-x^2}\,dx &= \lim_{R\to\infty}\int_{-R}^0 e^{-x^2}\,dx \\ &= \lim_{R\to\infty}\int_0^R e^{-u^2}\,du \\ &= \int_0^\infty e^{-u^2}\,du \\ &= \frac{\sqrt{\pi}}{2} \end{align} $$
である。ここで、積分変数は記号にすぎないので、
$$ \int_0^\infty e^{-u^2}\,du = \int_0^\infty e^{-x^2}\,dx $$
である。したがって、
$$ \int_{-\infty}^0 e^{-x^2}\,dx = \int_0^\infty e^{-x^2}\,dx = \frac{\sqrt{\pi}}{2} $$
である。
-以上より、
$$ \int_{-\infty}^{\infty}e^{-x^2}\,dx := \int_{-\infty}^{0}e^{-x^2}\,dx + \int_{0}^{\infty}e^{-x^2}\,dx = \sqrt{\pi} $$
である。
$$ \Box$$

正規分布の確率密度関数の全積分

$\mu\in\mathbb R$、$\sigma>0$ とする。
関数 $p_{\mu,\sigma^2}:\mathbb R\to[0,\infty)$ を
$$ p_{\mu,\sigma^2}(x) := \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) $$
によって定める。
このとき、広義リーマン積分
$$ \int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx $$
は収束し、
$$ \int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx = 1 $$
である。

$\sigma>0$ より、$\sqrt{\sigma^2}=\sigma$ である。したがって、
$$ p_{\mu,\sigma^2}(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) $$
である。
$ $
任意に $a,b\in\mathbb R$ を $a< b$ となるようにとる。このとき、
$$ \int_a^b p_{\mu,\sigma^2}(x)\,dx = \int_a^b \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\,dx $$
である。ここで、
$$ u:=\frac{x-\mu}{\sigma} $$
とおくと、$\sigma>0$ より、この変数変換は単調増加な $C^1$ 級の変数変換であり、
$$ dx=\sigma\,du $$
である。また、$x=a$ のとき $u=\frac{a-\mu}{\sigma}$ であり、$x=b$ のとき $u=\frac{b-\mu}{\sigma}$ である。
したがって、有限区間上の変数変換により、
$$ \begin{align} \int_a^b p_{\mu,\sigma^2}(x)\,dx &= \int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}} \frac{1}{\sigma\sqrt{2\pi}} e^{-u^2/2}\sigma\,du \\ &= \frac{1}{\sqrt{2\pi}} \int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}} e^{-u^2/2}\,du \end{align} $$
である。
ここで、$a\to-\infty$ とすると $\frac{a-\mu}{\sigma}\to-\infty$ であり、$b\to\infty$ とすると $\frac{b-\mu}{\sigma}\to\infty$ である。よって、
$$ \int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}e^{-u^2/2}\,du $$
である。
$ $
次に、
$$ v:=\frac{u}{\sqrt{2}} $$
とおくと、
$$ du=\sqrt{2}\,dv $$
である。また、$u\to-\infty$ のとき $v\to-\infty$ であり、$u\to\infty$ のとき $v\to\infty$ である。
したがって、
$$ \begin{align} \int_{-\infty}^{\infty}e^{-u^2/2}\,du &= \int_{-\infty}^{\infty}e^{-v^2}\sqrt{2}\,dv \\ &= \sqrt{2}\int_{-\infty}^{\infty}e^{-v^2}\,dv \\ &= \sqrt{2}\sqrt{\pi} \\ &= \sqrt{2\pi} \end{align} $$
である。ゆえに、
$$ \begin{align} \int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}e^{-u^2/2}\,du \\ &= \frac{1}{\sqrt{2\pi}}\sqrt{2\pi} \\ &= 1 \end{align} $$
である。

-したがって、
$$ \int_{-\infty}^{\infty}p_{\mu,\sigma^2}(x)\,dx = 1 $$
である。
$$ \Box$$

正規分布の期待値

$\mu\in\mathbb R$、$\sigma>0$ とする。実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。
このとき、$X$ の期待値は存在し、
$$ \mathbb E[X]=\mu $$
である。

期待値の存在は読み飛ばして良い(´Д｀)

まず、期待値の存在を示す。
任意に $a,b\in\mathbb R$ を $a< b$ となるようにとる。変数変換
$$ t=\frac{x-\mu}{\sigma} $$
を用いると、
$$ x=\sigma t+\mu,\quad dx=\sigma\,dt $$
である。
また、$x=a$ のとき $t=\frac{a-\mu}{\sigma}$ であり、$x=b$ のとき $t=\frac{b-\mu}{\sigma}$ である。
したがって、有限区間上の変数変換により、
$$ \begin{align} \int_a^b |x|p(x)\,dx &= \int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}} |\sigma t+\mu| \frac{1}{\sigma\sqrt{2\pi}} e^{-t^2/2}\sigma\,dt \\ &= \frac{1}{\sqrt{2\pi}} \int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}} |\sigma t+\mu|e^{-t^2/2}\,dt \end{align} $$
である。ここで、三角不等式より
$$ |\sigma t+\mu| \leq \sigma |t|+|\mu| $$
であるから、
$$ |\sigma t+\mu|e^{-t^2/2} \leq \sigma |t|e^{-t^2/2} + |\mu|e^{-t^2/2} $$
である。また、
$$ \begin{align} \int_{-\infty}^{\infty}|t|e^{-t^2/2}\,dt &= \int_{-\infty}^{0}|t|e^{-t^2/2}\,dt + \int_{0}^{\infty}|t|e^{-t^2/2}\,dt \quad \because \text{広義積分を左右に分ける} \\ &= \int_{-\infty}^{0}(-t)e^{-t^2/2}\,dt + \int_{0}^{\infty}t e^{-t^2/2}\,dt \quad \because t<0\text{ では }|t|=-t,\ t>0\text{ では }|t|=t \\ &= \lim_{a\to-\infty} \int_{a}^{0}(-t)e^{-t^2/2}\,dt + \int_{0}^{\infty}t e^{-t^2/2}\,dt \quad \because \int_{-\infty}^{0}\text{ は広義積分} \\ &= \lim_{a\to-\infty} \int_{-a}^{0}u e^{-u^2/2}(-du) + \int_{0}^{\infty}t e^{-t^2/2}\,dt \quad \because u=-t,\ dt=-du \\ &= \lim_{a\to-\infty} \int_{0}^{-a}u e^{-u^2/2}\,du + \int_{0}^{\infty}t e^{-t^2/2}\,dt \quad \because \text{積分区間の向きを入れ替える} \\ &= \int_{0}^{\infty}u e^{-u^2/2}\,du + \int_{0}^{\infty}t e^{-t^2/2}\,dt \quad \because a\to-\infty\text{ ならば }-a\to\infty \\ &= 2\int_{0}^{\infty}t e^{-t^2/2}\,dt \quad \because \text{積分変数の名前は値に影響しない} \\ &= 2\lim_{b\to\infty} \int_{0}^{b}t e^{-t^2/2}\,dt \quad \because \int_{0}^{\infty}\text{ は広義積分である} \\ &= 2\lim_{b\to\infty} \left[-e^{-t^2/2}\right]_{0}^{b} \quad \because \frac{d}{dt}\left(-e^{-t^2/2}\right)=t e^{-t^2/2} \\ &= 2\lim_{b\to\infty} \left(-e^{-b^2/2}+1\right) \quad \because e^0=1 \\ &= 2 \quad \because \lim_{b\to\infty}e^{-b^2/2}=0 \end{align} $$
であり、ガウス積分(本記事内で証明済み)より、
$$ \int_{-\infty}^{\infty}e^{-t^2/2}\,dt = \sqrt{2\pi} $$
である。したがって、
$$ \int_{-\infty}^{\infty}|t|e^{-t^2/2}\,dt<\infty, \quad \int_{-\infty}^{\infty}e^{-t^2/2}\,dt<\infty $$
であるから、比較判定法(補足を参照)より、
$$ \int_{-\infty}^{\infty} |\sigma t+\mu|e^{-t^2/2}\,dt<\infty $$
である。ゆえに、$a\to-\infty$、$b\to\infty$ として、
$$ \int_{-\infty}^{\infty}|x|p(x)\,dx = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} |\sigma t+\mu|e^{-t^2/2}\,dt <\infty $$
である。
したがって、$\mathbb E[X]$ は存在し、
$$ \mathbb E[X] = \int_{-\infty}^{\infty}xp(x)\,dx $$
が定義される。
$ $
次に、この値を計算する。変数変換
$$ t=\frac{x-\mu}{\sigma} $$
を用いると、
$$ x=\sigma t+\mu,\quad dx=\sigma\,dt $$
であり、$x\to-\infty$ のとき $t\to-\infty$、$x\to\infty$ のとき $t\to\infty$ である。
したがって、
$$ \begin{align} \mathbb E[X] &= \int_{-\infty}^{\infty} x\frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\,dx \\ &= \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^{\infty} (\sigma t+\mu)e^{-t^2/2}\sigma\,dt \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} (\sigma t+\mu)e^{-t^2/2}\,dt \\ &= \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^{\infty} t e^{-t^2/2}\,dt + \frac{\mu}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-t^2/2}\,dt \end{align} $$
である。
ここで、前述の計算より
$$ \int_0^\infty t e^{-t^2/2}\,dt = \left[-e^{-t^2/2}\right]_0^\infty = 1 $$
である。
また、変数変換 $u=-t$ により、
$$ \begin{align} \int_{-\infty}^{0}t e^{-t^2/2}\,dt &= \lim_{a\to-\infty}\int_a^0 t e^{-t^2/2}\,dt \quad \because \int_{-\infty}^{0}\text{ は広義積分である} \\ &= \lim_{a\to-\infty}\int_{-a}^{0}(-u)e^{-u^2/2}(-du) \quad \because u=-t,\ dt=-du \\ &= \lim_{a\to-\infty}\int_{-a}^{0}u e^{-u^2/2}\,du \\ &= -\lim_{a\to-\infty}\int_0^{-a}u e^{-u^2/2}\,du \quad \because \int_{\alpha}^{\beta}f(u)\,du=-\int_{\beta}^{\alpha}f(u)\,du \\ &= -\int_0^\infty u e^{-u^2/2}\,du \quad \because a\to-\infty\text{ ならば }-a\to\infty \\ &= -1 \end{align} $$
である。したがって、
$$ \int_{-\infty}^{\infty}t e^{-t^2/2}\,dt = \int_{-\infty}^{0}t e^{-t^2/2}\,dt + \int_0^\infty t e^{-t^2/2}\,dt = -1+1 = 0 $$
である。また、ガウス積分より、
$$ \int_{-\infty}^{\infty} e^{-t^2/2}\,dt = \sqrt{2\pi} $$
である。
よって、
$$ \begin{align} \mathbb E[X] &= \frac{\sigma}{\sqrt{2\pi}}\cdot 0 + \frac{\mu}{\sqrt{2\pi}}\cdot\sqrt{2\pi} \\ &= \mu \end{align} $$
である。

-以上より、
$$ \mathbb E[X]=\mu $$
である。
$$ \Box$$

比較判定法について

広義積分の比較判定法とは、非負関数 $f,g$ について、ある区間上で
$$ 0\leq f(t)\leq g(t) $$
が成り立ち、さらに
$$ \int g(t)\,dt $$
が収束するならば、
$$ \int f(t)\,dt $$
も収束する、という判定法である。

正規分布の分散

$\mu\in\mathbb R$、$\sigma>0$ とする。実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。
このとき、$X$ の分散は存在し、
$$ \operatorname{Var}(X)=\sigma^2 $$
である。

$X\sim\mathcal N(\mu,\sigma^2)$ とする。
このとき、$X$ の確率密度関数 $p:\mathbb R\to[0,\infty)$ は
$$ p(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) $$
である。$\sigma>0$ より、$\sqrt{\sigma^2}=\sigma$ であるから、
$$ p(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) $$
である。また、既に示した命題より、
$$ \mathbb E[X]=\mu $$
である。したがって、
$$ \int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx<\infty $$
を示せば、$X$ の分散は存在し、
$$ \operatorname{Var}(X) = \int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx $$
である。

まず、この積分を計算する。変数変換
$$ t=\frac{x-\mu}{\sigma} $$
を用いると、
$$ x-\mu=\sigma t,\quad dx=\sigma\,dt $$
である。また、$x\to-\infty$ のとき $t\to-\infty$ であり、$x\to\infty$ のとき $t\to\infty$ である。
よって、
$$ \begin{align} \int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx &= \int_{-\infty}^{\infty} (x-\mu)^2 \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\,dx \\ &= \int_{-\infty}^{\infty} \sigma^2t^2 \frac{1}{\sigma\sqrt{2\pi}} e^{-t^2/2}\sigma\,dt \\ &= \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt \end{align} $$
である。
$ $
次に、
$$ \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt $$
を求める。
関数 $t\mapsto t^2e^{-t^2/2}$ は非負であり、偶関数であるから、
$$ \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt = 2\int_0^\infty t^2e^{-t^2/2}\,dt $$
である。
ここで、$b>0$ とすると、部分積分により、
$$ \begin{align} \int_0^b t^2e^{-t^2/2}\,dt &= \int_0^b t\cdot te^{-t^2/2}\,dt \\ &= \int_0^b t\cdot \left(-\frac{d}{dt}e^{-t^2/2}\right)\,dt \quad \because \frac{d}{dt}e^{-t^2/2}=-te^{-t^2/2} \\ &= \int_0^b t\cdot d\left(-e^{-t^2/2}\right) \quad \because d\left(-e^{-t^2/2}\right)=te^{-t^2/2}\,dt \\ &= \left[-te^{-t^2/2}\right]_0^b - \int_0^b \left(-e^{-t^2/2}\right)\cdot 1\,dt \quad \because \text{部分積分公式} \\ &= \left[-te^{-t^2/2}\right]_0^b + \int_0^b e^{-t^2/2}\,dt \quad \because -\left(-e^{-t^2/2}\right)=e^{-t^2/2} \\ &= \left(-be^{-b^2/2}\right)-0 + \int_0^b e^{-t^2/2}\,dt \quad \because \left[-te^{-t^2/2}\right]_0^b=-be^{-b^2/2}-0 \\ &= -be^{-b^2/2} + \int_0^b e^{-t^2/2}\,dt \end{align} $$
である。また、
$$ \lim_{b\to\infty}be^{-b^2/2}=0 $$
である(補足を参照)から、
$$ \int_0^\infty t^2e^{-t^2/2}\,dt = \int_0^\infty e^{-t^2/2}\,dt $$
である。
よって、ガウス積分より、
$$ \int_{-\infty}^{\infty}e^{-t^2/2}\,dt = \sqrt{2\pi} $$
であり、$e^{-t^2/2}$ は偶関数であるから、
$$ \int_0^\infty e^{-t^2/2}\,dt = \frac{\sqrt{2\pi}}{2} $$
である。したがって、
$$ \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt = 2\int_0^\infty t^2e^{-t^2/2}\,dt = 2\int_0^\infty e^{-t^2/2}\,dt = \sqrt{2\pi} $$
である。
$ $
以上より、
$$ \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt = \sqrt{2\pi} $$
であるから、
$$ \int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx = \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt = \sigma^2 < \infty $$
である。
したがって、$X$ の分散は存在する。また、既に示した命題より $\mathbb E[X]=\mu$ であるから、
$$ \begin{align} \operatorname{Var}(X) &= \int_{-\infty}^{\infty}(x-\mathbb E[X])^2p(x)\,dx \\ &= \int_{-\infty}^{\infty}(x-\mu)^2p(x)\,dx \\ &= \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{\infty}t^2e^{-t^2/2}\,dt \\ &= \frac{\sigma^2}{\sqrt{2\pi}}\sqrt{2\pi} \\ &= \sigma^2 \end{align} $$
である。

-したがって、
$$ \operatorname{Var}(X)=\sigma^2 $$
である。
$$ \Box$$

極限 $\lim_{b\to\infty}be^{-b^2/2}=0$ について

$b>0$ とする。
指数関数の級数展開より、
$$ e^{b^2/2} = \sum_{n=0}^{\infty}\frac{(b^2/2)^n}{n!} $$
である。各項は非負であるから、特に $n=2$ の項だけを取り出して、
$$ e^{b^2/2} \geq \frac{(b^2/2)^2}{2!} = \frac{b^4}{8} $$
が成り立つ。
したがって、
$$ \begin{align} 0 \leq be^{-b^2/2} &= \frac{b}{e^{b^2/2}} \quad \because e^{-b^2/2}=\frac{1}{e^{b^2/2}} \\ &\leq \frac{b}{b^4/8} \quad \because e^{b^2/2}\geq\frac{b^4}{8} \\ &= \frac{8}{b^3} \end{align} $$
である。
ここで、
$$ \lim_{b\to\infty}\frac{8}{b^3}=0 $$
であるから、はさみうちの原理より、
$$ \lim_{b\to\infty}be^{-b^2/2}=0 $$
である。

正規分布の標準化

$\mu\in\mathbb R$、$\sigma>0$ とする。
実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。すなわち、任意の $a,b\in\mathbb R$ に対して、$a\leq b$ ならば、
$$ \mathbb P(a\leq X\leq b) = \int_a^b \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x-\mu)^2}{2\sigma^2} \right) \,dx $$
が成り立つとする。
このとき、
$$ Y:=\frac{X-\mu}{\sigma} $$
とおけば、$Y$ は標準正規分布 $\mathcal N(0,1)$ に従う。すなわち、
$$ Y\sim\mathcal N(0,1) $$
である。

まず、$Y$ が実数値確率変数であることを確認する。
写像 $g:\mathbb R\to\mathbb R$ を
$$ g(x):=\frac{x-\mu}{\sigma} $$
によって定める。
このとき、$g$ は $\mathbb R$ 上の連続関数である。したがって、$X$ が実数値確率変数であることから、
$$ Y=g(X)=\frac{X-\mu}{\sigma} $$
も実数値確率変数である。
$ $
次に、$Y$ の区間確率を計算する。
任意に $a,b\in\mathbb R$ を $a\leq b$ を満たすようにとる。
任意の $\omega\in\Omega$ に対して、$\sigma>0$ より、
$$ \begin{align} a\leq Y(\omega)\leq b &\Longleftrightarrow a\leq\frac{X(\omega)-\mu}{\sigma}\leq b \\ &\Longleftrightarrow \sigma a\leq X(\omega)-\mu\leq \sigma b \\ &\Longleftrightarrow \sigma a+\mu\leq X(\omega)\leq \sigma b+\mu \end{align} $$
である。
したがって、事象として、
$$ \{a\leq Y\leq b\} = \{\sigma a+\mu\leq X\leq \sigma b+\mu\} $$
である。ゆえに、
$$ \mathbb P(a\leq Y\leq b) = \mathbb P(\sigma a+\mu\leq X\leq \sigma b+\mu) $$
である。
また、$a\leq b$ かつ $\sigma>0$ であるから、
$$ \sigma a+\mu\leq \sigma b+\mu $$
である。
よって、$X\sim\mathcal N(\mu,\sigma^2)$ より、
$$ \mathbb P(a\leq Y\leq b) = \int_{\sigma a+\mu}^{\sigma b+\mu} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x-\mu)^2}{2\sigma^2} \right) \,dx $$
である。
$ $
右辺の積分を変数変換によって計算する。
変数変換
$$ t:=\frac{x-\mu}{\sigma} $$
を用いる。このとき、
$$ x=\sigma t+\mu,\quad dx=\sigma\,dt $$
である。
また、積分区間の端点は、
$$ x=\sigma a+\mu \quad\Longleftrightarrow\quad t=a $$
および
$$ x=\sigma b+\mu \quad\Longleftrightarrow\quad t=b $$
に対応する。
さらに、$\sigma>0$ より、
$$ \sqrt{\sigma^2}=\sigma $$
である。したがって、有限区間上の変数変換により、
$$ \begin{align} \mathbb P(a\leq Y\leq b) &= \int_{\sigma a+\mu}^{\sigma b+\mu} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x-\mu)^2}{2\sigma^2} \right) \,dx \\ &= \int_a^b \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(\sigma t+\mu-\mu)^2}{2\sigma^2} \right) \sigma\,dt \\ &= \int_a^b \frac{\sigma}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{\sigma^2t^2}{2\sigma^2} \right) \,dt \\ &= \int_a^b \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{t^2}{2} \right) \,dt \end{align} $$
である。
$ $
以上より、任意の $a,b\in\mathbb R$ に対して、$a\leq b$ ならば、
$$ \mathbb P(a\leq Y\leq b) = \int_a^b \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{t^2}{2} \right) \,dt $$
が成り立つ。
これは、$Y$ が平均 $0$、分散 $1$ の正規分布に従うことを意味する。
したがって、
$$ Y\sim\mathcal N(0,1) $$
である。

-すなわち、
$$ \frac{X-\mu}{\sigma}\sim\mathcal N(0,1) $$
である。
$$ \Box$$

標準化の意味

この命題は、平均 $\mu$、分散 $\sigma^2$ の正規分布に従う確率変数 $X$ から、平均を引き、標準偏差で割ると、標準正規分布に従うことを表している。
この変換
$$ Y=\frac{X-\mu}{\sigma} $$
を、正規分布の標準化という。

標準正規分布の密度関数の偶関数性

標準正規分布の密度関数 $\varphi:\mathbb R\to[0,\infty)$ を
$$ \varphi(x):= \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right) $$
によって定める。
このとき、$\varphi$ は偶関数である。すなわち、任意の $x\in\mathbb R$ に対して、
$$ \varphi(-x)=\varphi(x) $$
が成り立つ。

任意に $x\in\mathbb R$ をとる。
標準正規分布の密度関数の定義より、
$$ \varphi(x) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right) $$
である。
したがって、
$$ \begin{align} \varphi(-x) &= \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{(-x)^2}{2}\right) \\ &= \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right) \quad \because (-x)^2=x^2 \\ &= \varphi(x) \end{align} $$
である。
よって、任意の $x\in\mathbb R$ に対して、
$$ \varphi(-x)=\varphi(x) $$
が成り立つ。
したがって、$\varphi$ は偶関数である。
$$ \Box$$

標準正規分布の累積分布関数の積分表示

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布に従うとする。

すなわち、任意の実数 $a,b$ に対して、$a< b$ ならば、
$$ \mathbb P(a< Z\leq b) = \int_a^b \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) \,dt $$
が成り立つとする。
$Z$ の累積分布関数 $F_Z:\mathbb R\to[0,1]$ を
$$ F_Z(x):=\mathbb P(Z\leq x) $$
によって定める。

-このとき、任意の $x\in\mathbb R$ に対して、
$$ F_Z(x) = \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) \,dt $$
が成り立つ。

任意に $x\in\mathbb R$ をとる。
関数 $\varphi:\mathbb R\to[0,\infty)$ を
$$ \varphi(t) := \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) $$
によって定める。
既に示したガウス積分と標準正規分布の密度関数の全積分より、
$$ \int_{-\infty}^{\infty}\varphi(t)\,dt=1 $$
である。したがって、任意の $x\in\mathbb R$ に対して、広義積分
$$ \int_{-\infty}^{x}\varphi(t)\,dt $$
は収束する。

有限区間で近似するための事象を定める。
$N\in\mathbb N_{>0}$ を
$$ -N< x $$
となるようにとる。
$n\geq N$ に対して、
$$ A_n:=\{\omega\in\Omega\mid -n< Z(\omega)\leq x\} $$
と定める。
このとき、
$$ A_n = Z^{-1}((-n,x]) $$
である。区間 $(-n,x]$ は $\mathbb R$ のボレル集合であり、$Z$ は実数値確率変数であるから、
$$ A_n\in\mathcal F $$
である。したがって、$A_n$ は事象である。
また、$n\geq N$ ならば $-n\leq -N< x$ であるから、
$$ -n< x $$
である。
したがって、標準正規分布の定義より、
$$ \mathbb P(A_n) = \mathbb P(-n< Z\leq x) = \int_{-n}^{x}\varphi(t)\,dt $$
である。
$ $
次に、事象列 $(A_n)_{n=N}^{\infty}$ が単調増加であることを示す。
$n,m\in\mathbb N$ が $N\leq n\leq m$ を満たすとする。このとき、
$$ -m\leq -n $$
である。
任意に $\omega\in A_n$ をとる。このとき、$A_n$ の定義より、
$$ -n< Z(\omega)\leq x $$
である。
一方で、$-m\leq -n$ であるから、
$$ -m\leq -n< Z(\omega) $$
である。したがって、
$$ -m< Z(\omega)\leq x $$
が成り立つ。
ゆえに、$A_m$ の定義より、
$$ \omega\in A_m $$
である。
したがって、
$$ A_n\subseteq A_m $$
である。
よって、$(A_n)_{n=N}^{\infty}$ は単調増加列である。
$ $
次に、事象列 $(A_n)_{n=N}^{\infty}$ の和集合を求める。
$$ \bigcup_{n=N}^{\infty}A_n = \{Z\leq x\} $$
を示す。
i) まず、
$$ \bigcup_{n=N}^{\infty}A_n \subseteq \{Z\leq x\} $$
　を示す。
　任意に
$$ \omega\in\bigcup_{n=N}^{\infty}A_n $$
　をとる。このとき、ある $n\geq N$ が存在して、
$$ \omega\in A_n $$
　である。したがって、$A_n$ の定義より、
$$ -n< Z(\omega)\leq x $$
　である。よって、
$$ Z(\omega)\leq x $$
　であるから、
$$ \omega\in\{Z\leq x\} $$
　である。
　したがって、
$$ \bigcup_{n=N}^{\infty}A_n \subseteq \{Z\leq x\} $$
　である。
$ $
ii) 次に、
$$ \{Z\leq x\} \subseteq \bigcup_{n=N}^{\infty}A_n $$
　を示す。
　任意に
$$ \omega\in\{Z\leq x\} $$
　をとる。このとき、
$$ Z(\omega)\leq x $$
　である。
　また、$Z$ は実数値確率変数であるから、
$$ Z(\omega)\in\mathbb R $$
　である。したがって、アルキメデス性より、ある $n\in\mathbb N$ が存在して、
$$ n\geq N \quad\text{かつ}\quad n>-Z(\omega) $$
　が成り立つ。このとき、
$$ -n< Z(\omega) $$
　である。よって、
$$ -n< Z(\omega)\leq x $$
　であるから、$A_n$ の定義より、
$$ \omega\in A_n $$
　である。したがって、
$$ \omega\in\bigcup_{n=N}^{\infty}A_n $$
　である。
　ゆえに、
$$ \{Z\leq x\} \subseteq \bigcup_{n=N}^{\infty}A_n $$
　である。
i)、ii) より、
$$ \bigcup_{n=N}^{\infty}A_n = \{Z\leq x\} $$
である。
$ $
次に、確率の下からの連続性を用いる。
$(A_n)_{n=N}^{\infty}$ は単調増加列であり、
$$ \bigcup_{n=N}^{\infty}A_n = \{Z\leq x\} $$
であるから、確率の下からの連続性( 証明はコチラ )より、
$$ \mathbb P(Z\leq x) = \mathbb P\left(\bigcup_{n=N}^{\infty}A_n\right) = \lim_{n\to\infty}\mathbb P(A_n) $$
である。
$ $
最後に、広義積分の定義を用いて結論を得る。
累積分布関数の定義より、
$$ F_Z(x)=\mathbb P(Z\leq x) $$
である。したがって、
$$ \begin{align} F_Z(x) &= \mathbb P(Z\leq x) \\ &= \lim_{n\to\infty}\mathbb P(A_n) \\ &= \lim_{n\to\infty}\mathbb P(-n< Z\leq x) \\ &= \lim_{n\to\infty}\int_{-n}^{x}\varphi(t)\,dt \\ &= \int_{-\infty}^{x}\varphi(t)\,dt \end{align} $$
である。最後の等号は広義積分の定義による。

-ゆえに、
$$ F_Z(x) = \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) \,dt $$
である。
$$ \Box$$

正規分布の累積分布関数

$\mu\in\mathbb R$、$\sigma>0$ とする。
確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $X$ が正規分布 $\mathcal N(\mu,\sigma^2)$ に従うとする。

$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$ を、各 $x\in\mathbb R$ に対して
$$ F_X(x):=\mathbb P(X\leq x) $$
によって定める。
標準正規分布の累積分布関数を $\Phi:\mathbb R\to[0,1]$ と書く。すなわち、各 $y\in\mathbb R$ に対して、
$$ \Phi(y) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{y} \exp\left(-\frac{t^2}{2}\right) \,dt $$
である。

-このとき、任意の $x\in\mathbb R$ に対して、
$$ F_X(x) = \Phi\left(\frac{x-\mu}{\sigma}\right) $$
が成り立つ。すなわち、
$$ F_X(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\frac{x-\mu}{\sigma}} \exp\left(-\frac{t^2}{2}\right) \,dt $$
である。

任意に $x\in\mathbb R$ をとる。
$$ Z:=\frac{X-\mu}{\sigma} $$
とおく。
正規分布の標準化より、
$$ Z\sim\mathcal N(0,1) $$
である。
また、$\sigma>0$ より、任意の $\omega\in\Omega$ に対して、
$$ \begin{align} X(\omega)\leq x &\Longleftrightarrow X(\omega)-\mu\leq x-\mu \\ &\Longleftrightarrow \frac{X(\omega)-\mu}{\sigma}\leq \frac{x-\mu}{\sigma} \\ &\Longleftrightarrow Z(\omega)\leq \frac{x-\mu}{\sigma} \end{align} $$
である。
したがって、事象として、
$$ \{X\leq x\} = \left\{Z\leq \frac{x-\mu}{\sigma}\right\} $$
である。
ゆえに、
$$ \begin{align} F_X(x) &= \mathbb P(X\leq x) \\ &= \mathbb P\left(Z\leq \frac{x-\mu}{\sigma}\right) \\ &= \Phi\left(\frac{x-\mu}{\sigma}\right) \end{align} $$
である。
さらに、標準正規分布の累積分布関数の積分表示(本記事内で証明済み)より、
$$ \Phi\left(\frac{x-\mu}{\sigma}\right) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\frac{x-\mu}{\sigma}} \exp\left(-\frac{t^2}{2}\right) \,dt $$
である。
したがって、
$$ F_X(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\frac{x-\mu}{\sigma}} \exp\left(-\frac{t^2}{2}\right) \,dt $$
である。
以上より、任意の $x\in\mathbb R$ に対して、
$$ F_X(x) = \Phi\left(\frac{x-\mu}{\sigma}\right) $$
が成り立つ。
$$ \Box$$

標準正規分布の累積分布関数の対称性

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
$Z$ の累積分布関数 $F_Z:\mathbb R\to[0,1]$ を
$$ F_Z(x):=\mathbb P(Z\leq x) $$
によって定める。
このとき、任意の $x\in\mathbb R$ に対して、
$$ F_Z(x)+F_Z(-x)=1 $$
が成り立つ。

標準正規分布の密度関数を
$$ \varphi(t):= \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) $$
とおく。
標準正規分布の累積分布関数の積分表示(本記事内で証明済み)より、任意の $x\in\mathbb R$ に対して、
$$ F_Z(x)=\int_{-\infty}^{x}\varphi(t)\,dt $$
である。
また、$\varphi$ は偶関数である(本記事内で証明済み)。すなわち、任意の $t\in\mathbb R$ に対して、
$$ \varphi(-t)=\varphi(t) $$
である。
任意に $x\in\mathbb R$ をとる。まず、
$$ F_Z(-x) = \int_{-\infty}^{-x}\varphi(t)\,dt $$
である。
$a<-x$ とする。有限区間 $[a,-x]$ 上で変数変換
$$ u=-t $$
を行うと、$t=-u$、$dt=-du$ であり、$t=a$ のとき $u=-a$、$t=-x$ のとき $u=x$ である。したがって、
$$ \begin{align} \int_a^{-x}\varphi(t)\,dt &= \int_{-a}^{x}\varphi(-u)(-du) \\ &= \int_x^{-a}\varphi(-u)\,du \\ &= \int_x^{-a}\varphi(u)\,du \end{align} $$
である。最後の等号では、$\varphi$ が偶関数であることを用いた。
ここで、$a\to-\infty$ とすると、$-a\to\infty$ である。よって、広義積分の定義より、
$$ F_Z(-x) = \int_x^\infty \varphi(u)\,du $$
である。
一方、標準正規分布の密度関数の全積分(本記事内で証明済み)より、
$$ \int_{-\infty}^{\infty}\varphi(u)\,du=1 $$
である。
したがって、広義積分の分割により、
$$ \begin{align} 1 &= \int_{-\infty}^{\infty}\varphi(u)\,du \\ &= \int_{-\infty}^{x}\varphi(u)\,du + \int_x^\infty\varphi(u)\,du \\ &= F_Z(x)+F_Z(-x) \end{align} $$
である。
ゆえに、任意の $x\in\mathbb R$ に対して、
$$ F_Z(x)+F_Z(-x)=1 $$
が成り立つ。
$$ \Box$$

標準正規分布の右裾確率と左裾確率の対称性

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
このとき、任意の $x\in\mathbb R$ に対して、
$$ \mathbb P(Z\geq x)=\mathbb P(Z\leq -x) $$
が成り立つ。

$Z$ の累積分布関数を
$$ F_Z(x):=\mathbb P(Z\leq x) $$
とおく。
標準正規分布の累積分布関数の対称性(本記事内で証明済み)より、任意の $x\in\mathbb R$ に対して、
$$ F_Z(-x)=1-F_Z(x) $$
である。
一方、累積分布関数の定義より、
$$ F_Z(x)=\mathbb P(Z\leq x) $$
であるから、
$$ 1-F_Z(x)=\mathbb P(Z>x) $$
である。
また、標準正規分布の密度関数を $\varphi$ とおくと、標準正規分布の定義より、
$$ \mathbb P(Z=x) = \mathbb P(x\leq Z\leq x) = \int_x^x\varphi(t)\,dt = 0 $$
である。
したがって、
$$ \mathbb P(Z\geq x) = \mathbb P(Z>x)+\mathbb P(Z=x) = \mathbb P(Z>x) $$
である。ゆえに、
$$ \mathbb P(Z\geq x) = \mathbb P(Z>x) = 1-F_Z(x) $$
である。
また、累積分布関数の定義より、
$$ \mathbb P(Z\leq -x)=F_Z(-x) $$
である。したがって、
$$ \mathbb P(Z\leq -x) = F_Z(-x) = 1-F_Z(x) $$
である。
以上より、
$$ \mathbb P(Z\geq x) = 1-F_Z(x) = \mathbb P(Z\leq -x) $$
である。
したがって、任意の $x\in\mathbb R$ に対して、
$$ \mathbb P(Z\geq x)=\mathbb P(Z\leq -x) $$
が成り立つ。
$$ \Box$$

原点対称な分布について

この命題の本質は、標準正規分布が原点対称であることにある。
より一般に、確率変数 $Z$ と $-Z$ が同じ分布をもつならば、任意の $x\in\mathbb R$ に対して、
$$ \mathbb P(Z\geq x) = \mathbb P(Z\leq -x) $$
が成り立つ。
実際、
$$ \{Z\geq x\}=\{-Z\leq -x\} $$
であり、$Z$ と $-Z$ が同じ分布をもつならば、
$$ \mathbb P(Z\geq x) = \mathbb P(-Z\leq -x) = \mathbb P(Z\leq -x) $$
である。
標準正規分布はその典型例である。

標準正規分布の両側確率

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
このとき、任意の $z>0$ に対して、
$$ \mathbb P(|Z|>z) = 2\mathbb P(Z>z) $$
が成り立つ。

任意に $z>0$ をとる。
まず、
$$ \{|Z|>z\} = \{Z<-z\}\cup\{Z>z\} $$
である。
また、$z>0$ であるから、事象 $\{Z<-z\}$ と $\{Z>z\}$ は互いに排反である。
したがって、有限加法性( 詳しくはコチラ )より、
$$ \mathbb P(|Z|>z) = \mathbb P(Z<-z)+\mathbb P(Z>z) $$
である。
標準正規分布の密度関数を $\varphi$ とおく。標準正規分布の定義より、
$$ \mathbb P(Z=z) = \mathbb P(z\leq Z\leq z) = \int_z^z\varphi(t)\,dt = 0 $$
であり、同様に、
$$ \mathbb P(Z=-z)=0 $$
である。
したがって、
$$ \mathbb P(Z>z)=\mathbb P(Z\geq z) $$
であり、
$$ \mathbb P(Z<-z)=\mathbb P(Z\leq -z) $$
である。
また、標準正規分布の右裾確率と左裾確率の対称性(本記事内で証明済み)より、
$$ \mathbb P(Z\geq z) = \mathbb P(Z\leq -z) $$
である。
ゆえに、
$$ \mathbb P(Z<-z) = \mathbb P(Z\leq -z) = \mathbb P(Z\geq z) = \mathbb P(Z>z) $$
である。
以上より、
$$ \begin{align} \mathbb P(|Z|>z) &= \mathbb P(Z<-z)+\mathbb P(Z>z) \\ &= \mathbb P(Z>z)+\mathbb P(Z>z) \\ &= 2\mathbb P(Z>z) \end{align} $$
である。
$$ \Box$$

両側確率と対称性

この命題は、標準正規分布が原点対称であることから、正の値 $z$ を超えて外側に出る確率が、右側確率の $2$ 倍になることを表している。
この性質は、両側検定、信頼区間の構成、$t$ 分布の理解などで基本的に用いられる。

標準正規分布の区間確率と累積分布関数

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。

標準正規分布の累積分布関数 $\Phi:\mathbb R\to[0,1]$ を
$$ \Phi(x):=\mathbb P(Z\leq x) $$
によって定める。
標準正規分布の累積分布関数の積分表示より、
$$ \Phi(x) = \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}}e^{-t^2/2}\,dt $$
である。

-このとき、任意の $a,b\in\mathbb R$ に対して、$a< b$ ならば、
$$ \mathbb P(a< Z< b)=\Phi(b)-\Phi(a) $$
が成り立つ。

標準正規分布の密度関数を
$$ \varphi(t):= \frac{1}{\sqrt{2\pi}}e^{-t^2/2} $$
とおく。
標準正規分布は密度関数 $\varphi$ をもつので、任意の $c\in\mathbb R$ に対して、
$$ \mathbb P(Z=c) = \int_c^c\varphi(t)\,dt = 0 $$
である。
任意に $a,b\in\mathbb R$ を $a< b$ となるようにとる。
このとき、事象として、
$$ \{Z\leq b\} = \{Z\leq a\}\cup\{a< Z< b\}\cup\{Z=b\} $$
である。
また、右辺の $3$ つの事象は互いに排反である。したがって、確率の有限加法性( 詳しくはコチラ )より、
$$ \mathbb P(Z\leq b) = \mathbb P(Z\leq a) + \mathbb P(a< Z< b) + \mathbb P(Z=b) $$
である。
ここで、$\mathbb P(Z=b)=0$ であるから、
$$ \mathbb P(Z\leq b) = \mathbb P(Z\leq a) + \mathbb P(a< Z< b) $$
である。ゆえに、
$$ \begin{align} \mathbb P(a< Z< b) &= \mathbb P(Z\leq b)-\mathbb P(Z\leq a) \\ &= \Phi(b)-\Phi(a) \end{align} $$
である。
$$ \Box$$

累積分布関数を用いた標準正規分布の確率計算

確率変数 $Z$ が標準正規分布 $\mathcal N(0,1)$ に従うとする。
確率密度関数（PDF）では「ある区間に確率変数が収まる確率」を計算することは容易ではない(初等関数では表せない)。
しかし、累積分布関数（CDF: Cumulative Distribution Function）を使うことで、特定の範囲に含まれる確率を簡単に計算できる。

標準正規分布の累積分布関数 $\Phi(z)$
標準正規分布の累積分布関数 $\Phi:\mathbb R\to[0,1]$ は、各 $z\in\mathbb R$ に対して
$$ \Phi(z):=\mathbb P(Z\leq z) $$
によって定められる。
標準正規分布の累積分布関数の積分表示より、
$$ \Phi(z) = \mathbb P(Z\leq z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}}e^{-t^2/2}\,dt $$
である。
したがって、$\Phi(z)$ は、標準正規確率変数 $Z$ が $z$ 以下の値をとる確率を表す。
$ $
区間確率の計算
$a,b\in\mathbb R$、$a< b$ とする。
このとき、
$$ \{a< Z\leq b\} = \{Z\leq b\}\setminus\{Z\leq a\} $$
である。
したがって、確率の差により、
$$ \mathbb P(a< Z\leq b) = \mathbb P(Z\leq b)-\mathbb P(Z\leq a) = \Phi(b)-\Phi(a) $$
である。
また、標準正規分布は密度関数をもつ連続分布であるから、任意の $c\in\mathbb R$ に対して
$$ \mathbb P(Z=c)=0 $$
である。
したがって、
$$ \mathbb P(a< Z< b) = \mathbb P(a< Z\leq b) = \Phi(b)-\Phi(a) $$
である( 詳しくはコチラ )。
$ $
右側確率の計算
$z\in\mathbb R$ とする。
このとき、
$$ \{Z>z\} = \{Z\leq z\}^{c} $$
である。
したがって、補集合の確率より、
$$ \mathbb P(Z>z) = 1-\mathbb P(Z\leq z) $$
である。
累積分布関数の定義より、$\mathbb P(Z\leq z)=\Phi(z)$ であるから、
$$ \mathbb P(Z>z) = 1-\Phi(z) $$
である。
$ $
確率密度関数と累積分布関数の使い分け
標準正規分布の確率密度関数は
$$ \varphi(t):= \frac{1}{\sqrt{2\pi}}e^{-t^2/2} $$
である。
確率密度関数を用いても、区間確率は
$$ \mathbb P(a< Z\leq b) = \int_a^b\varphi(t)\,dt $$
によって表せる。
ただし、標準正規分布では、この積分は一般に初等関数では表せない。そのため、実際の確率計算では、累積分布関数 $\Phi$ を用いて
$$ \mathbb P(a< Z\leq b) = \Phi(b)-\Phi(a) $$
と表す方が扱いやすい。

正規分布における代表的な確率

$X\sim\mathcal N(\mu,\sigma^2)$ とする。このとき、確率変数の標準化
$$ Z:=\frac{X-\mu}{\sigma} $$
により、
$$ Z\sim\mathcal N(0,1) $$
である。
$ $
ここで、標準正規分布の分布関数を $\Phi$ とおくと、任意の $k>0$ に対して、
$$ \begin{align} \mathbb P(\mu-k\sigma\leq X\leq \mu+k\sigma) &= \mathbb P(-k\leq Z\leq k) &&\because \ Z=\frac{X-\mu}{\sigma},\ \sigma>0 \\ &= \Phi(k)-\Phi(-k) &&\because \ Z\sim\mathcal N(0,1),\ \mathbb P(Z=-k)=0 \end{align} $$
である。
さらに、標準正規分布の対称性より、
$$ \Phi(-k)=1-\Phi(k) $$
であるから、
$$ \mathbb P(\mu-k\sigma\leq X\leq \mu+k\sigma) = 2\Phi(k)-1 $$
である。
$ $
特に、
$$ \mathbb P(\mu-\sigma\leq X\leq \mu+\sigma) \approx 0.6827 $$
$$ \mathbb P(\mu-2\sigma\leq X\leq \mu+2\sigma) \approx 0.9545 $$
$$ \mathbb P(\mu-3\sigma\leq X\leq \mu+3\sigma) \approx 0.9973 $$
である。
上記$3$つの数値は重要なので覚えておいて損はない(´・ω・`)ｂ

投稿日：6月8日

更新日：6月8日

数学の力で現場を変えるアルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

Kagura

7363

■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。

他の人のコメント

コメントはありません。

読み込み中

Kagura

ガウス積分から始める(標準)正規分布の基本