0

標準正規分布の対称性

10
0
$$$$
標準正規分布

確率変数 $Z$ が標準正規分布に従うとは、$Z$ が実数値をとり、次の確率密度関数 $f_Z:\mathbb{R}\to[0,\infty)$ をもつことをいう。
$$ f_Z(x)=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2}{2}\right)\quad(x\in\mathbb{R}) $$
すなわち任意の実数 $a\le b$ に対して
$$ P(a\le Z\le b)=\int_a^b \frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2}{2}\right)\,dx $$
が成り立つとき、$Z$ は標準正規分布に従うといい、
$$ Z\sim N(0,1) $$
と書く。

累積分布関数

確率変数 $X$ に対し、関数 $F_X:\mathbb{R}\to[0,1]$
$$ F_X(x):=P(X\le x)\quad(x\in\mathbb{R}) $$
で定める。この $F_X$$X$ の累積分布関数という。

確率変数 $Z$ が標準正規分布 $N(0,1)$ に従うとする。このとき、次が成り立つ。

  1. 確率密度関数 $f_Z(x)$ は偶関数である。すなわち、
    $$ f_Z(-x) = f_Z(x), \quad \forall x \in \mathbb{R} $$
  2. 累積分布関数 $F_Z(x) = P(Z \leq x)$ は次の対称性を満たす。
    $$ F_Z(x)+F_Z(-x) = 1, \quad \forall x \in \mathbb{R} $$
  3. 確率変数 $Z$ の分布(補足を参照)に関して、次の等式が成り立つ。
    $$ P(Z \geq x) = P(Z \leq -x), \quad \forall x \in \mathbb{R} $$
  4. 確率変数 $Z\sim N(0,1)$ に対して、任意の $z>0$ について次が成り立つ。
    $$ P(|Z|>z) = 2\,P(Z>z) $$
偶関数とは

集合 $D\subseteq\mathbb{R}$ が、任意の $x\in D$ に対して $-x\in D$ も満たすとする。
関数 $f:D\to\mathbb{R}$ が偶関数であるとは、任意の $x\in D$ に対して
$$ f(-x)=f(x) $$
が成り立つことをいう。

3.に関しては、『標準正規分布に限らず、$Z$の分布が原点対称である限り成り立つ」という意味で読むのが自然で、
標準正規分布はその典型例、ということになる。

  1. 偶関数であること
    標準正規分布 $N(0,1)$ の確率密度関数 $f_Z(x)$ は次の形で与えられる。
    $$ f_Z(x) = \frac{1}{\sqrt{2\pi}} \exp\!\left(-\frac{x^2}{2}\right), \quad x \in \mathbb{R}. $$
    このとき、任意の $x \in \mathbb{R}$ に対して、引数を $-x$ に置き換えると
    $$ f_Z(-x) = \frac{1}{\sqrt{2\pi}} \exp\!\left(-\frac{(-x)^2}{2}\right) $$
    ここで、$(-x)^2 = x^2$ であるため、
    $$ f_Z(-x) = \frac{1}{\sqrt{2\pi}} \exp\!\left(-\frac{x^2}{2}\right) = f_Z(x) $$
    したがって、$f_Z(x)$ は偶関数であり、$f_Z(-x) = f_Z(x)$ が成り立つ。
    $$ \Box$$
  2. 累積分布関数の対称性
    標準正規分布$N(0,1)$に従う確率変数$Z$は確率密度関数$f_Z$をもつので、任意の$x\in\mathbb R$に対して
    $$ F_Z(x)=P(Z\le x)=\int_{-\infty}^{x} f_Z(t)\,dt $$
    が成り立つ。任意の$x\in\mathbb R$に対し、$F_Z(-x)$を計算する。定義より
    $$ F_Z(-x)=\int_{-\infty}^{-x} f_Z(t)\,dt $$
    である。ここで変数変換$u=-t$を行う。すなわち$t=-u,\ dt=-du$であり、端点は
    $$ t=-\infty\ \Rightarrow\ u=\infty,\qquad t=-x\ \Rightarrow\ u=x $$
    となる。従って
    $$ \int_{-\infty}^{-x} f_Z(t)\,dt =\int_{\infty}^{x} f_Z(-u)\,(-du) =\int_{x}^{\infty} f_Z(-u)\,du $$
    を得る。最後の変形は積分の性質
    $$ \int_{a}^{b} f(x)dx=-\int_{b}^{a} f(x)dx $$
    を用いた。ここで$1.$より$f_Z$は偶関数であるから$f_Z(-u)=f_Z(u)$が成り立ち、よって
    $$ F_Z(-x)=\int_{x}^{\infty} f_Z(u)\,du $$
    となる。
    $ $
    一方、同じく密度による表現から
    $$ 1-F_Z(x) =1-\int_{-\infty}^{x} f_Z(u)\,du =\int_{-\infty}^{\infty} f_Z(u)\,du-\int_{-\infty}^{x} f_Z(u)\,du =\int_{x}^{\infty} f_Z(u)\,du $$
    が成り立つ。ここで$\int_{-\infty}^{\infty} f_Z(u)\,du=1$は確率密度関数の性質である。
    $ $
    以上より
    $$ F_Z(-x)=\int_{x}^{\infty} f_Z(u)\,du=1-F_Z(x) $$
    が従う。すなわち任意の$x\in\mathbb R$に対して
    $$ F_Z(x)+F_Z(-x)=1 $$
    が成り立つ。
    $$ \Box$$
  3. 確率の対称性
    累積分布関数の性質
    $$ F_Z(-x)=1-F_Z(x) $$
    を用いて、任意の$x\in\mathbb R$に対して
    $$ P(Z\ge x)=P(Z\le -x) $$
    を示す。まず、$F_Z(x)=P(Z\le x)$より
    $$ 1-F_Z(x)=1-P(Z\le x)=P(Z>x) $$
    が成り立つ。一方、標準正規分布$N(0,1)$は確率密度関数をもつ連続分布であるから、任意の$x\in\mathbb R$に対して
    $$ P(Z=x)=0 $$
    が成り立つ( 証明はこちら )。従って
    $$ P(Z\ge x)=P(Z>x) $$
    である。以上より
    $$ P(Z\ge x)=P(Z>x)=1-F_Z(x) $$
    が成り立つ。また、定義より
    $$ P(Z\le -x)=F_Z(-x) $$
    であり、ここに$F_Z(-x)=1-F_Z(x)$を代入すると
    $$ P(Z\le -x)=F_Z(-x)=1-F_Z(x) $$
    となる。従って
    $$ P(Z\ge x)=1-F_Z(x)=P(Z\le -x) $$
    が得られる。よって
    $$ P(Z\ge x)=P(Z\le -x) $$
    が任意の$x\in\mathbb R$に対して成り立つ。
    $$ \Box$$
  4. 標準正規分布に従う確率変数 $Z\sim N(0,1)$ に対して、
    $$ \begin{align} P(|Z| > z) &= P\bigl(Z < -z \;\lor\; Z > z\bigr) \\ &= P(Z < -z) + P(Z > z) &&\because \{Z<-z\}\cap\{Z>z\}=\varnothing \\ &= P(Z > z) + P(Z > z) &&\because 3. \text{の結果より} \ P(Z<-z)=P(Z>z) \\ &= 2\,P(Z > z) \end{align} $$
    $$ \Box$$

4.は、すなわち「確率変数が原点対称分布のとき、その絶対値がある正の値を超える確率は、その正の値を超える片側確率の$2$倍に等しい」という性質である。こうした対称性は、両側検定や 信頼区間の構成、$t$ 分布の構造理解など、多くの統計手法の基礎に利用されている。

投稿日:9日前
数学の力で現場を変える アルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

AIを支える数学的な原理を理解したいです。

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中