0

カイ二乗分布の基本的な性質を段階的に示す

14
0
$$$$

Def.

ガンマ関数

正の実数 $s>0$ に対して、広義積分
$$ \int_0^\infty t^{s-1}e^{-t}\,dt $$
は収束する(後述)。そこで、
$$ \Gamma(s):=\int_0^\infty t^{s-1}e^{-t}\,dt $$
と定める。このようにして定まる関数
$$ \Gamma:(0,\infty)\to\mathbb R $$
を、(正の実数上の)ガンマ関数という。

カイ二乗分布

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、
$$ X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B(\mathbb R)) $$
を実数値確率変数とする。また、$\nu>0$ とする。

  1. $X$ が自由度 $\nu$ のカイ二乗分布に従うとは、任意の実数 $a,b$ に対して $a< b$ ならば、
    $$ \mathbb P(a< X\leq b) = \int_a^b f_\nu(x)\,dx $$
    が成り立つことをいう。ただし、$f_\nu:\mathbb R\to[0,\infty)$
    $$ f_\nu(x) := \begin{cases} \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} x^{\frac{\nu}{2}-1}e^{-x/2}, & x>0,\\ 0, & x\leq0 \end{cases} $$
    で定まる関数である。
  2. このとき、
    $$ X\sim\chi^2_\nu $$
    または
    $$ X\sim\chi^2(\nu) $$
    と書く。

-この分布を、自由度 $\nu$ のカイ二乗分布という。

自由度

$\nu$ を自由度という。
ここで、$\operatorname{Gamma}(\alpha,\theta)$ は、形状母数 $\alpha>0$、尺度母数 $\theta>0$ のガンマ分布を表すものとする。
自由度 $\nu$ のカイ二乗分布は、形状母数 $\frac{\nu}{2}$、尺度母数 $2$ のガンマ分布に一致する。
すなわち、分布として
$$ \chi^2_\nu = \operatorname{Gamma}\left(\frac{\nu}{2},2\right) $$
である。

標準正規分布による構成

いま、$\nu\in\mathbb N$ とする。
$Z_1,\ldots,Z_\nu$ を同じ確率空間上の実数値確率変数とし、互いに独立で、各 $i=1,\ldots,\nu$ に対して
$$ Z_i\sim\mathcal N(0,1) $$
を満たすとする。
このとき、
$$ X:=\sum_{i=1}^{\nu} Z_i^2 $$
と定めると、
$$ X\sim\chi^2_\nu $$
である。
したがって、自由度 $\nu\in\mathbb N$ の場合、自由度 $\nu$ のカイ二乗分布は、$\nu$ 個の独立な標準正規確率変数の平方和の分布として理解できる。
一方、密度関数による定義自体は、ガンマ関数 $\Gamma$ を用いることで一般の実数 $\nu>0$ に対して定義できる。

Prop&Proof

ガンマ関数を定める広義積分の収束

$s>0$ とする。このとき、広義積分
$$ \int_0^\infty t^{s-1}e^{-t}\,dt $$
は収束する。

$s>0$ とする。
被積分関数 $t\mapsto t^{s-1}e^{-t}$$(0,\infty)$ 上で非負連続である。
広義積分を $1$ で分割して、
$$ \int_0^1 t^{s-1}e^{-t}\,dt $$

$$ \int_1^\infty t^{s-1}e^{-t}\,dt $$
がともに収束することを示す。これが示されれば、
$$ \int_0^\infty t^{s-1}e^{-t}\,dt $$
は収束する。

  1. $0$ の近くでの収束を示す。
    任意の $t\in(0,1]$ に対して、
    $$ 0< e^{-t}\leq 1 $$
    である。したがって、
    $$ 0\leq t^{s-1}e^{-t}\leq t^{s-1} $$
    である。
    また、$s>0$ であるから、
    $$ \int_0^1 t^{s-1}\,dt = \frac{1}{s} < \infty $$
    である。
    よって、比較判定法により(補足を参照)、
    $$ \int_0^1 t^{s-1}e^{-t}\,dt $$
    は収束する。
    $ $
  2. $\infty$ の近くでの収束を示す。
    アルキメデス性より、ある $n\in\mathbb N$ が存在して、
    $$ n>s-1 $$
    を満たす。
    指数関数の級数展開より、任意の $t\geq0$ に対して、
    $$ e^t = \sum_{k=0}^{\infty}\frac{t^k}{k!} \geq \frac{t^{n+1}}{(n+1)!} $$
    である(補足を参照)。
    したがって、両辺は正であるから、逆数を取ると不等号の向きが反転し、
    任意の $t>0$ に対して、
    $$ e^{-t} \leq (n+1)!t^{-(n+1)} $$
    である。
    ゆえに、任意の $t\geq1$ に対して、
    $$ 0\leq t^{s-1}e^{-t} \leq (n+1)!t^{s-1-(n+1)} = (n+1)!t^{s-n-2} $$
    である。
    ここで、$n>s-1$ より、
    $$ s-n-2<-1 $$
    である。したがって、
    $$ \int_1^\infty t^{s-n-2}\,dt $$
    は収束する。
    よって、比較判定法により、
    $$ \int_1^\infty t^{s-1}e^{-t}\,dt $$
    は収束する。
    $ $

-以上より、
$$ \int_0^\infty t^{s-1}e^{-t}\,dt $$
は収束する。
$$ \Box$$

比較判定法について

広義積分の比較判定法とは、非負関数 $f,g$ について、ある区間上で
$$ 0\leq f(t)\leq g(t) $$
が成り立ち、さらに
$$ \int g(t)\,dt $$
が収束するならば、
$$ \int f(t)\,dt $$
も収束する、という判定法である。
本証明では、$0$ の近くでは
$$ 0\leq t^{s-1}e^{-t}\leq t^{s-1} $$
と評価し、$\int_0^1 t^{s-1}\,dt$ の収束から
$$ \int_0^1 t^{s-1}e^{-t}\,dt $$
の収束を導く。
また、$\infty$ の近くでは、適切な $n\in\mathbb N$ を用いて
$$ 0\leq t^{s-1}e^{-t}\leq (n+1)!t^{s-n-2} $$
と評価し、$\int_1^\infty t^{s-n-2}\,dt$ の収束から
$$ \int_1^\infty t^{s-1}e^{-t}\,dt $$
の収束を導く。
つまり、この証明では、被積分関数 $t^{s-1}e^{-t}$ を直接積分するのではなく、収束が分かりやすい関数で上から評価しているのである。

指数関数の級数展開より、任意の $t\geq0$ に対して、
$$ e^t = \sum_{k=0}^{\infty}\frac{t^k}{k!} $$
である。
ここで、部分和
$$ S_m:=\sum_{k=0}^{m}\frac{t^k}{k!} $$
を考える。
$t\geq0$ であるから、任意の $k\in\mathbb N\cup\{0\}$ に対して、
$$ \frac{t^k}{k!}\geq0 $$
である。
したがって、$m\geq n+1$ のとき、
$$ S_m = \sum_{k=0}^{m}\frac{t^k}{k!} = \frac{t^{n+1}}{(n+1)!} + \sum_{\substack{0\leq k\leq m\\k\ne n+1}}\frac{t^k}{k!} \geq \frac{t^{n+1}}{(n+1)!} $$
である。
ここで、
$$ e^t = \lim_{m\to\infty}S_m $$
である。
また、すべての $m\geq n+1$ に対して
$$ S_m\geq \frac{t^{n+1}}{(n+1)!} $$
が成り立つので、極限をとっても
$$ e^t = \lim_{m\to\infty}S_m \geq \frac{t^{n+1}}{(n+1)!} $$
が成り立つ。
以上より、任意の $t\geq0$ に対して、
$$ e^t \geq \frac{t^{n+1}}{(n+1)!} $$
である。

カイ二乗分布の密度関数が確率密度関数であること

$\nu>0$ とし、$f_\nu:\mathbb R\to[0,\infty)$
$$ f_\nu(x) := \begin{cases} \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} x^{\frac{\nu}{2}-1}e^{-x/2}, & x>0,\\ 0, & x\leq0 \end{cases} $$
で定める。このとき、$f_\nu$$\mathbb R$ 上の確率密度関数である。
すなわち、$f_\nu$ はボレル可測であり、任意の $x\in\mathbb R$ に対して $f_\nu(x)\geq0$ であり、
$$ \int_{-\infty}^{\infty}f_\nu(x)\,dx=1 $$
が成り立つ。

$\nu>0$ とする。すると、$\frac{\nu}{2}>0$ であるから、ガンマ関数の定義より、
$$ \Gamma\left(\frac{\nu}{2}\right) = \int_0^\infty t^{\frac{\nu}{2}-1}e^{-t}\,dt $$
である。さらに、被積分関数は $(0,\infty)$ 上で正であるから、
$$ \Gamma\left(\frac{\nu}{2}\right)>0 $$
である。したがって、$f_\nu$ は正しく定義される。

  1. まず、$f_\nu$$(-\infty,0]$ 上で定数関数であり、$(0,\infty)$ 上で連続関数である。したがって、$f_\nu$$\mathbb R$ 上のボレル可測関数である。
    また、任意の $x\in\mathbb R$ に対して、定義より $f_\nu(x)\geq0$ である。
    $ $
  2. 次に
    $$ \int_{-\infty}^{\infty}f_\nu(x)\,dx=1 $$
    を示す。$\nu>0$ より、
    $$ \frac{\nu}{2}>0 $$
    である。したがって、ガンマ関数の定義より、
    $$ \Gamma\left(\frac{\nu}{2}\right) = \int_0^\infty t^{\frac{\nu}{2}-1}e^{-t}\,dt $$
    である。ここで、$x=2t$ とおく。このとき、$dx=2\,dt$ であるから、
    広義積分の変数変換により、
    $$ \begin{align} \int_0^\infty x^{\frac{\nu}{2}-1}e^{-x/2}\,dx &= \int_0^\infty (2t)^{\frac{\nu}{2}-1}e^{-t}\,2\,dt\\ &= 2^{\frac{\nu}{2}}\int_0^\infty t^{\frac{\nu}{2}-1}e^{-t}\,dt\\ &= 2^{\frac{\nu}{2}}\Gamma\left(\frac{\nu}{2}\right) \end{align} $$
    である。
    よって、$f_\nu(x)=0$$x\leq0$ で成り立つことから、
    $$ \begin{align} \int_{-\infty}^{\infty}f_\nu(x)\,dx &= \int_{-\infty}^{0}f_\nu(x)\,dx + \int_0^\infty f_\nu(x)\,dx\\ &= 0 + \int_0^\infty \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} x^{\frac{\nu}{2}-1}e^{-x/2}\,dx\\ &= \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} \int_0^\infty x^{\frac{\nu}{2}-1}e^{-x/2}\,dx\\ &= \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} 2^{\frac{\nu}{2}}\Gamma\left(\frac{\nu}{2}\right)\\ &= 1 \end{align} $$
    である。

-以上より、$f_\nu$ はボレル可測であり、非負であり、全積分が $1$ である。
したがって、$f_\nu$$\mathbb R$ 上の確率密度関数である。
$$ \Box$$

自由度 $n$ のカイ二乗分布の期待値

$n>0$ とする。$X$ を自由度 $n$ のカイ二乗分布に従う実数値確率変数とする。
このとき、$X$ は可積分であり、
$$ \mathbb E[X]=n $$
が成り立つ。

$X\sim\chi^2_n$ とする。
自由度 $n$ のカイ二乗分布の確率密度関数 $f_n:\mathbb R\to[0,\infty)$ は、
$$ f_n(x) := \begin{cases} \dfrac{1}{2^{n/2}\Gamma\left(\frac{n}{2}\right)} x^{\frac{n}{2}-1}e^{-x/2}, & x>0,\\ 0, & x\leq0 \end{cases} $$
である。
したがって、
$$ \mathbb P(X\leq0) = \int_{-\infty}^{0}f_n(x)\,dx = 0 $$
である。ゆえに、$X\geq0$ がほとんど確実に成り立つ。
また、非負確率変数の期待値より、まず(拡大)実数値として
$$ \mathbb E[X] = \int_0^\infty x f_n(x)\,dx $$
である。
ゆえに、
$$ \begin{align} \mathbb E[X] &= \int_0^\infty x \dfrac{1}{2^{n/2}\Gamma\left(\frac{n}{2}\right)} x^{\frac{n}{2}-1}e^{-x/2}\,dx\\ &= \dfrac{1}{2^{n/2}\Gamma\left(\frac{n}{2}\right)} \int_0^\infty x^{\frac{n}{2}}e^{-x/2}\,dx \end{align} $$
である。
ここで、$x=2t$ とおくと、$dx=2\,dt$ である。したがって、広義積分の変数変換により、
$$ \begin{align} \int_0^\infty x^{\frac{n}{2}}e^{-x/2}\,dx &= \int_0^\infty (2t)^{\frac{n}{2}}e^{-t}\,2\,dt\\ &= 2^{\frac{n}{2}+1} \int_0^\infty t^{\frac{n}{2}}e^{-t}\,dt\\ &= 2^{\frac{n}{2}+1} \Gamma\left(\frac{n}{2}+1\right) \end{align} $$
である。ここで最後の等号は、ガンマ関数の定義
$$ \Gamma(s)=\int_0^\infty t^{s-1}e^{-t}\,dt \quad (s>0) $$
において $s=\frac{n}{2}+1$ としたものである。
よって、
$$ \begin{align} \mathbb E[X] &= \dfrac{1}{2^{n/2}\Gamma\left(\frac{n}{2}\right)} 2^{\frac{n}{2}+1} \Gamma\left(\frac{n}{2}+1\right)\\ &= \dfrac{2\Gamma\left(\frac{n}{2}+1\right)} {\Gamma\left(\frac{n}{2}\right)} \end{align} $$
である。
ガンマ関数の漸化式(証明要(後日更新))
$$ \Gamma(s+1)=s\Gamma(s) \quad (s>0) $$
より、
$$ \Gamma\left(\frac{n}{2}+1\right) = \frac{n}{2}\Gamma\left(\frac{n}{2}\right) $$
である。
したがって、
$$ \begin{align} \mathbb E[X] &= \dfrac{2}{\Gamma\left(\frac{n}{2}\right)} \cdot \frac{n}{2}\Gamma\left(\frac{n}{2}\right)\\ &= n \end{align} $$
である。以上より、
$$ \mathbb E[X]=n<\infty $$
である。また、すでに $X\geq0$ がほとんど確実に成り立つことを示したので、
$$ \mathbb E[|X|]=\mathbb E[X]<\infty $$
である。したがって、$X$ は可積分である。
$$ \Box$$

自由度 $n$ のカイ二乗分布の分散

$n>0$ とする。$X$ を自由度 $n$ のカイ二乗分布に従う実数値確率変数とする。
このとき、$X^2$ は可積分であり、
$$ \mathbb V[X]=2n $$
が成り立つ。

$X\sim\chi^2_n$ とする。
自由度 $n$ のカイ二乗分布の確率密度関数 $f_n:\mathbb R\to[0,\infty)$ は、
$$ f_n(x) := \begin{cases} \dfrac{1}{2^{n/2}\Gamma\left(\frac n2\right)} x^{\frac n2-1}e^{-x/2}, & x>0,\\ 0, & x\leq0 \end{cases} $$
である。
したがって、
$$ \mathbb P(X\leq0) = \int_{-\infty}^{0}f_n(x)\,dx = 0 $$
である。ゆえに、$X\geq0$ がほとんど確実に成り立つ。
まず、非負確率変数 $X^2$ について、拡大実数値として
$$ \mathbb E[X^2] = \int_0^\infty x^2 f_n(x)\,dx $$
である。
したがって、
$$ \begin{align} \mathbb E[X^2] &= \int_0^\infty x^2 \dfrac{1}{2^{n/2}\Gamma\left(\frac n2\right)} x^{\frac n2-1}e^{-x/2}\,dx\\ &= \dfrac{1}{2^{n/2}\Gamma\left(\frac n2\right)} \int_0^\infty x^{\frac n2+1}e^{-x/2}\,dx \end{align} $$
である。
ここで、$x=2t$ とおくと、$dx=2\,dt$ である。よって、広義積分の変数変換により、
$$ \begin{align} \int_0^\infty x^{\frac n2+1}e^{-x/2}\,dx &= \int_0^\infty (2t)^{\frac n2+1}e^{-t}\,2\,dt\\ &= 2^{\frac n2+2} \int_0^\infty t^{\frac n2+1}e^{-t}\,dt\\ &= 2^{\frac n2+2} \Gamma\left(\frac n2+2\right) \end{align} $$
である。
したがって、
$$ \begin{align} \mathbb E[X^2] &= \dfrac{1}{2^{n/2}\Gamma\left(\frac n2\right)} 2^{\frac n2+2} \Gamma\left(\frac n2+2\right)\\ &= \dfrac{4\Gamma\left(\frac n2+2\right)} {\Gamma\left(\frac n2\right)} \end{align} $$
である。
ガンマ関数の漸化式(証明要(後日更新))
$$ \Gamma(s+1)=s\Gamma(s) \quad (s>0) $$
を繰り返し適用する事により、
$$ \begin{align} \Gamma\left(\frac n2+2\right) &= \left(\frac n2+1\right)\Gamma\left(\frac n2+1\right)\\ &= \left(\frac n2+1\right)\frac n2\Gamma\left(\frac n2\right) \end{align} $$
である。
ゆえに、
$$ \begin{align} \mathbb E[X^2] &= \dfrac{4}{\Gamma\left(\frac n2\right)} \left(\frac n2+1\right)\frac n2\Gamma\left(\frac n2\right)\\ &= 4\cdot\frac n2\left(\frac n2+1\right)\\ &= 2n\left(\frac n2+1\right)\\ &= n(n+2) \end{align} $$
である。したがって、
$$ \mathbb E[X^2]=n(n+2)<\infty $$
である。また、$X^2\geq0$ であるから、
$$ \mathbb E[|X^2|]=\mathbb E[X^2]<\infty $$
である。よって、$X^2$ は可積分である。
また、すでに示した通り、
$$ \mathbb E[X]=n $$
である。よって、分散の公式( 証明はコチラ )より、
$$ \begin{align} \mathbb V[X] &= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\\ &= n(n+2)-n^2\\ &= 2n \end{align} $$
である。
$$ \Box$$

カイ二乗分布のモーメント母関数

$\nu>0$ とする。$Z$ を自由度 $\nu$ のカイ二乗分布に従う実数値確率変数とする。
このとき、$Z$ のモーメント母関数 $M_Z$ は、任意の $t<\frac{1}{2}$ に対して有限であり、
$$ M_Z(t) = \mathbb E[e^{tZ}] = (1-2t)^{-\nu/2} $$
が成り立つ。

$Z\sim\chi^2_\nu$ とする。
自由度 $\nu$ のカイ二乗分布の確率密度関数 $f_\nu:\mathbb R\to[0,\infty)$ は、
$$ f_\nu(x) := \begin{cases} \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} x^{\frac{\nu}{2}-1}e^{-x/2}, & x>0,\\ 0, & x\leq0 \end{cases} $$
である。
$t<\frac{1}{2}$ とする。このとき、
$$ \frac{1}{2}-t>0 $$
である。
関数 $x\mapsto e^{tx}$ は非負ボレル可測関数である。また、$Z$ の分布は密度 $f_\nu$ をもつ。
したがって、期待値の性質より、$[0,\infty]$ に値をとる拡大実数値として
$$ \mathbb E[e^{tZ}] = \int_{\mathbb R} e^{tx}f_\nu(x)\,dx $$
である( 証明はコチラ(命題$12$) )。
さらに、$f_\nu(x)=0$$x\leq0$ で成り立つので、
$$ \mathbb E[e^{tZ}] = \int_0^\infty e^{tx}f_\nu(x)\,dx $$
である。
ゆえに、
$$ \begin{align} M_Z(t) &= \mathbb E[e^{tZ}]\\ &= \int_0^\infty e^{tx} \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} x^{\frac{\nu}{2}-1}e^{-x/2}\,dx\\ &= \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} \int_0^\infty x^{\frac{\nu}{2}-1} e^{-\left(\frac{1}{2}-t\right)x} \,dx \end{align} $$
である。
ここで、
$$ u=\left(\frac{1}{2}-t\right)x $$
とおく。このとき、
$$ x=\frac{u}{\frac{1}{2}-t}, \quad dx=\frac{1}{\frac{1}{2}-t}\,du $$
である。
また、$\frac{1}{2}-t>0$ であるから、$x$$0$ から $\infty$ まで動くとき、$u$$0$ から $\infty$ まで動く。
したがって、広義積分の変数変換により、
$$ \begin{align} \int_0^\infty x^{\frac{\nu}{2}-1} e^{-\left(\frac{1}{2}-t\right)x} \,dx &= \int_0^\infty \left(\frac{u}{\frac{1}{2}-t}\right)^{\frac{\nu}{2}-1} e^{-u} \frac{1}{\frac{1}{2}-t} \,du\\ &= \left(\frac{1}{2}-t\right)^{-\left(\frac{\nu}{2}-1\right)} \left(\frac{1}{2}-t\right)^{-1} \int_0^\infty u^{\frac{\nu}{2}-1}e^{-u}\,du\\ &= \left(\frac{1}{2}-t\right)^{-\nu/2} \int_0^\infty u^{\frac{\nu}{2}-1}e^{-u}\,du\\ &= \left(\frac{1}{2}-t\right)^{-\nu/2} \Gamma\left(\frac{\nu}{2}\right) \end{align} $$
である。
よって、
$$ \begin{align} M_Z(t) &= \dfrac{1}{2^{\nu/2}\Gamma\left(\frac{\nu}{2}\right)} \left(\frac{1}{2}-t\right)^{-\nu/2} \Gamma\left(\frac{\nu}{2}\right)\\ &= 2^{-\nu/2} \left(\frac{1}{2}-t\right)^{-\nu/2}\\ &= \left(2\left(\frac{1}{2}-t\right)\right)^{-\nu/2}\\ &= (1-2t)^{-\nu/2} \end{align} $$
である。
ここで、$t<\frac{1}{2}$ より $1-2t>0$ であるから、
$$ (1-2t)^{-\nu/2}<\infty $$
である。したがって、$M_Z(t)$ は有限である。
以上より、任意の $t<\frac{1}{2}$ に対して、
$$ M_Z(t) = \mathbb E[e^{tZ}] = (1-2t)^{-\nu/2} $$
が成り立つ。
$$ \Box$$

独立なカイ二乗分布の和

確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上で、実数値確率変数 $X,Y$ が互いに独立であり、
$$ X\sim\chi^2_{\nu_1}, \quad Y\sim\chi^2_{\nu_2} $$
を満たすとする。ただし、$\nu_1,\nu_2>0$ とする。
このとき、
$$ X+Y\sim\chi^2_{\nu_1+\nu_2} $$
が成り立つ。

自由度 $\nu>0$ のカイ二乗分布に従う確率変数 $Z$ のモーメント母関数は、
$$ M_Z(t) = \mathbb E[e^{tZ}] = (1-2t)^{-\nu/2} \quad \left(t<\frac{1}{2}\right) $$
である($1$つ上で示した命題)。いま、$t<\frac{1}{2}$ とする。
$ $

  1. $X$$Y$ は独立であるから、可測関数による像も独立である。
    したがって、$e^{tX}$$e^{tY}$ は独立である(補足を参照)。
    また、
    $$ \mathbb E[e^{tX}] = (1-2t)^{-\nu_1/2} < \infty $$
    かつ
    $$ \mathbb E[e^{tY}] = (1-2t)^{-\nu_2/2} < \infty $$
    である。
    したがって、独立性より、
    $$ \begin{align} M_{X+Y}(t) &= \mathbb E[e^{t(X+Y)}]\\ &= \mathbb E[e^{tX}e^{tY}]\\ &= \mathbb E[e^{tX}]\mathbb E[e^{tY}]\\ &= M_X(t)M_Y(t)\\ &= (1-2t)^{-\nu_1/2}(1-2t)^{-\nu_2/2}\\ &= (1-2t)^{-(\nu_1+\nu_2)/2} \end{align} $$
    である( 証明はコチラ )。
    $ $
  2. 一方、$1$ つ上の命題より、任意の自由度 $\nu>0$ に対して、自由度 $\nu$ のカイ二乗分布に従う確率変数のモーメント母関数は
    $$ M(t) = (1-2t)^{-\nu/2} \quad \left(t<\frac{1}{2}\right) $$
    である。
    いま、$\nu_1,\nu_2>0$ であるから、
    $$ \nu_1+\nu_2>0 $$
    である。したがって、上の結果を自由度
    $$ \nu=\nu_1+\nu_2 $$
    の場合に適用できる。
    よって、自由度 $\nu_1+\nu_2$ のカイ二乗分布に従う確率変数のモーメント母関数は、任意の $t<\frac{1}{2}$ に対して
    $$ (1-2t)^{-(\nu_1+\nu_2)/2} $$
    である。

-したがって、$X+Y$ のモーメント母関数は、自由度 $\nu_1+\nu_2$ のカイ二乗分布のモーメント母関数と、$0$ を含む開区間 $\left(-\infty,\frac{1}{2}\right)$ 上で一致する。
また、両者のモーメント母関数はこの区間上で有限である。ゆえに、モーメント母関数の一意性定理より、
$$ X+Y\sim\chi^2_{\nu_1+\nu_2} $$
が成り立つ。
$$ \Box$$

独立な確率変数の可測変換

$X,Y$ を同じ確率空間上の独立な実数値確率変数とする。また、$g,h:\mathbb R\to\mathbb R$ をボレル可測関数とする。
このとき、$g(X)$$h(Y)$ は独立である。
実際、任意の $A,B\in\mathcal B(\mathbb R)$ に対して、$g^{-1}(A),h^{-1}(B)\in\mathcal B(\mathbb R)$ である。したがって、$X$$Y$ の独立性より、
$$ \begin{align} \mathbb P(g(X)\in A,\ h(Y)\in B) &= \mathbb P(X\in g^{-1}(A),\ Y\in h^{-1}(B))\\ &= \mathbb P(X\in g^{-1}(A))\mathbb P(Y\in h^{-1}(B))\\ &= \mathbb P(g(X)\in A)\mathbb P(h(Y)\in B) \end{align} $$
である。
よって、$g(X)$$h(Y)$ は独立である。

独立なカイ二乗分布の和の再生性

$m\in\mathbb N_{>0}$ とする。確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数
$$ X_1,\ldots,X_m $$
が互いに独立であり、各 $i=1,\ldots,m$ に対して
$$ X_i\sim\chi^2_{\nu_i} $$
を満たすとする。ただし、
$$ \nu_i>0 \quad (i=1,\ldots,m) $$
である。
このとき、
$$ S_m:=\sum_{i=1}^m X_i $$
と定めると、
$$ S_m\sim\chi^2_{\nu_1+\cdots+\nu_m} $$
が成り立つ。

$i=1,\ldots,m$ に対して、
$$ X_i\sim\chi^2_{\nu_i} $$
であるから、カイ二乗分布のモーメント母関数より、任意の $t<\frac{1}{2}$ に対して、
$$ M_{X_i}(t) = \mathbb E[e^{tX_i}] = (1-2t)^{-\nu_i/2} $$
である(本記事内で証明済み)。いま、$t<\frac{1}{2}$ とする。
$X_1,\ldots,X_m$ は互いに独立であるから、可測関数による像も互いに独立である。したがって、
$$ e^{tX_1},\ldots,e^{tX_m} $$
は互いに独立である(補足を参照)。
また、各 $i=1,\ldots,m$ に対して、
$$ \mathbb E[e^{tX_i}] = (1-2t)^{-\nu_i/2} < \infty $$
である。
したがって、独立性と期待値の積の公式( 証明はコチラ )より、
$$ \begin{align} M_{S_m}(t) &= \mathbb E[e^{tS_m}]\\ &= \mathbb E\left[e^{t\sum_{i=1}^m X_i}\right]\\ &= \mathbb E\left[\prod_{i=1}^m e^{tX_i}\right]\\ &= \prod_{i=1}^m \mathbb E[e^{tX_i}]\\ &= \prod_{i=1}^m (1-2t)^{-\nu_i/2}\\ &= (1-2t)^{-\frac{1}{2}\sum_{i=1}^m\nu_i} \end{align} $$
である。ここで、
$$ \nu:=\sum_{i=1}^m\nu_i $$
とおく。各 $\nu_i>0$ であるから、
$$ \nu>0 $$
である。
したがって、自由度 $\nu$ のカイ二乗分布のモーメント母関数は、任意の $t<\frac{1}{2}$ に対して、
$$ (1-2t)^{-\nu/2} $$
である。
ゆえに、$S_m$ のモーメント母関数は、自由度 $\nu$ のカイ二乗分布のモーメント母関数と、$0$ を含む開区間
$$ \left(-\infty,\frac{1}{2}\right) $$
上で一致する。また、両者のモーメント母関数はこの区間上で有限である。
よって、モーメント母関数の一意性定理より、
$$ S_m\sim\chi^2_\nu $$
である。すなわち、
$$ \sum_{i=1}^m X_i \sim \chi^2_{\nu_1+\cdots+\nu_m} $$
が成り立つ。
$$ \Box$$

独立な確率変数の可測変換

$X_1,\ldots,X_m$ を互いに独立な実数値確率変数とする。また、各 $i=1,\ldots,m$ に対して、$g_i:\mathbb R\to\mathbb R$ をボレル可測関数とする。
このとき、
$$ g_1(X_1),\ldots,g_m(X_m) $$
も互いに独立である。
実際、任意の $B_1,\ldots,B_m\in\mathcal B(\mathbb R)$ に対して、各 $g_i$ はボレル可測であるから、
$$ g_i^{-1}(B_i)\in\mathcal B(\mathbb R) $$
である。したがって、$X_1,\ldots,X_m$ の独立性より、
$$ \begin{align} \mathbb P\left(\bigcap_{i=1}^{m}\{g_i(X_i)\in B_i\}\right) &= \mathbb P\left(\bigcap_{i=1}^{m}\{X_i\in g_i^{-1}(B_i)\}\right)\\ &= \prod_{i=1}^{m}\mathbb P\left(X_i\in g_i^{-1}(B_i)\right)\\ &= \prod_{i=1}^{m}\mathbb P\left(g_i(X_i)\in B_i\right) \end{align} $$
である。
よって、$g_1(X_1),\ldots,g_m(X_m)$ は互いに独立である。
本証明では、各 $i=1,\ldots,m$ に対して
$$ g_i(x):=e^{tx} $$
とおくことで、
$$ e^{tX_1},\ldots,e^{tX_m} $$
が互いに独立であることを用いている。

標準正規確率変数の平方と自由度 $1$ のカイ二乗分布

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X$ を実数値確率変数とする。
$$ X\sim\mathcal N(0,1) $$
とし、
$$ Y:=X^2 $$
と定める。このとき、
$$ Y\sim\chi^2_1 $$
である。

$X\sim\mathcal N(0,1)$ とする。
標準正規分布の確率密度関数を $\varphi:\mathbb R\to[0,\infty)$ とおくと、
$$ \varphi(x) = \frac{1}{\sqrt{2\pi}}e^{-x^2/2} $$
である。
ここで、$Y:=X^2$ と定める。写像 $q:\mathbb R\to\mathbb R$$q(x):=x^2$ で定めると、$q$ は連続であるからボレル可測である。
したがって、$Y=q\circ X$ は実数値確率変数である。

  1. $Y:=X^2$ より $Y\geq0$ である。
    i) $y<0$ のとき、$Y\geq0$ より $\mathbb P(Y\leq y)=0$ である。
      また、$y=0$ のとき、
    $$ \begin{align} \mathbb P(Y\leq0) &= \mathbb P(X^2\leq0) &&\because Y=X^2\\ &= \mathbb P(X^2=0) &&\because X^2\geq0\\ &= \mathbb P(X=0) &&\because X^2=0\iff X=0\\ &= 0 &&\because \text{ 補足を参照。} \end{align} $$
      である(補足を参照)。
    $ $
    ii) $y>0$ とする。このとき、
    $$ Y\leq y \iff X^2\leq y \iff -\sqrt y\leq X\leq \sqrt y $$
      である。
      したがって、$X$ が標準正規分布に従うことより、
    $$ \mathbb P(Y\leq y) = \mathbb P(-\sqrt y\leq X\leq \sqrt y) = \int_{-\sqrt y}^{\sqrt y} \frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx $$
      である。
      ここで、$y>0$ に対して分布関数
    $$ F_Y(y):=\mathbb P(Y\leq y) $$
      を考えると、
    $$ F_Y(y) = \int_{-\sqrt y}^{\sqrt y} \frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx $$
      である。
      積分の微分公式より、$y>0$ に対して、
    $$ \begin{align} F_Y'(y) &= \frac{d}{dy} \int_{-\sqrt y}^{\sqrt y} \frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx &&\because F_Y(y)=\int_{-\sqrt y}^{\sqrt y}\frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx \\ &= \frac{1}{\sqrt{2\pi}}e^{-(\sqrt y)^2/2}\cdot\frac{d}{dy}\sqrt y - \frac{1}{\sqrt{2\pi}}e^{-(-\sqrt y)^2/2}\cdot\frac{d}{dy}(-\sqrt y) &&\because \frac{d}{dy}\int_{a(y)}^{b(y)}r(x)\,dx = r(b(y))b'(y)-r(a(y))a'(y) \\ &= \frac{1}{\sqrt{2\pi}}e^{-(\sqrt y)^2/2}\cdot\frac{1}{2\sqrt y} - \frac{1}{\sqrt{2\pi}}e^{-(-\sqrt y)^2/2}\cdot\left(-\frac{1}{2\sqrt y}\right) &&\because \frac{d}{dy}\sqrt y=\frac{1}{2\sqrt y},\quad \frac{d}{dy}(-\sqrt y)=-\frac{1}{2\sqrt y} \\ &= \frac{1}{\sqrt{2\pi}}e^{-y/2}\cdot\frac{1}{2\sqrt y} + \frac{1}{\sqrt{2\pi}}e^{-y/2}\cdot\frac{1}{2\sqrt y} &&\because (\sqrt y)^2=y,\quad (-\sqrt y)^2=y \\ &= \frac{1}{\sqrt{2\pi}}e^{-y/2}\cdot\frac{1}{\sqrt y} &&\because \frac{1}{2\sqrt y}+\frac{1}{2\sqrt y}=\frac{1}{\sqrt y} \\ &= \frac{1}{\sqrt{2\pi}}y^{-1/2}e^{-y/2} &&\because \frac{1}{\sqrt y}=y^{-1/2} \end{align} $$
      である。
    $ $
  2. ここで、$f:\mathbb R\to[0,\infty)$
    $$ f(y) := \begin{cases} \dfrac{1}{\sqrt{2\pi}}y^{-1/2}e^{-y/2}, & y>0,\\ 0, & y\leq0 \end{cases} $$
    で定める。
    $1.$ より、$F_Y(0)=0$ であり、任意の $u>0$ に対して
    $$ F_Y'(u)=f(u) $$
    である。
    i) $y>0$ の場合を示す。
     任意に $y>0$ をとる。また、任意に $\varepsilon\in(0,y)$ をとる。
     $F_Y$$[\varepsilon,y]$ 上で連続であり、$(\varepsilon,y)$ 上で微分可能である。したがって、微分積分学の基本定理より、
    $$ \begin{align} F_Y(y)-F_Y(\varepsilon) &= \int_\varepsilon^y F_Y'(u)\,du\\ &= \int_\varepsilon^y f(u)\,du \end{align} $$
     である。ここで、$\varepsilon\downarrow0$ とする。
     $F_Y$$0$ で右連続であり、$F_Y(0)=0$ であるから、
    $$ \lim_{\varepsilon\downarrow0}F_Y(\varepsilon)=F_Y(0)=0 $$
     である。
     また、$f$$(0,y]$ 上で連続であり、$0$ の近くで広義可積分である(補足を参照)から、
    $$ \int_0^y f(u)\,du = \lim_{\varepsilon\downarrow0}\int_\varepsilon^y f(u)\,du $$
     である。
     したがって、
    $$ F_Y(y) = \int_0^y f(u)\,du $$
     である。
     さらに、$f(u)=0$$u\leq0$ で成り立つので、
    $$ \begin{align} F_Y(y) &= \int_0^y f(u)\,du\\ &= \int_{-\infty}^{y}f(u)\,du \end{align} $$
     である。
    $ $
    ii) $y\leq0$ の場合を示す。
     $1.$ より、任意の $y\leq0$ に対して、
    $$ F_Y(y)=0 $$
     である。
     一方、$f(u)=0$$u\leq0$ で成り立つので、任意の $y\leq0$ に対して、
    $$ \int_{-\infty}^{y}f(u)\,du=0 $$
     である。
     よって、
    $$ F_Y(y) = \int_{-\infty}^{y}f(u)\,du $$
     である。
    以上より、任意の $y\in\mathbb R$ に対して、
    $$ F_Y(y) = \int_{-\infty}^{y}f(u)\,du $$
    が成り立つ。
    また、$f$$\mathbb R\setminus\{0\}$ 上で連続であり、$0$ で値を定めた非負ボレル可測関数である。
    ゆえに、$Y$ の分布は密度関数 $f$ をもつ。
    $ $
  3. 一方、自由度 $1$ のカイ二乗分布の密度関数 $g:\mathbb R\to[0,\infty)$
    $$ g(y) = \begin{cases} \dfrac{1}{2^{1/2}\Gamma\left(\frac{1}{2}\right)} y^{\frac{1}{2}-1}e^{-y/2}, & y>0,\\ 0, & y\leq0 \end{cases} $$
    である。
    ここで、既知の公式(証明要(後日更新))
    $$ \Gamma\left(\frac{1}{2}\right)=\sqrt\pi $$
    より、$y>0$ に対して
    $$ \begin{align} g(y) &= \frac{1}{2^{1/2}\Gamma\left(\frac{1}{2}\right)} y^{\frac{1}{2}-1}e^{-y/2}\\ &= \frac{1}{\sqrt{2}\sqrt\pi} y^{-1/2}e^{-y/2}\\ &= \frac{1}{\sqrt{2\pi}} y^{-1/2}e^{-y/2}\\ &= f(y) \end{align} $$
    である。
    また、$y\leq0$ に対しても、定義より
    $$ g(y)=0=f(y) $$
    である。
    したがって、$Y$ の密度関数 $f$ は自由度 $1$ のカイ二乗分布の密度関数 $g$ に一致する。

-よって、
$$ Y=X^2\sim\chi^2_1 $$
である。
$$ \Box$$

$y=0$ のとき、
$$ \mathbb P(Y\leq0) = \mathbb P(X^2\leq0) = \mathbb P(X=0) $$
である。
任意の $\varepsilon>0$ に対して、
$$ \{X=0\}\subseteq\{-\varepsilon< X\leq\varepsilon\} $$
であるから、確率の単調性( 証明はコチラ )
$$ 0\leq\mathbb P(X=0) \leq \mathbb P(-\varepsilon< X\leq\varepsilon) = \int_{-\varepsilon}^{\varepsilon} \frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx $$
である。
また、任意の $x\in[-\varepsilon,\varepsilon]$ に対して
$$ 0\leq \frac{1}{\sqrt{2\pi}}e^{-x^2/2} \leq \frac{1}{\sqrt{2\pi}} $$
であるから、
$$ 0 \leq \int_{-\varepsilon}^{\varepsilon} \frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx \leq \frac{2\varepsilon}{\sqrt{2\pi}} $$
である。したがって、$\varepsilon\downarrow0$ とすると右辺は $0$ に収束する。
ゆえに、はさみうちの原理より、
$$ \mathbb P(X=0)=0 $$
である。

$f$$0$ の近くで広義可積分であることを確認する。任意の $u\in(0,y]$ に対して、
$$ 0< e^{-u/2}\leq1 $$
であるから、
$$ 0\leq f(u) = \frac{1}{\sqrt{2\pi}}u^{-1/2}e^{-u/2} \leq \frac{1}{\sqrt{2\pi}}u^{-1/2} $$
である。一方、
$$ \int_0^y u^{-1/2}\,du = 2\sqrt y < \infty $$
である。したがって、比較判定法より、
$$ \int_0^y f(u)\,du $$
は広義積分として収束する。

独立な標準正規確率変数の平方和と自由度 $n$ のカイ二乗分布

$n\in\mathbb N_{>0}$ とする。確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上の実数値確率変数
$$ X_1,\ldots,X_n $$
が互いに独立であり、各 $i=1,\ldots,n$ に対して
$$ X_i\sim\mathcal N(0,1) $$
を満たすとする。このとき、
$$ Y:=\sum_{i=1}^n X_i^2 $$
と定めると、
$$ Y\sim\chi^2_n $$
が成り立つ。

$i=1,\ldots,n$ に対して、
$$ X_i\sim\mathcal N(0,1) $$
である。したがって、標準正規確率変数の平方と自由度 $1$ のカイ二乗分布の関係($1$つ上で示した命題)より、
$$ X_i^2\sim\chi^2_1 $$
である。
また、写像 $q:\mathbb R\to\mathbb R$
$$ q(x):=x^2 $$
で定めると、$q$ は連続であるからボレル可測である。
$X_1,\ldots,X_n$ は互いに独立であるから、可測関数による像も互いに独立である。したがって、
$$ X_1^2,\ldots,X_n^2 $$
は互いに独立である(補足を参照)。
ここで、独立なカイ二乗分布の和の再生性(本記事内で証明済み)より、独立な確率変数 $Z_1,\ldots,Z_n$ がそれぞれ
$$ Z_i\sim\chi^2_{\nu_i} $$
を満たすならば、
$$ \sum_{i=1}^n Z_i\sim\chi^2_{\nu_1+\cdots+\nu_n} $$
である。
これを
$$ Z_i=X_i^2,\quad \nu_i=1 $$
として適用すると、
$$ Y = \sum_{i=1}^n X_i^2 \sim \chi^2_{1+\cdots+1} = \chi^2_n $$
である。
したがって、
$$ Y\sim\chi^2_n $$
が成り立つ。
$$ \Box$$

独立な確率変数の可測変換

$X_1,\ldots,X_n$ を互いに独立な実数値確率変数とし、$g:\mathbb R\to\mathbb R$ をボレル可測関数とする。
このとき、
$$ g(X_1),\ldots,g(X_n) $$
も互いに独立である。
実際、任意の $B_1,\ldots,B_n\in\mathcal B(\mathbb R)$ に対して、$g$ はボレル可測であるから、
$$ g^{-1}(B_i)\in\mathcal B(\mathbb R) \quad (i=1,\ldots,n) $$
である。
したがって、$X_1,\ldots,X_n$ の独立性より、
$$ \begin{align} \mathbb P\left( \bigcap_{i=1}^{n}\{g(X_i)\in B_i\} \right) &= \mathbb P\left( \bigcap_{i=1}^{n}\{X_i\in g^{-1}(B_i)\} \right)\\ &= \prod_{i=1}^{n} \mathbb P\left(X_i\in g^{-1}(B_i)\right)\\ &= \prod_{i=1}^{n} \mathbb P\left(g(X_i)\in B_i\right) \end{align} $$
である。
よって、$g(X_1),\ldots,g(X_n)$ は互いに独立である。
本証明では、$g(x):=x^2$ とおくことで、
$$ X_1^2,\ldots,X_n^2 $$
が互いに独立であることを用いている。

投稿日:1日前
数学の力で現場を変える アルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

Kagura
Kagura
8
6072
■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。          

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中