0

平均ベクトルと共分散行列の性質

28
0
$$$$

はじめに

ここでは,多変量正規分布からのランダム標本$\boldsymbol{y_1}, \boldsymbol{y_2},\dots, \boldsymbol{y_n}$の標本平均ベクトル$ \overline{\boldsymbol{y}}$および標本共分散行列$\boldsymbol{S}$のもつ性質をいくつか見ていく.
※性質の多くは,1変量の場合の結果を拡張したものである.

$\overline{\boldsymbol{y}}$, $\boldsymbol{S}$がそれぞれ$\boldsymbol{\mu}$,$\boldsymbol{\Sigma}$の十分統計量であることの証明

十分統計量の定義(Neymanの因子分解定理)

一般に,以下の条件を満たす場合に,統計量$\hat{\boldsymbol{\theta}}$$\boldsymbol{\theta}$の十分統計量であると言える.

尤度関数$L$が以下のように分解される.

$L(\boldsymbol{y_1},\dots,\boldsymbol{y_n},\boldsymbol{\theta}) =g(\hat{\boldsymbol{\theta}}, \boldsymbol{\theta}) h(\boldsymbol{y_1},\dots,\boldsymbol{y_n})$・・・(2.54)

ただし,$h(\boldsymbol{y_1},\dots,\boldsymbol{y_n})$$\boldsymbol{\theta}$を含まない関数.

$\boldsymbol{y_1},\dots,\boldsymbol{y_n}$の持つ$\boldsymbol{\theta}$の情報は,$\hat{\boldsymbol{\theta}}$により捉えることができる.

具体的には,$\hat{\boldsymbol{\theta}}$$\boldsymbol{\theta}$の十分統計量であるとき,$\boldsymbol{\theta}$$\hat{\boldsymbol{\theta}}$(あるいはその不偏な関数)によって推定することができるのだった.

本題

$\boldsymbol{\mu}$,$\boldsymbol{\Sigma}$の十分統計量

多変量正規分布$N_p(\boldsymbol{\mu},\boldsymbol{\Sigma})$からのランダム標本$\boldsymbol{y_1}, \boldsymbol{y_2},\dots, \boldsymbol{y_n}$に対し,その標本平均ベクトル$\overline{\boldsymbol{y}}$と標本共分散行列$\boldsymbol{S}$はそれぞれ$\boldsymbol{\mu}$,$\boldsymbol{\Sigma}$の十分統計量である.

まず,尤度関数は以下.
$\begin{align} L(\boldsymbol{\mu},\boldsymbol{\Sigma})&=\prod_{i=1}^{n}f(\boldsymbol{y_i};\boldsymbol{\mu},\boldsymbol{\Sigma})\\ &=\prod_{i=1}^{n}\frac{1}{(\sqrt{2\pi})^p|\boldsymbol\Sigma|^{1/2}}exp\Big[-\frac{1}{2}(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})\Big]\\ &=\frac{1}{(\sqrt{2\pi})^{np}|\boldsymbol\Sigma|^{n/2}}exp\Big[-\frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})\Big] \end{align}$

ここで,
$\begin{align} \sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})&= \sum_{i=1}^{n}tr(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})\\ &=tr\Big[\boldsymbol\Sigma^{-1}\sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})(\boldsymbol{y_i}-\boldsymbol{\mu})'\Big] \end{align}$
さらに
$\begin{align} \sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})(\boldsymbol{y_i}-\boldsymbol{\mu})' &=\sum_{i=1}^{n}(\boldsymbol{y_i}-\overline{\boldsymbol{y}}+\overline{\boldsymbol{y}}-\boldsymbol{\mu})(\boldsymbol{y_i}-\overline{\boldsymbol{y}}+\overline{\boldsymbol{y}}-\boldsymbol{\mu})'\\ &=\sum_{i=1}^{n}(\boldsymbol{y_i}-\overline{\boldsymbol{y}})(\boldsymbol{y_i}-\overline{\boldsymbol{y}})'+n(\overline{\boldsymbol{y}}-\boldsymbol{\mu})(\overline{\boldsymbol{y}}-\boldsymbol{\mu})'\\ &=(n-1)\boldsymbol{S}+n(\overline{\boldsymbol{y}}-\boldsymbol{\mu})(\overline{\boldsymbol{y}}-\boldsymbol{\mu})' \end{align}$
したがって,

$\begin{align} L(\boldsymbol{\mu},\boldsymbol{\Sigma}) &=\frac{1}{(\sqrt{2\pi})^{np}|\boldsymbol\Sigma|^{n/2}}exp\Big[-\frac{1}{2}\{(n-1)tr\boldsymbol\Sigma^{-1}\boldsymbol{S}+n(\overline{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\overline{\boldsymbol{y}}-\boldsymbol{\mu})\}\Big]\\ &=g(\overline{\boldsymbol{y}},\boldsymbol{S},\boldsymbol{\mu}, \boldsymbol{\Sigma}) \cdot 1 \end{align}$

最後の結果を見ると,$\overline{\boldsymbol{y}}$$\boldsymbol{S}$はそれぞれが独立して$\boldsymbol{\mu}$および$\boldsymbol{\Sigma}$の十分統計量になるわけではないことがわかる.

一方,$\overline{\boldsymbol{y}}$$\boldsymbol{S}$は独立して分布する.

多変量正規分布$N_p(\boldsymbol{\mu},\boldsymbol{\Sigma})$からのランダム標本$\boldsymbol{X_1}, \boldsymbol{X_2},\dots, \boldsymbol{X_n}$に対し,その標本平均ベクトル$\overline{\boldsymbol{X}}$と標本共分散行列$\boldsymbol{S}$はそれぞれ独立である.

ただし,
$\displaystyle\overline{\boldsymbol{X}}=\frac{1}{n} \sum_{i=1}^{n}\boldsymbol{X_i} $
$\displaystyle\boldsymbol{S}=\frac{1}{n-1}\sum_{i=1}^{n}(\boldsymbol{X_i}-\overline{\boldsymbol{X}})(\boldsymbol{X_i}-\overline{\boldsymbol{X}})^{'}=\frac{1}{n-1}\boldsymbol{W}$
とする.

いま, $n×n$の直交行列で,その第1行が$\boldsymbol{1_n^{'}}/\sqrt{n}$であるような行列$\boldsymbol{\Gamma}$を考え,
$\boldsymbol{Y}=(\boldsymbol{Y_1}, \boldsymbol{Y_2},\dots, \boldsymbol{Y_n})^{'}=\boldsymbol{\Gamma}\boldsymbol{X}$とする.

このとき, 補題$^{※}$より$\boldsymbol{Y_1}, \boldsymbol{Y_2},\dots, \boldsymbol{Y_n} \in \mathbb{R}^{p} $は互いに独立に,共分散行列$\boldsymbol{\Sigma}$の多変量正規分布に従う.

よって,
$\displaystyle \boldsymbol{Y_1}=\boldsymbol{\Gamma_1}^{'}\boldsymbol{X}=\frac{1}{\sqrt{n}} \sum_{i=1}^{n} \boldsymbol{X_i}=\sqrt{n}\frac{1}{n} \sum_{i=1}^{n} \boldsymbol{X_i}=\sqrt{n}\overline{\boldsymbol{X}}$
また$i \geq 2$において,$\Gamma$の直交性より
$E[\boldsymbol{Y_i}]=E[\boldsymbol{\Gamma_i}^{'}\boldsymbol{X}] =\boldsymbol{\Gamma_i}^{'}E[\boldsymbol{X}]=\boldsymbol{\Gamma_i}^{'}\boldsymbol{\mu}=0$
が成り立つ.

一方,
$\begin{align} W&= \sum_{i=1}^{n}(\boldsymbol{X_i}-\overline{\boldsymbol{X}})(\boldsymbol{X_i}-\overline{\boldsymbol{X}})^{'}=\sum_{i=1}^{n}\boldsymbol{X_i}\boldsymbol{X_i}^{'}-n\overline{\boldsymbol{X}}\overline{\boldsymbol{X}^{'}}\\ &=\boldsymbol{X}^{'}\boldsymbol{X}-\boldsymbol{Y_1}\boldsymbol{Y_1}^{'} =\boldsymbol{Y}^{'}\boldsymbol{Y}-\boldsymbol{Y_1}\boldsymbol{Y_1}^{'}\\ &=\boldsymbol{Y_2}\boldsymbol{Y_2}^{'}+\cdots+\boldsymbol{Y_n}\boldsymbol{Y_n}^{'} \end{align}$
となり,$W$$\boldsymbol{Y_1}$を含まない形で表される.
$\boldsymbol{Y_1}$$\boldsymbol{Y_2},\dots, \boldsymbol{Y_n}$の独立性から,$\boldsymbol{Y_1}$$\boldsymbol{W}$は独立.

すなわち$\overline{\boldsymbol{X}}$$\boldsymbol{W}$は独立である.

$n×p$確率行列$\boldsymbol{X}$の各行が独立に共通の共分散行列$\boldsymbol{\Sigma}$の多変量正規分布に従うとし,$\boldsymbol{\Gamma}$$n$次の直交行列とする.
このとき,$\boldsymbol{Y}=\boldsymbol{\Gamma} \boldsymbol{X}$の各行は独立に共分散行列$\boldsymbol{\Sigma}$の多変量正規分布に従う.

投稿日:20241028
更新日:12
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

B3

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中