ここでは,多変量正規分布からのランダム標本$\boldsymbol{y_1}, \boldsymbol{y_2},\dots, \boldsymbol{y_n}$の標本平均ベクトル$ \overline{\boldsymbol{y}}$および標本共分散行列$\boldsymbol{S}$のもつ性質をいくつか見ていく.
※性質の多くは,1変量の場合の結果を拡張したものである.
一般に,以下の条件を満たす場合に,統計量$\hat{\boldsymbol{\theta}}$は$\boldsymbol{\theta}$の十分統計量であると言える.
尤度関数$L$が以下のように分解される.
$L(\boldsymbol{y_1},\dots,\boldsymbol{y_n},\boldsymbol{\theta}) =g(\hat{\boldsymbol{\theta}}, \boldsymbol{\theta}) h(\boldsymbol{y_1},\dots,\boldsymbol{y_n})$・・・(2.54)
ただし,$h(\boldsymbol{y_1},\dots,\boldsymbol{y_n})$は$\boldsymbol{\theta}$を含まない関数.
$\boldsymbol{y_1},\dots,\boldsymbol{y_n}$の持つ$\boldsymbol{\theta}$の情報は,$\hat{\boldsymbol{\theta}}$により捉えることができる.
具体的には,$\hat{\boldsymbol{\theta}}$が$\boldsymbol{\theta}$の十分統計量であるとき,$\boldsymbol{\theta}$を$\hat{\boldsymbol{\theta}}$(あるいはその不偏な関数)によって推定することができるのだった.
多変量正規分布$N_p(\boldsymbol{\mu},\boldsymbol{\Sigma})$からのランダム標本$\boldsymbol{y_1}, \boldsymbol{y_2},\dots, \boldsymbol{y_n}$に対し,その標本平均ベクトル$\overline{\boldsymbol{y}}$と標本共分散行列$\boldsymbol{S}$はそれぞれ$\boldsymbol{\mu}$,$\boldsymbol{\Sigma}$の十分統計量である.
まず,尤度関数は以下.
$\begin{align}
L(\boldsymbol{\mu},\boldsymbol{\Sigma})&=\prod_{i=1}^{n}f(\boldsymbol{y_i};\boldsymbol{\mu},\boldsymbol{\Sigma})\\
&=\prod_{i=1}^{n}\frac{1}{(\sqrt{2\pi})^p|\boldsymbol\Sigma|^{1/2}}exp\Big[-\frac{1}{2}(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})\Big]\\
&=\frac{1}{(\sqrt{2\pi})^{np}|\boldsymbol\Sigma|^{n/2}}exp\Big[-\frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})\Big]
\end{align}$
ここで,
$\begin{align}
\sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})&=
\sum_{i=1}^{n}tr(\boldsymbol{y_i}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\boldsymbol{y_i}-\boldsymbol{\mu})\\
&=tr\Big[\boldsymbol\Sigma^{-1}\sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})(\boldsymbol{y_i}-\boldsymbol{\mu})'\Big]
\end{align}$
さらに
$\begin{align}
\sum_{i=1}^{n}(\boldsymbol{y_i}-\boldsymbol{\mu})(\boldsymbol{y_i}-\boldsymbol{\mu})'
&=\sum_{i=1}^{n}(\boldsymbol{y_i}-\overline{\boldsymbol{y}}+\overline{\boldsymbol{y}}-\boldsymbol{\mu})(\boldsymbol{y_i}-\overline{\boldsymbol{y}}+\overline{\boldsymbol{y}}-\boldsymbol{\mu})'\\
&=\sum_{i=1}^{n}(\boldsymbol{y_i}-\overline{\boldsymbol{y}})(\boldsymbol{y_i}-\overline{\boldsymbol{y}})'+n(\overline{\boldsymbol{y}}-\boldsymbol{\mu})(\overline{\boldsymbol{y}}-\boldsymbol{\mu})'\\
&=(n-1)\boldsymbol{S}+n(\overline{\boldsymbol{y}}-\boldsymbol{\mu})(\overline{\boldsymbol{y}}-\boldsymbol{\mu})'
\end{align}$
したがって,
$\begin{align} L(\boldsymbol{\mu},\boldsymbol{\Sigma}) &=\frac{1}{(\sqrt{2\pi})^{np}|\boldsymbol\Sigma|^{n/2}}exp\Big[-\frac{1}{2}\{(n-1)tr\boldsymbol\Sigma^{-1}\boldsymbol{S}+n(\overline{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol\Sigma^{-1}(\overline{\boldsymbol{y}}-\boldsymbol{\mu})\}\Big]\\ &=g(\overline{\boldsymbol{y}},\boldsymbol{S},\boldsymbol{\mu}, \boldsymbol{\Sigma}) \cdot 1 \end{align}$
最後の結果を見ると,$\overline{\boldsymbol{y}}$と$\boldsymbol{S}$はそれぞれが独立して$\boldsymbol{\mu}$および$\boldsymbol{\Sigma}$の十分統計量になるわけではないことがわかる.
一方,$\overline{\boldsymbol{y}}$と$\boldsymbol{S}$は独立して分布する.
多変量正規分布$N_p(\boldsymbol{\mu},\boldsymbol{\Sigma})$からのランダム標本$\boldsymbol{X_1}, \boldsymbol{X_2},\dots, \boldsymbol{X_n}$に対し,その標本平均ベクトル$\overline{\boldsymbol{X}}$と標本共分散行列$\boldsymbol{S}$はそれぞれ独立である.
ただし,
$\displaystyle\overline{\boldsymbol{X}}=\frac{1}{n} \sum_{i=1}^{n}\boldsymbol{X_i} $
$\displaystyle\boldsymbol{S}=\frac{1}{n-1}\sum_{i=1}^{n}(\boldsymbol{X_i}-\overline{\boldsymbol{X}})(\boldsymbol{X_i}-\overline{\boldsymbol{X}})^{'}=\frac{1}{n-1}\boldsymbol{W}$
とする.
いま, $n×n$の直交行列で,その第1行が$\boldsymbol{1_n^{'}}/\sqrt{n}$であるような行列$\boldsymbol{\Gamma}$を考え,
$\boldsymbol{Y}=(\boldsymbol{Y_1}, \boldsymbol{Y_2},\dots, \boldsymbol{Y_n})^{'}=\boldsymbol{\Gamma}\boldsymbol{X}$とする.
このとき, 補題$^{※}$より$\boldsymbol{Y_1}, \boldsymbol{Y_2},\dots, \boldsymbol{Y_n} \in \mathbb{R}^{p} $は互いに独立に,共分散行列$\boldsymbol{\Sigma}$の多変量正規分布に従う.
よって,
$\displaystyle
\boldsymbol{Y_1}=\boldsymbol{\Gamma_1}^{'}\boldsymbol{X}=\frac{1}{\sqrt{n}} \sum_{i=1}^{n} \boldsymbol{X_i}=\sqrt{n}\frac{1}{n} \sum_{i=1}^{n} \boldsymbol{X_i}=\sqrt{n}\overline{\boldsymbol{X}}$
また$i \geq 2$において,$\Gamma$の直交性より
$E[\boldsymbol{Y_i}]=E[\boldsymbol{\Gamma_i}^{'}\boldsymbol{X}]
=\boldsymbol{\Gamma_i}^{'}E[\boldsymbol{X}]=\boldsymbol{\Gamma_i}^{'}\boldsymbol{\mu}=0$
が成り立つ.
一方,
$\begin{align}
W&= \sum_{i=1}^{n}(\boldsymbol{X_i}-\overline{\boldsymbol{X}})(\boldsymbol{X_i}-\overline{\boldsymbol{X}})^{'}=\sum_{i=1}^{n}\boldsymbol{X_i}\boldsymbol{X_i}^{'}-n\overline{\boldsymbol{X}}\overline{\boldsymbol{X}^{'}}\\
&=\boldsymbol{X}^{'}\boldsymbol{X}-\boldsymbol{Y_1}\boldsymbol{Y_1}^{'}
=\boldsymbol{Y}^{'}\boldsymbol{Y}-\boldsymbol{Y_1}\boldsymbol{Y_1}^{'}\\
&=\boldsymbol{Y_2}\boldsymbol{Y_2}^{'}+\cdots+\boldsymbol{Y_n}\boldsymbol{Y_n}^{'}
\end{align}$
となり,$W$は$\boldsymbol{Y_1}$を含まない形で表される.
$\boldsymbol{Y_1}$と$\boldsymbol{Y_2},\dots, \boldsymbol{Y_n}$の独立性から,$\boldsymbol{Y_1}$と$\boldsymbol{W}$は独立.
すなわち$\overline{\boldsymbol{X}}$と$\boldsymbol{W}$は独立である.
$n×p$確率行列$\boldsymbol{X}$の各行が独立に共通の共分散行列$\boldsymbol{\Sigma}$の多変量正規分布に従うとし,$\boldsymbol{\Gamma}$を$n$次の直交行列とする.
このとき,$\boldsymbol{Y}=\boldsymbol{\Gamma} \boldsymbol{X}$の各行は独立に共分散行列$\boldsymbol{\Sigma}$の多変量正規分布に従う.