本記事はM-推定量の一致性に関する備忘録です. もし間違い等があればコメントいただけますと幸いです.
$\{ X_i \}_{i \in \mathbb{N}}$を確率空間$(\Omega, \mathscr{F}, \mathbb{P})$上に定義された$\mathscr{X}$-値確率変数列とします. また, $\Theta$を未知パラメータの空間とし, パラメータの真値$\boldsymbol{\theta}_0$の推定を考えます.
$\{ Q_n \}_{n \in \mathbb{N}}$を$\mathscr{X}^n \times \Theta$上の実数値関数列とします. $X_1, \ldots, X_n$を$n$個の観測とするとき, $\widehat{\boldsymbol{\theta}}_n: \Omega \to \Theta$が$\boldsymbol{\theta}_0$のM-推定量であるとは, それが
\begin{align}
\widehat{\boldsymbol{\theta}}_n(\omega)
= \underset{\boldsymbol{\theta} \in \Theta}{\text{argmax}}\;Q_n\big( X_1(\omega), \ldots, X_n(\omega), \boldsymbol{\theta} \big), \quad \omega \in \Omega
\end{align}
を満たす$\mathscr{F}/\mathscr{B}(\mathbb{R})$-可測写像であるときに言います.
M-推定の"M"は"Maximum likelihood like"を意味し, その名の通りM-推定は最尤推定の一般化です. M-推定を念頭に置く際, $\{ Q_n \}$は真値$\boldsymbol{\theta}_0$を唯一の最小点に持つ関数$Q_0: \Theta \to \mathbb{R}$に (各点で) 確率収束する量であり, この意味で$Q_n$の最大点$\widehat{\boldsymbol{\theta}}_n$は真値$\boldsymbol{\theta}_0$に十分近いと考えるのがM-推定の思想です.$Q_n, Q_0$はそれぞれ最尤推定の枠組みにおける対数尤度, 期待対数尤度に相当します.
本記事では, M-推定量$\widehat{\boldsymbol{\theta}}_n$の一致性を証明します.
次の命題は大前提となるM-推定量$\widehat{\boldsymbol{\theta}}_n$の存在を保証するのに必要です.
$Q$を$\Omega \times \Uptheta$上の実数値関数とする. 次の3つの条件を仮定する.
このとき, $\mathscr{F}/\mathscr{B}(\Theta)$-可測写像$\widehat{\boldsymbol{\theta}}: \Omega \to \Theta$が存在して, 任意の$\omega \in \Omega$に対して,
\begin{align*}
Q\big( \omega, \widehat{\boldsymbol{\theta}}(\omega) \big)
= \max_{\boldsymbol{\theta} \in \Theta} Q(\omega, \boldsymbol{\theta})
\end{align*}
が成り立つ.
prop:1の証明は記事「 M-推定量の可測性について 」を参照してください.
次の5つの条件を仮定する.
このとき, 次の3つが成り立つ.
(iii)の証明はvan der Vaartbook3のTheorem 5.7を参考にしています.
仮定[1] - [3]よりprop:1 (可測選択定理) が適用できて, (i)が成り立つ.
任意に$\varepsilon > 0$を十分小さく固定する. 仮定[5]より$\{ Q_n \}$の部分列$\{ Q_{n^\prime} \}$が存在して, ある$N(\varepsilon) \in \mathbb{N}$に対して$n^\prime \geq N(\varepsilon)$ならば,
\begin{align*}
\sup_{\boldsymbol{\theta} \in \Theta} \big| Q_{n^\prime}(X_1, \ldots, X_{n^\prime}, \boldsymbol{\theta}) - Q_0(\boldsymbol{\theta}) \big| < \frac{\varepsilon}{4} \quad \text{a.s.}
\end{align*}
が成り立つ (例えば, 吉田book4の命題1.47). このときの$\mathbb{P}$-零集合を$\mathscr{N}$とし, $\omega_0 \in \Omega \setminus \mathscr{N}$とする. 任意に$\boldsymbol{\theta} \in \Theta$と$n^\prime \geq N(\varepsilon)$を固定するとき, 仮定[2]より十分小さい$\delta(\varepsilon) > 0$が存在して, $\| \widetilde{\boldsymbol{\theta}} - \boldsymbol{\theta} \| < \delta(\varepsilon)$ならば,
\begin{align*}
\big| Q_0(\widetilde{\boldsymbol{\theta}}) - Q_0(\boldsymbol{\theta}) \big|
&\leq \big| Q_0(\widetilde{\boldsymbol{\theta}}) - Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \widetilde{\boldsymbol{\theta}}) \big| \\[3pt]
&\qquad+ \big| Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \widetilde{\boldsymbol{\theta}}) - Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \boldsymbol{\theta}) \big| \\[3pt]
&\qquad+ \big| Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \boldsymbol{\theta}) - Q_0(\boldsymbol{\theta}) \big| \\[5pt]
&\leq 2\sup_{\boldsymbol{\theta} \in \Theta} \big| Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \boldsymbol{\theta}) - Q_0(\boldsymbol{\theta}) \big| \\[3pt]
&\qquad+ \big| Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \widetilde{\boldsymbol{\theta}}) - Q_{n^\prime}(X_1(\omega_0), \ldots, X_{n^\prime}(\omega_0), \boldsymbol{\theta}) \big| \\[5pt]
&< 2 \cdot \frac{\varepsilon}{4} + \frac{\varepsilon}{2}
= \varepsilon
\end{align*}
となる. すなわち, $Q_0: \Uptheta \to \mathbb{R}$は連続である.
(i)と仮定[5]より
\begin{align*}
Q_0(\boldsymbol{\theta}_0) - Q_0(\widehat{\boldsymbol{\theta}}_n)
&= Q_n(X_1, \ldots, X_n, \boldsymbol{\theta}_0) - Q_0(\widehat{\boldsymbol{\theta}}_n) + Q_0(\boldsymbol{\theta}_0) - Q_n(X_1, \ldots, X_n, \boldsymbol{\theta}_0) \\[5pt]
&\leq \big\{ Q_n(X_1, \ldots, X_n, \widehat{\boldsymbol{\theta}}_n) - Q_0(\widehat{\boldsymbol{\theta}}_n) \big\} + \big\{ Q_0(\boldsymbol{\theta}_0) - Q_n(X_1, \ldots, X_n, \boldsymbol{\theta}_0) \big\} \\[5pt]
&\leq 2\sup_{\boldsymbol{\theta} \in \Theta} \big| Q_n(X_1, \ldots, X_n, \boldsymbol{\theta}) - Q_0(\boldsymbol{\theta}) \big| \\[5pt]
&\to^p 0
\end{align*}
となる ((ii)より各$n$について$Q_0(\widehat{\boldsymbol{\theta}}_n)$は$\mathscr{F}/\mathscr{B}(\mathbb{R})$-可測であることに注意する). 任意に$\varepsilon > 0$を固定し,
\begin{align*}
\eta(\varepsilon) = Q_0(\boldsymbol{\theta}_0) - \sup_{\boldsymbol{\theta}: \| \boldsymbol{\theta} - \boldsymbol{\theta}_0 \| \geq \varepsilon} Q_0(\boldsymbol{\theta})
\end{align*}
とおく. このとき, 仮定[4]より$\eta(\varepsilon) > 0$であり, 各$n$について$\| \widehat{\boldsymbol{\theta}}_n - \boldsymbol{\theta}_0 \| \geq \varepsilon$ならば,
\begin{align*}
Q_0(\widehat{\boldsymbol{\theta}}_n) \leq \sup_{\boldsymbol{\theta}: \| \boldsymbol{\theta} - \boldsymbol{\theta}_0 \| \geq \varepsilon} Q_0(\boldsymbol{\theta}) = Q_0(\boldsymbol{\theta}_0) - \eta(\varepsilon)
\end{align*}
が成り立つ. したがって,
\begin{align*}
\mathbb{P}\big( \| \widehat{\boldsymbol{\theta}}_n - \boldsymbol{\theta}_0 \| \geq \varepsilon \big)
\leq \mathbb{P}\big( Q_0(\boldsymbol{\theta}_0) - Q_0(\widehat{\boldsymbol{\theta}}_n) \geq \eta(\varepsilon) \big)
\to 0
\end{align*}
となり, 結論を得る. (証明終)