はじめに
本記事は情報量等式の証明に関する備忘録です. もし間違い等があればコメントいただけますと幸いです.
Fisher情報量
を確率空間, を-有限測度空間とします. また, を未知パラメータの空間とし, を上の確率密度関数の族とします. さらに, を上に定義された-値確率変数とし, その密度関数をとします (暗黙にであると考えます).
以降, の微分可能性は仮定します. 固定されたに対して, 写像
は最尤推定の枠組みにおいてスコア関数と呼ばれます. すなわち, スコア関数とは対数尤度関数の1階導関数です. Fisher情報量はこのスコア関数を用いて次のように定義されます.
Fisher情報量・Fisher情報行列
行列
が存在すれば, これをFisher情報行列という. 特に, の場合は
となり, これをFisher情報量という.
後に示すように, 正則条件の下でスコア関数の期待値はなので, Fisher情報行列はスコア関数の分散となっています. 不偏推定量の分散の下限がFisher情報行列の逆行列で与えられることはCramér–Raoの不等式としてよく知られており, 推定量の有効性の議論をするにあたってFisher情報量は重要です.
Fisher情報行列に関する有名な事実として, 正則条件の下で等式
が成り立つことがあります. この等式は情報量等式と呼ばれ,
と書き直せることから, Fisher情報行列が対数尤度関数の2階導関数の期待値で与えられることを意味します. 本記事では, この情報量等式を証明します.
準備
記法
- 位相空間に対してはのBorel集合族を表す.
- a.s.はalmost surely (ほとんど確実に, 確率1での意) の略. また, a.e.はalmost everywhere (ほとんどいたる所の意) の略.
- 行列に対してはその転置を表す.
- はFrobeniusノルムを表す. すなわち, 行列に対して.
- とする. 例えば, に対して
設定
- は確率空間.
- は-有限測度空間.
- はの部分集合 (パラメータ空間).
- を上の確率密度関数の族.
- 上に定義された-値確率変数で密度関数を持つ.
微分と積分の順序交換 (Newey and McFadden[1], Lemma 3.6) を上の-値関数とする. 次の4つの条件を仮定する.
- は開集合.
- 各に対して, は-可測.
- に対して, は級.
- -可積分関数が存在して, 任意のに対して, .
このとき, 写像
は級で, 任意のに対して
が成り立つ.
任意にを固定し, をの近傍とする. このとき, 一般性を失わずには凸であると仮定してよい. -a.e.について, 平均値の定理より, に対して
が成り立つ. ここで,
である. 今, -a.e.について
であるから, Lebesgueの収束定理を適用すると, の連続性より
となる. したがって,
であるから,
が成り立つ. 写像
の連続性はの連続性とLebesgueの収束定理による. (証明終)
情報量等式の証明
情報量等式
次の4つの条件を仮定する.
- は開集合.
- -a.s.に対して, は級.
- と各に対して, .
- , .
このとき,
が成り立つ.
補題1より微分と積分の順序が交換できて,
となる. この結果を踏まえて, 再び補題1を用いることにより
を得る. (証明終)