0
大学数学基礎解説
文献あり

最尤推定量の漸近正規性について

34
0

はじめに

本記事は最尤推定量の漸近正規性に関する備忘録です. もし間違い等があればコメントいただけますと幸いです.

最尤推定

(X,A,μ)σ-有限測度空間とします. また, (Ω,F,P)を確率空間とし, {Xi}iNをその上に定義されたX-値i.i.d.確率変数列とします. さらに, ΘRpを未知パラメータの空間, {f(;θ)}θΘ(X,A,μ)の上の確率密度関数の族とし, X1は密度f(;θ0)を持つとします (暗黙に, θ0Θであると考えます).

以上の設定の下でθ0の推定を考えます. 今, X1,,Xnn個の観測とし, x1,,xnをその実現値とします. このとき, x=(x1,,xn)を含むA-可測集合Aμn(A)が十分小であるようにとれば (μnn個のμの直積測度),
P((X1,,Xn)A)=Ai=1nf(xi;θ0)μn(dx)i=1nf(xi;θ0)μn(A)
と表せます. したがって, Xi=xi, i=1,,nとなる確率はほとんどi=1nf(xi;θ0)に依存して決まると考えられ, θΘに対して
Ln(X1,,Xn,θ)=i=1nf(Xi;θ)
とおけば, これはX1,,Xnが観測されたことに対するパラメータθの尤もらしさの度合いを表す量とみなせます. 故に, xi=Xi(ω), i=1,,nが実現したのは, それがf(;θ0)で定まる母集団分布において最も出現しやすい値であったからだと考えれば,
θ^nML(ω)=argmaxθΘLn(X1(ω),,Xn(ω),θ),ωΩ
で定まるθ^nMLは真値θ0に近いと思うことができるでしょう.

関数θLn(X1,,Xn,θ)は観測X1,,Xn尤度と呼ばれ, θ^nMLθ0最尤推定量と呼ばれます. 最尤推定量は, その数学的な取り扱いやすさから, 対数尤度θlogLn(X1,,Xn,θ)を用いて次のように定義することが多いです.

最尤推定量

θ^nML:ΩΘθ0最尤推定量であるとは, それが任意のωΩに対して
θ^nML(ω)=argmaxθΘ1ni=1nlogf(Xi(ω);θ)
を満たすF/B(Θ)-可測写像であるときにいう.

対数関数の単調性より
argmaxθΘi=1nf(Xi(ω);θ)=argmaxθΘi=1nlogf(Xi(ω);θ),ωΩ
となることに注意してください.

本記事では, 最尤推定量θ^nMLの漸近正規性を証明します.

準備

記法
  • 位相空間Xに対してB(X)XのBorel集合族を表す.
  • B(θ,ρ)は中心θ, 半径ρの開球を表す. すなわち, B(θ,ρ)={θ~Θ|θ~θ<ρ}.
  • 行列Aに対してAはその転置を表す.
  • はFrobeniusノルムを表す. すなわち, 行列Aに対してA=tr(AA).
  • θ=[/θ1,,/θp]とする. 例えば, f:RpRに対して
    θf(θ)=[f(θ)θi]p×1,θ2f(θ)=[f(θ)θiθj]p×p.
  • Np(0,Σ)は平均ベクトル0, 分散共分散行列Σp変量正規分布を表す.
  • dは確率変数列の分布収束を表す.
  • a.s.はalmost surely (ほとんど確実に, 確率1での意) の略. また, a.e.はalmost everywhere (ほとんどいたる所の意) の略.
設定
  • (X,A,μ)σ-有限測度空間.
  • (Ω,F,P)は確率空間.
  • {Xi}iN(Ω,F,P)上に定義されたX-値i.i.d.確率変数列.
  • ΘRpの部分集合 (パラメータ空間).
  • {f(;θ)}θΘ(X,A,μ)上の確率密度関数の族 (推測したいパラメトリックモデル).
  • θ0Θはパラメータの真値. すなわち, X1は密度f(;θ0)を持つ.

最尤推定量の漸近正規性の証明には次の4つの事実を用います.

一様な大数の法則

qX×Θ上の実数値関数とする. 次の4つの条件を仮定する.

  • Θ0Θのコンパクト部分集合.
  • θΘに対して, Xxq(x,θ)RA/B(R)-可測.
  • P-a.s.ωΩに対して, Θθq(X1(ω),θ)Rは連続.
  • 関数M:XR+E[M(X1)]<なるものが存在して, supθΘ|q(X1,θ)|M(X1) a.s.

このとき, 写像ΘθE[q(X1,θ)]Rは連続であり,
limnsupθΘ|1ni=1nq(Xi,θ)E[q(X1,θ)]|=0a.s.
が成り立つ.

prop:1の証明は記事「 一様な大数の法則について 」を参照してください.

最尤推定量の一致性

次の4つの条件を仮定する.

  • 任意のθΘに対して, θθ0ならば, P(f(X1;θ)f(X1;θ0))>0.
  • Θはコンパクト.
  • iNP-a.s.ωΩに対して, Θθlogf(Xi(ω);θ)Rは連続.
  • E[supθ~Θ|logf(X1;θ~)|]<.

このとき, 次の3つが成り立つ.

  • nNP-a.s.ωΩに対して, 最尤推定量θ^nMLが存在する.
  • 写像ΘθE[logf(X1;θ)]Rは連続.
  • θ^nMLは 強一致推定量である. すなわち, θ^nMLθ0 a.s.が成り立つ.

prop:2の証明は記事「 最尤推定量の一致性について 」を参照してください.

情報量等式

次の4つの条件を仮定する.

  • Θは開集合.
  • P-a.s.ωΩに対して, Θθf(X1(ω);θ)RC2級.
  • μ-a.e.xXと各θNに対して, f(x;θ)>0.
  • Xsupθ~Nθf(x;θ~)μ(dx)<, Xsupθ~Nθ2f(x;θ~)μ(dx)<.

このとき,
E[θlogf(X1;θ0)]=0,E[(θlogf(X1;θ0))(θlogf(X1;θ0))]+E[θ2logf(X1;θ0)]=O
が成り立つ.

prop:3の証明は記事「 情報量等式の証明 」を参照してください.

M-推定量の漸近正規性

nNについてQnXn×Θ上の実数値関数とする. 次の5つの条件を仮定する.

  1. Θはコンパクトである. また, 開集合Nが存在して, θ0NΘ.
  2. nNについて, 任意にθΘを固定するとき, ΩωQn(X1(ω),,Xn(ω),θ)RF/B(R)-可測.
  3. nNについて, 任意にωΩを固定するとき, ΘθQn(X1(ω),,Xn(ω),θ)Rは連続. また, NθQn(X1(ω),,Xn(ω),θ)RC2級.
  4. p次正定値行列Σが存在して, nθ2Qn(X1,,Xn,θ0)dNp(0,Σ).
  5. θ0において連続な写像H:NRp×pが存在して, supθNθ2Qn(X1,,Xn,θ)H(θ)p0であり, 行列H(θ0)は正則.

このとき, 次の2つが成り立つ.

  1. nNについて, 任意の固定されたωΩに対して
    Qn(X1(ω),,Xn(ω),θ^n(ω))=maxθΘQn(X1(ω),,Xn(ω),θ)
    を満たすようなF/B(Θ)-可測写像θ^n:ΩΘが存在する.
  2. θ^npθ0ならば,
    n(θ^nθ0)dNp(0,H1(θ0)ΣH1(θ0))
    が成り立つ.

prop:4の証明は記事「 M-推定量の漸近正規性について 」を参照してください.

最尤推定量の漸近正規性

最尤推定量の漸近正規性

次の7つの条件を仮定する.

  1. 任意のθΘに対して, θθ0ならば, P(f(X1;θ)f(X1;θ0))>0.
  2. Θはコンパクトであり, 開集合Nが存在して, θ0NΘ.
  3. iNP-a.s.ωΩに対して, Θθf(Xi(ω);θ)Rは連続. また, Nθf(Xi(ω);θ)RC2級.
  4. μ-a.e.xXと各θNに対して, f(x;θ)>0.
  5. Xsupθ~Nθf(x;θ~)μ(dx)<, Xsupθ~Nθ2f(x;θ~)μ(dx)<.
  6. E[supθ~Θ|logf(X1;θ~)|]<, E[supθ~Nθ2logf(X1;θ~)]<.
  7. 行列J=E[(θlogf(X1;θ0))(θlogf(X1;θ0))]は正則.

このとき, 各nNP-a.s.ωΩに対して, 最尤推定量θ^nMLが存在して,
n(θ^nMLθ0)dNp(0,J1)
が成り立つ.

thm:5の仮定[1], [2], [3], [6]よりprop:2が適用できて, θ^nMLθ0 a.s.が成り立つことに注意すると, 定理を証明するには,
Qn(X1,,Xn,θ)=1ni=1nlogf(Xi;θ)
に対してprop:4の仮定[4], [5]が成り立つことを確認すればよい.

まず, thm:5の仮定[2], [3], [4], [5]よりprop:3が適用できて,
E[θlogf(X1;θ0)]=0,J=E[θ2logf(X1;θ0)]
が成り立つことに注意する.

次に, i.i.d.確率変数列に対する中心極限定理より
1ni=1nlogf(Xi;θ0)dNp(0,J)
となるから, prop:4の仮定[4]が成り立つ.

最後に, prop:4の仮定[5]を示す. r>0を十分小さくとることによりN0=cl(B(θ0,r))Nとできる. thm:5の仮定[2], [3], [4], [6]よりprop:1が適用できて, 写像θE[θ2logf(X1;θ)]は連続であり,
supθN01ni=1nθ2logf(Xi;θ)E[θ2logf(X1;θ)]0a.s.
となるから, prop:4の仮定[5]が成り立つ.

以上から, prop:4の結論より
n(θ^nMLθ0)dNp(0,(J)1J(J)1)=Np(0,J1)
を得る.

最尤推定量θ^nMLの漸近分散に登場するJFisher情報行列と呼ばれます. 推定量のクラスを適当に制限するとき, 漸近分散の下限がFisher情報行列の逆行列で与えられることは有名な事実であり, この意味で最尤推定量は漸近有効推定量です.

参考文献

[1]
Newey, W. K. and McFadden, D., Large sample estimation and hypothesis testing, Handbook of Econometrics, 1994, 2111 - 2245
[2]
清水泰隆, 統計学への漸近論, その先は 現代の統計リテラシーから確率過程の統計学へ, 内田老鶴圃, 2023
投稿日:214
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

非数学科で統計してる人

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. 最尤推定
  3. 準備
  4. 最尤推定量の漸近正規性
  5. 参考文献