0
大学数学基礎解説
文献あり

最尤推定量の一致性について

108
0

はじめに

本記事は最尤推定量の一致性に関する備忘録です. もし間違い等があればコメントいただけますと幸いです.

最尤推定

(X,A,μ)σ-有限測度空間とします. また, (Ω,F,P)を確率空間とし, {Xi}iNをその上に定義されたX-値i.i.d.確率変数列とします. さらに, ΘRpを未知パラメータの空間, {f(;θ)}θΘ(X,A,μ)の上の確率密度関数の族とし, X1は密度f(;θ0)を持つとします (暗黙に, θ0Θであると考えます).

以上の設定の下でθ0の推定を考えます. 今, X1,,Xnn個の観測とし, x1,,xnをその実現値とします. このとき, x=(x1,,xn)を含むA-可測集合Aμn(A)が十分小であるようにとれば (μnn個のμの直積測度),
P((X1,,Xn)A)=Ai=1nf(xi;θ0)μn(dx)i=1nf(xi;θ0)μn(A)
と表せます. したがって, Xi=xi, i=1,,nとなる確率はほとんどi=1nf(xi;θ0)に依存して決まると考えられ, θΘに対して
Ln(X1,,Xn,θ)=i=1nf(Xi;θ)
とおけば, これはX1,,Xnが観測されたことに対するパラメータθの尤もらしさの度合いを表す量とみなせます. 故に, xi=Xi(ω), i=1,,nが実現したのは, それがf(;θ0)で定まる母集団分布において最も出現しやすい値であったからだと考えれば,
θ^nML(ω)=argmaxθΘLn(X1(ω),,Xn(ω),θ),ωΩ
で定まるθ^nMLは真値θ0に近いと思うことができるでしょう.

関数θLn(X1,,Xn,θ)は観測X1,,Xn尤度と呼ばれ, θ^nMLθ0最尤推定量と呼ばれます. 最尤推定量は, その数学的な取り扱いやすさから, 対数尤度θlogLn(X1,,Xn,θ)を用いて次のように定義することが多いです.

最尤推定量

θ^nML:ΩΘθ0最尤推定量であるとは, それが任意のωΩに対して
θ^nML(ω)=argmaxθΘ1ni=1nlogf(Xi(ω);θ)
を満たすF/B(Θ)-可測写像であるときにいう.

対数関数の単調性より
argmaxθΘi=1nf(Xi(ω);θ)=argmaxθΘi=1nlogf(Xi(ω);θ),ωΩ
となることに注意してください.

本記事では, 最尤推定量θ^nMLの一致性を証明します.

準備

記法
  • 位相空間Xに対してB(X)XのBorel集合族を表す.
  • a.s.はalmost surely (ほとんど確実に, 確率1での意) の略.
設定
  • (X,A,μ)σ-有限測度空間.
  • (Ω,F,P)は確率空間.
  • {Xi}iN(Ω,F,P)上に定義されたX-値i.i.d.確率変数列.
  • ΘRpの部分集合 (パラメータ空間).
  • {f(;θ)}θΘ(X,A,μ)上の確率密度関数の族 (推測したいパラメトリックモデル).
  • θ0Θはパラメータの真値. すなわち, X1は密度f(;θ0)を持つ.

最尤推定量の一致性の証明には次の3つの事実を用います.

一様な大数の法則

qX×Θ上の実数値関数とする. 次の4つの条件を仮定する.

  • Θ0Θのコンパクト部分集合.
  • θΘに対して, Xxq(x,θ)RA/B(R)-可測.
  • P-a.s.ωΩに対して, Θθq(X1(ω),θ)Rは連続.
  • 関数M:XR+E[M(X1)]<なるものが存在して, supθΘ|q(X1,θ)|M(X1) a.s.

このとき, 写像ΘθE[q(X1,θ)]Rは連続であり,
limnsupθΘ|1ni=1nq(Xi,θ)E[q(X1,θ)]|=0a.s.
が成り立つ.

prop:1の証明は記事「 一様な大数の法則について 」を参照してください.

一致性定理

nNについてQnXn×Θ上の実数値関数とし, Q0Θ上の実数値関数とする. 次の5つの条件を仮定する.

  1. nNと各θΘに対して, ΩωQn(X1(ω),,Xn(ω),θ)RF/B(R)-可測.
  2. nNP-a.s.ωΩに対して, ΘθQn(X1(ω),,Xn(ω),θ)Rは連続.
  3. Θはコンパクト.
  4. 任意のε>0に対してsupθ:θθ0εQ0(θ)<Q0(θ0).
  5. supθΘ|Qn(X1,,Xn,θ)Q0(θ)|0 a.s.

このとき, 次の3つが成り立つ.

  1. nNP-a.s.ωΩに対して
    Qn(X1(ω),,Xn(ω),θ^n(ω))=maxθΘQn(X1(ω),,Xn(ω),θ)
    を満たすようなF/B(Θ)-可測写像θ^n:ΩΘが存在する.
  2. Q0:ΘRは連続.
  3. θ^nは強一致推定量である. すなわち, θ^nθ0 a.s.が成り立つ.

prop:2の証明は記事「 M-推定量の一致性について 」を参照してください.

次の補題は, 最尤推定の場合, θ0の識別可能性という弱い条件の下で期待対数尤度の最大点が一意に定まることを意味します.

情報量不等式

次の2つの条件を仮定する.

  • 任意のθΘに対して, θθ0ならば, P(f(X1;θ)f(X1;θ0))>0.
  • E[supθ~Θ|logf(X1;θ~)|]<.

このとき, 写像θE[logf(X1;θ)]θ0において最大となり, 他の最大点を持たない.

x>0に対して不等式logxx1が成り立つことに注意すると, 任意のθΘに対して
E[logf(X1;θ0)]E[logf(X1;θ)]=E[logf(X1;θ)f(X1;θ0)]E[1f(X1;θ)f(X1;θ0)]=1Xf(x;θ)f(x;θ0)f(x;θ0)μ(dx)=1Xf(x;θ)μ(dx)=0.
第2行における等号はf(X1;θ)=f(X1;θ0) a.s., すなわち, θ=θ0のときに限る. (証明終)

最尤推定量の一致性

以上の準備の下で, 最尤推定量の一致性は次で与えられます.

最尤推定量の一致性

次の4つの条件を仮定する.

  1. 任意のθΘに対して, θθ0ならば, P(f(X1;θ)f(X1;θ0))>0.
  2. Θはコンパクト.
  3. iNP-a.s.ωΩに対して, Θθlogf(Xi(ω);θ)Rは連続.
  4. E[supθ~Θ|logf(X1;θ~)|]<.

このとき, 次の3つが成り立つ.

  1. nNP-a.s.ωΩに対して, 最尤推定量θ^nMLが存在する.
  2. 写像ΘθE[logf(X1;θ)]Rは連続.
  3. θ^nMLは 強一致推定量である. すなわち, θ^nMLθ0 a.s.が成り立つ.

定理を証明するには,
Qn(X1,,Xn,θ)=1ni=1nlogf(Xi;θ),Q0(θ)=E[logf(X1;θ)]
に対してprop:2の仮定[4], [5]が成り立つことを確認すればよい. thm:4の仮定[1], [4]よりがlem:3が適用できて, prop:2の仮定[4]が成り立つ. thm:4の仮定[2], [3], [4]よりprop:1が適用できて, prop:2の仮定[5]が成り立つ. (証明終)

参考文献

[1]
Newey, W. K. and McFadden, D., Large sample estimation and hypothesis testing, Handbook of Econometrics, 1994, 2111 - 2245
[2]
清水泰隆, 統計学への漸近論, その先は 現代の統計リテラシーから確率過程の統計学へ, 内田老鶴圃, 2023
投稿日:22
更新日:213
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

非数学科で統計してる人

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. 最尤推定
  3. 準備
  4. 最尤推定量の一致性
  5. 参考文献