EMアルゴリズムの基礎 と同じ記号を用いる.
知りたいのは ℓ(θ)=logp(y|θ) のヘシアンだが, EMアルゴリズムのメリットは E[logp(y,z|θ)] を用いることで ℓ(θ) を直接評価しなくていいようにしたことだった.
そこで, E[logp(y,z|θ)] の微分を用いて logp(y|θ) の微分を表すことを考えよう.
∂∂θlogp(y|θ)=1p(y|θ)∂∂θp(y|θ)=1p(y|θ)∫∂∂θp(y,z|θ)dz=∫(∂∂θlogp(y,z|θ))p(y,z|θ)p(y|θ)dz=E[∂∂θlogp(y,z|θ)].
これを用いると次の結果が得られる.
∂∂θ′(∂∂θlogp(y|θ))=∫∂∂θ′(∂∂θlogp(y,z|θ))p(y,z|θ)p(y|θ)dz+∫(∂∂θlogp(y,z|θ))(∂∂θ′p(y,zθ))dzp(y|θ)−∫(∂∂θlogp(y,z|θ))p(y,z|θ){p(y|θ)}2dz=E[∂2∂θ∂θ′logp(y,z|θ)]−V[∂∂θlogp(y,z|θ)].
ここでは f(z) の p(z|y) による条件付き分散を V[f(z)]と書いた.
バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。