leave-one-out 情報量を事後分布から計算する方法

まず次のように記号を定義する.

$θ$ : すべての未知パラメータ（推定のターゲット）をまとめて $θ$ と置く
$ϕ (θ)$ : 事前分布の密度関数
$p (x | θ)$ : 評価の対象となる確率モデルの密度関数. モデルの尤度の部分. 独立同分布の仮定を置く.
$ϕ^{*} (θ)$ : 事後分布の密度関数
$ϕ_{k}^{*} (θ)$ : 得られたサンプル $x_{1}, x_{2}, \dots, x_{n}$ から $k$ 番目のサンプル $x_{k}$ を除いてできるデータから実現された事後分布の密度関数

leave-one-out(loo)情報量を次で定義する:

$LOOIC = - \sum_{k = 1}^{n} \log (\int p (x_{k} | θ) ϕ_{k}^{*} (θ) d θ .)$

この右辺は「データを1個抜いて作った事後分布で作った予測分布で抜いておいたデータの対数尤度を評価したときの値の総和」を意味している.

これと事後分布の定義;
$ϕ^{*} (θ) = \frac{ϕ (θ) p (x_{k} | θ) \prod_{i = 1}^{n} p (x_{i} | θ) d θ}{\int ϕ (θ) \prod_{i \neq k} p (x_{i} | θ) d θ}$
から愚直に計算して, 次を得る.
$\begin{aligned} LOOIC & = - \sum_{k = 1}^{n} \log (\frac{\int ϕ (θ) p (x_{k} | θ) \prod_{i \neq k} p (x_{k} | θ) d θ}{\int ϕ (θ) \prod_{i \neq k} p (x_{i} | θ) d θ}) \\ = - \sum_{k = 1}^{n} \log (\frac{\int ϕ (θ) \prod_{i = 1}^{n} p (x_{i} | θ) d θ}{\int ϕ (θ) p (x_{i} | θ)^{- 1} \prod_{i = 1}^{n} p (x_{i} | θ) d θ}) \\ = \sum_{k = 1}^{n} \log (\frac{\int ϕ (θ) p (x_{k} | θ)^{- 1} \prod_{i = 1}^{n} p (x_{i} | θ) d θ}{\int ϕ (θ) \prod_{i = 1}^{n} p (x_{i} | θ) d θ}) \\ = \sum_{k = 1}^{n} \log (\int p (x_{k} | θ)^{- 1} ϕ^{*} (θ) d θ) \end{aligned}$
この等式は「サンプル1つあたりの尤度の逆数を事後分布により平均したものの総和」で loo 情報量が得られることを示している. つまり事後分布を何回も作り直す必要がなくなって便利である.