$n\in\mathbb N$ を $n\geq3$ を満たすように固定し、$\theta\in\mathbb R$ を未知の母数とする。
また、$(\Omega,\mathcal F,\mathbb P)$ を確率空間とする。
本記事では、上記の仮定を便宜上「誤差の公理」と呼ぶことにする。
ただし、この呼称は一般に確立された標準的名称ではなく、本記事内での一時的な呼称である点に注意する。
ここでいう「誤差の公理」とは、誤差の独立同分布性、共通の正値密度の存在、密度の正則性、および算術平均の最尤性をまとめた仮定を指す。
$n\in\mathbb N$ を $n\geq3$ を満たすように固定し、$\theta\in\mathbb R$ を未知の母数とする。
また、$(\Omega,\mathcal F,\mathbb P)$ を確率空間とする。
同じ確率空間 $(\Omega,\mathcal F,\mathbb P)$ 上に定義された実数値確率変数
$$
X_1,\ldots,X_n,
\quad
E_1,\ldots,E_n
$$
があり、各 $i=1,\ldots,n$ に対して
$$
X_i=\theta+E_i
$$
が成り立つとする。
この固定した $n$ に対する誤差 $E_1,\ldots,E_n$ が、本記事で定めた意味で「誤差の公理」を満たすとする。
すなわち、次の条件が成り立つ。
-このとき、ある $\tau>0$ が存在して、
$$
f(x)
=
\frac{1}{\sqrt{2\pi\tau^2}}
\exp\left(
-\frac{x^2}{2\tau^2}
\right)
\quad
(x\in\mathbb R)
$$
が成り立つ。
さらに、各 $i=1,\ldots,n$ に対して、任意の $a,b\in\mathbb R$ が $a< b$ を満たすならば、
$$
\mathbb P(a< X_i\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi\tau^2}}
\exp\left(
-\frac{(t-\theta)^2}{2\tau^2}
\right)
\,dt
$$
が成り立つ。
本稿では、以下の$5$つのステップで証明する。
$n\geq3$ を満たす $n$ を最初に固定する。
その固定した $n$ に対して、任意の観測値 $x_1,\ldots,x_n$ で算術平均が尤度を最大化すると仮定する。
-以上より、本記事でいう「誤差の公理」を満たす関数は、ある $\tau>0$ が存在して、
$$
f(x)
=
\frac{1}{\sqrt{2\pi\tau^2}}
\exp\left(
-\frac{x^2}{2\tau^2}
\right)
\quad
(x\in\mathbb R)
$$
で表される。
さらに、各 $i=1,\ldots,n$ に対して、$E_i$ の密度関数は $f$ であるから、任意の $a,b\in\mathbb R$ が $a< b$ を満たすならば、
$$
\mathbb P(a< E_i\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi\tau^2}}
\exp\left(
-\frac{x^2}{2\tau^2}
\right)
\,dx
$$
である。
また、仮定より、
$$
X_i=\theta+E_i
$$
である。
したがって、任意の $a,b\in\mathbb R$ が $a< b$ を満たすならば、
$$
\begin{align}
\mathbb P(a< X_i\leq b)
&=
\mathbb P(a<\theta+E_i\leq b)\\
&=
\mathbb P(a-\theta< E_i\leq b-\theta)\\
&=
\int_{a-\theta}^{b-\theta}
\frac{1}{\sqrt{2\pi\tau^2}}
\exp\left(
-\frac{u^2}{2\tau^2}
\right)
\,du
\end{align}
$$
である。
ここで、変数変換
$$
t:=u+\theta
$$
を行うと、
$$
u=t-\theta,
\qquad
du=dt
$$
である。また、$u=a-\theta$ のとき $t=a$ であり、$u=b-\theta$ のとき $t=b$ である。
ゆえに、
$$
\begin{align}
\mathbb P(a< X_i\leq b)
&=
\int_a^b
\frac{1}{\sqrt{2\pi\tau^2}}
\exp\left(
-\frac{(t-\theta)^2}{2\tau^2}
\right)
\,dt
\end{align}
$$
である。
$$ \Box$$
$G'(x)=0$ が任意の $x\in\mathbb R$ で成り立つ。
任意の $u,v\in\mathbb R$ を $u< v$ として取る。
$G$ は $[u,v]$ 上で連続、$(u,v)$ 上で微分可能であるから、平均値の定理より、ある $c\in(u,v)$ が存在して、
$$
\frac{G(v)-G(u)}{v-u}
=
G'(c)
$$
が成り立つ。
ところが $G'(c)=0$ であるから、
$$
\frac{G(v)-G(u)}{v-u}
=
0
$$
である。
$v-u\ne0$ より、
$$
G(v)-G(u)=0
$$
である。
したがって、
$$
G(v)=G(u)
$$
である。
ゆえに、$G$ は $\mathbb R$ 上で定数関数である。
そこで、$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、
$$
Z:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B(\mathbb R))
$$
を実数値確率変数とする。
$Z$ が標準正規分布に従うとは、任意の $a,b\in\mathbb R$ に対して $a< b$ ならば、
$$
\mathbb P(a< Z\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi}}
\exp\left(
-\frac{t^2}{2}
\right)
\,dt
$$
が成り立つことをいう。
すなわち、標準正規分布とは、パラメータ $\mu=0$、$\sigma^2=1$ の正規分布のことである。
さらに、$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、
$$
X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B(\mathbb R))
$$
を実数値確率変数とする。また、$\mu\in\mathbb R$、$\sigma>0$ とする。
$X$ がパラメータ $\mu,\sigma^2$ の正規分布に従うとは、任意の $a,b\in\mathbb R$ に対して $a< b$ ならば、
$$
\mathbb P(a< X\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{(t-\mu)^2}{2\sigma^2}
\right)
\,dt
$$
が成り立つことをいう。
ここで、$\mu$ は中心の位置を表す母数であり、$\sigma>0$ は広がりを表す母数である。
本記事の証明で得られた誤差密度は、$\mu=0$、$\sigma=\tau$ の場合に対応する。
また、観測値 $X_i=\theta+E_i$ の密度は、誤差密度を $\theta$ だけ平行移動したものに対応する。
標準正規分布は、正規分布のうち中心が $0$、広がりの母数が $1$ の特別な場合である。
一般のパラメータ $\mu,\sigma^2$ の正規分布は、標準正規分布を $\sigma$ 倍に尺度変換し、さらに $\mu$ だけ平行移動した分布である。
具体的には、$Z$ が標準正規分布に従うとき、
$$
X:=\mu+\sigma Z
$$
とおけば、任意の $a,b\in\mathbb R$ に対して $a< b$ ならば、
$$
\mathbb P(a< X\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi\sigma^2}}
\exp\left(
-\frac{(t-\mu)^2}{2\sigma^2}
\right)
\,dt
$$
が成り立つ。
逆に、$X$ がパラメータ $\mu,\sigma^2$ の正規分布に従うとき、
$$
Z:=\frac{X-\mu}{\sigma}
$$
とおけば、任意の $a,b\in\mathbb R$ に対して $a< b$ ならば、
$$
\mathbb P(a< Z\leq b)
=
\int_a^b
\frac{1}{\sqrt{2\pi}}
\exp\left(
-\frac{t^2}{2}
\right)
\,dt
$$
が成り立つ。