$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が可積分であるとは、
$$
\int_\Omega |X|\,d\mathbb P<\infty
$$
が成り立つことをいう。
このとき、$X$ の期待値 $\mathbb E[X]$ を
$$
\mathbb E[X]:=\int_\Omega X\,d\mathbb P
$$
で定める。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$A\in\mathcal F$ を事象とする。
事象 $A$ の指示関数 $\mathbf 1_A:\Omega\to\{0,1\}$ を
$$
\mathbf 1_A(\omega)=
\begin{cases}
1, & \omega\in A,\\
0, & \omega\notin A
\end{cases}
$$
で定義する。このとき、$\mathbf 1_A$ は可積分であり、
$$
\mathbb E[\mathbf 1_A]=\mathbb P(A)
$$
が成り立つ。
-以上より、
$$
\mathbb E[\mathbf 1_A]=\mathbb P(A)
$$
が成り立つ。
$$ \Box$$
指示関数 $\mathbf 1_A$ は、事象 $A$ が起こったかどうかを数値化した確率変数である。
すなわち、$A$ が起これば $1$、$A$ が起こらなければ $0$ を取る。
したがって、その平均値は
$$
1\cdot\mathbb P(A)+0\cdot\mathbb P(A^c)=\mathbb P(A)
$$
となる。このため、事象の確率は指示関数の期待値として表せるのである。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to[0,\infty]$ を非負実数値確率変数とする。
$X$ の期待値を
$$
\mathbb E[X]:=\int_\Omega X\,d\mathbb P
$$
で定義する。このとき、
$$
\mathbb E[X]\ge0
$$
が成り立つ。
-期待値の定義より、
$$
\mathbb E[X]=\int_\Omega X\,d\mathbb P
$$
であるから、
$$
\mathbb E[X]\ge0
$$
が成り立つ。
$$ \Box$$
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$C\in\mathbb R$ とする。
定数関数
$$
Y:\Omega\to\mathbb R,\quad Y(\omega):=C
$$
を考える。このとき、$Y$ は可積分であり、
$$
\mathbb E[Y]=C
$$
が成り立つ。
-したがって、
$$
\mathbb E[Y]=C
$$
が成り立つ。
$$ \Box$$
厳密には、期待値 $\mathbb E[\cdot]$ は確率変数に対して定義される。
したがって、
$$
\mathbb E[C]
$$
という記法は、実数 $C$ そのものではなく、定数確率変数
$$
\omega\mapsto C
$$
の期待値を意味する略記である。定数確率変数を単に $C$ と書く約束をすれば、
$$
\mathbb E[C]=C
$$
である。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
このとき、
$$
\mathbb E[\mathbb E[X]]=\mathbb E[X]
$$
が成り立つ。実際、$X$ は可積分であるから、
$$
\mathbb E[X]\in\mathbb R
$$
である。
そこで、
$$
C:=\mathbb E[X]
$$
とおく。このとき、$C$ は実数である。
命題より、定数確率変数 $C$ について
$$
\mathbb E[C]=C
$$
が成り立つ。
したがって、
$$
\mathbb E[\mathbb E[X]]
=
\mathbb E[C]
=
C
=
\mathbb E[X]
$$
である。
よって、
$$
\mathbb E[\mathbb E[X]]=\mathbb E[X]
$$
が成り立つ。
$$ \Box$$
【補足】
繰り返しであるが、$\mathbb E[X]$ は確率変数ではなく、実数である。
そのため、
$$
\mathbb E[\mathbb E[X]]
$$
という記法は、厳密には $\mathbb E[X]$ を定数確率変数とみなしたうえで期待値を取っている。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
このとき、$X+Y$ も可積分であり、
$$
\mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y]
$$
が成り立つ。
仮定より $X,Y$ は可積分であるから、
$$
\int_\Omega |X|\,d\mathbb P<\infty,\quad
\int_\Omega |Y|\,d\mathbb P<\infty
$$
である。
-以上より、
$$
\mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y]
$$
が成り立つ。
$$ \Box$$
この命題では、$X$ と $Y$ の独立性は仮定していない。
期待値の加法性
$$
\mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y]
$$
は、$X$ と $Y$ が独立でなくても、可積分であれば成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
また、$c\in\mathbb R$ とする。このとき、$cX$ も可積分であり、
$$
\mathbb E[cX]=c\mathbb E[X]
$$
が成り立つ。
$X$ は可積分であるから、
$$
\int_\Omega |X|\,d\mathbb P<\infty
$$
である。
-以上より、
$$
\mathbb E[cX]=c\mathbb E[X]
$$
が成り立つ。
$$ \Box$$
この命題では、確率変数の独立性は関係しない。
期待値の定数倍の性質は、ルベーグ積分の定数倍の性質から従う性質である。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
また、$c,d,t\in\mathbb R$ とする。このとき、写像
$$
cX+dY+t:\Omega\to\mathbb R
$$
を
$$
(cX+dY+t)(\omega):=cX(\omega)+dY(\omega)+t
$$
で定めると、$cX+dY+t$ は可積分な実数値確率変数であり、
$$
\mathbb E[cX+dY+t]
=
c\mathbb E[X]+d\mathbb E[Y]+t
$$
が成り立つ。
$X,Y$ は実数値確率変数であるから、$X,Y$ は可測関数である。
また、可測関数の定数倍、和、定数関数との和は可測であるから、$cX+dY+t$ もまた実数値確率変数である。
厳密には、$t$ は実数であり、期待値は確率変数に対して定義される。
したがって、
$$
\mathbb E[cX+dY+t]
$$
という記法では、実数 $t$ を定数確率変数
$$
\Omega\ni\omega\mapsto t\in\mathbb R
$$
とみなしている。
この定数確率変数の期待値は、
$$
\mathbb E[t]=t
$$
である。
この同一視は標準的な記法であり、混乱がなければ定数確率変数を単に $t$ と書いてよい。
期待値の線形性のまとめは、新しい性質というより、直前の期待値の加法性と期待値の定数倍の性質を組み合わせた系である。
実際、$X,Y$ が可積分であるとき、期待値の定数倍の性質より、$cX,dY$ は可積分であり、
$$
\mathbb E[cX]=c\mathbb E[X],
\qquad
\mathbb E[dY]=d\mathbb E[Y]
$$
が成り立つ。
また、定数 $t\in\mathbb R$ を定数確率変数
$$
\Omega\ni\omega\mapsto t\in\mathbb R
$$
とみなすと、この定数確率変数は可積分であり、
$$
\mathbb E[t]=t
$$
である。
したがって、期待値の加法性を繰り返し用いることで、
$$
\begin{aligned}
\mathbb E[cX+dY+t]
&=
\mathbb E[(cX+dY)+t] \\
&=
\mathbb E[cX+dY]+\mathbb E[t] \\
&=
\mathbb E[cX]+\mathbb E[dY]+\mathbb E[t] \\
&=
c\mathbb E[X]+d\mathbb E[Y]+t
\end{aligned}
$$
が従う。同様に、$cX,dY,t$ はいずれも可積分であるから、
期待値の加法性に含まれる可積分性の主張を繰り返し用いることで、$cX+dY+t$ も可積分である。
以上より、期待値の線形性のまとめは、期待値の加法性、期待値の定数倍の性質、定数確率変数の期待値から導かれる系である。
期待値の線形性には、$X$ と $Y$ の独立性は不要である。
すなわち、$X,Y$ が可積分であれば、$X$ と $Y$ が独立でなくても
$$
\mathbb E[cX+dY+t]
=
c\mathbb E[X]+d\mathbb E[Y]+t
$$
が成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
任意の $\omega\in\Omega$ に対して
$$
X(\omega)\le Y(\omega)
$$
が成り立つとする。このとき、
$$
\mathbb E[X]\le\mathbb E[Y]
$$
が成り立つ。
$X,Y$ は可積分であるから、
$$
\int_\Omega |X|\,d\mathbb P<\infty,\quad
\int_\Omega |Y|\,d\mathbb P<\infty
$$
である。
-ゆえに、
$$
\mathbb E[X]\le\mathbb E[Y]
$$
が成り立つ。
$$ \Box$$
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を実数値確率変数とする。
$X,Y,XY$ が可積分であるとする。すなわち、
$$
\mathbb E[|X|]<\infty,\quad
\mathbb E[|Y|]<\infty,\quad
\mathbb E[|XY|]<\infty
$$
が成り立つとする。
共分散を
$$
\operatorname{Cov}(X,Y)
:=
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]
$$
で定義する。このとき、
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y)
$$
が成り立つ。
まず、$X,Y,XY$ が可積分であるから、
$$
\mathbb E[X],\quad \mathbb E[Y],\quad \mathbb E[XY]
$$
は有限な実数として定義される。
ここで、
$$
\mu_X:=\mathbb E[X],\quad \mu_Y:=\mathbb E[Y]
$$
とおく。このとき、$\mu_X,\mu_Y$ は実数である。
まず、
$$
(X-\mu_X)(Y-\mu_Y)
=
XY-\mu_XY-\mu_YX+\mu_X\mu_Y
$$
である。
また、$X,Y,XY$ は可積分であり、$\mu_X,\mu_Y$ は実数であるから、
$$
XY-\mu_XY-\mu_YX+\mu_X\mu_Y
$$
も可積分である。
したがって、期待値の加法性、定数倍の性質、定数確率変数の期待値より、
$$
\begin{align}
\operatorname{Cov}(X,Y)
&=
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]
&&\because \text{共分散の定義} \\
&=
\mathbb E\left[(X-\mu_X)(Y-\mu_Y)\right]
&&\because \mu_X=\mathbb E[X],\ \mu_Y=\mathbb E[Y] \\
&=
\mathbb E\left[XY-\mu_XY-\mu_YX+\mu_X\mu_Y\right]
&&\because \text{積を展開した} \\
&=
\mathbb E[XY]-\mathbb E[\mu_XY]-\mathbb E[\mu_YX]+\mathbb E[\mu_X\mu_Y]
&&\because \text{期待値の加法性} \\
&=
\mathbb E[XY]-\mu_X\mathbb E[Y]-\mu_Y\mathbb E[X]+\mu_X\mu_Y
&&\because \text{期待値の定数倍の性質と定数確率変数の期待値} \\
&=
\mathbb E[XY]-\mu_X\mu_Y-\mu_Y\mu_X+\mu_X\mu_Y
&&\because \mu_X=\mathbb E[X],\ \mu_Y=\mathbb E[Y] \\
&=
\mathbb E[XY]-\mu_X\mu_Y
&&\because -\mu_X\mu_Y-\mu_Y\mu_X+\mu_X\mu_Y=-\mu_X\mu_Y \\
&=
\mathbb E[XY]-\mathbb E[X]\mathbb E[Y]
&&\because \mu_X=\mathbb E[X],\ \mu_Y=\mathbb E[Y]
\end{align}
$$
よって、
$$
\operatorname{Cov}(X,Y)=\mathbb E[XY]-\mathbb E[X]\mathbb E[Y]
$$
である。
したがって、両辺に $\mathbb E[X]\mathbb E[Y]$ を加えると、
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y)
$$
を得る。
以上より、
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y)
$$
が成り立つ。
$$ \Box$$
この命題では、$X,Y,XY$ が可積分であることを仮定している。
これは、
$$
\mathbb E[X],\quad \mathbb E[Y],\quad \mathbb E[XY],\quad \operatorname{Cov}(X,Y)
$$
をすべて有限な実数として扱うためである。
特に、$X,Y\in L^2$、すなわち
$$
\mathbb E[X^2]<\infty,\quad \mathbb E[Y^2]<\infty
$$
を仮定すれば、$X,Y,XY$ は可積分になる。
したがって、共分散を扱う多くの文脈では、$X,Y$ が二乗可積分であることを仮定する。
この命題では、$X$ と $Y$ の独立性は仮定していない。
等式
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y)
$$
は、共分散の定義を変形した恒等式である。
独立性が必要になるのは、一般に
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]
$$
を示したい場合である。実際、独立で可積分な確率変数に対しては
$$
\operatorname{Cov}(X,Y)=0
$$
となる。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
さらに、$X$ と $Y$ は独立であるとする。このとき、$XY$ は可積分であり、
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]
$$
が成り立つ。
$X$ と $Y$ の分布測度をそれぞれ
$$
\mathbb P_X,\quad \mathbb P_Y
$$
と書く。また、$(X,Y)$ の同時分布測度を
$$
\mathbb P_{(X,Y)}
$$
と書く。すなわち、任意の $B\in\mathcal B(\mathbb R^2)$ に対して
$$
\mathbb P_{(X,Y)}(B):=\mathbb P((X,Y)\in B)
$$
である。
$X$ と $Y$ は独立であるから、同時分布測度は周辺分布測度の直積測度に等しい。すなわち、
$$
\mathbb P_{(X,Y)}=\mathbb P_X\otimes\mathbb P_Y
$$
が成り立つ。
-したがって、
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]
$$
が成り立つ。
$$ \Box$$
この命題の逆は一般には成り立たない。すなわち、
$$
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]
$$
が成り立っても、そこから $X$ と $Y$ が独立であるとは限らない。
$\mathrm{Tonelli}$ の定理は、非負可測関数に対して、直積測度上の積分と反復積分を同一視できることを保証する定理である。
$(S,\mathcal A,\mu)$ と $(T,\mathcal B,\nu)$ を $\sigma$ 有限測度空間とする。
また、非負 $\mathcal A\otimes\mathcal B$ 可測関数
$$
f:S\times T\to[0,\infty]
$$
を考える。このとき、関数
$$
s\mapsto\int_T f(s,t)\,d\nu(t),
\qquad
t\mapsto\int_S f(s,t)\,d\mu(s)
$$
はそれぞれ非負可測関数であり、
$$
\int_{S\times T} f(s,t)\,d(\mu\otimes\nu)(s,t)
=
\int_S\left(\int_T f(s,t)\,d\nu(t)\right)d\mu(s)
=
\int_T\left(\int_S f(s,t)\,d\mu(s)\right)d\nu(t)
$$
が成り立つ。
ここで重要なのは、$f\ge0$ であるため、積分値が $+\infty$ になってもよいという点である。
したがって、$\mathrm{Tonelli}$ の定理は、非負関数について
$$
\text{直積上でまとめて積分しても、片方ずつ順に積分しても同じである}
$$
ということを保証する定理である。
$\mathrm{Fubini}$ の定理は、可積分な関数に対して、積分の順序を交換してよいことを保証する定理である。
$(S,\mathcal A,\mu)$ と $(T,\mathcal B,\nu)$ を $\sigma$ 有限測度空間とする。
また、$\mathcal A\otimes\mathcal B$ 可測関数
$$
f:S\times T\to\mathbb R
$$
が可積分、すなわち
$$
\int_{S\times T}|f(s,t)|\,d(\mu\otimes\nu)(s,t)<\infty
$$
を満たすとする。
このとき、$\mu$ ほとんどすべての $s\in S$ に対して
$$
\int_T |f(s,t)|\,d\nu(t)<\infty
$$
であり、$\nu$ ほとんどすべての $t\in T$ に対して
$$
\int_S |f(s,t)|\,d\mu(s)<\infty
$$
である。
さらに、
$$
s\mapsto\int_T f(s,t)\,d\nu(t),
\qquad
t\mapsto\int_S f(s,t)\,d\mu(s)
$$
はそれぞれ可積分関数として定まり、
$$
\int_{S\times T} f(s,t)\,d(\mu\otimes\nu)(s,t)
=
\int_S\left(\int_T f(s,t)\,d\nu(t)\right)d\mu(s)
=
\int_T\left(\int_S f(s,t)\,d\mu(s)\right)d\nu(t)
$$
が成り立つ。
ここで重要なのは、$f$ が正負の値を取りうる場合でも、絶対値の積分が有限であれば、積分順序を交換してよいという点である。
したがって、$\mathrm{Fubini}$ の定理は、
$$
\text{可積分性が保証されているなら、二重積分をどちらの順番で計算しても同じである}
$$
ということを保証する定理である。
$\mathrm{Tonelli}$ の定理は、非負可測関数に使う。
すなわち、
$$
f\ge0
$$
であるとき、積分値が $+\infty$ になりうる場合も含めて、直積上の積分と反復積分を結びつける。
$ $
一方、$\mathrm{Fubini}$ の定理は、可積分関数に使う。
すなわち、
$$
\int_{S\times T}|f|\,d(\mu\otimes\nu)<\infty
$$
が分かっているとき、正負の値を取る関数についても、積分順序の交換を正当化する。
したがって、実際の証明では次のように使い分けることが多い。
$ $
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$n\in\mathbb N_{>0}$ とする。
$X_1,\dots,X_n:\Omega\to\mathbb R$ を可積分な実数値確率変数とし、$X_1,\dots,X_n$ は相互に独立であるとする。
このとき、
$$
\prod_{i=1}^{n}X_i
$$
は可積分であり、
$$
\mathbb E\left[\prod_{i=1}^{n}X_i\right]
=
\prod_{i=1}^{n}\mathbb E[X_i]
$$
が成り立つ。すなわち、
$$
\mathbb E[X_1X_2\cdots X_n]
=
\mathbb E[X_1]\mathbb E[X_2]\cdots\mathbb E[X_n]
$$
が成り立つ。
$n$ に関する数学的帰納法で示す。
-以上より、数学的帰納法により、任意の $n\in\mathbb N_{>0}$ について
$$
\mathbb E\left[\prod_{i=1}^{n}X_i\right]
=
\prod_{i=1}^{n}\mathbb E[X_i]
$$
が成り立つ。
$$ \Box$$
以下では、次の標準的事実を用いる。
$X_1,\dots,X_n$ が相互に独立な実数値確率変数であるとき、互いに交わらない添字集合から生成される $\sigma$ 代数は独立である。
特に、$1\le m< n$ に対して、
$$
\sigma(X_1,\dots,X_m)
\quad\text{と}\quad
\sigma(X_{m+1})
$$
は独立である。
この事実を用いれば、任意のボレル可測関数 $h:\mathbb R^m\to\mathbb R$ に対して、
$$
h(X_1,\dots,X_m)
$$
と $X_{m+1}$ は独立である。
$ $
【命題】
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X_1,\dots,X_n:\Omega\to\mathbb R$ を相互に独立な実数値確率変数とする。
また、$1\le m< n$ とし、$h:\mathbb R^m\to\mathbb R$ をボレル可測関数とする。
このとき、
$$
h(X_1,\dots,X_m)
$$
と
$$
X_{m+1}
$$
は独立である。
特に、
$$
h(x_1,\dots,x_m)=x_1x_2\cdots x_m
$$
とおけば、
$$
\prod_{i=1}^{m}X_i
$$
と $X_{m+1}$ は独立である。
$ $
【証明】
$X_1,\dots,X_n$ が相互に独立であるから、$\sigma(X_1,\dots,X_m)$ と $\sigma(X_{m+1})$ は独立である。
ここで、$h$ はボレル可測であり、$(X_1,\dots,X_m)$ は $\mathbb R^m$ 値確率変数であるから、
$$
h(X_1,\dots,X_m)
$$
は実数値確率変数である。
さらに、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$
\{h(X_1,\dots,X_m)\in B\}
=
\{(X_1,\dots,X_m)\in h^{-1}(B)\}
$$
である。
$h$ はボレル可測であるから、
$$
h^{-1}(B)\in\mathcal B(\mathbb R^m)
$$
である。したがって、
$$
\{h(X_1,\dots,X_m)\in B\}\in\sigma(X_1,\dots,X_m)
$$
である。
一方、任意の $C\in\mathcal B(\mathbb R)$ に対して
$$
\{X_{m+1}\in C\}\in\sigma(X_{m+1})
$$
である。
よって、$\sigma(X_1,\dots,X_m)$ と $\sigma(X_{m+1})$ の独立性より、
$$
\begin{align}
&\mathbb P\left(
\{h(X_1,\dots,X_m)\in B\}
\cap
\{X_{m+1}\in C\}
\right)\\
&=
\mathbb P\left(h(X_1,\dots,X_m)\in B\right)
\mathbb P\left(X_{m+1}\in C\right)
\end{align}
$$
が成り立つ。
したがって、$h(X_1,\dots,X_m)$ と $X_{m+1}$ は独立である。
特に、
$$
h:\mathbb R^m\to\mathbb R,\qquad
h(x_1,\dots,x_m)=x_1x_2\cdots x_m
$$
はボレル可測関数であるから、
$$
\prod_{i=1}^{m}X_i
=
h(X_1,\dots,X_m)
$$
と $X_{m+1}$ は独立である。
$$ \Box$$
$n=2$ の場合、この命題は
$$
\mathbb E[X_1X_2]=\mathbb E[X_1]\mathbb E[X_2]
$$
である。
これは、$2$ つの独立な可積分確率変数の積の期待値の公式そのものである。
この命題は、その $2$ 変数の場合を有限個に拡張したものである。
この命題では、$X_1,\dots,X_n$ が相互に独立であることを仮定している。
単に $2$ つずつ独立であること、すなわち任意の $i\neq j$ について $X_i$ と $X_j$ が独立であることだけでは、一般には十分ではない。
確率変数の積
$$
X_1X_2\cdots X_n
$$
の期待値を
$$
\mathbb E[X_1]\mathbb E[X_2]\cdots\mathbb E[X_n]
$$
に分解するには、有限個全体としての相互独立性が必要である。
この命題では、各 $X_i$ が可積分であることを仮定している。
さらに、相互独立性により
$$
\mathbb E\left[\prod_{i=1}^{n}|X_i|\right]
=
\prod_{i=1}^{n}\mathbb E[|X_i|]
$$
が成り立つので、
$$
\prod_{i=1}^{n}X_i
$$
も可積分である。
したがって、左辺
$$
\mathbb E\left[\prod_{i=1}^{n}X_i\right]
$$
は有限な実数として定義される。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とする。
また、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とし、$X$ と $Y$ は独立であるとする。
このとき、
$$
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]=0
$$
が成り立つ。
まず、
$$
\mu_i:=\mathbb E[X],\quad \mu_j:=\mathbb E[Y]
$$
とおく。
$X$ と $Y$ は可積分であるから、
$$
\mu_i,\mu_j\in\mathbb R
$$
である。
また、$X$ と $Y$ は独立で可積分であるから、独立な可積分確率変数の積の期待値の公式より、
$$
XY\text{ は可積分であり、}\quad
\mathbb E[XY]=\mathbb E[X]\mathbb E[Y]
$$
が成り立つ。
したがって、
$$
\mathbb E[XY]=\mu_i\mu_j
$$
である。
ここで、偏差の積を展開すると、
$$
(X-\mu_i)(Y-\mu_j)
=
XY-\mu_jX-\mu_iY+\mu_i\mu_j
$$
である。
$X,Y,XY$ は可積分であり、$\mu_i,\mu_j$ は実数であるから、
$$
(X-\mu_i)(Y-\mu_j)
$$
も可積分である。
よって、期待値の加法性、期待値の定数倍の性質、定数確率変数の期待値より、
$$
\begin{align}
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]
&=
\mathbb E\left[(X-\mu_i)(Y-\mu_j)\right]
&&\because \mu_i=\mathbb E[X],\ \mu_j=\mathbb E[Y] \\
&=
\mathbb E\left[XY-\mu_jX-\mu_iY+\mu_i\mu_j\right]
&&\because \text{分配法則} \\
&=
\mathbb E[XY]-\mathbb E[\mu_jX]-\mathbb E[\mu_iY]+\mathbb E[\mu_i\mu_j]
&&\because \text{期待値の加法性} \\
&=
\mathbb E[XY]-\mu_j\mathbb E[X]-\mu_i\mathbb E[Y]+\mu_i\mu_j
&&\because \text{期待値の定数倍の性質と定数確率変数の期待値} \\
&=
\mathbb E[XY]-\mu_j\mu_i-\mu_i\mu_j+\mu_i\mu_j
&&\because \mu_i=\mathbb E[X],\ \mu_j=\mathbb E[Y] \\
&=
\mathbb E[XY]-\mu_i\mu_j
&&\because -\mu_j\mu_i-\mu_i\mu_j+\mu_i\mu_j=-\mu_i\mu_j \\
&=
\mu_i\mu_j-\mu_i\mu_j
&&\because X\text{ と }Y\text{ は独立なので }\mathbb E[XY]=\mu_i\mu_j \\
&=
0
\end{align}
$$
したがって、
$$
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]=0
$$
が成り立つ。
$$ \Box$$
この命題では、$X$ と $Y$ が可積分であることを仮定している。
独立性により、
$$
\mathbb E[|XY|]=\mathbb E[|X|]\mathbb E[|Y|]<\infty
$$
が成り立つので、$XY$ は可積分である。
したがって、
$$
(X-\mathbb E[X])(Y-\mathbb E[Y])
$$
も可積分であり、その期待値は有限な実数として定義される。
この命題は、独立な確率変数の共分散が $0$ であることを意味する。
すなわち、共分散を
$$
\operatorname{Cov}(X,Y)
:=
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]
$$
で定義すれば、$X$ と $Y$ が独立であるとき、
$$
\operatorname{Cov}(X,Y)=0
$$
が成り立つ。
ただし、逆は一般には成り立たない。つまり、
$$
\operatorname{Cov}(X,Y)=0
$$
であっても、$X$ と $Y$ が独立であるとは限らない。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が確率密度関数
$$
p:\mathbb R\to[0,\infty)
$$
をもつとする。すなわち、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$
\mathbb P(X\in B)=\int_B p(x)\,dx
$$
が成り立つとする。
また、$g:\mathbb R\to\mathbb R$ をボレル可測関数とし、
$$
\int_{-\infty}^{\infty}|g(x)|p(x)\,dx<\infty
$$
が成り立つとする。このとき、$g(X)$ は可積分であり、
$$
\mathbb E[g(X)]
=
\int_{-\infty}^{\infty}g(x)p(x)\,dx
$$
が成り立つ。
$X$ の分布測度を $\mathbb P_X$ とおく。すなわち、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$
\mathbb P_X(B):=\mathbb P(X\in B)
$$
で定める。
仮定より、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$
\mathbb P_X(B)=\int_B p(x)\,dx
$$
が成り立つ。
したがって、$\mathbb P_X$ はルベーグ測度に関して密度 $p$ をもつ。すなわち、任意の非負ボレル可測関数 $h:\mathbb R\to[0,\infty]$ に対して
$$
\int_{\mathbb R}h(x)\,d\mathbb P_X(x)
=
\int_{\mathbb R}h(x)p(x)\,dx
$$
が成り立つ。
-したがって、
$$
\mathbb E[g(X)]
=
\int_{-\infty}^{\infty}g(x)p(x)\,dx
$$
が成り立つ。
$$ \Box$$
$X:\Omega\to\mathbb R$ を実数値確率変数とし、$\mathbb P_X$ を $X$ の分布測度とする。
このとき、任意のボレル可測関数 $g:\mathbb R\to\mathbb R$ について、積分が意味をもつならば
$$
\int_\Omega g(X)\,d\mathbb P
=
\int_{\mathbb R}g(x)\,d\mathbb P_X(x)
$$
が成り立つ。
これは、$g(X)$ を $\Omega$ 上で積分することと、$g$ を $X$ の分布測度 $\mathbb P_X$ に関して $\mathbb R$ 上で積分することが同じである、という意味である。
この命題は、$g(X)$ の期待値を求めるために、$g(X)$ 自体の確率密度関数を求めなくてもよい、ということを述べている。
実際、
$$
\mathbb E[g(X)]
$$
は、$X$ の密度 $p$ を用いて
$$
\int_{-\infty}^{\infty}g(x)p(x)\,dx
$$
として計算できる。
したがって、$g(X)$ の分布を直接求める代わりに、$X$ の値 $x$ に対して $g(x)$ を重み $p(x)$ で平均していると解釈できる。
$X:\Omega\to\mathbb R$ を実数値確率変数とし、$\mathbb P_X$ を $X$ の分布測度とする。
$X$ が確率密度関数 $p$ をもつとは、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$
\mathbb P_X(B)=\int_B p(x)\,dx
$$
が成り立つことを意味する。
このことは、測度として
$$
d\mathbb P_X(x)=p(x)\,dx
$$
と書けるという意味である。
したがって、$\mathbb P_X$ に関する積分は、ルベーグ測度 $dx$ に関する積分に密度 $p(x)$ を掛けた形へ書き換えられる。すなわち、
$$
\int_{\mathbb R}|g(x)|\,d\mathbb P_X(x)
=
\int_{\mathbb R}|g(x)|p(x)\,dx
$$
が成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を独立な実数値確率変数とする。
また、$g,h:\mathbb R\to\mathbb R$ をボレル可測関数とする。
さらに、
$$
\mathbb E[|g(X)|]<\infty,\qquad \mathbb E[|h(Y)|]<\infty
$$
が成り立つとする。このとき、$g(X)h(Y)$ は可積分であり、
$$
\mathbb E[g(X)h(Y)]
=
\mathbb E[g(X)]\,\mathbb E[h(Y)]
$$
が成り立つ。
-以上より、
$$
\mathbb E[g(X)h(Y)]
=
\mathbb E[g(X)]\,\mathbb E[h(Y)]
$$
が成り立つ。
$$ \Box$$
特に、$t\in\mathbb R$ とし、
$$
g(x):=e^{tx},\qquad h(y):=e^{ty}
$$
とおく。
指数関数はボレル可測関数であるから、
$$
g(X)=e^{tX},\qquad h(Y)=e^{tY}
$$
である。
さらに、
$$
\mathbb E[e^{tX}]<\infty,\qquad \mathbb E[e^{tY}]<\infty
$$
が成り立つならば、上の命題より
$$
\mathbb E[e^{tX}e^{tY}]
=
\mathbb E[e^{tX}]\,\mathbb E[e^{tY}]
$$
が成り立つ。
また、
$$
e^{tX}e^{tY}=e^{t(X+Y)}
$$
であるから、
$$
\mathbb E[e^{t(X+Y)}]
=
\mathbb E[e^{tX}]\,\mathbb E[e^{tY}]
$$
も成り立つ。詳しくはモーメント母関数で扱う。