【13個】期待値の代表的な性質をまとめておく(´・ω・`)

この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。

Def.

可積分な実数値確率変数の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が可積分であるとは、
$$ \int_\Omega |X|\,d\mathbb P<\infty $$
が成り立つことをいう。
このとき、$X$ の期待値 $\mathbb E[X]$ を
$$ \mathbb E[X]:=\int_\Omega X\,d\mathbb P $$
で定める。

Prop&Proof

指示関数の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$A\in\mathcal F$ を事象とする。
事象 $A$ の指示関数 $\mathbf 1_A:\Omega\to\{0,1\}$ を
$$ \mathbf 1_A(\omega)= \begin{cases} 1, & \omega\in A,\\ 0, & \omega\notin A \end{cases} $$
で定義する。このとき、$\mathbf 1_A$ は可積分であり、
$$ \mathbb E[\mathbf 1_A]=\mathbb P(A) $$
が成り立つ。

まず、$\mathbf 1_A$ が可測であることを示す。
$\mathbf 1_A$ の値域は $\{0,1\}$ である。任意のボレル集合 $B\in\mathcal B(\mathbb R)$ に対して、
$$ \mathbf 1_A^{-1}(B) $$
は、$B$ が $0$ と $1$ を含むかどうかに応じて、次の $4$ 通りのいずれかになる。
$$ \varnothing,\quad A,\quad A^c,\quad \Omega $$
である。
ここで、$A\in\mathcal F$ であり、$\mathcal F$ は $\sigma$-代数であるから、
$$ A^c\in\mathcal F,\quad \varnothing\in\mathcal F,\quad \Omega\in\mathcal F $$
である。
したがって、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$ \mathbf 1_A^{-1}(B)\in\mathcal F $$
である。よって、$\mathbf 1_A$ は確率変数である。
$ $
次に、$\mathbf 1_A$ が可積分であることを示す。
任意の $\omega\in\Omega$ に対して
$$ |\mathbf 1_A(\omega)|\le1 $$
である。したがって、
$$ |\mathbf 1_A|\le1_\Omega $$
である。
よって、非負ルベーグ積分の単調性より、
$$ \int_\Omega |\mathbf 1_A|\,d\mathbb P \le \int_\Omega 1_\Omega\,d\mathbb P = \mathbb P(\Omega) = 1 <\infty $$
である。したがって、$\mathbf 1_A$ は可積分である。
$ $
最後に、期待値を計算する。
指示関数の積分の定義より、
$$ \int_\Omega \mathbf 1_A\,d\mathbb P = \mathbb P(A) $$
である。
したがって、期待値の定義より、
$$ \mathbb E[\mathbf 1_A] = \int_\Omega \mathbf 1_A\,d\mathbb P = \mathbb P(A) $$
である。

-以上より、
$$ \mathbb E[\mathbf 1_A]=\mathbb P(A) $$
が成り立つ。
$$ \Box$$

直感的な意味

指示関数 $\mathbf 1_A$ は、事象 $A$ が起こったかどうかを数値化した確率変数である。
すなわち、$A$ が起これば $1$、$A$ が起こらなければ $0$ を取る。
したがって、その平均値は
$$ 1\cdot\mathbb P(A)+0\cdot\mathbb P(A^c)=\mathbb P(A) $$
となる。このため、事象の確率は指示関数の期待値として表せるのである。

非負確率変数の期待値の非負性

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to[0,\infty]$ を非負実数値確率変数とする。
$X$ の期待値を
$$ \mathbb E[X]:=\int_\Omega X\,d\mathbb P $$
で定義する。このとき、
$$ \mathbb E[X]\ge0 $$
が成り立つ。

まず、非負単関数の場合を考える。
$\varphi:\Omega\to[0,\infty)$ を非負単関数とする。
すなわち、ある $m\in\mathbb N_{>0}$ に対して、互いに排反な事象 $E_1,\dots,E_m\in\mathcal F$、および非負実数 $a_1,\dots,a_m\ge0$ によって
$$ \varphi=\sum_{j=1}^{m}a_j1_{E_j} $$
と表されるとする。
このとき、非負単関数の積分の定義より、
$$ \int_\Omega \varphi\,d\mathbb P = \sum_{j=1}^{m}a_j\mathbb P(E_j) $$
である。
各 $j\in\{1,\dots,m\}$ について
$$ a_j\ge0,\quad \mathbb P(E_j)\ge0 $$
であるから、
$$ a_j\mathbb P(E_j)\ge0 $$
である。
したがって、非負実数の有限和は非負なので、
$$ \int_\Omega \varphi\,d\mathbb P\ge0 $$
が成り立つ。
$ $
次に、一般の非負可測関数 $X:\Omega\to[0,\infty]$ を考える。
非負可測関数のルベーグ積分は、
$$ \int_\Omega X\,d\mathbb P := \sup\left\{ \int_\Omega \varphi\,d\mathbb P \mid \varphi\ \text{は非負単関数であり}\ 0\le\varphi\le X \right\} $$
で定義される。
$ $
ここで、零関数
$$ 0:\Omega\to[0,\infty),\quad 0(\omega)=0 $$
は非負単関数であり、
$$ 0\le0\le X $$
を満たす。したがって、上の集合は空でない。
また、1. で示したように、任意の非負単関数 $\varphi$ について
$$ \int_\Omega \varphi\,d\mathbb P\ge0 $$
である。
よって、それらの上限も非負である。すなわち、
$$ \int_\Omega X\,d\mathbb P\ge0 $$
である。

-期待値の定義より、
$$ \mathbb E[X]=\int_\Omega X\,d\mathbb P $$
であるから、
$$ \mathbb E[X]\ge0 $$
が成り立つ。
$$ \Box$$

定数確率変数の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$C\in\mathbb R$ とする。
定数関数
$$ Y:\Omega\to\mathbb R,\quad Y(\omega):=C $$
を考える。このとき、$Y$ は可積分であり、
$$ \mathbb E[Y]=C $$
が成り立つ。

まず、$Y$ が可積分であることを示す。
$Y(\omega)=C$ は定数関数であるから可測である。
また、任意の $\omega\in\Omega$ に対して
$$ |Y(\omega)|=|C| $$
である。
さらに、任意の $\omega\in\Omega$ に対して
$$ 1_\Omega(\omega)=1 $$
なので、
$$ |C|1_\Omega(\omega)=|C|\cdot1=|C| $$
である。したがって、$\Omega$ 上の実数値可測関数として
$$ |Y|=|C|1_\Omega $$
が成り立つ。
よって、
$$ \begin{align} \int_\Omega |Y|\,d\mathbb P &= \int_\Omega |C|1_\Omega\,d\mathbb P &&\because |Y|=|C|1_\Omega \\ &= |C|\mathbb P(\Omega) &&\because |C|1_\Omega\text{ は }m=1,\ a_1=|C|,\ E_1=\Omega\text{ の非負単関数である} \\ &= |C| &&\because \mathbb P\text{ は確率測度であるから }\mathbb P(\Omega)=1 \end{align} $$
である。
したがって、
$$ \int_\Omega |Y|\,d\mathbb P=|C|<\infty $$
であるから、$Y$ は可積分である。
$ $
次に、期待値を計算する。
期待値の定義より、
$$ \mathbb E[Y]=\int_\Omega Y\,d\mathbb P $$
である。
また、任意の $\omega\in\Omega$ に対して
$$ Y(\omega)=C=C1_\Omega(\omega) $$
であるから、$\Omega$ 上の実数値可測関数として
$$ Y=C1_\Omega $$
である。
したがって、
$$ \begin{align} \mathbb E[Y] &= \int_\Omega Y\,d\mathbb P &&\because \text{期待値の定義} \\ &= \int_\Omega C1_\Omega\,d\mathbb P &&\because Y=C1_\Omega \\ &= C\mathbb P(\Omega) &&\because C1_\Omega\text{ は定数関数であり、定数関数の積分より }C\int_\Omega 1_\Omega\,d\mathbb P=C\mathbb P(\Omega) \\ &= C &&\because \mathbb P(\Omega)=1 \end{align} $$
である。

-したがって、
$$ \mathbb E[Y]=C $$
が成り立つ。
$$ \Box$$

厳密には、期待値 $\mathbb E[\cdot]$ は確率変数に対して定義される。
したがって、
$$ \mathbb E[C] $$
という記法は、実数 $C$ そのものではなく、定数確率変数
$$ \omega\mapsto C $$
の期待値を意味する略記である。定数確率変数を単に $C$ と書く約束をすれば、
$$ \mathbb E[C]=C $$
である。

期待値の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
このとき、
$$ \mathbb E[\mathbb E[X]]=\mathbb E[X] $$
が成り立つ。実際、$X$ は可積分であるから、
$$ \mathbb E[X]\in\mathbb R $$
である。
そこで、
$$ C:=\mathbb E[X] $$
とおく。このとき、$C$ は実数である。
命題より、定数確率変数 $C$ について
$$ \mathbb E[C]=C $$
が成り立つ。
したがって、
$$ \mathbb E[\mathbb E[X]] = \mathbb E[C] = C = \mathbb E[X] $$
である。
よって、
$$ \mathbb E[\mathbb E[X]]=\mathbb E[X] $$
が成り立つ。
$$ \Box$$
【補足】
繰り返しであるが、$\mathbb E[X]$ は確率変数ではなく、実数である。
そのため、
$$ \mathbb E[\mathbb E[X]] $$
という記法は、厳密には $\mathbb E[X]$ を定数確率変数とみなしたうえで期待値を取っている。

期待値の加法性

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
このとき、$X+Y$ も可積分であり、
$$ \mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y] $$
が成り立つ。

仮定より $X,Y$ は可積分であるから、
$$ \int_\Omega |X|\,d\mathbb P<\infty,\quad \int_\Omega |Y|\,d\mathbb P<\infty $$
である。

まず、$X+Y$ が可積分であることを示す。
任意の $\omega\in\Omega$ に対して、三角不等式より
$$ |X(\omega)+Y(\omega)|\le |X(\omega)|+|Y(\omega)| $$
が成り立つ。したがって、$\Omega$ 上の非負可測関数として
$$ |X+Y|\le |X|+|Y| $$
である。
よって、非負ルベーグ積分の単調性より、
$$ \int_\Omega |X+Y|\,d\mathbb P \le \int_\Omega (|X|+|Y|)\,d\mathbb P $$
である。
また、非負可測関数に対する積分の加法性より、
$$ \int_\Omega (|X|+|Y|)\,d\mathbb P = \int_\Omega |X|\,d\mathbb P + \int_\Omega |Y|\,d\mathbb P $$
である。
よって、
$$ \int_\Omega |X+Y|\,d\mathbb P \le \int_\Omega |X|\,d\mathbb P + \int_\Omega |Y|\,d\mathbb P <\infty $$
である。したがって、$X+Y$ は可積分である。
$ $
次に、期待値を計算する。
期待値の定義より、
$$ \mathbb E[X+Y] = \int_\Omega (X+Y)\,d\mathbb P $$
である。
$X,Y$ は可積分であり、$X+Y$ も可積分であるから、可積分関数に対するルベーグ積分の線形性より、
$$ \int_\Omega (X+Y)\,d\mathbb P = \int_\Omega X\,d\mathbb P + \int_\Omega Y\,d\mathbb P $$
が成り立つ。
したがって、
$$ \begin{align} \mathbb E[X+Y] &= \int_\Omega (X+Y)\,d\mathbb P &&\because \text{期待値の定義} \\ &= \int_\Omega X\,d\mathbb P+\int_\Omega Y\,d\mathbb P &&\because \text{可積分関数に対するルベーグ積分の線形性} \\ &= \mathbb E[X]+\mathbb E[Y] &&\because \text{期待値の定義} \end{align} $$
である。

-以上より、
$$ \mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y] $$
が成り立つ。
$$ \Box$$

独立性は不要である

この命題では、$X$ と $Y$ の独立性は仮定していない。
期待値の加法性
$$ \mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y] $$
は、$X$ と $Y$ が独立でなくても、可積分であれば成り立つ。

期待値の定数倍の性質

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
また、$c\in\mathbb R$ とする。このとき、$cX$ も可積分であり、
$$ \mathbb E[cX]=c\mathbb E[X] $$
が成り立つ。

$X$ は可積分であるから、
$$ \int_\Omega |X|\,d\mathbb P<\infty $$
である。

まず、$cX$ が可積分であることを示す。
任意の $\omega\in\Omega$ に対して、
$$ |cX(\omega)|=|c|\,|X(\omega)| $$
である。したがって、$\Omega$ 上の非負可測関数として
$$ |cX|=|c|\,|X| $$
が成り立つ。よって、非負可測関数に対する積分の定数倍の性質より、
$$ \begin{align} \int_\Omega |cX|\,d\mathbb P &= \int_\Omega |c|\,|X|\,d\mathbb P \\ &= |c|\int_\Omega |X|\,d\mathbb P \end{align} $$
である。ここで、
$$ \int_\Omega |X|\,d\mathbb P<\infty $$
であり、また $|c|<\infty$ であるから、
$$ |c|\int_\Omega |X|\,d\mathbb P<\infty $$
である。
したがって、
$$ \int_\Omega |cX|\,d\mathbb P<\infty $$
である。ゆえに、$cX$ は可積分である。
$ $
次に、期待値を計算する。
期待値の定義より、
$$ \mathbb E[cX]=\int_\Omega cX\,d\mathbb P $$
である。
可積分関数に対するルベーグ積分の定数倍の性質より、
$$ \int_\Omega cX\,d\mathbb P = c\int_\Omega X\,d\mathbb P $$
が成り立つ。
したがって、
$$ \begin{align} \mathbb E[cX] &= \int_\Omega cX\,d\mathbb P &&\because \text{期待値の定義} \\ &= c\int_\Omega X\,d\mathbb P &&\because \text{可積分関数に対するルベーグ積分の定数倍の性質} \\ &= c\mathbb E[X] &&\because \text{期待値の定義} \end{align} $$
である。

-以上より、
$$ \mathbb E[cX]=c\mathbb E[X] $$
が成り立つ。
$$ \Box$$

独立性は不要である

この命題では、確率変数の独立性は関係しない。
期待値の定数倍の性質は、ルベーグ積分の定数倍の性質から従う性質である。

期待値の線形性のまとめ【系】

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
また、$c,d,t\in\mathbb R$ とする。このとき、写像
$$ cX+dY+t:\Omega\to\mathbb R $$
を
$$ (cX+dY+t)(\omega):=cX(\omega)+dY(\omega)+t $$
で定めると、$cX+dY+t$ は可積分な実数値確率変数であり、
$$ \mathbb E[cX+dY+t] = c\mathbb E[X]+d\mathbb E[Y]+t $$
が成り立つ。

$X,Y$ は実数値確率変数であるから、$X,Y$ は可測関数である。
また、可測関数の定数倍、和、定数関数との和は可測であるから、$cX+dY+t$ もまた実数値確率変数である。

まず、$cX+dY+t$ が可積分であることを示す。
$X,Y$ は可積分であるから、
$$ \mathbb E[|X|]<\infty,\qquad \mathbb E[|Y|]<\infty $$
である。
任意の $\omega\in\Omega$ に対して、三角不等式より
$$ |cX(\omega)+dY(\omega)+t| \le |c||X(\omega)|+|d||Y(\omega)|+|t| $$
である。したがって、$\Omega$ 上の非負可測関数として
$$ |cX+dY+t| \le |c||X|+|d||Y|+|t| $$
である。
非負可測関数に対する積分の単調性より、
$$ \int_\Omega |cX+dY+t|\,d\mathbb P \le \int_\Omega \left(|c||X|+|d||Y|+|t|\right)\,d\mathbb P $$
である。
さらに、非負可測関数に対する積分の加法性と定数倍の性質より、
$$ \begin{aligned} \int_\Omega \left(|c||X|+|d||Y|+|t|\right)\,d\mathbb P &= |c|\int_\Omega |X|\,d\mathbb P + |d|\int_\Omega |Y|\,d\mathbb P + \int_\Omega |t|\,d\mathbb P \\ &= |c|\mathbb E[|X|]+|d|\mathbb E[|Y|]+|t| \end{aligned} $$
である。
ここで、
$$ \mathbb E[|X|]<\infty,\qquad \mathbb E[|Y|]<\infty $$
であり、$c,d,t\in\mathbb R$ であるから、
$$ \int_\Omega |cX+dY+t|\,d\mathbb P<\infty $$
である。
よって、$cX+dY+t$ は可積分である。
$ $
次に、期待値を計算する。
定数関数
$$ \Omega\ni\omega\mapsto t\in\mathbb R $$
を単に $t$ と書く。
可積分関数に対する積分の加法性と定数倍の性質より、
$$ \begin{aligned} \mathbb E[cX+dY+t] &= \int_\Omega (cX+dY+t)\,d\mathbb P \\ &= c\int_\Omega X\,d\mathbb P + d\int_\Omega Y\,d\mathbb P + \int_\Omega t\,d\mathbb P \\ &= c\mathbb E[X]+d\mathbb E[Y]+t\mathbb P(\Omega) \\ &= c\mathbb E[X]+d\mathbb E[Y]+t \end{aligned} $$
である。
したがって、
$$ \mathbb E[cX+dY+t] = c\mathbb E[X]+d\mathbb E[Y]+t $$
が成り立つ。
$$ \Box$$

定数 $t$ の扱い

厳密には、$t$ は実数であり、期待値は確率変数に対して定義される。
したがって、
$$ \mathbb E[cX+dY+t] $$
という記法では、実数 $t$ を定数確率変数
$$ \Omega\ni\omega\mapsto t\in\mathbb R $$
とみなしている。
この定数確率変数の期待値は、
$$ \mathbb E[t]=t $$
である。
この同一視は標準的な記法であり、混乱がなければ定数確率変数を単に $t$ と書いてよい。

直前の命題からの導出

期待値の線形性のまとめは、新しい性質というより、直前の期待値の加法性と期待値の定数倍の性質を組み合わせた系である。
実際、$X,Y$ が可積分であるとき、期待値の定数倍の性質より、$cX,dY$ は可積分であり、
$$ \mathbb E[cX]=c\mathbb E[X], \qquad \mathbb E[dY]=d\mathbb E[Y] $$
が成り立つ。
また、定数 $t\in\mathbb R$ を定数確率変数
$$ \Omega\ni\omega\mapsto t\in\mathbb R $$
とみなすと、この定数確率変数は可積分であり、
$$ \mathbb E[t]=t $$
である。
したがって、期待値の加法性を繰り返し用いることで、
$$ \begin{aligned} \mathbb E[cX+dY+t] &= \mathbb E[(cX+dY)+t] \\ &= \mathbb E[cX+dY]+\mathbb E[t] \\ &= \mathbb E[cX]+\mathbb E[dY]+\mathbb E[t] \\ &= c\mathbb E[X]+d\mathbb E[Y]+t \end{aligned} $$
が従う。同様に、$cX,dY,t$ はいずれも可積分であるから、
期待値の加法性に含まれる可積分性の主張を繰り返し用いることで、$cX+dY+t$ も可積分である。
以上より、期待値の線形性のまとめは、期待値の加法性、期待値の定数倍の性質、定数確率変数の期待値から導かれる系である。

独立性は不要である

期待値の線形性には、$X$ と $Y$ の独立性は不要である。
すなわち、$X,Y$ が可積分であれば、$X$ と $Y$ が独立でなくても
$$ \mathbb E[cX+dY+t] = c\mathbb E[X]+d\mathbb E[Y]+t $$
が成り立つ。

期待値の単調性

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
任意の $\omega\in\Omega$ に対して
$$ X(\omega)\le Y(\omega) $$
が成り立つとする。このとき、
$$ \mathbb E[X]\le\mathbb E[Y] $$
が成り立つ。

$X,Y$ は可積分であるから、
$$ \int_\Omega |X|\,d\mathbb P<\infty,\quad \int_\Omega |Y|\,d\mathbb P<\infty $$
である。

まず、$Y-X$ が可積分であることを示す。
任意の $\omega\in\Omega$ に対して、三角不等式より
$$ |Y(\omega)-X(\omega)|\le |Y(\omega)|+|X(\omega)| $$
が成り立つ。したがって、$\Omega$ 上の非負可測関数として
$$ |Y-X|\le |Y|+|X| $$
である。
非負ルベーグ積分の単調性を非負関数に対して用いると、
$$ \int_\Omega |Y-X|\,d\mathbb P \le \int_\Omega (|Y|+|X|)\,d\mathbb P $$
である。
また、非負可測関数に対する積分の加法性より、
$$ \int_\Omega (|Y|+|X|)\,d\mathbb P = \int_\Omega |Y|\,d\mathbb P+\int_\Omega |X|\,d\mathbb P $$
である。
よって、
$$ \int_\Omega |Y-X|\,d\mathbb P \le \int_\Omega |Y|\,d\mathbb P+\int_\Omega |X|\,d\mathbb P <\infty $$
である。したがって、$Y-X$ は可積分である。
$ $
次に、仮定より任意の $\omega\in\Omega$ に対して
$$ X(\omega)\le Y(\omega) $$
であるから、
$$ Y(\omega)-X(\omega)\ge0 $$
が成り立つ。したがって、
$$ Y-X\ge0 $$
である。
非負確率変数の期待値の非負性より、
$$ \mathbb E[Y-X]\ge0 $$
である。
一方、期待値の線形性より、
$$ \begin{align} \mathbb E[Y-X] &= \mathbb E[Y+(-X)] \\ &= \mathbb E[Y]+\mathbb E[-X] &&\because \text{期待値の加法性} \\ &= \mathbb E[Y]-\mathbb E[X] &&\because \text{期待値の定数倍の性質より }\mathbb E[-X]=-\mathbb E[X] \end{align} $$
である。
したがって、
$$ \mathbb E[Y]-\mathbb E[X]\ge0 $$
である。

-ゆえに、
$$ \mathbb E[X]\le\mathbb E[Y] $$
が成り立つ。
$$ \Box$$

共分散による積の期待値の表示

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を実数値確率変数とする。
$X,Y,XY$ が可積分であるとする。すなわち、
$$ \mathbb E[|X|]<\infty,\quad \mathbb E[|Y|]<\infty,\quad \mathbb E[|XY|]<\infty $$
が成り立つとする。
共分散を
$$ \operatorname{Cov}(X,Y) := \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right] $$
で定義する。このとき、
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y) $$
が成り立つ。

まず、$X,Y,XY$ が可積分であるから、
$$ \mathbb E[X],\quad \mathbb E[Y],\quad \mathbb E[XY] $$
は有限な実数として定義される。
ここで、
$$ \mu_X:=\mathbb E[X],\quad \mu_Y:=\mathbb E[Y] $$
とおく。このとき、$\mu_X,\mu_Y$ は実数である。
まず、
$$ (X-\mu_X)(Y-\mu_Y) = XY-\mu_XY-\mu_YX+\mu_X\mu_Y $$
である。
また、$X,Y,XY$ は可積分であり、$\mu_X,\mu_Y$ は実数であるから、
$$ XY-\mu_XY-\mu_YX+\mu_X\mu_Y $$
も可積分である。
したがって、期待値の加法性、定数倍の性質、定数確率変数の期待値より、
$$ \begin{align} \operatorname{Cov}(X,Y) &= \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right] &&\because \text{共分散の定義} \\ &= \mathbb E\left[(X-\mu_X)(Y-\mu_Y)\right] &&\because \mu_X=\mathbb E[X],\ \mu_Y=\mathbb E[Y] \\ &= \mathbb E\left[XY-\mu_XY-\mu_YX+\mu_X\mu_Y\right] &&\because \text{積を展開した} \\ &= \mathbb E[XY]-\mathbb E[\mu_XY]-\mathbb E[\mu_YX]+\mathbb E[\mu_X\mu_Y] &&\because \text{期待値の加法性} \\ &= \mathbb E[XY]-\mu_X\mathbb E[Y]-\mu_Y\mathbb E[X]+\mu_X\mu_Y &&\because \text{期待値の定数倍の性質と定数確率変数の期待値} \\ &= \mathbb E[XY]-\mu_X\mu_Y-\mu_Y\mu_X+\mu_X\mu_Y &&\because \mu_X=\mathbb E[X],\ \mu_Y=\mathbb E[Y] \\ &= \mathbb E[XY]-\mu_X\mu_Y &&\because -\mu_X\mu_Y-\mu_Y\mu_X+\mu_X\mu_Y=-\mu_X\mu_Y \\ &= \mathbb E[XY]-\mathbb E[X]\mathbb E[Y] &&\because \mu_X=\mathbb E[X],\ \mu_Y=\mathbb E[Y] \end{align} $$
よって、
$$ \operatorname{Cov}(X,Y)=\mathbb E[XY]-\mathbb E[X]\mathbb E[Y] $$
である。
したがって、両辺に $\mathbb E[X]\mathbb E[Y]$ を加えると、
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y) $$
を得る。
以上より、
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y) $$
が成り立つ。
$$ \Box$$

可積分性の仮定について

この命題では、$X,Y,XY$ が可積分であることを仮定している。
これは、
$$ \mathbb E[X],\quad \mathbb E[Y],\quad \mathbb E[XY],\quad \operatorname{Cov}(X,Y) $$
をすべて有限な実数として扱うためである。
特に、$X,Y\in L^2$、すなわち
$$ \mathbb E[X^2]<\infty,\quad \mathbb E[Y^2]<\infty $$
を仮定すれば、$X,Y,XY$ は可積分になる。
したがって、共分散を扱う多くの文脈では、$X,Y$ が二乗可積分であることを仮定する。

独立性は不要である

この命題では、$X$ と $Y$ の独立性は仮定していない。
等式
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y]+\operatorname{Cov}(X,Y) $$
は、共分散の定義を変形した恒等式である。
独立性が必要になるのは、一般に
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y] $$
を示したい場合である。実際、独立で可積分な確率変数に対しては
$$ \operatorname{Cov}(X,Y)=0 $$
となる。

独立な確率変数の積の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とする。
さらに、$X$ と $Y$ は独立であるとする。このとき、$XY$ は可積分であり、
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y] $$
が成り立つ。

$X$ と $Y$ の分布測度をそれぞれ
$$ \mathbb P_X,\quad \mathbb P_Y $$
と書く。また、$(X,Y)$ の同時分布測度を
$$ \mathbb P_{(X,Y)} $$
と書く。すなわち、任意の $B\in\mathcal B(\mathbb R^2)$ に対して
$$ \mathbb P_{(X,Y)}(B):=\mathbb P((X,Y)\in B) $$
である。
$X$ と $Y$ は独立であるから、同時分布測度は周辺分布測度の直積測度に等しい。すなわち、
$$ \mathbb P_{(X,Y)}=\mathbb P_X\otimes\mathbb P_Y $$
が成り立つ。

まず、$XY$ が可積分であることを示す。
期待値の分布測度による表示より、
$$ \mathbb E[|XY|] = \int_{\mathbb R^2}|xy|\,d\mathbb P_{(X,Y)}(x,y) $$
である。独立性より $\mathbb P_{(X,Y)}=\mathbb P_X\otimes\mathbb P_Y$ であるから、
$$ \mathbb E[|XY|] = \int_{\mathbb R^2}|xy|\,d(\mathbb P_X\otimes\mathbb P_Y)(x,y) $$
である。
ここで、任意の $x,y\in\mathbb R$ に対して
$$ |xy|=|x||y| $$
である。したがって、$\mathrm{Tonelli}$の定理より、
$$ \begin{align} \int_{\mathbb R^2}|xy|\,d(\mathbb P_X\otimes\mathbb P_Y)(x,y) &= \int_{\mathbb R}\left(\int_{\mathbb R}|x||y|\,d\mathbb P_Y(y)\right)d\mathbb P_X(x) \\ &= \int_{\mathbb R}\left(|x|\int_{\mathbb R}|y|\,d\mathbb P_Y(y)\right)d\mathbb P_X(x) \\ &= \left(\int_{\mathbb R}|x|\,d\mathbb P_X(x)\right) \left(\int_{\mathbb R}|y|\,d\mathbb P_Y(y)\right) \end{align} $$
である。また、$X,Y$ は可積分であるから、
$$ \int_{\mathbb R}|x|\,d\mathbb P_X(x)=\mathbb E[|X|]<\infty $$
かつ
$$ \int_{\mathbb R}|y|\,d\mathbb P_Y(y)=\mathbb E[|Y|]<\infty $$
である。
したがって、
$$ \mathbb E[|XY|] = \mathbb E[|X|]\mathbb E[|Y|] <\infty $$
である。よって、$XY$ は可積分である。
$ $
次に、$\mathbb E[XY]$ を計算する。
期待値の分布測度による表示より、
$$ \mathbb E[XY] = \int_{\mathbb R^2}xy\,d\mathbb P_{(X,Y)}(x,y) $$
である。独立性より $\mathbb P_{(X,Y)}=\mathbb P_X\otimes\mathbb P_Y$ であるから、
$$ \mathbb E[XY] = \int_{\mathbb R^2}xy\,d(\mathbb P_X\otimes\mathbb P_Y)(x,y) $$
である。
すでに $XY$ が可積分であることを示したので、$\mathrm{Fubini}$の定理を適用できる。したがって、
$$ \begin{align} \mathbb E[XY] &= \int_{\mathbb R}\left(\int_{\mathbb R}xy\,d\mathbb P_Y(y)\right)d\mathbb P_X(x) \\ &= \int_{\mathbb R}\left(x\int_{\mathbb R}y\,d\mathbb P_Y(y)\right)d\mathbb P_X(x) \\ &= \left(\int_{\mathbb R}x\,d\mathbb P_X(x)\right) \left(\int_{\mathbb R}y\,d\mathbb P_Y(y)\right) \end{align} $$
である。ここで、期待値の分布測度による表示より、
$$ \int_{\mathbb R}x\,d\mathbb P_X(x)=\mathbb E[X] $$
かつ
$$ \int_{\mathbb R}y\,d\mathbb P_Y(y)=\mathbb E[Y] $$
である。

-したがって、
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y] $$
が成り立つ。
$$ \Box$$

この命題の逆は一般には成り立たない。すなわち、
$$ \mathbb E[XY]=\mathbb E[X]\mathbb E[Y] $$
が成り立っても、そこから $X$ と $Y$ が独立であるとは限らない。

$\mathrm{Tonelli}$ の定理

$\mathrm{Tonelli}$ の定理は、非負可測関数に対して、直積測度上の積分と反復積分を同一視できることを保証する定理である。
$(S,\mathcal A,\mu)$ と $(T,\mathcal B,\nu)$ を $\sigma$ 有限測度空間とする。
また、非負 $\mathcal A\otimes\mathcal B$ 可測関数
$$ f:S\times T\to[0,\infty] $$
を考える。このとき、関数
$$ s\mapsto\int_T f(s,t)\,d\nu(t), \qquad t\mapsto\int_S f(s,t)\,d\mu(s) $$
はそれぞれ非負可測関数であり、
$$ \int_{S\times T} f(s,t)\,d(\mu\otimes\nu)(s,t) = \int_S\left(\int_T f(s,t)\,d\nu(t)\right)d\mu(s) = \int_T\left(\int_S f(s,t)\,d\mu(s)\right)d\nu(t) $$
が成り立つ。
ここで重要なのは、$f\ge0$ であるため、積分値が $+\infty$ になってもよいという点である。
したがって、$\mathrm{Tonelli}$ の定理は、非負関数について
$$ \text{直積上でまとめて積分しても、片方ずつ順に積分しても同じである} $$
ということを保証する定理である。

$\mathrm{Fubini}$ の定理

$\mathrm{Fubini}$ の定理は、可積分な関数に対して、積分の順序を交換してよいことを保証する定理である。
$(S,\mathcal A,\mu)$ と $(T,\mathcal B,\nu)$ を $\sigma$ 有限測度空間とする。
また、$\mathcal A\otimes\mathcal B$ 可測関数
$$ f:S\times T\to\mathbb R $$
が可積分、すなわち
$$ \int_{S\times T}|f(s,t)|\,d(\mu\otimes\nu)(s,t)<\infty $$
を満たすとする。
このとき、$\mu$ ほとんどすべての $s\in S$ に対して
$$ \int_T |f(s,t)|\,d\nu(t)<\infty $$
であり、$\nu$ ほとんどすべての $t\in T$ に対して
$$ \int_S |f(s,t)|\,d\mu(s)<\infty $$
である。
さらに、
$$ s\mapsto\int_T f(s,t)\,d\nu(t), \qquad t\mapsto\int_S f(s,t)\,d\mu(s) $$
はそれぞれ可積分関数として定まり、
$$ \int_{S\times T} f(s,t)\,d(\mu\otimes\nu)(s,t) = \int_S\left(\int_T f(s,t)\,d\nu(t)\right)d\mu(s) = \int_T\left(\int_S f(s,t)\,d\mu(s)\right)d\nu(t) $$
が成り立つ。
ここで重要なのは、$f$ が正負の値を取りうる場合でも、絶対値の積分が有限であれば、積分順序を交換してよいという点である。
したがって、$\mathrm{Fubini}$ の定理は、
$$ \text{可積分性が保証されているなら、二重積分をどちらの順番で計算しても同じである} $$
ということを保証する定理である。

$\mathrm{Tonelli}$ の定理と $\mathrm{Fubini}$ の定理の使い分け

$\mathrm{Tonelli}$ の定理は、非負可測関数に使う。
すなわち、
$$ f\ge0 $$
であるとき、積分値が $+\infty$ になりうる場合も含めて、直積上の積分と反復積分を結びつける。
$ $
一方、$\mathrm{Fubini}$ の定理は、可積分関数に使う。
すなわち、
$$ \int_{S\times T}|f|\,d(\mu\otimes\nu)<\infty $$
が分かっているとき、正負の値を取る関数についても、積分順序の交換を正当化する。
したがって、実際の証明では次のように使い分けることが多い。
$ $

まず、非負関数 $|f|$ に $\mathrm{Tonelli}$ の定理を適用して
$$ \int_{S\times T}|f|\,d(\mu\otimes\nu)<\infty $$
を確認する。
$ $
次に、$f$ が可積分であることが分かったので、$\mathrm{Fubini}$ の定理を $f$ に適用し、積分順序を交換する。
この流れにより、符号をもつ関数についても安全に反復積分を扱えるのである。

相互独立な確率変数の積の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$n\in\mathbb N_{>0}$ とする。
$X_1,\dots,X_n:\Omega\to\mathbb R$ を可積分な実数値確率変数とし、$X_1,\dots,X_n$ は相互に独立であるとする。
このとき、
$$ \prod_{i=1}^{n}X_i $$
は可積分であり、
$$ \mathbb E\left[\prod_{i=1}^{n}X_i\right] = \prod_{i=1}^{n}\mathbb E[X_i] $$
が成り立つ。すなわち、
$$ \mathbb E[X_1X_2\cdots X_n] = \mathbb E[X_1]\mathbb E[X_2]\cdots\mathbb E[X_n] $$
が成り立つ。

$n$ に関する数学的帰納法で示す。

$n=1$ の場合を示す。
このとき、
$$ \mathbb E\left[\prod_{i=1}^{1}X_i\right] = \mathbb E[X_1] = \prod_{i=1}^{1}\mathbb E[X_i] $$
である。
したがって、$n=1$ の場合は成り立つ。
$ $
帰納法の仮定をおく。
ある $k\in\mathbb N_{>0}$ に対して、任意の可積分な実数値確率変数 $X_1,\dots,X_k$ が相互に独立であるならば、
$$ \prod_{i=1}^{k}X_i $$
は可積分であり、
$$ \mathbb E\left[\prod_{i=1}^{k}X_i\right] = \prod_{i=1}^{k}\mathbb E[X_i] $$
が成り立つと仮定する。
$ $
$n=k+1$ の場合を示す。
$X_1,\dots,X_k,X_{k+1}$ を可積分な実数値確率変数とし、これらが相互に独立であるとする。
ここで、
$$ Z:=\prod_{i=1}^{k}X_i $$
とおく。
帰納法の仮定より、$Z$ は可積分であり、
$$ \mathbb E[Z] = \prod_{i=1}^{k}\mathbb E[X_i] $$
が成り立つ。
また、$X_1,\dots,X_k,X_{k+1}$ は相互に独立であるから、$X_1,\dots,X_k$ から作られる確率変数
$$ Z=\prod_{i=1}^{k}X_i $$
と $X_{k+1}$ は独立である(補足を参照)。
したがって、$2$ つの独立な可積分確率変数の積の期待値の公式より、$ZX_{k+1}$ は可積分であり、
$$ \mathbb E[ZX_{k+1}] = \mathbb E[Z]\mathbb E[X_{k+1}] $$
が成り立つ。
ここで、
$$ ZX_{k+1} = \left(\prod_{i=1}^{k}X_i\right)X_{k+1} = \prod_{i=1}^{k+1}X_i $$
である。
よって、
$$ \begin{align} \mathbb E\left[\prod_{i=1}^{k+1}X_i\right] &= \mathbb E[ZX_{k+1}] &&\because Z=\prod_{i=1}^{k}X_i \\ &= \mathbb E[Z]\mathbb E[X_{k+1}] &&\because Z\text{ と }X_{k+1}\text{ は独立である} \\ &= \left(\prod_{i=1}^{k}\mathbb E[X_i]\right)\mathbb E[X_{k+1}] &&\because \text{帰納法の仮定} \\ &= \prod_{i=1}^{k+1}\mathbb E[X_i] \end{align} $$
である。
したがって、$n=k+1$ の場合も成り立つ。

-以上より、数学的帰納法により、任意の $n\in\mathbb N_{>0}$ について
$$ \mathbb E\left[\prod_{i=1}^{n}X_i\right] = \prod_{i=1}^{n}\mathbb E[X_i] $$
が成り立つ。
$$ \Box$$

独立性は可測関数で保たれる

以下では、次の標準的事実を用いる。
$X_1,\dots,X_n$ が相互に独立な実数値確率変数であるとき、互いに交わらない添字集合から生成される $\sigma$ 代数は独立である。
特に、$1\le m< n$ に対して、
$$ \sigma(X_1,\dots,X_m) \quad\text{と}\quad \sigma(X_{m+1}) $$
は独立である。
この事実を用いれば、任意のボレル可測関数 $h:\mathbb R^m\to\mathbb R$ に対して、
$$ h(X_1,\dots,X_m) $$
と $X_{m+1}$ は独立である。
$ $
【命題】
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X_1,\dots,X_n:\Omega\to\mathbb R$ を相互に独立な実数値確率変数とする。
また、$1\le m< n$ とし、$h:\mathbb R^m\to\mathbb R$ をボレル可測関数とする。
このとき、
$$ h(X_1,\dots,X_m) $$
と
$$ X_{m+1} $$
は独立である。
特に、
$$ h(x_1,\dots,x_m)=x_1x_2\cdots x_m $$
とおけば、
$$ \prod_{i=1}^{m}X_i $$
と $X_{m+1}$ は独立である。
$ $
【証明】
$X_1,\dots,X_n$ が相互に独立であるから、$\sigma(X_1,\dots,X_m)$ と $\sigma(X_{m+1})$ は独立である。
ここで、$h$ はボレル可測であり、$(X_1,\dots,X_m)$ は $\mathbb R^m$ 値確率変数であるから、
$$ h(X_1,\dots,X_m) $$
は実数値確率変数である。
さらに、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$ \{h(X_1,\dots,X_m)\in B\} = \{(X_1,\dots,X_m)\in h^{-1}(B)\} $$
である。
$h$ はボレル可測であるから、
$$ h^{-1}(B)\in\mathcal B(\mathbb R^m) $$
である。したがって、
$$ \{h(X_1,\dots,X_m)\in B\}\in\sigma(X_1,\dots,X_m) $$
である。
一方、任意の $C\in\mathcal B(\mathbb R)$ に対して
$$ \{X_{m+1}\in C\}\in\sigma(X_{m+1}) $$
である。
よって、$\sigma(X_1,\dots,X_m)$ と $\sigma(X_{m+1})$ の独立性より、
$$ \begin{align} &\mathbb P\left( \{h(X_1,\dots,X_m)\in B\} \cap \{X_{m+1}\in C\} \right)\\ &= \mathbb P\left(h(X_1,\dots,X_m)\in B\right) \mathbb P\left(X_{m+1}\in C\right) \end{align} $$
が成り立つ。
したがって、$h(X_1,\dots,X_m)$ と $X_{m+1}$ は独立である。
特に、
$$ h:\mathbb R^m\to\mathbb R,\qquad h(x_1,\dots,x_m)=x_1x_2\cdots x_m $$
はボレル可測関数であるから、
$$ \prod_{i=1}^{m}X_i = h(X_1,\dots,X_m) $$
と $X_{m+1}$ は独立である。
$$ \Box$$

$n=2$ の場合

$n=2$ の場合、この命題は
$$ \mathbb E[X_1X_2]=\mathbb E[X_1]\mathbb E[X_2] $$
である。
これは、$2$ つの独立な可積分確率変数の積の期待値の公式そのものである。
この命題は、その $2$ 変数の場合を有限個に拡張したものである。

この命題では、$X_1,\dots,X_n$ が相互に独立であることを仮定している。
単に $2$ つずつ独立であること、すなわち任意の $i\neq j$ について $X_i$ と $X_j$ が独立であることだけでは、一般には十分ではない。
確率変数の積
$$ X_1X_2\cdots X_n $$
の期待値を
$$ \mathbb E[X_1]\mathbb E[X_2]\cdots\mathbb E[X_n] $$
に分解するには、有限個全体としての相互独立性が必要である。

可積分性について

この命題では、各 $X_i$ が可積分であることを仮定している。
さらに、相互独立性により
$$ \mathbb E\left[\prod_{i=1}^{n}|X_i|\right] = \prod_{i=1}^{n}\mathbb E[|X_i|] $$
が成り立つので、
$$ \prod_{i=1}^{n}X_i $$
も可積分である。
したがって、左辺
$$ \mathbb E\left[\prod_{i=1}^{n}X_i\right] $$
は有限な実数として定義される。

独立な確率変数の偏差積の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とする。
また、$X,Y:\Omega\to\mathbb R$ を可積分な実数値確率変数とし、$X$ と $Y$ は独立であるとする。
このとき、
$$ \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]=0 $$
が成り立つ。

まず、
$$ \mu_i:=\mathbb E[X],\quad \mu_j:=\mathbb E[Y] $$
とおく。
$X$ と $Y$ は可積分であるから、
$$ \mu_i,\mu_j\in\mathbb R $$
である。
また、$X$ と $Y$ は独立で可積分であるから、独立な可積分確率変数の積の期待値の公式より、
$$ XY\text{ は可積分であり、}\quad \mathbb E[XY]=\mathbb E[X]\mathbb E[Y] $$
が成り立つ。
したがって、
$$ \mathbb E[XY]=\mu_i\mu_j $$
である。
ここで、偏差の積を展開すると、
$$ (X-\mu_i)(Y-\mu_j) = XY-\mu_jX-\mu_iY+\mu_i\mu_j $$
である。
$X,Y,XY$ は可積分であり、$\mu_i,\mu_j$ は実数であるから、
$$ (X-\mu_i)(Y-\mu_j) $$
も可積分である。
よって、期待値の加法性、期待値の定数倍の性質、定数確率変数の期待値より、
$$ \begin{align} \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right] &= \mathbb E\left[(X-\mu_i)(Y-\mu_j)\right] &&\because \mu_i=\mathbb E[X],\ \mu_j=\mathbb E[Y] \\ &= \mathbb E\left[XY-\mu_jX-\mu_iY+\mu_i\mu_j\right] &&\because \text{分配法則} \\ &= \mathbb E[XY]-\mathbb E[\mu_jX]-\mathbb E[\mu_iY]+\mathbb E[\mu_i\mu_j] &&\because \text{期待値の加法性} \\ &= \mathbb E[XY]-\mu_j\mathbb E[X]-\mu_i\mathbb E[Y]+\mu_i\mu_j &&\because \text{期待値の定数倍の性質と定数確率変数の期待値} \\ &= \mathbb E[XY]-\mu_j\mu_i-\mu_i\mu_j+\mu_i\mu_j &&\because \mu_i=\mathbb E[X],\ \mu_j=\mathbb E[Y] \\ &= \mathbb E[XY]-\mu_i\mu_j &&\because -\mu_j\mu_i-\mu_i\mu_j+\mu_i\mu_j=-\mu_i\mu_j \\ &= \mu_i\mu_j-\mu_i\mu_j &&\because X\text{ と }Y\text{ は独立なので }\mathbb E[XY]=\mu_i\mu_j \\ &= 0 \end{align} $$
したがって、
$$ \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]=0 $$
が成り立つ。
$$ \Box$$

可積分性について

この命題では、$X$ と $Y$ が可積分であることを仮定している。
独立性により、
$$ \mathbb E[|XY|]=\mathbb E[|X|]\mathbb E[|Y|]<\infty $$
が成り立つので、$XY$ は可積分である。
したがって、
$$ (X-\mathbb E[X])(Y-\mathbb E[Y]) $$
も可積分であり、その期待値は有限な実数として定義される。

独立性と共分散

この命題は、独立な確率変数の共分散が $0$ であることを意味する。
すなわち、共分散を
$$ \operatorname{Cov}(X,Y) := \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right] $$
で定義すれば、$X$ と $Y$ が独立であるとき、
$$ \operatorname{Cov}(X,Y)=0 $$
が成り立つ。
ただし、逆は一般には成り立たない。つまり、
$$ \operatorname{Cov}(X,Y)=0 $$
であっても、$X$ と $Y$ が独立であるとは限らない。

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が確率密度関数
$$ p:\mathbb R\to[0,\infty) $$
をもつとする。すなわち、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$ \mathbb P(X\in B)=\int_B p(x)\,dx $$
が成り立つとする。
また、$g:\mathbb R\to\mathbb R$ をボレル可測関数とし、
$$ \int_{-\infty}^{\infty}|g(x)|p(x)\,dx<\infty $$
が成り立つとする。このとき、$g(X)$ は可積分であり、
$$ \mathbb E[g(X)] = \int_{-\infty}^{\infty}g(x)p(x)\,dx $$
が成り立つ。

$X$ の分布測度を $\mathbb P_X$ とおく。すなわち、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$ \mathbb P_X(B):=\mathbb P(X\in B) $$
で定める。
仮定より、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$ \mathbb P_X(B)=\int_B p(x)\,dx $$
が成り立つ。
したがって、$\mathbb P_X$ はルベーグ測度に関して密度 $p$ をもつ。すなわち、任意の非負ボレル可測関数 $h:\mathbb R\to[0,\infty]$ に対して
$$ \int_{\mathbb R}h(x)\,d\mathbb P_X(x) = \int_{\mathbb R}h(x)p(x)\,dx $$
が成り立つ。

まず、$g(X)$ が可積分であることを示す。
分布測度による積分表示より、
$$ \begin{align} \int_\Omega |g(X)|\,d\mathbb P &= \int_{\mathbb R}|g(x)|\,d\mathbb P_X(x) &&\because \text{分布測度による積分表示} \\ &= \int_{\mathbb R}|g(x)|p(x)\,dx &&\because \mathbb P_X\text{ は密度 }p\text{ をもつ} \\ &< \infty &&\because \text{仮定より }\int_{\mathbb R}|g(x)|p(x)\,dx<\infty \end{align} $$
である。
したがって、
$$ \int_\Omega |g(X)|\,d\mathbb P<\infty $$
であるから、$g(X)$ は可積分である。
$ $
次に、期待値を計算する。
期待値の定義より、
$$ \mathbb E[g(X)] = \int_\Omega g(X)\,d\mathbb P $$
である。
また、$g(X)$ は可積分であるから、分布測度による積分表示を $g$ に適用できる。よって、
$$ \begin{align} \mathbb E[g(X)] &= \int_\Omega g(X)\,d\mathbb P &&\because \text{期待値の定義} \\ &= \int_{\mathbb R}g(x)\,d\mathbb P_X(x) &&\because \text{分布測度による積分表示} \\ &= \int_{\mathbb R}g(x)p(x)\,dx &&\because \mathbb P_X\text{ は密度 }p\text{ をもつ} \\ &= \int_{-\infty}^{\infty}g(x)p(x)\,dx \end{align} $$
である。

-したがって、
$$ \mathbb E[g(X)] = \int_{-\infty}^{\infty}g(x)p(x)\,dx $$
が成り立つ。
$$ \Box$$

分布測度による積分表示

$X:\Omega\to\mathbb R$ を実数値確率変数とし、$\mathbb P_X$ を $X$ の分布測度とする。
このとき、任意のボレル可測関数 $g:\mathbb R\to\mathbb R$ について、積分が意味をもつならば
$$ \int_\Omega g(X)\,d\mathbb P = \int_{\mathbb R}g(x)\,d\mathbb P_X(x) $$
が成り立つ。
これは、$g(X)$ を $\Omega$ 上で積分することと、$g$ を $X$ の分布測度 $\mathbb P_X$ に関して $\mathbb R$ 上で積分することが同じである、という意味である。

この公式の意味

この命題は、$g(X)$ の期待値を求めるために、$g(X)$ 自体の確率密度関数を求めなくてもよい、ということを述べている。
実際、
$$ \mathbb E[g(X)] $$
は、$X$ の密度 $p$ を用いて
$$ \int_{-\infty}^{\infty}g(x)p(x)\,dx $$
として計算できる。
したがって、$g(X)$ の分布を直接求める代わりに、$X$ の値 $x$ に対して $g(x)$ を重み $p(x)$ で平均していると解釈できる。

密度関数をもつ場合の積分の書き換え

$X:\Omega\to\mathbb R$ を実数値確率変数とし、$\mathbb P_X$ を $X$ の分布測度とする。
$X$ が確率密度関数 $p$ をもつとは、任意の $B\in\mathcal B(\mathbb R)$ に対して
$$ \mathbb P_X(B)=\int_B p(x)\,dx $$
が成り立つことを意味する。
このことは、測度として
$$ d\mathbb P_X(x)=p(x)\,dx $$
と書けるという意味である。
したがって、$\mathbb P_X$ に関する積分は、ルベーグ測度 $dx$ に関する積分に密度 $p(x)$ を掛けた形へ書き換えられる。すなわち、
$$ \int_{\mathbb R}|g(x)|\,d\mathbb P_X(x) = \int_{\mathbb R}|g(x)|p(x)\,dx $$
が成り立つ。

独立な確率変数の関数の積の期待値

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を独立な実数値確率変数とする。
また、$g,h:\mathbb R\to\mathbb R$ をボレル可測関数とする。
さらに、
$$ \mathbb E[|g(X)|]<\infty,\qquad \mathbb E[|h(Y)|]<\infty $$
が成り立つとする。このとき、$g(X)h(Y)$ は可積分であり、
$$ \mathbb E[g(X)h(Y)] = \mathbb E[g(X)]\,\mathbb E[h(Y)] $$
が成り立つ。

まず、$g(X)$ と $h(Y)$ が確率変数であることを確認する。
$X,Y$ は実数値確率変数であり、$g,h$ はボレル可測関数であるから、合成関数
$$ g(X):=g\circ X,\qquad h(Y):=h\circ Y $$
は実数値確率変数である。
$ $
次に、$g(X)$ と $h(Y)$ が独立であることを示す。
任意の $B,C\in\mathcal B(\mathbb R)$ をとる。このとき、
$$ \{\,\omega\in\Omega:g(X(\omega))\in B\,\} = \{\,\omega\in\Omega:X(\omega)\in g^{-1}(B)\,\} $$
である。
また、$g$ はボレル可測であるから、
$$ g^{-1}(B)\in\mathcal B(\mathbb R) $$
である。同様に、
$$ h^{-1}(C)\in\mathcal B(\mathbb R) $$
である。
したがって、$X$ と $Y$ の独立性より、
$$ \begin{align} \mathbb P(g(X)\in B,\ h(Y)\in C) &= \mathbb P(X\in g^{-1}(B),\ Y\in h^{-1}(C)) &&\because \text{逆像の定義} \\ &= \mathbb P(X\in g^{-1}(B))\,\mathbb P(Y\in h^{-1}(C)) &&\because X\text{ と }Y\text{ は独立である} \\ &= \mathbb P(g(X)\in B)\,\mathbb P(h(Y)\in C) &&\because \text{逆像の定義} \end{align} $$
である。ゆえに、$g(X)$ と $h(Y)$ は独立である。
$ $
ここで、仮定より
$$ \mathbb E[|g(X)|]<\infty,\qquad \mathbb E[|h(Y)|]<\infty $$
であるから、$g(X)$ と $h(Y)$ は可積分である。
さらに、$g(X)$ と $h(Y)$ は独立であるから、独立な可積分確率変数の積の期待値の公式より、
$$ g(X)h(Y)\text{ は可積分であり、} $$
かつ
$$ \mathbb E[g(X)h(Y)] = \mathbb E[g(X)]\,\mathbb E[h(Y)] $$
が成り立つ。

-以上より、
$$ \mathbb E[g(X)h(Y)] = \mathbb E[g(X)]\,\mathbb E[h(Y)] $$
が成り立つ。
$$ \Box$$

指数関数の場合

特に、$t\in\mathbb R$ とし、
$$ g(x):=e^{tx},\qquad h(y):=e^{ty} $$
とおく。
指数関数はボレル可測関数であるから、
$$ g(X)=e^{tX},\qquad h(Y)=e^{tY} $$
である。
さらに、
$$ \mathbb E[e^{tX}]<\infty,\qquad \mathbb E[e^{tY}]<\infty $$
が成り立つならば、上の命題より
$$ \mathbb E[e^{tX}e^{tY}] = \mathbb E[e^{tX}]\,\mathbb E[e^{tY}] $$
が成り立つ。
また、
$$ e^{tX}e^{tY}=e^{t(X+Y)} $$
であるから、
$$ \mathbb E[e^{t(X+Y)}] = \mathbb E[e^{tX}]\,\mathbb E[e^{tY}] $$
も成り立つ。詳しくはモーメント母関数で扱う。

投稿日：15日前

更新日：11日前

数学の力で現場を変えるアルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

Kagura

4751

■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。

他の人のコメント

コメントはありません。

読み込み中

Kagura

【13個】期待値の代表的な性質をまとめておく(´・ω・`)