【9個】分散の代表的な性質をまとめておく |ω・`)

この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。

Def.

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が二乗可積分であるとは、
$$ \mathbb E[X^2]<\infty $$
が成り立つことをいう。

分散

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
このとき、$X$ の分散 $\mathbb V(X)$ を
$$ \mathbb V(X):=\mathbb E\left[(X-\mathbb E[X])^2\right] $$
で定義する。

同じ量を
$$ \operatorname{Var}(X) $$
と書くこともある。

二乗可積分性を仮定する理由

分散は
$$ \mathbb E\left[(X-\mathbb E[X])^2\right] $$
として定義されるため、まず $\mathbb E[X]$ が有限な実数として存在し、さらに $(X-\mathbb E[X])^2$ の期待値が有限である必要がある。
$X$ が二乗可積分、すなわち
$$ \mathbb E[X^2]<\infty $$
を満たせば、$X$ は可積分である。すなわち、
$$ \mathbb E[|X|]<\infty $$
が成り立つ(証明は後述)。さらに、
$$ (X-\mathbb E[X])^2 $$
も可積分になるので、
$$ \mathbb V(X)<\infty $$
が保証される。

標準偏差

$X$ を二乗可積分な実数値確率変数とする。
$X$ の標準偏差 $\sigma_X$ を
$$ \sigma_X:=\sqrt{\mathbb V(X)} $$
で定義する。
分散は常に非負であるため、
$$ \mathbb V(X)\ge0 $$
であり、したがって $\sqrt{\mathbb V(X)}$ は非負実数として定まる。
定義より、
$$ \mathbb V(X)=\sigma_X^2 $$
が成り立つ。
$ $
分散は偏差の二乗の期待値なので、もとの確率変数 $X$ の単位を二乗した単位をもつ。
一方、標準偏差は分散の平方根であるため、$X$ と同じ単位でばらつきを表す量である。

Prop&Proof

二乗可積分なら可積分である

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が二乗可積分であるとする。すなわち、
$$ \mathbb E[X^2]<\infty $$
が成り立つとする。
このとき、$X$ は可積分である。すなわち、
$$ \mathbb E[|X|]<\infty $$
が成り立つ。

$X$ は実数値確率変数であるから、
$$ X^2=|X|^2 $$
である。したがって、仮定より
$$ \int_\Omega |X|^2\,d\mathbb P = \mathbb E[X^2] <\infty $$
である。
ここで、$\mathbf 1_\Omega$ を $\Omega$ 上の定数関数 $1$ とする。すると、
$$ |X|=|X|\mathbf 1_\Omega $$
である。
$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$ \begin{align} \int_\Omega |X|\,d\mathbb P &= \int_\Omega |X|\mathbf 1_\Omega\,d\mathbb P \\ &\le \left(\int_\Omega |X|^2\,d\mathbb P\right)^{1/2} \left(\int_\Omega \mathbf 1_\Omega^2\,d\mathbb P\right)^{1/2} \end{align} $$
が成り立つ。
ここで、
$$ \int_\Omega \mathbf 1_\Omega^2\,d\mathbb P = \int_\Omega \mathbf 1_\Omega\,d\mathbb P = \mathbb P(\Omega) = 1 $$
である。よって、
$$ \begin{align} \int_\Omega |X|\,d\mathbb P &\le \left(\int_\Omega |X|^2\,d\mathbb P\right)^{1/2} \\ &= \sqrt{\mathbb E[X^2]} \\ &< \infty \end{align} $$
である。
したがって、
$$ \mathbb E[|X|]<\infty $$
であるから、$X$ は可積分である。
$$ \Box$$

分散の計算公式

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
すなわち、
$$ \mathbb E[X^2]<\infty $$
が成り立つとする。
このとき、
$$ \mathbb V(X)=\mathbb E[X^2]-\{\mathbb E[X]\}^2 $$
が成り立つ。

$X$ は二乗可積分であるから、$X$ は可積分である。
したがって、
$$ \mathbb E[X]\in\mathbb R $$
である。
ここで、
$$ \mu:=\mathbb E[X] $$
とおく。
分散の定義より、
$$ \mathbb V(X)=\mathbb E[(X-\mu)^2] $$
である。
また、任意の $\omega\in\Omega$ に対して、
$$ (X(\omega)-\mu)^2=X(\omega)^2-2\mu X(\omega)+\mu^2 $$
である。したがって、確率変数として
$$ (X-\mu)^2=X^2-2\mu X+\mu^2 $$
が成り立つ。
ここで、$X$ は二乗可積分であり、$\mu\in\mathbb R$ であるから、
$$ X^2,\quad X,\quad \mu^2 $$
はそれぞれ可積分である。
したがって、期待値の線形性、期待値の定数倍の性質、定数確率変数の期待値( 証明はコチラ )より、
$$ \begin{align} \mathbb V(X) &= \mathbb E[(X-\mu)^2] &&\because \text{分散の定義} \\ &= \mathbb E[X^2-2\mu X+\mu^2] &&\because (X-\mu)^2=X^2-2\mu X+\mu^2 \\ &= \mathbb E[X^2]-2\mu\mathbb E[X]+\mu^2 &&\because \text{期待値の線形性と定数倍の性質} \\ &= \mathbb E[X^2]-2\mu^2+\mu^2 &&\because \mu=\mathbb E[X] \\ &= \mathbb E[X^2]-\mu^2 \\ &= \mathbb E[X^2]-\{\mathbb E[X]\}^2 &&\because \mu=\mathbb E[X] \end{align} $$
である。
以上より、
$$ \mathbb V(X)=\mathbb E[X^2]-\{\mathbb E[X]\}^2 $$
が成り立つ。
$$ \Box$$

公式の意味

分散の定義は、
$$ \mathbb V(X)=\mathbb E[(X-\mathbb E[X])^2] $$
であり、これは $X$ が平均 $\mathbb E[X]$ からどれくらい離れているかを二乗平均で測る定義である。
$ $
一方、計算では
$$ \mathbb V(X)=\mathbb E[X^2]-\{\mathbb E[X]\}^2 $$
を使うことが多い(特に、各々の確率分布に従う確率変数の分散を求める時によく使う印象(´・ω・`))。
この公式は、二乗の期待値から期待値の二乗を引くことで、平均まわりのばらつきを計算できることを表している。

分散の定数倍の性質

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
また、$c\in\mathbb R$ とする。このとき、$cX$ も二乗可積分であり、
$$ \mathbb V(cX)=c^2\mathbb V(X) $$
が成り立つ。

まず、$cX$ が二乗可積分であることを示す。
$c$ は定数であり、$X$ は実数値確率変数であるから、$cX$ も実数値確率変数である。
任意の $\omega\in\Omega$ に対して、
$$ (cX(\omega))^2=c^2X(\omega)^2 $$
である。したがって、期待値の定数倍の性質( 証明はコチラ )より、
$$ \begin{align} \mathbb E[(cX)^2] &= \mathbb E[c^2X^2] \\ &= c^2\mathbb E[X^2] \end{align} $$
である。
ここで、$c^2<\infty$ であり、仮定より
$$ \mathbb E[X^2]<\infty $$
であるから、
$$ \mathbb E[(cX)^2]<\infty $$
である。
したがって、$cX$ は二乗可積分である。
$ $
また、$X$ は二乗可積分であるから、$X-\mathbb E[X]$ も二乗可積分である。実際、
$$ (X-\mathbb E[X])^2 \le 2X^2+2\{\mathbb E[X]\}^2 $$
であり(補足を参照)、右辺は可積分である。
$ $
次に、分散を計算する。
二乗可積分性より、$X$ は可積分であり、
$$ \mathbb E[X]\in\mathbb R $$
である。
期待値の定数倍の性質( 証明はコチラ )より、
$$ \mathbb E[cX]=c\mathbb E[X] $$
である。
したがって、分散の定義より、
$$ \begin{align} \mathbb V(cX) &= \mathbb E\left[\left(cX-\mathbb E[cX]\right)^2\right] &&\because \text{分散の定義} \\ &= \mathbb E\left[\left(cX-c\mathbb E[X]\right)^2\right] &&\because \mathbb E[cX]=c\mathbb E[X] \\ &= \mathbb E\left[\left(c(X-\mathbb E[X])\right)^2\right] \\ &= \mathbb E\left[c^2(X-\mathbb E[X])^2\right] \\ &= c^2\mathbb E\left[(X-\mathbb E[X])^2\right] &&\because \text{期待値の定数倍の性質} \\ &= c^2\mathbb V(X) &&\because \text{分散の定義} \end{align} $$
である。

-以上より、
$$ \mathbb V(cX)=c^2\mathbb V(X) $$
が成り立つ。
$$ \Box$$

$(a+b)^2\le2a^2+2b^2$

任意の $x\in\mathbb R$ に対して $x^2\ge0$ であるから、任意の実数 $a,b$ について
$$ (a-b)^2\ge0 $$
が成り立つ。これを展開すると
$$ a^2-2ab+b^2\ge0 $$
である。従って
$$ 2ab\le a^2+b^2 $$
が得られる。ここで
$$ (a+b)^2=a^2+2ab+b^2 $$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$ (a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2 $$
となる。
$$ \Box$$

分散は平均からのずれを二乗して測る量である。
したがって、確率変数を $c$ 倍すると、平均からのずれも $c$ 倍されるが、そのずれを二乗するため、
$$ c^2 $$
が現れる。
そのため、$c$ が負であっても、
$$ \mathbb V(cX)=c^2\mathbb V(X) $$
となる。

$c=0$ の場合

$c=0$ の場合、$cX=0$ は定数確率変数である。
したがって、
$$ \mathbb V(0X)=\mathbb V(0)=0 $$
である。
一方、
$$ c^2\mathbb V(X)=0^2\mathbb V(X)=0 $$
であるから、この場合にも
$$ \mathbb V(cX)=c^2\mathbb V(X) $$
が成り立つ。

分散の定数シフトの性質

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
また、$t\in\mathbb R$ とする。このとき、$X+t$ も二乗可積分であり、
$$ \mathbb V(X+t)=\mathbb V(X) $$
が成り立つ。

まず、$X+t$ が二乗可積分であることを示す。
$t$ は定数であり、$X$ は実数値確率変数であるから、$X+t$ も実数値確率変数である。
任意の $\omega\in\Omega$ に対して、
$$ (X(\omega)+t)^2\le 2X(\omega)^2+2t^2 $$
が成り立つ(補足を参照)。したがって、$\Omega$ 上の非負可測関数として
$$ (X+t)^2\le 2X^2+2t^2 $$
である。
期待値の単調性と線形性( 証明はコチラ )より、
$$ \begin{align} \mathbb E[(X+t)^2] &\le \mathbb E[2X^2+2t^2] &&\because (X+t)^2\le 2X^2+2t^2 \\ &= 2\mathbb E[X^2]+2t^2 &&\because \text{期待値の線形性と定数確率変数の期待値} \\ &< \infty &&\because X\text{ は二乗可積分であり }t\in\mathbb R\text{ である} \end{align} $$
である。したがって、$X+t$ は二乗可積分である。
$ $
次に、分散を計算する。
$X$ は二乗可積分であるから、特に可積分であり、
$$ \mathbb E[X]\in\mathbb R $$
である(最初の命題)。
期待値の定数シフトの性質より、
$$ \mathbb E[X+t]=\mathbb E[X]+t $$
である( 証明はコチラ )。
したがって、分散の定義より、
$$ \begin{align} \mathbb V(X+t) &= \mathbb E\left[\left((X+t)-\mathbb E[X+t]\right)^2\right] &&\because \text{分散の定義} \\ &= \mathbb E\left[\left((X+t)-(\mathbb E[X]+t)\right)^2\right] &&\because \mathbb E[X+t]=\mathbb E[X]+t \\ &= \mathbb E\left[\left(X-\mathbb E[X]\right)^2\right] &&\because (X+t)-(\mathbb E[X]+t)=X-\mathbb E[X] \\ &= \mathbb V(X) &&\because \text{分散の定義} \end{align} $$
である。

-以上より、
$$ \mathbb V(X+t)=\mathbb V(X) $$
が成り立つ。
$$ \Box$$

$(a+b)^2\le2a^2+2b^2$

定数シフトで分散が変わらない理由

分散は、確率変数が自分自身の平均からどれくらい離れているかを測る量である。
$X$ に定数 $t$ を加えると、平均も同じだけ $t$ だけ移動する。すなわち、
$$ \mathbb E[X+t]=\mathbb E[X]+t $$
である。
したがって、平均からのずれは
$$ (X+t)-\mathbb E[X+t] = (X+t)-(\mathbb E[X]+t) = X-\mathbb E[X] $$
となり、もとのずれと一致する。
そのため、
$$ \mathbb V(X+t)=\mathbb V(X) $$
が成り立つ。

分散のアフィン変換の性質

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
また、$c,t\in\mathbb R$ とする。このとき、$cX+t$ も二乗可積分であり、
$$ \mathbb V(cX+t)=c^2\mathbb V(X) $$
が成り立つ。
$ $
実際、$X$ は二乗可積分である。
したがって、分散の定数倍の性質より、$cX$ も二乗可積分であり、
$$ \mathbb V(cX)=c^2\mathbb V(X) $$
が成り立つ。
また、分散の定数シフトの性質より、$cX+t$ も二乗可積分であり、
$$ \mathbb V(cX+t)=\mathbb V(cX) $$
が成り立つ。
よって、
$$ \begin{align} \mathbb V(cX+t) &= \mathbb V(cX) &&\because \text{分散の定数シフトの性質} \\ &= c^2\mathbb V(X) &&\because \text{分散の定数倍の性質} \end{align} $$
である。
したがって、
$$ \mathbb V(cX+t)=c^2\mathbb V(X) $$
が成り立つ。
$$ \Box$$

独立な確率変数の和の分散

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
すなわち、
$$ \mathbb E[X^2]<\infty,\quad \mathbb E[Y^2]<\infty $$
が成り立つとする。さらに、$X$ と $Y$ は独立であるとする。
このとき、$X+Y$ も二乗可積分であり、
$$ \mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y) $$
が成り立つ。

まず、$X+Y$ が二乗可積分であることを示す。
$X,Y$ は実数値確率変数であるから、$X+Y$ も実数値確率変数である。
任意の $\omega\in\Omega$ に対して、
$$ (X(\omega)+Y(\omega))^2\le 2X(\omega)^2+2Y(\omega)^2 $$
が成り立つ(補足を参照)。したがって、$\Omega$ 上の非負可測関数として
$$ (X+Y)^2\le 2X^2+2Y^2 $$
である。
期待値の単調性と線形性より、
$$ \begin{align} \mathbb E[(X+Y)^2] &\le \mathbb E[2X^2+2Y^2] &&\because (X+Y)^2\le 2X^2+2Y^2 \\ &= 2\mathbb E[X^2]+2\mathbb E[Y^2] &&\because \text{期待値の線形性} \\ &< \infty &&\because X,Y\text{ は二乗可積分である} \end{align} $$
である。
したがって、$X+Y$ は二乗可積分である。
$ $
さらに、$X-\mu_X$ と $Y-\mu_Y$ が二乗可積分であることを確認する。
まず
$$ \mu_X:=\mathbb E[X],\quad \mu_Y:=\mathbb E[Y] $$
とおく。
$X,Y$ は二乗可積分であるから、特に可積分(最初の命題で示した)であり、
$$ \mu_X,\mu_Y\in\mathbb R $$
である。したがって、$X,Y$ は二乗可積分であり、$\mu_X,\mu_Y\in\mathbb R$ であるから、
$X-\mu_X$ と $Y-\mu_Y$ もそれぞれ二乗可積分である。
$ $
また、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$ \mathbb E\left[|(X-\mu_X)(Y-\mu_Y)|\right] \le \left(\mathbb E[(X-\mu_X)^2]\right)^{1/2} \left(\mathbb E[(Y-\mu_Y)^2]\right)^{1/2} < \infty $$
である。よって、$(X-\mu_X)(Y-\mu_Y)$ も可積分である。
$ $
次に、分散を計算する。
期待値の加法性( 証明はコチラ )より、
$$ \mathbb E[X+Y]=\mathbb E[X]+\mathbb E[Y]=\mu_X+\mu_Y $$
である。
したがって、分散の定義より、
$$ \begin{align} \mathbb V(X+Y) &= \mathbb E\left[\left((X+Y)-\mathbb E[X+Y]\right)^2\right] &&\because \text{分散の定義} \\ &= \mathbb E\left[\left((X+Y)-(\mu_X+\mu_Y)\right)^2\right] &&\because \mathbb E[X+Y]=\mu_X+\mu_Y \\ &= \mathbb E\left[\left((X-\mu_X)+(Y-\mu_Y)\right)^2\right] \\ &= \mathbb E\left[(X-\mu_X)^2+2(X-\mu_X)(Y-\mu_Y)+(Y-\mu_Y)^2\right] &&\because \text{平方の展開} \\ &= \mathbb E[(X-\mu_X)^2] + 2\mathbb E[(X-\mu_X)(Y-\mu_Y)] + \mathbb E[(Y-\mu_Y)^2] &&\because \text{期待値の線形性} \end{align} $$
である。
ここで、分散の定義より、
$$ \mathbb E[(X-\mu_X)^2]=\mathbb V(X),\quad \mathbb E[(Y-\mu_Y)^2]=\mathbb V(Y) $$
である。
また、$X$ と $Y$ は独立であるから、独立な確率変数の偏差の積の期待値より、
$$ \mathbb E[(X-\mathbb E[X])(Y-\mathbb E[Y])]=0 $$
が成り立つ( 証明はコチラ )。すなわち、
$$ \mathbb E[(X-\mu_X)(Y-\mu_Y)]=0 $$
である。
したがって、
$$ \begin{align} \mathbb V(X+Y) &= \mathbb V(X)+2\cdot0+\mathbb V(Y) \\ &= \mathbb V(X)+\mathbb V(Y) \end{align} $$
である。

-以上より、
$$ \mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y) $$
が成り立つ。
$$ \Box$$

$(a+b)^2\le2a^2+2b^2$

独立性の使いどころ

この命題で独立性を使うのは、
$$ \mathbb E[(X-\mathbb E[X])(Y-\mathbb E[Y])]=0 $$
を導く箇所である。
一般には、二乗可積分な確率変数 $X,Y$ に対して
$$ \mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y) $$
が成り立つ。分散の和に余分な項として共分散が現れる。
したがって、$X$ と $Y$ が独立であれば
$$ \operatorname{Cov}(X,Y)=0 $$
となり、
$$ \mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y) $$
が従う。なお、分散の和の公式は、独立性より少し弱い条件である無相関性、すなわち
$$ \operatorname{Cov}(X,Y)=0 $$
だけでも成り立つ。

分散の和の公式

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
すなわち、
$$ \mathbb E[X^2]<\infty,\qquad \mathbb E[Y^2]<\infty $$
が成り立つとする。
共分散を
$$ \operatorname{Cov}(X,Y) := \mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right] $$
で定義する。
このとき、$X+Y$ も二乗可積分であり、
$$ \mathbb V(X+Y) = \mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y) $$
が成り立つ。

まず、$X+Y$ が二乗可積分であることを示す。
$X,Y$ は実数値確率変数であるから、$X+Y$ も実数値確率変数である。
任意の $\omega\in\Omega$ に対して、
$$ (X(\omega)+Y(\omega))^2\le 2X(\omega)^2+2Y(\omega)^2 $$
が成り立つ(補足を参照)。したがって、$\Omega$ 上の非負可測関数として
$$ (X+Y)^2\le 2X^2+2Y^2 $$
である。
期待値の単調性と線形性( 証明はコチラ )より、
$$ \begin{align} \mathbb E[(X+Y)^2] &\le \mathbb E[2X^2+2Y^2] &&\because (X+Y)^2\le 2X^2+2Y^2 \\ &= 2\mathbb E[X^2]+2\mathbb E[Y^2] &&\because \text{期待値の線形性} \\ &< \infty &&\because X,Y\text{ は二乗可積分である} \end{align} $$
である。
したがって、$X+Y$ は二乗可積分である。
$ $
ここで、$X-\mu_X$ と $Y-\mu_Y$ が二乗可積分であることを確認する。
$X,Y$ は二乗可積分であるから、特に可積分である(最初の命題で示した)。
そこで、
$$ \mu_X:=\mathbb E[X],\qquad \mu_Y:=\mathbb E[Y] $$
とおく。
すると、$X,Y$ は二乗可積分であり、$\mu_X,\mu_Y\in\mathbb R$ であるから、$X-\mu_X$ と $Y-\mu_Y$ も二乗可積分である。
実際、
$$ \begin{align} (X-\mu_X)^2\le 2X^2+2\mu_X^2\\ (Y-\mu_Y)^2\le 2Y^2+2\mu_Y^2 \end{align} $$
であり(補足を参照)、いずれも右辺は可積分である。
したがって、$X-\mu_X$ は二乗可積分である。同様に、$Y-\mu_Y$ も二乗可積分である。
$ $
さらに、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$ \mathbb E\left[|(X-\mu_X)(Y-\mu_Y)|\right] \le \left(\mathbb E[(X-\mu_X)^2]\right)^{1/2} \left(\mathbb E[(Y-\mu_Y)^2]\right)^{1/2} < \infty $$
である。
よって、$(X-\mu_X)(Y-\mu_Y)$ は可積分であり、$\operatorname{Cov}(X,Y)$ は有限な実数として定義される。
$ $
$ $
次に、分散を計算する。
期待値の加法性( 証明はコチラ )より、
$$ \mathbb E[X+Y]=\mu_X+\mu_Y $$
である。
したがって、分散の定義より、
$$ \begin{align} \mathbb V(X+Y) &= \mathbb E\left[\left((X+Y)-\mathbb E[X+Y]\right)^2\right] &&\because \text{分散の定義} \\ &= \mathbb E\left[\left((X+Y)-(\mu_X+\mu_Y)\right)^2\right] &&\because \mathbb E[X+Y]=\mu_X+\mu_Y \\ &= \mathbb E\left[\left((X-\mu_X)+(Y-\mu_Y)\right)^2\right] \\ &= \mathbb E\left[(X-\mu_X)^2+2(X-\mu_X)(Y-\mu_Y)+(Y-\mu_Y)^2\right] &&\because \text{平方の展開} \\ &= \mathbb E[(X-\mu_X)^2] + 2\mathbb E[(X-\mu_X)(Y-\mu_Y)] + \mathbb E[(Y-\mu_Y)^2] &&\because \text{期待値の線形性} \end{align} $$
である。
ここで、再度分散の定義より、
$$ \mathbb E[(X-\mu_X)^2]=\mathbb V(X) $$
かつ
$$ \mathbb E[(Y-\mu_Y)^2]=\mathbb V(Y) $$
である。
また、共分散の定義より、
$$ \mathbb E[(X-\mu_X)(Y-\mu_Y)] = \operatorname{Cov}(X,Y) $$
である。
したがって、
$$ \begin{align} \mathbb V(X+Y) &= \mathbb V(X) + 2\operatorname{Cov}(X,Y) + \mathbb V(Y) \\ &= \mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y) \end{align} $$
である。

-以上より、
$$ \mathbb V(X+Y) = \mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y) $$
が成り立つ。
$$ \Box$$

$(a+b)^2\le2a^2+2b^2$

用語について

この公式は、共分散項を含む分散の和の公式である。
厳密には、単に
$$ \mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y) $$
が常に成り立つわけではない。
一般には、
$$ 2\operatorname{Cov}(X,Y) $$
という項が加わる。
したがって、$\operatorname{Cov}(X,Y)=0$ の場合に限り、
$$ \mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y) $$
が成り立つ。
特に、$X$ と $Y$ が独立ならば
$$ \operatorname{Cov}(X,Y)=0 $$
であるから、独立な場合には分散は加法的になる。

和の二乗の展開公式【補題】

$n\in\mathbb N_{>0}$ とし、$a_1,\dots,a_n\in\mathbb R$ とする。
このとき、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \sum_{i=1}^{n}a_i^2 + \sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j $$
が成り立つ。

同値に、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \sum_{i=1}^{n}a_i^2 + 2\sum_{1\le i< j\le n}a_ia_j $$
が成り立つ。

まず、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \left(\sum_{i=1}^{n}a_i\right) \left(\sum_{j=1}^{n}a_j\right) $$
である。
積に対する分配法則より、
$$ \left(\sum_{i=1}^{n}a_i\right) \left(\sum_{j=1}^{n}a_j\right) = \sum_{i=1}^{n}\sum_{j=1}^{n}a_ia_j $$
が成り立つ。
したがって、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \sum_{i=1}^{n}\sum_{j=1}^{n}a_ia_j $$
である。
$ $
ここで、添字集合 $\{1,\dots,n\}^2$ は、$i=j$ を満たす部分と $i\neq j$ を満たす部分に交わりなく分解される。
そこで、二重和を $i=j$ の場合と $i\neq j$ の場合に分けると、
$$ \sum_{i=1}^{n}\sum_{j=1}^{n}a_ia_j = \sum_{\substack{1\le i,j\le n\\ i=j}}a_ia_j + \sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j $$
である。
$i=j$ の場合には $a_ia_j=a_i^2$ であるから、
$$ \sum_{\substack{1\le i,j\le n\\ i=j}}a_ia_j = \sum_{i=1}^{n}a_i^2 $$
である。
よって、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \sum_{i=1}^{n}a_i^2 + \sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j $$
が成り立つ。
$ $
さらに、実数の積は可換であるから、$i< j$ の各組について
$$ a_ia_j+a_ja_i=2a_ia_j $$
である。
したがって、
$$ \sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j = 2\sum_{1\le i< j\le n}a_ia_j $$
である。

-ゆえに、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \sum_{i=1}^{n}a_i^2 + 2\sum_{1\le i< j\le n}a_ia_j $$
も成り立つ。
$$ \Box$$

添字の注意

式
$$ \sum_{i\neq j}a_ia_j $$
と書く場合には、添字の範囲を明示する必要がある。
この命題では、
$$ \sum_{i\neq j}a_ia_j := \sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j $$
という意味である。
この和は、$(i,j)$ と $(j,i)$ を別々に数える。
したがって、
$$ \sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j = 2\sum_{1\le i< j\le n}a_ia_j $$
である。

有限和の分散と共分散

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$n\in\mathbb N_{>0}$ とする。
$X_1,\dots,X_n:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。すなわち、任意の $i\in\{1,\dots,n\}$ に対して
$$ \mathbb E[X_i^2]<\infty $$
が成り立つとする。
このとき、
$$ S:=\sum_{i=1}^{n}X_i $$
も二乗可積分であり、
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) + \sum_{\substack{1\le i,j\le n\\ i\neq j}} \operatorname{Cov}(X_i,X_j) $$
が成り立つ。
ただし、共分散は
$$ \operatorname{Cov}(X_i,X_j) := \mathbb E\left[(X_i-\mathbb E[X_i])(X_j-\mathbb E[X_j])\right] $$
で定義される。

まず、$S$ が二乗可積分であることを示す。
有限個の実数値確率変数の和であるから、$S=\sum_{i=1}^{n}X_i$ も実数値確率変数である。
$ $
任意の実数 $a_1,\dots,a_n$ に対して、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より
$$ \left(\sum_{i=1}^{n}a_i\right)^2 \le n\sum_{i=1}^{n}a_i^2 $$
が成り立つ(補足を参照)。
これを
$$ a_i=X_i(\omega) $$
に適用すると、任意の $\omega\in\Omega$ に対して
$$ S(\omega)^2 = \left(\sum_{i=1}^{n}X_i(\omega)\right)^2 \le n\sum_{i=1}^{n}X_i(\omega)^2 $$
である。したがって、$\Omega$ 上の非負可測関数として
$$ S^2\le n\sum_{i=1}^{n}X_i^2 $$
が成り立つ。
期待値の単調性と線形性( 証明はコチラ )より、
$$ \begin{align} \mathbb E[S^2] &\le \mathbb E\left[n\sum_{i=1}^{n}X_i^2\right] &&\because S^2\le n\sum_{i=1}^{n}X_i^2 \\ &= n\sum_{i=1}^{n}\mathbb E[X_i^2] &&\because \text{期待値の線形性} \\ &< \infty &&\because \text{各 }X_i\text{ は二乗可積分であり、}n\text{ は有限である} \end{align} $$
である。したがって、$S$ は二乗可積分である。
$ $
各 $X_i$ は二乗可積分であるから、特に可積分である。そこで、
$$ \mu_i:=\mathbb E[X_i]\qquad (i=1,\dots,n) $$
とおく。
各 $i\in\{1,\dots,n\}$ について、$X_i$ は二乗可積分であり、$\mu_i\in\mathbb R$ であるから、$X_i-\mu_i$ も二乗可積分である。
実際、
$$ (X_i-\mu_i)^2\le 2X_i^2+2\mu_i^2 $$
であり(補足を参照)、右辺は可積分である。
$ $
さらに、任意の $i,j\in\{1,\dots,n\}$ について、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$ \mathbb E\left[|(X_i-\mu_i)(X_j-\mu_j)|\right] \le \left(\mathbb E[(X_i-\mu_i)^2]\right)^{1/2} \left(\mathbb E[(X_j-\mu_j)^2]\right)^{1/2} < \infty $$
である。
したがって、$(X_i-\mu_i)(X_j-\mu_j)$ は可積分であり、$\operatorname{Cov}(X_i,X_j)$ は有限な実数として定義される。
$ $
次に、分散を計算する。
期待値の線形性より、
$$ \mathbb E[S] = \mathbb E\left[\sum_{i=1}^{n}X_i\right] = \sum_{i=1}^{n}\mathbb E[X_i] = \sum_{i=1}^{n}\mu_i $$
である。
したがって、
$$ S-\mathbb E[S] = \sum_{i=1}^{n}X_i-\sum_{i=1}^{n}\mu_i = \sum_{i=1}^{n}(X_i-\mu_i) $$
である。
分散の定義より、
$$ \begin{align} \mathbb V(S) &= \mathbb E\left[(S-\mathbb E[S])^2\right] &&\because \text{分散の定義} \\ &= \mathbb E\left[\left(\sum_{i=1}^{n}(X_i-\mu_i)\right)^2\right] &&\because S-\mathbb E[S]=\sum_{i=1}^{n}(X_i-\mu_i) \end{align} $$
である。
ここで、和の二乗の展開公式($1$つ上で示した補題)より、
$$ \left(\sum_{i=1}^{n}(X_i-\mu_i)\right)^2 = \sum_{i=1}^{n}(X_i-\mu_i)^2 + \sum_{\substack{1\le i,j\le n\\ i\neq j}}(X_i-\mu_i)(X_j-\mu_j) $$
である。
よって、期待値の線形性より、
$$ \begin{align} \mathbb V(S) &= \mathbb E\left[ \sum_{i=1}^{n}(X_i-\mu_i)^2 + \sum_{\substack{1\le i,j\le n\\ i\neq j}}(X_i-\mu_i)(X_j-\mu_j) \right] \\ &= \sum_{i=1}^{n}\mathbb E[(X_i-\mu_i)^2] + \sum_{\substack{1\le i,j\le n\\ i\neq j}} \mathbb E[(X_i-\mu_i)(X_j-\mu_j)] \end{align} $$
である。
ここで、分散と共分散の定義より、
$$ \mathbb E[(X_i-\mu_i)^2]=\mathbb V(X_i) $$
であり、また $i\neq j$ に対して
$$ \mathbb E[(X_i-\mu_i)(X_j-\mu_j)] = \operatorname{Cov}(X_i,X_j) $$
である。
したがって、
$$ \begin{align} \mathbb V(S) &= \sum_{i=1}^{n}\mathbb V(X_i) + \sum_{\substack{1\le i,j\le n\\ i\neq j}} \operatorname{Cov}(X_i,X_j) \end{align} $$
である。
$S=\sum_{i=1}^{n}X_i$ であるから、
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) + \sum_{\substack{1\le i,j\le n\\ i\neq j}} \operatorname{Cov}(X_i,X_j) $$
が成り立つ。
$$ \Box$$

$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式の使い方

有限個の実数 $a_1,\dots,a_n$ に対して
$$ \left(\sum_{i=1}^{n}a_i\right)^2 \le n\sum_{i=1}^{n}a_i^2 $$
が成り立つ理由は、有限列に対する $\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式を、以下の$2$ つの列
$$ (a_1,\dots,a_n),\qquad (1,\dots,1) $$
に適用するからである。
有限列に対する $\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式は、
$$ \left(\sum_{i=1}^{n}a_i b_i\right)^2 \le \left(\sum_{i=1}^{n}a_i^2\right) \left(\sum_{i=1}^{n}b_i^2\right) $$
である。
ここで、任意の $i\in\{1,\dots,n\}$ に対して
$$ b_i:=1 $$
とおくと、
$$ \sum_{i=1}^{n}a_i b_i = \sum_{i=1}^{n}a_i\cdot 1 = \sum_{i=1}^{n}a_i $$
であり、また
$$ \sum_{i=1}^{n}b_i^2 = \sum_{i=1}^{n}1^2 = \sum_{i=1}^{n}1 = n $$
である。
したがって、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$ \left(\sum_{i=1}^{n}a_i\right)^2 = \left(\sum_{i=1}^{n}a_i\cdot 1\right)^2 \le \left(\sum_{i=1}^{n}a_i^2\right) \left(\sum_{i=1}^{n}1^2\right) = n\sum_{i=1}^{n}a_i^2 $$
が従う。
つまり、この不等式は、$a_1,\dots,a_n$ の和を、ベクトル $(a_1,\dots,a_n)$ とベクトル $(1,\dots,1)$ の内積と見て、
$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式を適用したものである。

$(a+b)^2\le2a^2+2b^2$

添字の注意

式
$$ \sum_{\substack{1\le i,j\le n\\ i\neq j}} \operatorname{Cov}(X_i,X_j) $$
は、順序付き組 $(i,j)$ を $i\neq j$ の範囲で全部足す和である。
したがって、$i< j$ の範囲だけで書く場合は、
$$ \sum_{\substack{1\le i,j\le n\\ i\neq j}} \operatorname{Cov}(X_i,X_j) = 2\sum_{1\le i< j\le n}\operatorname{Cov}(X_i,X_j) $$
である。ここでは、共分散の対称性
$$ \operatorname{Cov}(X_i,X_j)=\operatorname{Cov}(X_j,X_i) $$
を用いている。
このため、同じ公式は次のようにも書ける。
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) + 2\sum_{1\le i< j\le n}\operatorname{Cov}(X_i,X_j) $$

独立な場合

$X_1,\dots,X_n$ が相互に独立であれば、任意の $i\neq j$ について $X_i$ と $X_j$ は独立である。
このとき、
$$ \operatorname{Cov}(X_i,X_j)=0 $$
が成り立つ。
したがって、上の公式から
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) $$
が従う。

相互独立な確率変数の和の分散

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$n\in\mathbb N_{>0}$ とする。
$X_1,\dots,X_n:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。すなわち、任意の $i\in\{1,\dots,n\}$ に対して
$$ \mathbb E[X_i^2]<\infty $$
が成り立つとする。さらに、$X_1,\dots,X_n$ は相互に独立であるとする。
このとき、
$$ S:=\sum_{i=1}^{n}X_i $$
も二乗可積分であり、
$$ \mathbb V(S)=\sum_{i=1}^{n}\mathbb V(X_i) $$
が成り立つ。すなわち、
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) $$
が成り立つ。

まず、$S$ が二乗可積分であることを示す。
有限個の実数値確率変数の和であるから、$S=\sum_{i=1}^{n}X_i$ も実数値確率変数である。
$ $
任意の実数 $a_1,\dots,a_n$ に対して、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より
$$ \left(\sum_{i=1}^{n}a_i\right)^2 \le n\sum_{i=1}^{n}a_i^2 $$
が成り立つ(補足を参照)。
これを $a_i=X_i(\omega)$ に適用すると、任意の $\omega\in\Omega$ に対して
$$ S(\omega)^2 = \left(\sum_{i=1}^{n}X_i(\omega)\right)^2 \le n\sum_{i=1}^{n}X_i(\omega)^2 $$
である。
したがって、$\Omega$ 上の非負可測関数として
$$ S^2\le n\sum_{i=1}^{n}X_i^2 $$
が成り立つ。
期待値の単調性と線形性( 証明はコチラ )より、
$$ \begin{align} \mathbb E[S^2] &\le \mathbb E\left[n\sum_{i=1}^{n}X_i^2\right] &&\because S^2\le n\sum_{i=1}^{n}X_i^2 \\ &= n\sum_{i=1}^{n}\mathbb E[X_i^2] &&\because \text{期待値の線形性} \\ &< \infty &&\because \text{各 }X_i\text{ は二乗可積分であり、}n\text{ は有限である} \end{align} $$
である。したがって、$S$ は二乗可積分である。
$ $
各 $X_i$ は二乗可積分であるから、特に可積分である。そこで、
$$ \mu_i:=\mathbb E[X_i]\qquad (i=1,\dots,n) $$
とおく。各 $i\in\{1,\dots,n\}$ について、$X_i$ は二乗可積分であり、$\mu_i\in\mathbb R$ であるから、$X_i-\mu_i$ も二乗可積分である。
実際、
$$ (X_i-\mu_i)^2\le 2X_i^2+2\mu_i^2 $$
であり、右辺は可積分である。
$ $
さらに、任意の $i,j\in\{1,\dots,n\}$ について、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$ \mathbb E\left[|(X_i-\mu_i)(X_j-\mu_j)|\right] \le \left(\mathbb E[(X_i-\mu_i)^2]\right)^{1/2} \left(\mathbb E[(X_j-\mu_j)^2]\right)^{1/2} < \infty $$
である。したがって、$(X_i-\mu_i)(X_j-\mu_j)$ は可積分である。
$ $
次に、分散を計算する。
期待値の線形性( 証明はコチラ )より、
$$ \mathbb E[S] = \mathbb E\left[\sum_{i=1}^{n}X_i\right] = \sum_{i=1}^{n}\mathbb E[X_i] = \sum_{i=1}^{n}\mu_i $$
である。
したがって、
$$ S-\mathbb E[S] = \sum_{i=1}^{n}X_i-\sum_{i=1}^{n}\mu_i = \sum_{i=1}^{n}(X_i-\mu_i) $$
である。
分散の定義より、
$$ \begin{align} \mathbb V(S) &= \mathbb E\left[(S-\mathbb E[S])^2\right] &&\because \text{分散の定義} \\ &= \mathbb E\left[\left(\sum_{i=1}^{n}(X_i-\mu_i)\right)^2\right] &&\because S-\mathbb E[S]=\sum_{i=1}^{n}(X_i-\mu_i) \end{align} $$
である。
ここで、和の二乗の展開公式($2$つ上で示した補題)より、
$$ \left(\sum_{i=1}^{n}(X_i-\mu_i)\right)^2 = \sum_{i=1}^{n}(X_i-\mu_i)^2 + \sum_{\substack{1\le i,j\le n\\ i\neq j}}(X_i-\mu_i)(X_j-\mu_j) $$
である。
よって、期待値の線形性より、
$$ \begin{align} \mathbb V(S) &= \mathbb E\left[ \sum_{i=1}^{n}(X_i-\mu_i)^2 + \sum_{\substack{1\le i,j\le n\\ i\neq j}}(X_i-\mu_i)(X_j-\mu_j) \right] \\ &= \sum_{i=1}^{n}\mathbb E[(X_i-\mu_i)^2] + \sum_{\substack{1\le i,j\le n\\ i\neq j}} \mathbb E[(X_i-\mu_i)(X_j-\mu_j)] \end{align} $$
である。
$ $
ここで、任意の $i\neq j$ に対して、相互独立性より $X_i$ と $X_j$ は独立である。
したがって、独立な確率変数の偏差積の期待値より、
$$ \mathbb E[(X_i-\mathbb E[X_i])(X_j-\mathbb E[X_j])]=0 $$
が成り立つ。すなわち、
$$ \mathbb E[(X_i-\mu_i)(X_j-\mu_j)]=0 $$
である。
ゆえに、
$$ \sum_{\substack{1\le i,j\le n\\ i\neq j}} \mathbb E[(X_i-\mu_i)(X_j-\mu_j)] = 0 $$
である( 証明はコチラ )。
したがって、
$$ \begin{align} \mathbb V(S) &= \sum_{i=1}^{n}\mathbb E[(X_i-\mu_i)^2] \\ &= \sum_{i=1}^{n}\mathbb V(X_i) &&\because \mathbb V(X_i)=\mathbb E[(X_i-\mathbb E[X_i])^2] \end{align} $$
である。

-以上より、
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) $$
が成り立つ。
$$ \Box$$

$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式の使い方

相互独立性の使いどころ

この証明で相互独立性を使うのは、$i\neq j$ のとき
$$ \mathbb E[(X_i-\mathbb E[X_i])(X_j-\mathbb E[X_j])]=0 $$
を導く箇所である。
つまり、和の分散を展開したときに現れる交差項がすべて $0$ になることが本質である。
一般には、
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) + \sum_{\substack{1\le i,j\le n\\ i\neq j}} \operatorname{Cov}(X_i,X_j) $$
である。
したがって、相互独立ならば $i\neq j$ に対して
$$ \operatorname{Cov}(X_i,X_j)=0 $$
となり、分散の和だけが残る。

相互独立性と無相関性

この命題では $X_1,\dots,X_n$ の相互独立性を仮定した。
しかし、結論
$$ \mathbb V\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n}\mathbb V(X_i) $$
だけを得るには、相互独立性より弱い条件で十分である。
具体的には、任意の $i\neq j$ について
$$ \operatorname{Cov}(X_i,X_j)=0 $$
が成り立てばよい。この条件を、$X_1,\dots,X_n$ が互いに無相関であるという。
相互独立ならば互いに無相関であるが、一般にその逆は成り立たない。

投稿日：15日前

更新日：12日前

数学の力で現場を変えるアルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

Kagura

4586

■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。

他の人のコメント

コメントはありません。

読み込み中

Kagura

【9個】分散の代表的な性質をまとめておく |ω・`)