$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が二乗可積分であるとは、
$$
\mathbb E[X^2]<\infty
$$
が成り立つことをいう。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
このとき、$X$ の分散 $\mathbb V(X)$ を
$$
\mathbb V(X):=\mathbb E\left[(X-\mathbb E[X])^2\right]
$$
で定義する。
同じ量を
$$
\operatorname{Var}(X)
$$
と書くこともある。
分散は
$$
\mathbb E\left[(X-\mathbb E[X])^2\right]
$$
として定義されるため、まず $\mathbb E[X]$ が有限な実数として存在し、さらに $(X-\mathbb E[X])^2$ の期待値が有限である必要がある。
$X$ が二乗可積分、すなわち
$$
\mathbb E[X^2]<\infty
$$
を満たせば、$X$ は可積分である。すなわち、
$$
\mathbb E[|X|]<\infty
$$
が成り立つ(証明は後述)。さらに、
$$
(X-\mathbb E[X])^2
$$
も可積分になるので、
$$
\mathbb V(X)<\infty
$$
が保証される。
$X$ を二乗可積分な実数値確率変数とする。
$X$ の標準偏差 $\sigma_X$ を
$$
\sigma_X:=\sqrt{\mathbb V(X)}
$$
で定義する。
分散は常に非負であるため、
$$
\mathbb V(X)\ge0
$$
であり、したがって $\sqrt{\mathbb V(X)}$ は非負実数として定まる。
定義より、
$$
\mathbb V(X)=\sigma_X^2
$$
が成り立つ。
$ $
分散は偏差の二乗の期待値なので、もとの確率変数 $X$ の単位を二乗した単位をもつ。
一方、標準偏差は分散の平方根であるため、$X$ と同じ単位でばらつきを表す量である。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が二乗可積分であるとする。すなわち、
$$
\mathbb E[X^2]<\infty
$$
が成り立つとする。
このとき、$X$ は可積分である。すなわち、
$$
\mathbb E[|X|]<\infty
$$
が成り立つ。
$X$ は実数値確率変数であるから、
$$
X^2=|X|^2
$$
である。したがって、仮定より
$$
\int_\Omega |X|^2\,d\mathbb P
=
\mathbb E[X^2]
<\infty
$$
である。
ここで、$\mathbf 1_\Omega$ を $\Omega$ 上の定数関数 $1$ とする。すると、
$$
|X|=|X|\mathbf 1_\Omega
$$
である。
$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$
\begin{align}
\int_\Omega |X|\,d\mathbb P
&=
\int_\Omega |X|\mathbf 1_\Omega\,d\mathbb P \\
&\le
\left(\int_\Omega |X|^2\,d\mathbb P\right)^{1/2}
\left(\int_\Omega \mathbf 1_\Omega^2\,d\mathbb P\right)^{1/2}
\end{align}
$$
が成り立つ。
ここで、
$$
\int_\Omega \mathbf 1_\Omega^2\,d\mathbb P
=
\int_\Omega \mathbf 1_\Omega\,d\mathbb P
=
\mathbb P(\Omega)
=
1
$$
である。よって、
$$
\begin{align}
\int_\Omega |X|\,d\mathbb P
&\le
\left(\int_\Omega |X|^2\,d\mathbb P\right)^{1/2} \\
&=
\sqrt{\mathbb E[X^2]} \\
&<
\infty
\end{align}
$$
である。
したがって、
$$
\mathbb E[|X|]<\infty
$$
であるから、$X$ は可積分である。
$$ \Box$$
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
すなわち、
$$
\mathbb E[X^2]<\infty
$$
が成り立つとする。
このとき、
$$
\mathbb V(X)=\mathbb E[X^2]-\{\mathbb E[X]\}^2
$$
が成り立つ。
$X$ は二乗可積分であるから、$X$ は可積分である。
したがって、
$$
\mathbb E[X]\in\mathbb R
$$
である。
ここで、
$$
\mu:=\mathbb E[X]
$$
とおく。
分散の定義より、
$$
\mathbb V(X)=\mathbb E[(X-\mu)^2]
$$
である。
また、任意の $\omega\in\Omega$ に対して、
$$
(X(\omega)-\mu)^2=X(\omega)^2-2\mu X(\omega)+\mu^2
$$
である。したがって、確率変数として
$$
(X-\mu)^2=X^2-2\mu X+\mu^2
$$
が成り立つ。
ここで、$X$ は二乗可積分であり、$\mu\in\mathbb R$ であるから、
$$
X^2,\quad X,\quad \mu^2
$$
はそれぞれ可積分である。
したがって、期待値の線形性、期待値の定数倍の性質、定数確率変数の期待値(
証明はコチラ
)より、
$$
\begin{align}
\mathbb V(X)
&=
\mathbb E[(X-\mu)^2]
&&\because \text{分散の定義} \\
&=
\mathbb E[X^2-2\mu X+\mu^2]
&&\because (X-\mu)^2=X^2-2\mu X+\mu^2 \\
&=
\mathbb E[X^2]-2\mu\mathbb E[X]+\mu^2
&&\because \text{期待値の線形性と定数倍の性質} \\
&=
\mathbb E[X^2]-2\mu^2+\mu^2
&&\because \mu=\mathbb E[X] \\
&=
\mathbb E[X^2]-\mu^2 \\
&=
\mathbb E[X^2]-\{\mathbb E[X]\}^2
&&\because \mu=\mathbb E[X]
\end{align}
$$
である。
以上より、
$$
\mathbb V(X)=\mathbb E[X^2]-\{\mathbb E[X]\}^2
$$
が成り立つ。
$$ \Box$$
分散の定義は、
$$
\mathbb V(X)=\mathbb E[(X-\mathbb E[X])^2]
$$
であり、これは $X$ が平均 $\mathbb E[X]$ からどれくらい離れているかを二乗平均で測る定義である。
$ $
一方、計算では
$$
\mathbb V(X)=\mathbb E[X^2]-\{\mathbb E[X]\}^2
$$
を使うことが多い(特に、各々の確率分布に従う確率変数の分散を求める時によく使う印象(´・ω・`))。
この公式は、二乗の期待値から期待値の二乗を引くことで、平均まわりのばらつきを計算できることを表している。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
また、$c\in\mathbb R$ とする。このとき、$cX$ も二乗可積分であり、
$$
\mathbb V(cX)=c^2\mathbb V(X)
$$
が成り立つ。
-以上より、
$$
\mathbb V(cX)=c^2\mathbb V(X)
$$
が成り立つ。
$$ \Box$$
任意の $x\in\mathbb R$ に対して $x^2\ge0$ であるから、任意の実数 $a,b$ について
$$
(a-b)^2\ge0
$$
が成り立つ。これを展開すると
$$
a^2-2ab+b^2\ge0
$$
である。従って
$$
2ab\le a^2+b^2
$$
が得られる。ここで
$$
(a+b)^2=a^2+2ab+b^2
$$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$
(a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2
$$
となる。
$$ \Box$$
分散は平均からのずれを二乗して測る量である。
したがって、確率変数を $c$ 倍すると、平均からのずれも $c$ 倍されるが、そのずれを二乗するため、
$$
c^2
$$
が現れる。
そのため、$c$ が負であっても、
$$
\mathbb V(cX)=c^2\mathbb V(X)
$$
となる。
$c=0$ の場合、$cX=0$ は定数確率変数である。
したがって、
$$
\mathbb V(0X)=\mathbb V(0)=0
$$
である。
一方、
$$
c^2\mathbb V(X)=0^2\mathbb V(X)=0
$$
であるから、この場合にも
$$
\mathbb V(cX)=c^2\mathbb V(X)
$$
が成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
また、$t\in\mathbb R$ とする。このとき、$X+t$ も二乗可積分であり、
$$
\mathbb V(X+t)=\mathbb V(X)
$$
が成り立つ。
-以上より、
$$
\mathbb V(X+t)=\mathbb V(X)
$$
が成り立つ。
$$ \Box$$
任意の $x\in\mathbb R$ に対して $x^2\ge0$ であるから、任意の実数 $a,b$ について
$$
(a-b)^2\ge0
$$
が成り立つ。これを展開すると
$$
a^2-2ab+b^2\ge0
$$
である。従って
$$
2ab\le a^2+b^2
$$
が得られる。ここで
$$
(a+b)^2=a^2+2ab+b^2
$$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$
(a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2
$$
となる。
$$ \Box$$
分散は、確率変数が自分自身の平均からどれくらい離れているかを測る量である。
$X$ に定数 $t$ を加えると、平均も同じだけ $t$ だけ移動する。すなわち、
$$
\mathbb E[X+t]=\mathbb E[X]+t
$$
である。
したがって、平均からのずれは
$$
(X+t)-\mathbb E[X+t]
=
(X+t)-(\mathbb E[X]+t)
=
X-\mathbb E[X]
$$
となり、もとのずれと一致する。
そのため、
$$
\mathbb V(X+t)=\mathbb V(X)
$$
が成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
また、$c,t\in\mathbb R$ とする。このとき、$cX+t$ も二乗可積分であり、
$$
\mathbb V(cX+t)=c^2\mathbb V(X)
$$
が成り立つ。
$ $
実際、$X$ は二乗可積分である。
したがって、分散の定数倍の性質より、$cX$ も二乗可積分であり、
$$
\mathbb V(cX)=c^2\mathbb V(X)
$$
が成り立つ。
また、分散の定数シフトの性質より、$cX+t$ も二乗可積分であり、
$$
\mathbb V(cX+t)=\mathbb V(cX)
$$
が成り立つ。
よって、
$$
\begin{align}
\mathbb V(cX+t)
&=
\mathbb V(cX)
&&\because \text{分散の定数シフトの性質} \\
&=
c^2\mathbb V(X)
&&\because \text{分散の定数倍の性質}
\end{align}
$$
である。
したがって、
$$
\mathbb V(cX+t)=c^2\mathbb V(X)
$$
が成り立つ。
$$ \Box$$
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
すなわち、
$$
\mathbb E[X^2]<\infty,\quad \mathbb E[Y^2]<\infty
$$
が成り立つとする。さらに、$X$ と $Y$ は独立であるとする。
このとき、$X+Y$ も二乗可積分であり、
$$
\mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)
$$
が成り立つ。
-以上より、
$$
\mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)
$$
が成り立つ。
$$ \Box$$
任意の $x\in\mathbb R$ に対して $x^2\ge0$ であるから、任意の実数 $a,b$ について
$$
(a-b)^2\ge0
$$
が成り立つ。これを展開すると
$$
a^2-2ab+b^2\ge0
$$
である。従って
$$
2ab\le a^2+b^2
$$
が得られる。ここで
$$
(a+b)^2=a^2+2ab+b^2
$$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$
(a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2
$$
となる。
$$ \Box$$
この命題で独立性を使うのは、
$$
\mathbb E[(X-\mathbb E[X])(Y-\mathbb E[Y])]=0
$$
を導く箇所である。
一般には、二乗可積分な確率変数 $X,Y$ に対して
$$
\mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y)
$$
が成り立つ。分散の和に余分な項として共分散が現れる。
したがって、$X$ と $Y$ が独立であれば
$$
\operatorname{Cov}(X,Y)=0
$$
となり、
$$
\mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)
$$
が従う。なお、分散の和の公式は、独立性より少し弱い条件である無相関性、すなわち
$$
\operatorname{Cov}(X,Y)=0
$$
だけでも成り立つ。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X,Y:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。
すなわち、
$$
\mathbb E[X^2]<\infty,\qquad \mathbb E[Y^2]<\infty
$$
が成り立つとする。
共分散を
$$
\operatorname{Cov}(X,Y)
:=
\mathbb E\left[(X-\mathbb E[X])(Y-\mathbb E[Y])\right]
$$
で定義する。
このとき、$X+Y$ も二乗可積分であり、
$$
\mathbb V(X+Y)
=
\mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y)
$$
が成り立つ。
-以上より、
$$
\mathbb V(X+Y)
=
\mathbb V(X)+\mathbb V(Y)+2\operatorname{Cov}(X,Y)
$$
が成り立つ。
$$ \Box$$
任意の $x\in\mathbb R$ に対して $x^2\ge0$ であるから、任意の実数 $a,b$ について
$$
(a-b)^2\ge0
$$
が成り立つ。これを展開すると
$$
a^2-2ab+b^2\ge0
$$
である。従って
$$
2ab\le a^2+b^2
$$
が得られる。ここで
$$
(a+b)^2=a^2+2ab+b^2
$$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$
(a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2
$$
となる。
$$ \Box$$
この公式は、共分散項を含む分散の和の公式である。
厳密には、単に
$$
\mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)
$$
が常に成り立つわけではない。
一般には、
$$
2\operatorname{Cov}(X,Y)
$$
という項が加わる。
したがって、$\operatorname{Cov}(X,Y)=0$ の場合に限り、
$$
\mathbb V(X+Y)=\mathbb V(X)+\mathbb V(Y)
$$
が成り立つ。
特に、$X$ と $Y$ が独立ならば
$$
\operatorname{Cov}(X,Y)=0
$$
であるから、独立な場合には分散は加法的になる。
$n\in\mathbb N_{>0}$ とし、$a_1,\dots,a_n\in\mathbb R$ とする。
このとき、
$$
\left(\sum_{i=1}^{n}a_i\right)^2
=
\sum_{i=1}^{n}a_i^2
+
\sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j
$$
が成り立つ。
同値に、
$$
\left(\sum_{i=1}^{n}a_i\right)^2
=
\sum_{i=1}^{n}a_i^2
+
2\sum_{1\le i< j\le n}a_ia_j
$$
が成り立つ。
-ゆえに、
$$
\left(\sum_{i=1}^{n}a_i\right)^2
=
\sum_{i=1}^{n}a_i^2
+
2\sum_{1\le i< j\le n}a_ia_j
$$
も成り立つ。
$$ \Box$$
式
$$
\sum_{i\neq j}a_ia_j
$$
と書く場合には、添字の範囲を明示する必要がある。
この命題では、
$$
\sum_{i\neq j}a_ia_j
:=
\sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j
$$
という意味である。
この和は、$(i,j)$ と $(j,i)$ を別々に数える。
したがって、
$$
\sum_{\substack{1\le i,j\le n\\ i\neq j}}a_ia_j
=
2\sum_{1\le i< j\le n}a_ia_j
$$
である。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$n\in\mathbb N_{>0}$ とする。
$X_1,\dots,X_n:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。すなわち、任意の $i\in\{1,\dots,n\}$ に対して
$$
\mathbb E[X_i^2]<\infty
$$
が成り立つとする。
このとき、
$$
S:=\sum_{i=1}^{n}X_i
$$
も二乗可積分であり、
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
+
\sum_{\substack{1\le i,j\le n\\ i\neq j}}
\operatorname{Cov}(X_i,X_j)
$$
が成り立つ。
ただし、共分散は
$$
\operatorname{Cov}(X_i,X_j)
:=
\mathbb E\left[(X_i-\mathbb E[X_i])(X_j-\mathbb E[X_j])\right]
$$
で定義される。
有限個の実数 $a_1,\dots,a_n$ に対して
$$
\left(\sum_{i=1}^{n}a_i\right)^2
\le
n\sum_{i=1}^{n}a_i^2
$$
が成り立つ理由は、有限列に対する $\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式を、以下の$2$ つの列
$$
(a_1,\dots,a_n),\qquad (1,\dots,1)
$$
に適用するからである。
有限列に対する $\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式は、
$$
\left(\sum_{i=1}^{n}a_i b_i\right)^2
\le
\left(\sum_{i=1}^{n}a_i^2\right)
\left(\sum_{i=1}^{n}b_i^2\right)
$$
である。
ここで、任意の $i\in\{1,\dots,n\}$ に対して
$$
b_i:=1
$$
とおくと、
$$
\sum_{i=1}^{n}a_i b_i
=
\sum_{i=1}^{n}a_i\cdot 1
=
\sum_{i=1}^{n}a_i
$$
であり、また
$$
\sum_{i=1}^{n}b_i^2
=
\sum_{i=1}^{n}1^2
=
\sum_{i=1}^{n}1
=
n
$$
である。
したがって、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$
\left(\sum_{i=1}^{n}a_i\right)^2
=
\left(\sum_{i=1}^{n}a_i\cdot 1\right)^2
\le
\left(\sum_{i=1}^{n}a_i^2\right)
\left(\sum_{i=1}^{n}1^2\right)
=
n\sum_{i=1}^{n}a_i^2
$$
が従う。
つまり、この不等式は、$a_1,\dots,a_n$ の和を、ベクトル $(a_1,\dots,a_n)$ とベクトル $(1,\dots,1)$ の内積と見て、
$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式を適用したものである。
任意の $x\in\mathbb R$ に対して $x^2\ge0$ であるから、任意の実数 $a,b$ について
$$
(a-b)^2\ge0
$$
が成り立つ。これを展開すると
$$
a^2-2ab+b^2\ge0
$$
である。従って
$$
2ab\le a^2+b^2
$$
が得られる。ここで
$$
(a+b)^2=a^2+2ab+b^2
$$
であるから、上の不等式 $2ab\le a^2+b^2$ を用いて
$$
(a+b)^2=a^2+2ab+b^2\le a^2+(a^2+b^2)+b^2=2a^2+2b^2
$$
となる。
$$ \Box$$
式
$$
\sum_{\substack{1\le i,j\le n\\ i\neq j}}
\operatorname{Cov}(X_i,X_j)
$$
は、順序付き組 $(i,j)$ を $i\neq j$ の範囲で全部足す和である。
したがって、$i< j$ の範囲だけで書く場合は、
$$
\sum_{\substack{1\le i,j\le n\\ i\neq j}}
\operatorname{Cov}(X_i,X_j)
=
2\sum_{1\le i< j\le n}\operatorname{Cov}(X_i,X_j)
$$
である。ここでは、共分散の対称性
$$
\operatorname{Cov}(X_i,X_j)=\operatorname{Cov}(X_j,X_i)
$$
を用いている。
このため、同じ公式は次のようにも書ける。
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
+
2\sum_{1\le i< j\le n}\operatorname{Cov}(X_i,X_j)
$$
$X_1,\dots,X_n$ が相互に独立であれば、任意の $i\neq j$ について $X_i$ と $X_j$ は独立である。
このとき、
$$
\operatorname{Cov}(X_i,X_j)=0
$$
が成り立つ。
したがって、上の公式から
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
$$
が従う。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$n\in\mathbb N_{>0}$ とする。
$X_1,\dots,X_n:\Omega\to\mathbb R$ を二乗可積分な実数値確率変数とする。すなわち、任意の $i\in\{1,\dots,n\}$ に対して
$$
\mathbb E[X_i^2]<\infty
$$
が成り立つとする。さらに、$X_1,\dots,X_n$ は相互に独立であるとする。
このとき、
$$
S:=\sum_{i=1}^{n}X_i
$$
も二乗可積分であり、
$$
\mathbb V(S)=\sum_{i=1}^{n}\mathbb V(X_i)
$$
が成り立つ。すなわち、
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
$$
が成り立つ。
-以上より、
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
$$
が成り立つ。
$$ \Box$$
有限個の実数 $a_1,\dots,a_n$ に対して
$$
\left(\sum_{i=1}^{n}a_i\right)^2
\le
n\sum_{i=1}^{n}a_i^2
$$
が成り立つ理由は、有限列に対する $\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式を、以下の$2$ つの列
$$
(a_1,\dots,a_n),\qquad (1,\dots,1)
$$
に適用するからである。
有限列に対する $\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式は、
$$
\left(\sum_{i=1}^{n}a_i b_i\right)^2
\le
\left(\sum_{i=1}^{n}a_i^2\right)
\left(\sum_{i=1}^{n}b_i^2\right)
$$
である。
ここで、任意の $i\in\{1,\dots,n\}$ に対して
$$
b_i:=1
$$
とおくと、
$$
\sum_{i=1}^{n}a_i b_i
=
\sum_{i=1}^{n}a_i\cdot 1
=
\sum_{i=1}^{n}a_i
$$
であり、また
$$
\sum_{i=1}^{n}b_i^2
=
\sum_{i=1}^{n}1^2
=
\sum_{i=1}^{n}1
=
n
$$
である。
したがって、$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式より、
$$
\left(\sum_{i=1}^{n}a_i\right)^2
=
\left(\sum_{i=1}^{n}a_i\cdot 1\right)^2
\le
\left(\sum_{i=1}^{n}a_i^2\right)
\left(\sum_{i=1}^{n}1^2\right)
=
n\sum_{i=1}^{n}a_i^2
$$
が従う。
つまり、この不等式は、$a_1,\dots,a_n$ の和を、ベクトル $(a_1,\dots,a_n)$ とベクトル $(1,\dots,1)$ の内積と見て、
$\mathrm{Cauchy}$-$\mathrm{Schwarz}$ の不等式を適用したものである。
この証明で相互独立性を使うのは、$i\neq j$ のとき
$$
\mathbb E[(X_i-\mathbb E[X_i])(X_j-\mathbb E[X_j])]=0
$$
を導く箇所である。
つまり、和の分散を展開したときに現れる交差項がすべて $0$ になることが本質である。
一般には、
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
+
\sum_{\substack{1\le i,j\le n\\ i\neq j}}
\operatorname{Cov}(X_i,X_j)
$$
である。
したがって、相互独立ならば $i\neq j$ に対して
$$
\operatorname{Cov}(X_i,X_j)=0
$$
となり、分散の和だけが残る。
この命題では $X_1,\dots,X_n$ の相互独立性を仮定した。
しかし、結論
$$
\mathbb V\left(\sum_{i=1}^{n}X_i\right)
=
\sum_{i=1}^{n}\mathbb V(X_i)
$$
だけを得るには、相互独立性より弱い条件で十分である。
具体的には、任意の $i\neq j$ について
$$
\operatorname{Cov}(X_i,X_j)=0
$$
が成り立てばよい。この条件を、$X_1,\dots,X_n$ が互いに無相関であるという。
相互独立ならば互いに無相関であるが、一般にその逆は成り立たない。