相関係数$r$が$-1 \leq r \leq 1$を満たすことを示す。
そのために、コーシーシュワルツの不等式、
$ (\sum_{i=1}^{n} a_{i}^{2})(\sum_{i=1}^{n}b_{i}^{2}) \geq (\sum_{i=1}^{n}a_{i}b_{i})^{2} $
を示す。
$A=:B$はAはBによって定義されることを表す
$(x_{i},y_{i})$の組がn個あるとする
$r =: \frac{Cov(X,Y)}{σ_{x}σ_{y}}$
$μ_{x} =: \frac{1}{n} \sum_{i=1}^{n}x_{i} $
$σ_{x} =: \sqrt {\frac{1}{n} \sum_{i=1}^{n} (x_{i}-μ_{x})^{2}}$
$Cov(X,Y) =: \frac{1}{n} \sum_{i=1}^{n}(x_{i}-μ_{x})(y_{i}-μ_{y}) $
$ (\sum_{i=1}^{n} a_{i}^{2})(\sum_{i=1}^{n}b_{i}^{2}) \geq (\sum_{i=1}^{n}a_{i}b_{i})^{2} $
これを示す。以下、$ \sum $は特に断りの無い限り$ \sum_{i=1}^{n} $を表し、明らかな場合には添字を省略する。
まず、2次関数$ f(t) =: \sum (at-b)^2 $を考える。
この右辺は負にならないから、$ f(t)=0 $の解は高々1つである。
すなわち、この2次関数の判別式を$ D $と置くと$ D \leq 0 $となる。
さて、$f(t)$を展開して標準形に書き直すと、$ f(t)=\sum a^{2}t-2abt+b^{2} $となる。ここで$ \sum $の影響を受けるのは$ a,b $であるから整理して
$ f(t) = (\sum a^{2})t^{2}-2(\sum ab)t+(\sum b^{2}) $
1次の係数が$ 2n $の形をしているので$ \frac{D}{4} $を用いる。
$ \frac{D}{4} = (\sum ab)^2-(\sum a^{2})(\sum b^{2}) \leq 0 $
故に、$ (\sum_{i=1}^{n} a_{i}^{2})(\sum_{i=1}^{n}b_{i}^{2}) \geq (\sum_{i=1}^{n}a_{i}b_{i})^{2} $
(省略していた添字をもとに戻したことに注意。)
証明終
先程示した$ (\sum_{i=1}^{n} a_{i}^{2})(\sum_{i=1}^{n}b_{i}^{2}) \geq (\sum_{i=1}^{n}a_{i}b_{i})^{2} $を用いる。
$
\begin{eqnarray}
\left\{
\begin{array}{l}
a_{i}=x_{i}-μ_{x} \\
b_{i}=y_{i}-μ_{y}
\end{array}
\right.
\end{eqnarray}
$
を代入し、左辺で両辺を割ると
$ 1 \geq \frac{(\sum_{i=1}^{n} (x_{i}-μ_{x})(y_{i}-μ_{y}))^{2}}{(\sum_{i=1}^{n}(x_{i}-μ_{x})^{2})(\sum_{i=1}^{n}(y_{i}-μ_{y})^{2})} $
また、右辺の分子分母を$\frac{1}{n^{2}}$倍すると
$ 1 \geq \frac{(\frac{1}{n}\sum_{i=1}^{n} (x_{i}-μ_{x})(y_{i}-μ_{y}))^{2}}{(\frac{1}{n}\sum_{i=1}^{n}(x_{i}-μ_{x})^{2})(\frac{1}{n}\sum_{i=1}^{n}(y_{i}-μ_{y})^{2})} $
となる。これと定義を比較すると
$ 1 \geq \frac{Cov(X,Y)^{2}}{σ_{x}^{2}σ_{y}^{2}} $
つまり
$ 1 \geq r^{2} $
よって
$ -1 \leq r \leq 1 $
証明終
調べて見ましたがよくわかりませんでした。
$TeX$初心者なので許してください。