1
大学数学基礎解説
文献あり

相関係数に関する理解を深める

614
1

学部生と一緒に、竹村先生の「新装改訂版 現代数理統計学」を輪読する機会がありました。その際に分散(variance)あるいは標準偏差(standard deviation)、共分散(covariance)、相関係数(correlation coefficient)をまとめた話の内容に関して結構ウケが良かったので、そこから少し一般向けに表記を改変したものをここに置いておきます。

相関係数ρは2つのベクトルの内積を考えたときのcosineの値なんですよ~という、少しググれば出てくる結論に至るまでの過程を紹介します。

準備

この手の話では準備が必要です。統計学の入門的な話をするに当たっては1つの確率変数で考えるのが普通なのですが、相関の話は2変量以上で行われる議論なので、ここでは2つの確率変数で考えます。それから、確率変数は離散型と連続型どちらで考えても、細かいところを除いては一緒なので、この記事では後者にします。

というわけでX,Yの2つの連続型確率変数に対して確率分布関数と確率密度関数を以下のように定義しましょう。

同時分布関数F(x,y)と同時確率密度関数f(x,y)

F(x,y)=xyf(u,v)dudv

f(x,y)=2xyF(x,y)

同時確率密度関数に関しては2つの確率変数で考えているわけだから、1つの確率変数に着目したいときには、一方をガン無視してもう一方だけを全範囲積分することもできます。その結果として周辺確率密度関数なるものが出来上がります。たとえばxに関して周辺を取ると
f(x)=f(x,y)dy
という感じになります。確率分布関数に関しても同様に考えることができます。

同時分布と周辺分布の関係を頑張って散布図に表してみると下のようになります。同時分布は上から見たときの等高線と思ってもらって構いません。

scatterplot scatterplot

分散の話題

統計学の入門書を見ると、Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)が成り立つと書いてあることが多いです。そしてたいていの本には引き続きこんなことが書かれてあるはずです。確率変数X,Yが独立な場合には、Var(X+Y)=Var(X)+Var(Y)である、と。これはつまり、独立なときには三平方の定理が成り立つということを示しています。

var var

ピタゴラスの定理は余弦定理に一般化できるので、直角Θに対して
cosθ=Var(X)+Var(Y)Var(X+Y)2Var(X)Var(Y)
となって、分子が0になることでcosθ0になることがわかります。ここで気づいてほしいのですが、この式の分母は標準偏差で、分子は2Covと同値なので共分散です。相関係数ρcosθと同じであると言われている意味が少し分かっていただけたかなと思います。

2つのベクトルが独立であれば内積は0になるという発想から、同じ結論をベクトルからも得ることができます。統計学では行列代数を多用するのですが、確率変数の直線的な関連の度合いを測るという点で、むしろベクトルの方が分かりやすいです。

では確率変数X,Yが独立でない場合にはどう解釈できるでしょうか。また1ρ1で定義されていることも確認してみましょう。簡単なのでご自身で考えてみてください。
scatterplot2 scatterplot2

独立と相関

ここまでの議論を、準備で述べた同時確率の話に持ち込めば、次の結論が得られるでしょう。互いに互いの確率分布の情報を持たないことこそが独立であるわけだから、同時確率密度関数がそれぞれの確率密度関数の積であればよいのだと。つまり
fX,Y(x,y)=fX(x)fY(y)fX|Y(x|y)=fX(x)
という条件を満たせば独立であるということを示唆しているにすぎません。先の節では、XYが互いに独立ならばそれらは無相関であるということを示しました。しかし逆が成り立つとは限りません。相関を持たないというのは単に平衡が取れている状態なので、「実は従属的でした~!」という可能性も捨てられません。相関係数はあくまでも2変量がどれだけ近しいかを見ていて、しかもお互いの確率変数どうしを基準にみていることに注意してください。ある意味、相関と因果の違いを感じさせられる場面でもありますね。

共分散とモーメントの話題

そもそも標準偏差なんてあくまでも共分散を標準化しただけなので、実はここまでの話って茶番です。結局のところ、ρを決定づけているのは共分散でしょう。共分散の話題なくして分かった気にはなれませんよね。
 共分散は2つの確率変数の偏差積の平均をとったものとして紹介されていることが多いです。共分散の中でも代表的な表現方法として、以下のようなものがあります。

2変量の分散共分散行列(variance-covariance mtrx.)

=E(XEX)(YEY)
は2×2対称行列かつ非負定値行列で、その対角要素は確率変数の分散である。

この分散共分散行列は、分散の概念を拡張したものと解釈できます。しかしこの概念が突然出てくると少し難しく感じるので、モーメントを用いてもう少し掘り下げてみようと思います。

2変量分布のモーメント

・原点まわり(j,k)次のモーメント
μjk=xjykf(x,y)dxdy

・平均まわり(j,k)次のモーメント
νjk=(xμ10)j(yμ01)kf(x,y)dxdy

ここでμ10Xの1次モーメント、μ01Yの1次モーメントを表す。

これを用いると、共分散は以下のように定義できます。

共分散

共分散は平均まわり(1,1)次のモーメントで、
Cov(X,Y)=ν11=μ11μ10μ01=E(XY)E(X)E(Y)=E(XEX)(YEY)

定義3と定義4をもとに、定義2にある分散共分散行列を変形すると、
=(ν202ν11ν11ν022)=(σ12ν11ν11σ22)
となります。ここでσ12Xの分散を、σ22Yの分散を表しています。
ここまでの記法をρに適用すれば、以下のようになります。

Pearsonの相関係数

ρ=v11v202v022=v11σ1σ2

さいごに

分散の個所に関しては高校生にも参考にしてもらえるよう、マイルドな表現にしてみました。とにかくここら辺のトピックはさまざまな話に展開しやすく、皆が一度は苦しむであろう自由度の説明にはもってこいですし、独立性と無相関性の個所は行列代数を用いてもう少し丁寧に追いたかった個所です。最低限の理解ということで分散共分散行列に関しては深掘りしませんでしたし、主に2変数に限定していたり、細かいところや途中計算を省いている個所もあります。時間が許されるならば追記なり新規で記事を書こうかなあと思っています。

参考文献

[1]
Jun Shao, Mathematical statistics
[2]
Stephen Boyd, Lieven Vandenberghe, Introduction to Applied Linear Algebra
[3]
Sudipto Banerjee, Anindya Roy, Linear Algebra and Matrix Analysis for Satistics
[4]
Matrix Algebra From a Statistician Perspective, Matrix Algebra From a Statistician's Perspective
[5]
Peter J. Bickel, Kjell A. Doksum , Mathematical Statistics: Basic Ideas and Selected Topics, Volume I
投稿日:2021119
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

大学で応用経済学(計量経済学、産業組織論)をかじったあと、医学系の大学院に進学して疫学と統計学の世界に迷い込んできました。

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. 準備
  2. 分散の話題
  3. 独立と相関
  4. 共分散とモーメントの話題
  5. さいごに
  6. 参考文献