0

ピアソンの積率相関係数, スピアマンの順位相関係数, ファイ係数

479
0

はじめに

組のデータ (xi,yi), (i=1,n) が得られたとき, ピアソン(Pearson)の積率相関係数 r は次の式で求められる.

r=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2=ni=1nxiyi(i=1nxi)(i=1nyi)ni=1nxi2(i=1nxi)2ni=1nyi2(i=1nyi)2=i=1nxiyi1n(i=1nxi)(i=1nyi)i=1nxi21n(i=1nxi)2i=1nyi21n(i=1nyi)2

ちなみにコサイン類似度は

cosin_similality(x,y)=i=1n(xiyi)i=1nxi2i=1nyi2

なので相関係数は標本平均からのズレ具合についてのコサイン類似度です.

また, 順位データ(xi,yi), (i=1,n) が得られたとき, スピアマン(Spearman)の順位相関係数 rs は次の式で求められる.

rs=16i=1n(xiyi)2n(n21)

そして, 2×2 の分割表が次のように与えられたとき,

yx010ab1cd

ファイ係数 ϕ は次の式で求められる.

ϕ=adbc(a+b)(c+d)(a+c)(b+d)

多くの教科書には, 「順位相関係数は積率相関係数の特殊な場合である」とか, 「ファイ係数は2値データどうしの相関係数と等しい」とか書いてある.

でもそのことの証明などはたいてい省略されている.

そこでここでは初等的な計算により, 順位相関係数は順位データどうしの相関係数であり, ファイ係数は2値データどうしの相関係数であることを示す.

スピアマンの順位相関係数

xi, yi はどちらも順位データ(1からnまでの重複のない自然数)であるから, i=1nxi=i=1nyi, i=1nxi2=i=1nyi2 が成り立つ.

r=ni=1nxiyi(i=1nxi)(i=1nyi)ni=1nxi2(i=1xi)2ni=1nyi2(i=1yi)2=(2i=1nxiyi)2n(i=1nxi)(i=1nyi)2i=1nxi22n(i=1xi)2=(i=1nxi2+i=1nyi22i=1nxiyi)+i=1nxi2+i=1nyi22n(i=1nxi)(i=1nyi)2i=1nxi22n(i=1xi)2=1i=1n(xiyi)22i=1nxi22n(i=1xi)2

ここで,

(分母)=2i=1nxi22n(i=1xi)2=216n(n+1)(2n+1)2n(12n(n+1))2=16(2n(n+1)(2n+1)3n(n+1)2)=16n(n21)

結果,
r=rs=16i=1n(xiyi)2n(n21).

ファイ係数

分割表を再掲する.

yx010ab1cd

2値(0または1の値をとる)変数 xi, yi の積の合計 i=1nxiyi は分割表の d の値であるから,

r=ni=1nxiyi(i=1nxi)(i=1nyi)ni=1nxi2(i=1xi)2ni=1nxi2(i=1xi)2

(分子)=nd(b+d)(c+d)=(a+b+c+d)d(bc+bd+cd+d2)=adbc

ni=1nxi2(i=1xi)2=n(b+d)(b+d)2=(a+b+c+d(b+d))(b+d)=(a+c)(b+d)

ni=1nyi2(i=1yi)2=n(c+d)(c+d)2=(a+b+c+d(c+d))(c+d)=(a+b)(c+d)

結果,

r=ϕ=adbc(a+b)(c+d)(a+c)(b+d)

おしまい.

投稿日:20201118
更新日:2024531
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

cocotan
0
2546

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中