0
大学数学基礎解説
文献あり

確率論の言葉で書く標本平均・標本分散・不偏標本分散

241
0

概要

本稿では,測度論やルベーグ積分に基づく公理的確率論の言葉を用いて,統計学における標本平均と標本分散,不偏標本分散について述べる.従って,読者は公理的確率論の基礎を理解しているものとする.加えて統計学の知識もあることが望ましいが,証明を追うだけであれば無くても問題はない.

以下,(Ω,F,P)を確率空間とする.また,単に確率変数と言ったときは,(Ω,F)上の実数値確率変数を意味するものとする.さらに,RのBorel集合族,すなわちRの開集合全体を含む最小のσ-加法族をB(R)と書く.

必要最低限の確率論の復習

用語の定義

確率変数の独立性

確率変数X,Y独立であるとは,任意のA,BB(R)に対して
P(XA,YB)=P(XA)P(YB)
が成り立つことをいう.また,確率変数X1,X2,,Xn独立であるとは,任意のA1,A2,,AnB(R)に対して
P(X1A1,X2A2,,XnAn)=i=1nP(XiAi)
が成り立つことをいう.

確率変数の分布

Xを確率変数とする.任意のAB(R)に対して
PX(A)=P(XA)
を満たす(R,B(R))上の確率測度PXを,X分布という.

確率変数の分布が確率測度であることの証明

定義2において,PX(R,B(R))上の確率測度であることを示せ.

確率変数の期待値,分散,共分散

確率変数Xに対して,E(X)=ΩX(ω)P(dω)X期待値という.
また,V(X)=E({XE(X)}2)X分散という.
さらに,確率変数X,Yに対して,C(X,Y)=E({XE(X)}{YE(Y)})X,Y共分散という.

期待値の線形性

積分の線形性により,期待値にも線形性が備わっている.すなわち,確率変数X,Yと実数a,bに対して,常にE(aX+bY)=aE(X)+bE(Y)が成り立つ.

確率変数の可積分性

確率変数XE(|X|)<を満たすとき,X可積分であるという.
また,XE(X2)<を満たすとき,X二乗可積分であるという.

分散や共分散が定義される条件

確率変数Xの分散V(X)の値が定義されるためには,Xが二乗可積分であることが必要である.また,確率変数X,Yの共分散C(X,Y)の値が定義されるためには,X,Yがともに二乗可積分であることが必要である.以下,これらの値について述べる際には,適切な二乗可積分性が仮定されているものとする.

確率変数Xに対してV(X)=E(X2)E(X)2であることを示せ.

諸性質とその証明

次の定理は,期待値すなわちルベーグ積分の定義に戻ることで証明できるが,冗長になるためここでは割愛する.

独立な可積分確率変数の積の期待値

独立な可積分確率変数X1,X2,,Xnに対してE(i=1nXi)=i=1nE(Xi)が成り立つ.

例えば,舟木直久『確率論』(朝倉書店,2004)補題3.17を参照せよ.

分散の非線形性1

確率変数Xおよび実数a,bに対してV(aX+b)=a2V(X)が成り立つ.

分散の定義および期待値の線形性に注意して計算すると,
V(aX+b)=E({(aX+b)E(aX+b)}2)=E({aX+b(aE(X)+b)}2)=E({a(XE(X))}2)=a2E({XE(X)}2)=a2V(X)
となる.

分散の非線形性2

確率変数X,Yに対してV(X+Y)=V(X)+V(Y)+2C(X,Y)が成り立つ.

分散の定義および期待値の線形性に注意して計算すると,
V(X+Y)=E({(X+Y)E(X+Y)}2)=E({(XE(X))+(YE(Y))}2)=E({XE(X)}2+2{XE(X)}{YE(Y)}+{YE(Y)}2)=E({XE(X)}2)+2E({XE(X)}{YE(Y)})+E({YE(Y)}2)=V(X)+2C(X,Y)+V(Y)
となる.

確率変数の独立性と共分散

独立な確率変数X,Yに対してC(X,Y)=0が成り立つ.

共分散の定義および期待値の線形性に注意して計算すると,
C(X,Y)=E({XE(X)}{YE(Y)})=E(XYXE(Y)YE(X)+E(X)E(Y))=E(XY)E(Y)E(X)E(X)E(Y)+E(X)E(Y)=E(XY)E(X)E(Y)
となる.ここで,X,Yは独立ゆえ,定理1よりE(XY)=E(X)E(Y)である.従って,C(X,Y)=0が成り立つ.

独立な確率変数の分散の線形性

独立な確率変数X,Yに対してV(X+Y)=V(X)+V(Y)が成り立つ.

命題3と命題4から従う.

命題5の拡張

独立な確率変数X1,X2,,Xnに対してV(i=1nXi)=i=1nV(Xi)が成り立つことを示せ.

標本平均・標本分散・不偏標本分散

無作為標本と独立同分布性

母集団の統計的推測を行うためには,標本が無作為に選ばれている必要がある.無作為に選ばれた標本,すなわち無作為標本は,数学的には独立同分布な確率変数列として定義される.以下,標本Xと言ったとき,Xは確率変数である.

無作為標本

標本X1,X2,,Xnが互いに独立かつ同一の分布Fに従うとき,X1,X2,,Xnを母集団分布Fから抽出された大きさn無作為標本という.

標本平均・標本分散・不偏標本分散

標本平均と標本分散

標本X1,X2,,Xnに対して,X=1ni=1nXi標本平均という.
また,S2=1ni=1n(XiX)2標本分散という.

標本平均,標本分散の定義は,データの平均,分散の求め方を考えればごく自然である.しかし,分散については,次に定義する不偏標本分散を用いることが多い.その理由は次節で明らかになる.

不偏標本分散

標本X1,X2,,Xnに対して,s2=1n1i=1n(XiX)2不偏標本分散という.

標本分散と不偏標本分散の違い

標本分散と不偏標本分散の違いは,偏差の平方和をnで割るかn1で割るかだけである.よって,標本X1,X2,,Xnの標本分散,不偏標本分散をそれぞれS2,s2とすると,s2=nn1S2が成り立つ.

不偏推定量

標本平均や標本分散,不偏標本分散のように,標本の関数T(X1,X2,,Xn)として表されるものを統計量という.統計学では,これらの統計量を用いて,母平均や母分散といったパラメータを推定する.このように,推定に用いられる統計量を推定量という.

不偏推定量

パラメータθの推定量XE(X)=θを満たすとき,Xθ不偏推定量という.

母平均と母分散の不偏推定量

X1,X2,,Xnを,母平均μ,母分散σ2を持つ分布から抽出された大きさnの無作為標本とする.このとき,標本平均X,不偏標本分散s2は,それぞれ母平均μ,母分散σ2の不偏推定量である.

標本平均の期待値は,期待値の線形性より
E(X)=E(1ni=1nXi)=1ni=1nE(Xi)=1nnμ=μ
となる.従って,標本平均Xは母平均μの不偏推定量である.一方,不偏標本分散の期待値は,
E(s2)=E(1n1i=1n(XiX)2)=1n1E(i=1n(XiX)2)
となる.ここで,Xμ=1ni=1n(Xiμ)に注意すると
i=1n(XiX)2=i=1n{(Xiμ)(Xμ)}2=i=1n{(Xiμ)22(Xiμ)(Xμ)+(Xμ)2}=i=1n(Xiμ)22(Xμ)i=1n(Xiμ)+n(Xμ)2=i=1n(Xiμ)22n(Xμ)2+n(Xμ)2=i=1n(Xiμ)2n(Xμ)2
である.さらに,問題2および命題2,問題3より
E((Xiμ)2)=E((Xiμ)2)E(Xiμ)2=V(Xiμ)=V(Xi)=σ2E((Xμ)2)=E((Xμ)2)E(Xμ)2=V(Xμ)=V(X)=V(1ni=1nXi)=1n2V(i=1nXi)=1n2i=1nV(Xi)=1n2nσ2=σ2n
と計算できる.ゆえに
E(s2)=1n1(nσ2nσ2n)=1n1(n1)σ2=σ2
となる.従って,不偏標本分散s2は母分散σ2の不偏推定量である.

不偏標本分散が用いられる理由

注意(標本分散と不偏標本分散の違い)と定理6より,母平均μ,母分散σ2を持つ分布から抽出された大きさnの無作為標本X1,X2,,Xnに対し,その標本分散をS2とすると,
E(S2)=E(n1ns2)=n1nE(s2)=n1nσ2
となる.すなわち,標本分散は母分散の不偏推定量ではない.

問題の解答

問題1

  1. Xは実数値確率変数であるから,PX()=P(X)=0およびPX(R)=P(XR)=1が成り立つ.
  2. AnB(R)n=1,2,)が互いに素,すなわち相異なるi,j{1,2,}に対してAiAj=を満たすとき,相異なるi,j{1,2,}に対して{XAi}{XAj}=が成り立つから,確率測度Pσ-加法性により
    PX(n=1An)=P(n=1{XAn})=n=1P(XAn)=n=1PX(An)
    となる.

以上より,PX(R,B(R))上の確率測度である.

問題2

分散の定義および期待値の線形性に注意して計算すると,
V(X)=E({XE(X)}2)=E(X22XE(X)+E(X)2)=E(X2)2E(X)E(X)+E(X)2=E(X2)E(X)2
となる.

問題3

分散の定義および期待値の線形性に注意して計算すると,
V(i=1nXi)=E({i=1nXiE(i=1nXi)}2)=E({i=1n{XiE(Xi)}}2)=E(i=1n{XiE(Xi)}2+21i<jn{XiE(Xi)}{XjE(Xj)})=i=1nE({XiE(Xi)}2)+21i<jnE({XiE(Xi)}{XjE(Xj)})=i=1nV(Xi)+21i<jnC(Xi,Xj)
となる.ここで,X1,X2,,Xnは独立ゆえ,命題4より,相異なるi,j{1,2,,n}に対してC(Xi,Xj)=0である.従って,上式最後の第2項は0となるからV(i=1nXi)=i=1nV(Xi)を得る.

参考文献

[1]
舟木 直久, 確率論, 講座〈数学の考え方〉20, 朝倉書店, 2004
[2]
倉田 博史・星野 崇宏 共著, 入門統計解析, 新世社, 2009
投稿日:2022719
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

電気魚
電気魚
25
31517

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. 概要
  2. 必要最低限の確率論の復習
  3. 用語の定義
  4. 諸性質とその証明
  5. 標本平均・標本分散・不偏標本分散
  6. 無作為標本と独立同分布性
  7. 標本平均・標本分散・不偏標本分散
  8. 不偏推定量
  9. 問題の解答
  10. 問題1
  11. 問題2
  12. 問題3
  13. 参考文献