概要
本稿では,測度論やルベーグ積分に基づく公理的確率論の言葉を用いて,統計学における標本平均と標本分散,不偏標本分散について述べる.従って,読者は公理的確率論の基礎を理解しているものとする.加えて統計学の知識もあることが望ましいが,証明を追うだけであれば無くても問題はない.
以下,を確率空間とする.また,単に確率変数と言ったときは,上の実数値確率変数を意味するものとする.さらに,のBorel集合族,すなわちの開集合全体を含む最小の-加法族をと書く.
必要最低限の確率論の復習
用語の定義
確率変数の独立性
確率変数が独立であるとは,任意のに対して
が成り立つことをいう.また,確率変数が独立であるとは,任意のに対して
が成り立つことをいう.
確率変数の分布
を確率変数とする.任意のに対して
を満たす上の確率測度を,の分布という.
確率変数の期待値,分散,共分散
確率変数に対して,をの期待値という.
また,をの分散という.
さらに,確率変数に対して,をの共分散という.
期待値の線形性
積分の線形性により,期待値にも線形性が備わっている.すなわち,確率変数と実数に対して,常にが成り立つ.
確率変数の可積分性
確率変数がを満たすとき,は可積分であるという.
また,がを満たすとき,は二乗可積分であるという.
分散や共分散が定義される条件
確率変数の分散の値が定義されるためには,が二乗可積分であることが必要である.また,確率変数の共分散の値が定義されるためには,がともに二乗可積分であることが必要である.以下,これらの値について述べる際には,適切な二乗可積分性が仮定されているものとする.
諸性質とその証明
次の定理は,期待値すなわちルベーグ積分の定義に戻ることで証明できるが,冗長になるためここでは割愛する.
例えば,舟木直久『確率論』(朝倉書店,2004)補題3.17を参照せよ.
分散の定義および期待値の線形性に注意して計算すると,
となる.
分散の定義および期待値の線形性に注意して計算すると,
となる.
共分散の定義および期待値の線形性に注意して計算すると,
となる.ここで,は独立ゆえ,定理1よりである.従って,が成り立つ.
標本平均・標本分散・不偏標本分散
無作為標本と独立同分布性
母集団の統計的推測を行うためには,標本が無作為に選ばれている必要がある.無作為に選ばれた標本,すなわち無作為標本は,数学的には独立同分布な確率変数列として定義される.以下,標本と言ったとき,は確率変数である.
無作為標本
標本が互いに独立かつ同一の分布に従うとき,を母集団分布から抽出された大きさの無作為標本という.
標本平均・標本分散・不偏標本分散
標本平均と標本分散
標本に対して,を標本平均という.
また,を標本分散という.
標本平均,標本分散の定義は,データの平均,分散の求め方を考えればごく自然である.しかし,分散については,次に定義する不偏標本分散を用いることが多い.その理由は次節で明らかになる.
標本分散と不偏標本分散の違い
標本分散と不偏標本分散の違いは,偏差の平方和をで割るかで割るかだけである.よって,標本の標本分散,不偏標本分散をそれぞれとすると,が成り立つ.
不偏推定量
標本平均や標本分散,不偏標本分散のように,標本の関数として表されるものを統計量という.統計学では,これらの統計量を用いて,母平均や母分散といったパラメータを推定する.このように,推定に用いられる統計量を推定量という.
不偏推定量
パラメータの推定量がを満たすとき,をの不偏推定量という.
母平均と母分散の不偏推定量
を,母平均,母分散を持つ分布から抽出された大きさの無作為標本とする.このとき,標本平均,不偏標本分散は,それぞれ母平均,母分散の不偏推定量である.
標本平均の期待値は,期待値の線形性より
となる.従って,標本平均は母平均の不偏推定量である.一方,不偏標本分散の期待値は,
となる.ここで,に注意すると
である.さらに,問題2および命題2,問題3より
と計算できる.ゆえに
となる.従って,不偏標本分散は母分散の不偏推定量である.
不偏標本分散が用いられる理由
注意(標本分散と不偏標本分散の違い)と定理6より,母平均,母分散を持つ分布から抽出された大きさの無作為標本に対し,その標本分散をとすると,
となる.すなわち,標本分散は母分散の不偏推定量ではない.
問題の解答
問題1
- は実数値確率変数であるから,およびが成り立つ.
- ()が互いに素,すなわち相異なるに対してを満たすとき,相異なるに対してが成り立つから,確率測度の-加法性により
となる.
以上より,は上の確率測度である.
問題2
分散の定義および期待値の線形性に注意して計算すると,
となる.
問題3
分散の定義および期待値の線形性に注意して計算すると,
となる.ここで,は独立ゆえ,命題4より,相異なるに対してである.従って,上式最後の第2項はとなるからを得る.