2

確率母関数から積率母関数へ

2712
0

はじめに

統計学において母関数(generating function)として用いられるものにはいくつか種類があります。たとえば確率母関数(probability generating function, p.g.fと略記)、特性関数(characteristic function, ch.f)、モーメント母関数(moment generating function,m.g.f)、キュムラント母関数(cumulant generating function,c.g.f)、factorial moment generating functionなどが挙げられます。確率分布の性質を知るのに母関数を用いることは良い方向に作用するので、数理統計学の参考書で突然母関数の議論が出てくることが多いです。それを見て戸惑う人のための理解の一助になればよいと思ったのがこの記事を書いたモチベーションです。まず今回は、比較的とっつきやすいp.g.fの概念からm.g.fを説明することを目指します。

Probability Generating Function(p.g.f,確率母関数)

確率母関数は主に負でない整数値をとる離散型の確率変数で用いられます。簡単のためにこの節では離散型のみの記述にとどめます。離散型の確率変数Xに関する確率質量関数(probability mass function, p.m.f)は
fX(x)=P(X=x)
で定義されます。xXの実現値です。このとき、p.g.fは以下のように定義されます。

p.g.f

GX(t)=EtX=x=0txfX(x)

ここでt|t|<1をみたす変数である。

なお、t=1を代入するとGX(1)=1になります。

上の定義は離散型の確率変数に関する平均(期待値)の定義に沿ったものであることを確認してください。
E(X)=xxfX(x)

またGX(t)が与えられたもとで、これをk回微分してt=0とおけばp.g.fからp.m.fが導かれます。つまりGX(k)(t)k!=fX(k)ということであり、「t=0のもとではfX(k)m.g.fk階微分と等しくなる」ということがいえます。これは後に述べるm.g.fにおいてもほぼ同じ議論ができます。

Moment Generating Function(m.g.f,モーメント母関数)

文献によっては積率母関数といわれることもあります。m.g.fp.g.fにおいてt=eθとおいたもので、以下のように定義します。
m.g.fにおいてθ0とおくと、p.g.fではt=eθ1になるので両者は等しいことに注意して眺めてみてください。

m.g.f

MX(θ)=EeθX

m.g.fを確率変数の形によって定義すると以下のようになる。
MX(θ)={ xeθXP(X=x)XdiscreteeθXfX(x)dxXcontinuous

これは定義1を変えただけなので何ら問題はないように見えるでしょう。ただし、0近傍のθに対して期待値が存在する場合に成り立つことに注意してください。つまり期待値が0近傍で存在しない場合には、m.g.fそれ自体が存在しないということを示唆しています。

さて、次の定理がこの記事の要点です。

もし確率変数Xm.g.fが存在する場合、以下が成り立つ。
EXn=MX(n)(0)where MX(n)(0)=dndθnMX(θ)|θ=0

この定理は、n次モーメントはt=0においてm.g.fn階微分に等しいということを強調しています。言い換えるなら、m.g.f0における微分係数が、確率変数Xの原点まわりn次のモーメントμn=EXnを表しているということを示唆しています。以下に定理の証明をのせます。

微分と積分が交換可能であるとすれば、
ddθMX(θ)=ddθeθxfX(x)dx=(ddθeθx)fX(x)dx=(xeθx)fX(x)dx=EXeθX
となる。なお最後の等号においては、LOTUSを用いている。
したがって、
dndθnMX(θ)|θ=0=EXneθX|θ=0=EXn

終わりに、m.g.fp.g.fの両方で、二項分布における平均と分散を導出できることを確認しましょう。

m.g.fを用いた二項分布の平均と分散の導出

MX(θ)=(eθp+1p)nEX=ddθMX(θ)|θ=0=n(eθp+1p)n1peθ|θ=0=npEX2=d2dθ2MX(θ)|θ=0=n(n1)p(eθp+1p)n2peθ|θ=0+np(eθp+1p)n1et|θ=0=n(n1)p2+np

よってVarX=np(1p)

p.g.fを用いた二項分布の平均と分散の導出

GX(t)=(pt+1p)nG(t)=np(1+p(t1))n1  G(1)=EX=npG(2)(t)=np(n1)(1+p(t1))n2p  G(2)(1)=EX(X1)=n(n1)p

よってVarX=np(1p)

※なぜt=1を代入したのか考えてみてください

さいごに

m.g.fはモーメント計算や確率分布を調べる際に有用ですが、その存在範囲に問題があります。ここでは解説しませんでしたが、ch.fは常に存在して確率分布を決定づけることから、一般的にはch.fを用います。どの累積分布関数(cumulative distribution function,c.d.f)にも固有のch.fが存在することが知られています。

p.g.fm.g.fを用いれば平均や分散があるような確率分布の計算はできますが、経済学など、歪度や尖度を求めるに際してモーメント計算が必要な分野はあるとしても、医学統計などではあまり見たことがなかったりもするので、使うかどうかは分野次第でしょう。

参考文献

  1. 竹村彰通「新装改訂版 現代数理統計学」,学術図書出版社,2020
  2. Jun Shao "Mathematical Statistics" 2nd ed.,Springer,2003
  3. 野田一雄、宮岡悦良「入門・演習 数理統計」,共立出版株式会社,1990
投稿日:20201113
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

大学で応用経済学(計量経済学、産業組織論)をかじったあと、医学系の大学院に進学して疫学と統計学の世界に迷い込んできました。

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. Probability Generating Function(p.g.f,確率母関数)
  3. Moment Generating Function(m.g.f,モーメント母関数)
  4. さいごに