6
大学数学基礎解説
文献あり

確率論を理解したい(随時更新)

1139
5

目次

・はじめに
・記法・準備
・内容
・最後に

はじめに

どうも、色々やる数学徒です。
あけましておめでとうございます。
去年の12月は個人的に確率論を勉強していたので自分用のまとめ記事を書こうと思いこの記事を書いています。
確率論はつい最近手を出し始めた分野なのでおかしな箇所もあると思いますが良ければ最後まで読んでみてください。

参考にしたもの
マシロ様の記事
・確率・統計 PROBABILITY AND STATISTICS 柴田 文明
・PROBABILITY AND MEASURE J.R.NORRIS,N.BERESTYCKI

記法・定義

硬貨を投げる、カードを選ぶといった操作を試行、試行の結果起こった出来事を事象と呼ぶことにします。
全ての事象の集合をΩと書くことにします。(事象の1つを根元事象とか言ったりします)
ここでは空集合として、集合A補集合としてAcを使います。

可測空間

Ωは空でない集合とし、Ωの部分集合族A
[1]ΩA
[2]AAならばAcA
[3]{An}Aならばn=1AnA
を満たすときAσ集合体、組(Ω,A)を可測空間と呼ぶ

ここでわざわざ可測空間を導入するのは後で測度を導入するときに大きさを評価できる必要があるためです。
さらに後で使うのですが確率変数を通してより都合の良い可測空間を考えるためにBorel集合を定義しておきます。

Borel集合

(X,O)を位相空間とし、Xの開集合全体の集合O(X)により生成されるσ集合体をBorel集合族といいB(X)=σ(O(X))と書き、そのBorel集合族の元をBorel集合と呼びます。

ここで具体的に使うBorel集合はB(R)における(a,b)です。

内容

5,6で初めて確率というものを学校で習ったのですがそのとき教わった定義が曖昧なように感じて今まで確率を少し軽んじてしまっていたので今回の記事で克服しようと思います(`・ω・´)

小・中までの定義

事象の起こりやすさを確率という

僕はこんな感じで紹介されましたね。このとき起こりやすさってなんだよってめちゃくちゃ疑問でしたね。

Ωの要素の個数をn(Ω)と表します。

どの根元事象も同様に確からしく起こるとき
P(C)=n(C)n(Ω)を事象Cの確率という

これならちゃんと納得できる定義ですね。
測度論を使えば次のように定義できます。

確率測度

可測空間(Ω,F)上の確率測度とは以下の3つを満たす関数Pである
【1】P(Ω)=1
【2】AFならP(A)0
【3】A1,A2,A3Fでありそれぞれが互いに素ならばP(i=1Ai)=i=1P(Ai)
また、組(Ω,F,P)を確率空間と呼びます。

マシロ様の2つ目の記事にある定義をそのまま書きました。
マシロ様の記事がめちゃくちゃ初学者向けでわかりやすかったです。マジ神!
(ここでは一旦測度論は忘れて確率論を触ろうと思います)

次に条件付き確率を考えましょう。
ベン図 ベン図
上のベン図と定義4を用いると条件付き確率というものが考えられます。事象Aが起こったという前提のもと事象Bが起こる確率を条件付き確率といいP(B|A)と表します。PA(B)とも書くみたいですがここでは前者を使います。
先程の定義4に基づき条件付き確率を考えましょう。
n(AB)/n(Ω)n(A)/n(Ω)=P(AB)P(A)より
P(B|A)=P(AB)P(A)が成り立ちます。
また、P(B|A)=P(B)のように条件付き確率がAに依存しなければA,Bは互いに独立と言います。
ここまでは中学校でも習う確率の話ですね。

条件付き確率の書き方の覚え方としては条件付き確率はあくまでBが主役だから先に書く、みたいなイメージですかね?わかりにくかったらすみません
あっていればどんな覚え方でも、オッケーです

次からどんどん大数の確率論を見ていきましょう。(今見るとこの大学数学の略大数と大数の法則ってまどろっこしいですね、どうでもいいけど)

確率変数

確率変数なるものを導入します。
試行に伴って根元事象にそれぞれ与えられた数値を返す変数Xを確率変数と呼びます。
また、与えられた数値を実現値と呼びます。
e.g.)硬貨を投げて表がでる事象に1を裏がでる事象に0を割り当てるなど。(1,1のときもあるそうな…)
そして、上の例のように連続的でない確率変数を離散的確率変数、逆に連続的ならば連続的確率変数といいます。(まんまでわかりやすいですね)
以下、確率変数はXと書きます。
測度論的に確率変数を定義したら次のようになります。

確率変数

確率空間(Ω,A,P),可測空間(U,L)を考える

任意のBLに対しX1(B)Aを満たす写像X:ΩUを確率変数と呼ぶ

僕が初めて確率変数を見たとき「ん?写像じゃね」と思いツイートしたところ、どうやら後から確率測度空間からの写像としてみなされたようでした。先に名前がついっちゃってたパターンですね。

確率分布(離散)

確率分布を考えてみましょう。
確率変数Xが離散的確率変数のとき、返す値x1,x2,,xnのどれかは試行を行うまではわかりません。しかし、根元事象の確率がわかっているならば返される値の確率も考えることができます。
そこでj番目のxjを返す確率をP(X=xj)=Wjと表しWjXの確率関数と言い、Wjが与えられるとき、Xの確率分布が与えられていると言います。
e.g.)上の硬貨の具体例で考えてみましょう。
P(X=x1)=P(X=1)=W1=12
2も同様
また、確率の性質から0Wj1がわかります。

自然科学とかの論文を読むのが趣味の人とかだったら一度は確率分布という単語を見たことがあるのではないでしょうか。

確率関数に続き分布関数を導入します。
Xx以下であるときの確率を
F(x)=xjxWjと表す。

分布関数の性質として以下が知られています。(性質というか満たさねばならない定義ですね)
1.F()=1
2.F()=0
3.X(a,b]に入る確率はF(b)F(a)となる

簡単に示せるのでぜひ手を動かしてみてください。

確率分布(連続)

離散的な場合の確率分布すでにやりましたね。では、連続的な場合はどうなるのでしょうか?
積分ですね。
実現値の微小区間xx+Δxを考えましょう。
この区間に実現値が入る確率をW(x)Δxと表します。これを確率密度と言います。(離散と違いぎゅうぎゅうに詰まっているイメージですね)
以上を使って離散で考えたように分布関数を考えてあげましょう。(x以下をとる確率を考えるわけです)
F(x)=xW(x)dx
と書けますね。また上であげた性質も全て満たします。

よく確率論のpdfとかで積分を使っている理由が見えてきましたね。

測度論的な確率分布

一般に確率分布を考える際には上のように離散と連続で区別しなければなりませんでしたが測度論を用いればモーマンタイです。

確率分布

確率空間(Ω,A,W)の可測空間(R,B(R))値確率変数XWX(B)=W(X1(B))を満たすとき確率測度WXを確率分布という

Bernoulli試行とPoisson分布

高校数学である試行をn回行ったとき確率pの事象がx回起こる確率というものを考えたと思います。
それは以下のように書けるのでした。

反復試行の確率

P=(nx)px(1p)nx

反復試行の確率は何気に高校数学ででてくる確率の公式で一番好きかもしれませんねw
よくゲームのガチャとかで遊ぶときに真剣に使っていましたね。導出自体は簡単なのでぜひ試してみてください。

これは確率論ではBernoulli分布といい同じ試行を繰り返すことを特にBernoulli試行と言います。
では具体的にグラフを描いてみましょう。
にゃんこ大戦争というゲームが有名なのでありがたく具体例で使わせていただきます。
超激レアというキャラがガチャで排出される確率が0.05だそうなので100回引いたうちx回排出される確率を考えることにします。
にゃんこ大戦争のガチャの確率 にゃんこ大戦争のガチャの確率
グラフにしたら上みたいな感じになりそうですね。
一番確率が高そうな4回で約17%…
高いですね!(にゃんこヘビーユーザーより)
また、Bernoulli分布をB(n,p)と表すことにします。

高校数学の振り返りが終わったので早速Poisson分布を導入します。(極限操作が多いので教科書片手に打っていきます…)
先程のBernoulli分布でnが充分大きく、pは充分小さい場合を考えましょう。
ただし、np=μとし有限とします。
反復試行を書き直してみましょう。
Wx=(nx)(μn)x(1μn)nx
=(n)xx!nxμx(1μn)nx
(ここで(n)xは降冪のポッホハマー記号としています。)
また、(n)xnxより
Wx1x!μx(1μn)n

Wx1x!μxeμ(指数の定義より)
これをPoisson分布と言います。
前提からわかるようにこの分布は滅多に起こることない事象に対し何回も繰り返し試行することによって生じます。(ということは上の具体例は…まあいいや)

稀な事象を何回も繰り返し試行するとPoisson分布になるわけですが、不思議と自然界での事象を考えるとPoisson分布に合う現象があるそうな

正規分布

Poisson分布では大小関係から導入していったわけですがここでは大小はあまり気にしません。やったー
実は先程のPoisson分布ではnが大きくなるといきなり大きく増加する地点がでてきます。そこでlnWxを考えます。(lnは単調ですからね、都合がいい)
また、ここでは離散を考えているのですが、ln(x!)ならxが充分に大きいなら連続関数として扱えますね。
ということで次のように計算しちゃいましょう。
ln((x+Δx)!)ln(x!)Δxddxln(x!)
これは離散なので
ddxln(x!)lnx
が得られます。
定理1より
ln(Wx)=ln(n!)ln(x!)ln((nx)!)+xlnp+(nx)ln(1p)
そして上より
ddxlnWxlnx+ln(nx)+lnpln(1p)
もっとも確率が大きくなる地点での微分係数はもちろん0ですので
ln(μnμ)=ln(p1p)
さらに2階微分すると
d2dx2lnWxnx(nx)
ここでσ2=np(1p)という数を導入します。
するとx=μでの2階微分係数は
1σ2となります。
lnWxμの周りでテイラー展開します。
するとσ2を導入しておいたおかげで綺麗に書けますね!
lnWx=lnWx(xμ)22σ2+
x3次からの項は微少量となるため無視していいようです。
したがって、Wx=Wμexp((xμ)22σ2)が得られます。
さあいよいよです。みなさん大好きなガウス積分を使います。
気持ちいい!!!

eax2dx=πa,a>0

積分自体もめちゃくちゃ面白いのに確率でも登場してくれるっ!
そこに痺れる憧れるぅ

そして分布関数はWxdx=1を満たさねばなりませんでしたね。
よって
Wx=12πσ2exp((xμ)22σ2)
が得られます。
確率密度がこのような形になる確率分布を正規分布といい、N(μ,σ2)と書きます。(σ2は特に分散と言いますね)
Z=Xμσという確率変数の確率密度は

確率密度

Wx=12πez22

となりこれを標準正規化分布といいます。

最後に

いかがだったでしょうか。
確率論を少し覗くことができたのではないでしょうか?
僕は最初、「正直確率とか統計って現実ではよく使う道具だけど数学的な面白みはあるの?」と疑問に思っていたのですが確率論の世界を覗きこんでみるととても素晴らしい数学が広がっていることに気づけました。
やはり、数学徒たるもの、数学の分野は全て楽しみたいですね。(好き嫌いはよくないと学べました)
より厳密でわかりやすい議論はマシロ様が記事を投稿予定なので楽しみに待っていましょう♪
そして、ここでは測度論的にPoisson分布の話を記せなかったり確率密度らへんで中途半端に終わってしまったので中心極限定理を理解するまでは確率論の勉強を続けようと思います。(☻-☻)
それじゃ!

参考文献

[1]
柴田 文明, 確率・統計 PROBABILITY AND STATISTICS , 岩波書店
投稿日:202416
更新日:2024111
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

色数
色数
188
43148

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. 目次
  2. はじめに
  3. 記法・定義
  4. 内容
  5. 確率変数
  6. 確率分布(離散)
  7. 確率分布(連続)
  8. 測度論的な確率分布
  9. Bernoulli試行とPoisson分布
  10. 正規分布
  11. 最後に
  12. 参考文献