第１回　確率変数と確率と確率分布

イントロダクション

正規分布の確率密度関数とは、このような姿をしています。

$$f_X(x)=\b{1}{\sqrt{2\pi\sigma}} \int_{-\infty}^{x}e^{-\b{(t-m)^2}{2\sigma^2}}dt$$

とはいうものの、この式がなぜこうなのか、具体的には、なぜ$\pi$や$e$が出てきて、指数の分母に$2\sigma^2$があるのか、きちんと説明するのは大変です。

学習指導要領が改訂されるにあたり、統計に関する内容が一層充実します。上記の数式は既に数学Ｂの教科書にも載っていますが、「…であることが知られている」と留め、証明などは触れられていません。むしろ、数学Ⅲを履修する前では、式の意味すら分からないはずです。

そこで、私はMathlogというプラットフォームで、確率変数とは何かあたりから、コツコツとまとめてみようと思います。まずは正規分布の確率密度関数の証明までを目標にして、頑張ります。

ということで、はじめは、確率変数についてのそもそも話から。

確率変数

ある範囲を動くことが想定されている数のことを変数という。試行の結果から得られる観測値は、偶然の影響のために定数ではなく、ある範囲を動く変数となる。しかも、どの値が出やすく、どの値が出にくいといった確率的な傾向が付加されている。このような変数を 確率変数 という。

確率変数には、習慣として𝑋, 𝑌, 𝑍, 𝑇, …のように大文字を用いる。

次に、確率変数とは区別して考えたほうが良いものを定義する。

実現値

確率変数𝑋に対して、その取りうる値のひとつひとつを、𝑋の実現値と呼ぶ。

例えば、大小２個のサイコロを１回投げて、出た目の和を考える。このとき、出た目の和は、偶然の影響によっていろいろな値をとる変数である。つまり、確率変数である。大文字で$X$と表すことにしよう。

実際に投げたとき、大きいサイコロが４の目、小さいサイコロが５の目となったとしよう。和は９である。つまり、この場合の確率変数の実現値は９となる。式で書くと
$$X=9$$
と表せる。その他、大小２個のサイコロの目の和は、２から１２までの自然数の値をとる。これらが、実現値。実現値は、小文字で表す習慣がある。$x=2,3,\dots,12$としたとき、
$$X=x$$
という式は、「確率変数$X$が、実現値$x$である場合」と捉えればよいと思う。

確率変数と実現値を、このように区別することは、最初は大変だと思う。けれども、はじめは曖昧なままであっても、勉強をすすめていくと徐々にイメージがつかめるようになるだろう。私もそうだった。

確率

次に、確率変数と確率の表し方を定義しよう。

確率

確率変数$X$が、実現値$x$と等しい確率を
$$P(X=x)$$
と表す。

かっこの中は、等号でなくともよい。確率変数$X$が、実現値$x$以下となる確率は、
$$P(X\ika x)$$
と表すことができる。そろそろ例題。

確率変数、実現値、確率について

大小２個のサイコロを同時に投げて、出た目の和を確率変数$X$とする。以下の確率を求めよう。
⑴ $P(X=9)$　　⑵ $P(X\ika 9)$　　⑶ $P(3\ika X<10)$

解　⑴ $\b{4}{36}$　　⑵ $\b{30}{36}$　　⑶ $\b{27}{36}$　 $\blacksquare$

※　状況に応じて、約分したりしなかったり、小数にしたりしなかったり、四捨五入もテキトウだったりする立場をとる。

確率分布

最後に、確率変数が取りうる実現値とその確率の関係性をビジュアル化する考え方について。

確率分布

実現値と、その確率との対応関係を確率分布という。確率変数$X$がある確率分布$\mathbb{D}$による対応関係で実現値をとるとき、確率変数$X$は確率分布$\mathbb{D}$に従うといい
$$X\sim\mathbb{D}$$
と表す。

$\mathbb{D}$は、ここでしか使わない謎の記号だが、「確率分布全体からなる集合（のようなもの）」と言えばよいだろう。分布をdistributionというからＤ。

確率分布

１個のサイコロを３回投げて、１の目が出た回数を$X$とする。$X$が従う確率分布をまとめよう。

解　これはいわゆる反復試行である。$X$がとりうる実現値は、$0,1,2,3$の４通りである。１の目が出る確率は$\b{1}{6}$であるから、実現値を$k$とかくと、
$$ P(X=k)={}_3 \mathrm{ C }_k \l\b{1}{6}\r^k\l\b{5}{6}\r^{3-k} $$
と一般に書くことができる。おのおのの実現値で計算すると、以下のようになる。
$$ P(X=0)=\b{125}{216},\\ P(X=1)=\b{75}{216},\\ P(X=2)=\b{15}{216},\\ P(X=3)=\b{1}{216} $$
これでもう立派な確率分布であるが、表にするとなお見栄えがよい。さらに、ヒストグラムのように図示することも有効である。　$\blacksquare$