0

一様分布の期待値と分散、累積分布関数。

16
0
$$$$

Def.

区間上の一様分布

$a,b\in\mathbb R$ とし、$a< b$ とする。また、$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。
$X$ が区間 $[a,b]$ 上の一様分布に従うとは、$X$ の確率密度関数 $f_X:\mathbb R\to[0,\infty)$
$$ f_X(x) = \begin{cases} \dfrac{1}{b-a}, & a\le x\le b,\\ 0, & x< a\text{ または }x>b \end{cases} $$
で与えられることをいう。
このとき、
$$ X\sim\operatorname{Uniform}(a,b) $$
または
$$ X\sim U(a,b) $$
と書く。

累積分布関数による同値な定義

$X\sim U(a,b)$ であることは、$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$
$$ F_X(x) = \mathbb P(X\le x) = \begin{cases} 0, & x< a,\\ \dfrac{x-a}{b-a}, & a\le x\le b,\\ 1, & x>b \end{cases} $$
で与えられることと同値である。

確率の計算

$X\sim U(a,b)$ とする。このとき、$a\le c\le d\le b$ ならば、
$$ \mathbb P(c\le X\le d) = \int_c^d \frac{1}{b-a}\,dx = \frac{d-c}{b-a} $$
である。
すなわち、一様分布では、区間 $[a,b]$ の中で長さが同じ区間には同じ確率が割り当てられる。

端点における密度の値

確率密度関数の値は、$a$$b$ のような一点で変更しても、定まる分布は変わらない( 証明はコチラ )。
したがって、文献によっては
$$ f_X(x) = \begin{cases} \dfrac{1}{b-a}, & a< x< b,\\ 0, & x\le a\text{ または }x\ge b \end{cases} $$
のように書くこともある。
これは、$1$ 点の違いが積分で計算される確率に影響しないためである。

Prop&Proof.

一様分布の期待値

$a,b\in\mathbb R$ とし、$a< b$ とする。確率変数 $X$ が区間 $[a,b]$ 上の一様分布に従うとする。すなわち、
$$ X\sim U(a,b) $$
とする。
このとき、$X$ は可積分であり、
$$ \mathbb E[X]=\frac{a+b}{2} $$
が成り立つ。

一様分布 $U(a,b)$ の確率密度関数 $p:\mathbb R\to[0,\infty)$ は、
$$ p(x) = \begin{cases} \dfrac{1}{b-a}, & a\le x\le b,\\ 0, & x< a\text{ または }x>b \end{cases} $$
である。

  1. まず、$X$ が可積分であることを示す。
    $$ \begin{aligned} \int_{-\infty}^{\infty}|x|p(x)\,dx &= \int_a^b |x|\frac{1}{b-a}\,dx\\ &= \frac{1}{b-a}\int_a^b |x|\,dx \end{aligned} $$
    である。ここで、関数 $x\mapsto |x|$ は閉区間 $[a,b]$ 上で連続である。
    したがって、最大値の定理により、ある $M\ge0$ が存在して、任意の $x\in[a,b]$ に対して
    $$ |x|\le M $$
    が成り立つ。例えば、
    $$ M:=\max\{|a|,|b|\} $$
    とおけばよい。また、仮定より $a< b$ であるから、
    $$ b-a>0 $$
    である。したがって、
    $$ \begin{aligned} \int_{-\infty}^{\infty}|x|p(x)\,dx &= \int_a^b |x|\frac{1}{b-a}\,dx\\ &= \frac{1}{b-a}\int_a^b |x|\,dx\\ &\le \frac{1}{b-a}M(b-a)\\ &= M< \infty \end{aligned} $$
    である。したがって、
    $$ \mathbb E[|X|] = \int_{-\infty}^{\infty}|x|p(x)\,dx < \infty $$
    である。ゆえに、$X$ は可積分である。
    $ $
  2. 次に、期待値を計算する。期待値の定義より、
    $$ \begin{aligned} \mathbb E[X] &= \int_{-\infty}^{\infty}x p(x)\,dx\\ &= \int_a^b x\frac{1}{b-a}\,dx\\ &= \frac{1}{b-a}\int_a^b x\,dx\\ &= \frac{1}{b-a}\left[\frac{x^2}{2}\right]_a^b\\ &= \frac{1}{b-a}\left(\frac{b^2}{2}-\frac{a^2}{2}\right)\\ &= \frac{1}{b-a}\cdot\frac{b^2-a^2}{2}\\ &= \frac{1}{b-a}\cdot\frac{(b-a)(b+a)}{2}\\ &= \frac{a+b}{2} \end{aligned} $$
    である。

-以上より、
$$ \mathbb E[X]=\frac{a+b}{2} $$
が成り立つ。
$$ \Box$$

可積分性を先に示す理由

期待値 $\mathbb E[X]$ を有限な実数として扱うためには、通常は $X$ が可積分であること、すなわち
$$ \mathbb E[|X|]<\infty $$
を先に確認する必要がある。
この命題では、一様分布 $U(a,b)$ の台が有界区間 $[a,b]$ であるため、$X$ は可積分である。

中点としての意味

一様分布 $U(a,b)$ では、区間 $[a,b]$ の中で同じ長さの区間に同じ確率が割り当てられる。
そのため、期待値は区間の中点
$$ \frac{a+b}{2} $$
になる。

一様分布の分散

$a,b\in\mathbb R$ とし、$a< b$ とする。確率変数 $X$ が区間 $[a,b]$ 上の一様分布に従うとする。すなわち、
$$ X\sim U(a,b) $$
とする。
このとき、$X$ は二乗可積分であり、
$$ \mathbb V(X)=\frac{(b-a)^2}{12} $$
が成り立つ。

一様分布 $U(a,b)$ の確率密度関数 $p:\mathbb R\to[0,\infty)$ は、
$$ p(x) = \begin{cases} \dfrac{1}{b-a}, & a\le x\le b,\\ 0, & x< a\text{ または }x>b \end{cases} $$
である。

  1. まず、$X$ が二乗可積分であることを示す。
    期待値の定義より、
    $$ \begin{aligned} \mathbb E[X^2] &= \int_{-\infty}^{\infty}x^2p(x)\,dx\\ &= \int_a^b x^2\frac{1}{b-a}\,dx\\ &= \frac{1}{b-a}\int_a^b x^2\,dx\\ &= \frac{1}{b-a}\left[\frac{x^3}{3}\right]_a^b\\ &= \frac{1}{b-a}\left(\frac{b^3}{3}-\frac{a^3}{3}\right)\\ &= \frac{b^3-a^3}{3(b-a)} \end{aligned} $$
    である。ここで、
    $$ b^3-a^3=(b-a)(b^2+ab+a^2) $$
    である。また、$a< b$ より $b-a\neq0$ である。
    したがって、
    $$ \begin{aligned} \mathbb E[X^2] &= \frac{(b-a)(b^2+ab+a^2)}{3(b-a)}\\ &= \frac{b^2+ab+a^2}{3} \end{aligned} $$
    である。右辺は有限な実数であるから、
    $$ \mathbb E[X^2]<\infty $$
    である。ゆえに、$X$ は二乗可積分である。
    $ $
  2. 次に、分散を計算する。
    すでに示した通り、一様分布 $U(a,b)$ に従う確率変数 $X$ の期待値は
    $$ \mathbb E[X]=\frac{a+b}{2} $$
    である。
    また、$X$ は二乗可積分であるから、分散の公式より、
    $$ \mathbb V(X)=\mathbb E[X^2]-(\mathbb E[X])^2 $$
    である(直前の命題)。
    したがって、
    $$ \begin{aligned} \mathbb V(X) &= \mathbb E[X^2]-(\mathbb E[X])^2\\ &= \frac{b^2+ab+a^2}{3} - \left(\frac{a+b}{2}\right)^2\\ &= \frac{b^2+ab+a^2}{3} - \frac{(a+b)^2}{4}\\ &= \frac{4(b^2+ab+a^2)}{12} - \frac{3(a+b)^2}{12}\\ &= \frac{4(b^2+ab+a^2)-3(a+b)^2}{12}\\ &= \frac{4b^2+4ab+4a^2-3(a^2+2ab+b^2)}{12}\\ &= \frac{4b^2+4ab+4a^2-3a^2-6ab-3b^2}{12}\\ &= \frac{b^2-2ab+a^2}{12}\\ &= \frac{(b-a)^2}{12} \end{aligned} $$
    である。

-以上より、$X$ は二乗可積分であり、
$$ \mathbb V(X)=\frac{(b-a)^2}{12} $$
が成り立つ。
$$ \Box$$

分散が区間の長さだけに依存すること

一様分布 $U(a,b)$ の分散は
$$ \mathbb V(X)=\frac{(b-a)^2}{12} $$
である。
したがって、分散は区間の位置ではなく、区間の長さ $b-a$ によって決まる。
例えば、区間 $[a,b]$ を平行移動しても長さ $b-a$ は変わらないため、分散も変わらない。

一様分布の累積分布関数

$a,b\in\mathbb R$ とし、$a< b$ とする。確率変数 $X$ が区間 $[a,b]$ 上の一様分布 $U(a,b)$ に従うとする。
すなわち、$X$ は確率密度関数 $f_X:\mathbb R\to[0,\infty)$
$$ f_X(t) = \begin{cases} \dfrac{1}{b-a}, & a\le t\le b,\\ 0, & t< a\text{ または }t>b \end{cases} $$
をもつとする。
このとき、$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$
$$ F_X(x) = \begin{cases} 0, & x< a,\\ \dfrac{x-a}{b-a}, & a\le x\le b,\\ 1, & x>b \end{cases} $$
で与えられる。

累積分布関数の定義より、任意の $x\in\mathbb R$ に対して
$$ F_X(x)=\mathbb P(X\le x) $$
である。
また、$X$ は確率密度関数 $f_X$ をもつので、
$$ F_X(x)=\int_{-\infty}^{x}f_X(t)\,dt $$
が成り立つ。
以下、$x$ の範囲で場合分けする。

  1. $x< a$ の場合
    このとき、任意の $t\le x$ に対して $t< a$ である。
    したがって、$f_X(t)=0$ である。
    ゆえに、
    $$ F_X(x) = \int_{-\infty}^{x}f_X(t)\,dt = \int_{-\infty}^{x}0\,dt = 0 $$
    である。
    $ $
  2. $a\le x\le b$ の場合
    このとき、$t< a$ では $f_X(t)=0$ であり、$a\le t\le x$ では
    $$ f_X(t)=\frac{1}{b-a} $$
    である。したがって、
    $$ \begin{aligned} F_X(x) &= \int_{-\infty}^{x}f_X(t)\,dt\\ &= \int_a^x\frac{1}{b-a}\,dt\\ &= \frac{1}{b-a}\int_a^x1\,dt\\ &= \frac{1}{b-a}[t]_a^x\\ &= \frac{x-a}{b-a} \end{aligned} $$
    である。
    $ $
  3. $x>b$ の場合
    このとき、$t< a$ では $f_X(t)=0$ であり、$a\le t\le b$ では
    $$ f_X(t)=\frac{1}{b-a} $$
    であり、$t>b$ では $f_X(t)=0$ である。
    したがって、
    $$ \begin{aligned} F_X(x) &= \int_{-\infty}^{x}f_X(t)\,dt\\ &= \int_a^b\frac{1}{b-a}\,dt\\ &= \frac{1}{b-a}\int_a^b1\,dt\\ &= \frac{1}{b-a}[t]_a^b\\ &= \frac{b-a}{b-a}\\ &= 1 \end{aligned} $$
    である。

-以上より、
$$ F_X(x) = \begin{cases} 0, & x< a,\\ \dfrac{x-a}{b-a}, & a\le x\le b,\\ 1, & x>b \end{cases} $$
が成り立つ。
$$ \Box$$

端点での値について

一様分布の確率密度関数は、端点 $a,b$ における値を変更しても、定まる分布は変わらない( 証明はコチラ )。
これは、$1$ 点の違いが積分で計算される確率に影響しないためである。
したがって、文献によっては密度関数を
$$ f_X(t) = \begin{cases} \dfrac{1}{b-a}, & a< t< b,\\ 0, & t\le a\text{ または }t\ge b \end{cases} $$
のように書くこともある。

累積分布関数としての性質

上で得られた $F_X$ は広義単調増加で右連続であり、
$$ \lim_{x\to-\infty}F_X(x)=0,\qquad \lim_{x\to\infty}F_X(x)=1 $$
を満たす。

投稿日:11日前
更新日:11日前
数学の力で現場を変える アルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

Kagura
Kagura
7
4872
■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。          ----------------------------------------------- ■ ノート『数学概論』の読み方     STEP1:まずは定義を一通り理解し覚える。 STEP2:各命題の主張を一通り理解する。 STEP3:証明を繰り返し読んで流れを掴む。 STEP4:何も見ずに定義に従って証明を創る。 STEP5:他の証明方法を創ってみる。     ※ポイントは全体から細部へ読む事(´・ω・`)

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中