指数分布の性質。無記憶性とか。

この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。

Def.

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。また、$\lambda>0$ とする。
$X$ がパラメーター $\lambda$ の指数分布に従うとは、$X$ が確率密度関数 $f_X:\mathbb R\to[0,\infty)$ をもち、その確率密度関数が
$$ f_X(x) = \begin{cases} \lambda e^{-\lambda x}, & x\ge0,\\ 0, & x<0 \end{cases} $$
で与えられることをいう。
このとき、
$$ X\sim\operatorname{Exp}(\lambda) $$
と書く。

累積分布関数による同値な定義

上の定義と同値に、$X$ がパラメーター $\lambda$ の指数分布に従うとは、$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$ が、任意の $x\in\mathbb R$ に対して
$$ F_X(x) = \mathbb P(X\le x) = \begin{cases} 0, & x<0,\\ 1-e^{-\lambda x}, & x\ge0 \end{cases} $$
で与えられることをいう。

$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to[0,\infty)$ を非負実数値確率変数とする。
$X$ が無記憶性をもつとは、任意の $s,t\ge0$ について、$\mathbb P(X>s)>0$ ならば、
$$ \mathbb P(X>s+t\mid X>s)=\mathbb P(X>t) $$
が成り立つことをいう。
$ $
ここで、条件付き確率は
$$ \mathbb P(X>s+t\mid X>s) = \frac{\mathbb P(\{X>s+t\}\cap\{X>s\})}{\mathbb P(X>s)} $$
で定義される。

さらに、$t\ge0$ であるから、
$$ \{X>s+t\}\subseteq\{X>s\} $$
であり、したがって
$$ \mathbb P(X>s+t\mid X>s) = \frac{\mathbb P(X>s+t)}{\mathbb P(X>s)} $$
である。

無記憶性の直観

無記憶性とは、すでに $s$ 時間待ったという情報を与えられても、
さらに $t$ 時間を超えて待つ条件付き確率が、最初から $t$ 時間を超えて待つ確率と同じであるという性質である。

Prop&Proof

指数関数とべき関数の比の極限の性質

任意の $n\in\mathbb N\cup\{0\}$ に対して、
$$ \lim_{x\to\infty}\frac{x^n}{e^x}=0 $$
が成り立つ。

$k\in\mathbb N$ を任意に固定し、$x\ge0$ に対して
$$ f_k(x):=\frac{x^k}{e^x} $$
と定義する。このとき、$f_k$ は $[0,\infty)$ 上で連続であり、$(0,\infty)$ 上で微分可能である。
$x>0$ において、商の微分公式より、
$$ \begin{aligned} f'_k(x) &= \frac{kx^{k-1}e^x-x^ke^x}{e^{2x}}\\ &= \frac{kx^{k-1}-x^k}{e^x}\\ &= \frac{x^{k-1}(k-x)}{e^x} \end{aligned} $$
である。
ここで、$x>0$ では
$$ x^{k-1}>0,\qquad e^x>0 $$
であるから、$f'_k(x)$ の符号は $k-x$ の符号に一致する。
したがって、
$$ \begin{array}{c|ccc} x & 0< x< k & x=k & x>k \\ \hline f'_k(x) & + & 0 & - \end{array} $$
である。よって、$f_k$ は $(0,k)$ で増加し、$(k,\infty)$ で減少に転ずる。
また、
$$ f_k(0)=0 $$
であり、
$$ f_k(k)=\frac{k^k}{e^k}>0 $$
である。したがって、$f_k$ は $[0,\infty)$ 上で $x=k$ において最大値をとる。
ゆえに、任意の $x\ge0$ に対して、
$$ 0\le f_k(x)\le f_k(k)=\frac{k^k}{e^k}=\left(\frac{k}{e}\right)^k $$
が成り立つ。
特に、$x>0$ に対して両辺を $x$ で割ると、
$$ 0 \le \frac{f_k(x)}{x} \le \frac{1}{x}\left(\frac{k}{e}\right)^k $$
である。
右辺について、
$$ \lim_{x\to\infty} \frac{1}{x}\left(\frac{k}{e}\right)^k = 0 $$
であるから、はさみうちの原理より、
$$ \lim_{x\to\infty}\frac{f_k(x)}{x}=0 $$
が成り立つ。ここで、
$$ \frac{f_k(x)}{x} = \frac{x^k}{xe^x} = \frac{x^{k-1}}{e^x} $$
であるから、
$$ \lim_{x\to\infty}\frac{x^{k-1}}{e^x}=0 $$
が成り立つ。
ここで、$k\in\mathbb N$ は任意であるから、任意に $n\in\mathbb N\cup\{0\}$ をとり、
$$ k:=n+1 $$
とおけば、$k\in\mathbb N$ であり、$k-1=n$ である。
したがって、
$$ \lim_{x\to\infty}\frac{x^n}{e^x}=0 $$
が従う。
$$ \Box$$

十分大きな $x$ に対する不等式

任意の $n\in\mathbb N\cup\{0\}$ に対して、
$$ \lim_{x\to\infty}\frac{x^n}{e^x}=0 $$
である。
したがって、極限の定義において $\varepsilon=1$ と取れば、ある $R>0$ が存在して、$x>R$ ならば
$$ \left|\frac{x^n}{e^x}\right|<1 $$
が成り立つ。
また、$x>0$ では
$$ \frac{x^n}{e^x}\ge0 $$
であるから、
$$ 0\le\frac{x^n}{e^x}<1 $$
である。
$e^x>0$ より、
$$ x^n< e^x $$
が従う。
すなわち、任意の $n\in\mathbb N\cup\{0\}$ に対して、十分大きな $x>0$ について
$$ x^n< e^x $$
が成り立つ。

指数分布の期待値

$\lambda>0$ とし、$X$ をパラメーター $\lambda$ の指数分布に従う確率変数とする。
すなわち、$X$ の確率密度関数 $f:\mathbb R\to[0,\infty)$ が
$$ f(x) = \begin{cases} \lambda e^{-\lambda x}, & x\ge0,\\ 0, & x<0 \end{cases} $$
で与えられているとする。
このとき、$X$ は可積分であり、
$$ \mathbb E[X]=\frac{1}{\lambda} $$
が成り立つ。

指数分布の密度関数は $x<0$ で $0$ であるから、
$$ \mathbb P(X<0) = \int_{-\infty}^0 f(x)\,dx = 0 $$
である。したがって、$X\ge0$ がほとんど確実に成り立つ。
よって、$X$ の期待値は非負確率変数の期待値として
$$ \mathbb E[X] = \int_{-\infty}^{\infty}x f(x)\,dx = \lambda\int_0^\infty x e^{-\lambda x}\,dx $$
で与えられる。
ここで、任意の $b>0$ に対して
$$ I_b:=\int_0^b x e^{-\lambda x}\,dx $$
とおく。
部分積分により、
$$ \begin{aligned} I_b &= \int_0^b x e^{-\lambda x}\,dx\\ &= \left[-\frac{x}{\lambda}e^{-\lambda x}\right]_0^b + \frac{1}{\lambda}\int_0^b e^{-\lambda x}\,dx\quad \because \int_a^b u(x)v'(x)\ dx=[u(x)v(x)]_a^b-\int_a^b u'(x)v(x)\ dx \\ &= -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda}\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^b\\ &= -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda^2}(1-e^{-\lambda b}) \end{aligned} $$
である。
ここで、$y=\lambda b$ とおくと、$b\to\infty$ のとき $y\to\infty$ であり、
$$ b e^{-\lambda b} = \frac{1}{\lambda}y e^{-y} = \frac{1}{\lambda}\frac{y}{e^y} $$
である。
既知の極限($1$つ上で示した命題)
$$ \lim_{y\to\infty}\frac{y}{e^y}=0 $$
より、
$$ \lim_{b\to\infty}b e^{-\lambda b} = 0 $$
が成り立つ。また、指数関数の極限についての性質から
$$ \lim_{b\to\infty}e^{-\lambda b}=0 $$
である。したがって、
$$ \begin{aligned} \int_0^\infty x e^{-\lambda x}\,dx &= \lim_{b\to\infty}I_b\\ &= \lim_{b\to\infty} \left( -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda^2}(1-e^{-\lambda b}) \right)\\ &= \frac{1}{\lambda^2} \end{aligned} $$
である。ゆえに、
$$ \mathbb E[X] = \lambda\int_0^\infty x e^{-\lambda x}\,dx = \lambda\cdot\frac{1}{\lambda^2} = \frac{1}{\lambda} $$
である。さらに、
$$ \int_{-\infty}^{\infty}|x|f(x)\,dx = \int_0^\infty x\lambda e^{-\lambda x}\,dx = \frac{1}{\lambda} < \infty $$
であるから、$X$ は可積分である。
以上より、
$$ \mathbb E[X]=\frac{1}{\lambda} $$
が成り立つ。
$$ \Box$$

指数分布の分散と標準偏差

$\lambda>0$ とし、$X$ をパラメーター $\lambda$ の指数分布に従う確率変数とする。
すなわち、$X$ の確率密度関数 $f:\mathbb R\to[0,\infty)$ が
$$ f(x) = \begin{cases} \lambda e^{-\lambda x}, & x\ge0,\\ 0, & x<0 \end{cases} $$
で与えられているとする。
このとき、$X$ は二乗可積分であり、
$$ \mathbb V(X)=\frac{1}{\lambda^2} $$
が成り立つ。
また、標準偏差 $\sigma(X)$ は
$$ \sigma(X)=\frac{1}{\lambda} $$
である。

まず、$X^2$ は非負確率変数であるから、その期待値は
$$ \mathbb E[X^2] = \int_{-\infty}^{\infty}x^2f(x)\,dx $$
で与えられる。
密度関数の定義より、$x<0$ では $f(x)=0$ であり、$x\ge0$ では $f(x)=\lambda e^{-\lambda x}$ であるから、
$$ \mathbb E[X^2] = \lambda\int_0^\infty x^2e^{-\lambda x}\,dx $$
である。任意の $b>0$ に対して、
$$ I_b:=\int_0^b x^2e^{-\lambda x}\,dx $$
とおく。部分積分により、
$$ \begin{aligned} I_b &= \int_0^b x^2e^{-\lambda x}\,dx\\ &= \left[-\frac{x^2}{\lambda}e^{-\lambda x}\right]_0^b + \frac{2}{\lambda}\int_0^b xe^{-\lambda x}\,dx\quad \because \int_a^b u(x)v'(x)\ dx=[u(x)v(x)]_a^b-\int_a^b u'(x)v(x)\ dx \\ \end{aligned} $$
である。
さらに、再び部分積分により、
$$ \begin{align} \int_0^b xe^{-\lambda x}\,dx &= \int_0^b x\cdot e^{-\lambda x}\,dx\\ &= \left[ x\left(-\frac{1}{\lambda}e^{-\lambda x}\right) \right]_0^b - \int_0^b 1\cdot\left(-\frac{1}{\lambda}e^{-\lambda x}\right)\,dx \qquad \because u=x,\quad v' = e^{-\lambda x}\\ &= \left[-\frac{x}{\lambda}e^{-\lambda x}\right]_0^b + \frac{1}{\lambda}\int_0^b e^{-\lambda x}\,dx\\ &= \left( -\frac{b}{\lambda}e^{-\lambda b} \right) - \left( -\frac{0}{\lambda}e^{-\lambda\cdot0} \right) + \frac{1}{\lambda} \left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^b\\ &= -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda} \left( -\frac{1}{\lambda}e^{-\lambda b} - \left( -\frac{1}{\lambda}e^{-\lambda\cdot0} \right) \right)\\ &= -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda} \left( -\frac{1}{\lambda}e^{-\lambda b} + \frac{1}{\lambda} \right)\\ &= -\frac{b}{\lambda}e^{-\lambda b} + \left( -\frac{1}{\lambda^2}e^{-\lambda b} + \frac{1}{\lambda^2} \right)\\ &= -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda^2}(1-e^{-\lambda b}) \end{align} $$
である。したがって、
$$ \begin{aligned} I_b &= -\frac{b^2}{\lambda}e^{-\lambda b} + \frac{2}{\lambda} \left( -\frac{b}{\lambda}e^{-\lambda b} + \frac{1}{\lambda^2}(1-e^{-\lambda b}) \right)\\ &= -\frac{b^2}{\lambda}e^{-\lambda b} - \frac{2b}{\lambda^2}e^{-\lambda b} + \frac{2}{\lambda^3}(1-e^{-\lambda b}) \end{aligned} $$
である。ここで、$y=\lambda b$ とおく。
$\lambda>0$ であるから、$b\to\infty$ のとき $y\to\infty$ である。

ここで、
$$ b^2e^{-\lambda b} = \frac{1}{\lambda^2}\frac{y^2}{e^y} $$
である。既知の極限($2$つ上で示した命題)
$$ \lim_{y\to\infty}\frac{y^2}{e^y}=0 $$
より、
$$ \lim_{b\to\infty}b^2e^{-\lambda b}=0 $$
が成り立つ。
$ $
同様に、
$$ be^{-\lambda b} = \frac{1}{\lambda}\frac{y}{e^y} $$
であり、既知の極限($2$つ上で示した命題)
$$ \lim_{y\to\infty}\frac{y}{e^y}=0 $$
より、
$$ \lim_{b\to\infty}be^{-\lambda b}=0 $$
が成り立つ。
$ $
また、$y=\lambda b$ とおくと、$b\to\infty$ のとき $y\to\infty$ であり、
$$ e^{-\lambda b} = e^{-y} = \frac{1}{e^y} $$
である。指数関数の性質より $y\to\infty$ のとき $e^y\to\infty$ であるから、
$$ \lim_{b\to\infty}e^{-\lambda b} = \lim_{y\to\infty}\frac{1}{e^y} = 0 $$
である。

-したがって、
$$ \begin{aligned} \int_0^\infty x^2e^{-\lambda x}\,dx &= \lim_{b\to\infty}I_b\\ &= \lim_{b\to\infty} \left( -\frac{b^2}{\lambda}e^{-\lambda b} - \frac{2b}{\lambda^2}e^{-\lambda b} + \frac{2}{\lambda^3}(1-e^{-\lambda b}) \right)\\ &= \frac{2}{\lambda^3} \end{aligned} $$
である。ゆえに、
$$ \mathbb E[X^2] = \lambda\int_0^\infty x^2e^{-\lambda x}\,dx = \lambda\cdot\frac{2}{\lambda^3} = \frac{2}{\lambda^2} < \infty $$
である。したがって、$X$ は二乗可積分である。
また、すでに示した指数分布の期待値($1$つ上で示した命題)より、
$$ \mathbb E[X]=\frac{1}{\lambda} $$
である。$X$ は二乗可積分であるから、分散の公式( 証明はコチラ )
$$ \mathbb V(X)=\mathbb E[X^2]-(\mathbb E[X])^2 $$
を用いることができる。
したがって、
$$ \begin{aligned} \mathbb V(X) &= \mathbb E[X^2]-(\mathbb E[X])^2\\ &= \frac{2}{\lambda^2} - \left(\frac{1}{\lambda}\right)^2\\ &= \frac{1}{\lambda^2} \end{aligned} $$
である。また、$\lambda>0$ であるから、
$$ \begin{aligned} \sigma(X) &= \sqrt{\mathbb V(X)}\\ &= \sqrt{\frac{1}{\lambda^2}}\\ &= \frac{1}{\lambda} \end{aligned} $$
である。
以上より、
$$ \mathbb V(X)=\frac{1}{\lambda^2}, \qquad \sigma(X)=\frac{1}{\lambda} $$
が成り立つ。
$$ \Box$$

分散公式
$$ \mathbb V(X)=\mathbb E[X^2]-(\mathbb E[X])^2 $$
を有限な実数の等式として使うには、$X$ が二乗可積分であること、すなわち
$$ \mathbb E[X^2]<\infty $$
が必要である。
そのため、まず $\mathbb E[X^2]$ を計算して有限性を確認し、その後に分散公式を用いるのが厳密である。

$\lambda>0$ とし、$X$ をパラメーター $\lambda$ の指数分布に従う確率変数とする。
すなわち、$X$ の確率密度関数 $f_X:\mathbb R\to[0,\infty)$ が
$$ f_X(x) = \begin{cases} \lambda e^{-\lambda x}, & x\ge0,\\ 0, & x<0 \end{cases} $$
で与えられているとする。
このとき、$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$ は
$$ F_X(x) = \begin{cases} 0, & x<0,\\ 1-e^{-\lambda x}, & x\ge0 \end{cases} $$
で与えられる。

累積分布関数の定義より、任意の $x\in\mathbb R$ に対して
$$ F_X(x)=\mathbb P(X\le x) $$
である。
また、$X$ は確率密度関数 $f_X$ をもつので、
$$ F_X(x) = \int_{-\infty}^{x}f_X(t)\,dt $$
が成り立つ。
以下、$x$ の範囲で場合分けする。

$x<0$ の場合
このとき、任意の $t\le x$ に対して $t<0$ である。したがって、指数分布の確率密度関数の定義より、
$$ f_X(t)=0 $$
である。
ゆえに、
$$ F_X(x) = \int_{-\infty}^{x}f_X(t)\,dt = \int_{-\infty}^{x}0\,dt = 0 $$
である。
$ $
$x\ge0$ の場合
このとき、$t<0$ では $f_X(t)=0$ であり、$t\ge0$ では $f_X(t)=\lambda e^{-\lambda t}$ であるから、
$$ F_X(x) = \int_{-\infty}^{x}f_X(t)\,dt = \int_0^x\lambda e^{-\lambda t}\,dt $$
である。
したがって、
$$ \begin{aligned} F_X(x) &= \int_0^x\lambda e^{-\lambda t}\,dt\\ &= \lambda\int_0^x e^{-\lambda t}\,dt \qquad \because \lambda\text{ は }t\text{ に依存しない定数である}\\ &= \lambda\left[-\frac{1}{\lambda}e^{-\lambda t}\right]_0^x \qquad \because \frac{d}{dt}\left(-\frac{1}{\lambda}e^{-\lambda t}\right) = e^{-\lambda t}\\ &= \lambda \left( -\frac{1}{\lambda}e^{-\lambda x} - \left(-\frac{1}{\lambda}e^{-\lambda\cdot0}\right) \right) \qquad \because [g(t)]_0^x=g(x)-g(0)\\ &= \lambda \left( -\frac{1}{\lambda}e^{-\lambda x} + \frac{1}{\lambda}e^0 \right) \qquad \because -\left(-\frac{1}{\lambda}e^{-\lambda\cdot0}\right) = \frac{1}{\lambda}e^0\\ &= \lambda \left( -\frac{1}{\lambda}e^{-\lambda x} + \frac{1}{\lambda} \right) \qquad \because e^0=1\\ &= \lambda\cdot \frac{1}{\lambda} \left( 1-e^{-\lambda x} \right) \qquad \because -\frac{1}{\lambda}e^{-\lambda x} + \frac{1}{\lambda} = \frac{1}{\lambda}(1-e^{-\lambda x})\\ &= 1-e^{-\lambda x} \qquad \because \lambda>0\text{ より }\lambda\cdot\frac{1}{\lambda}=1 \end{aligned} $$
である。

-以上より、
$$ F_X(x) = \begin{cases} 0, & x<0,\\ 1-e^{-\lambda x}, & x\ge0 \end{cases} $$
が成り立つ。
$$ \Box$$

$\lambda>0$ とし、確率変数 $X$ がパラメーター $\lambda$ の指数分布に従うとする。すなわち、
$$ X\sim\operatorname{Exp}(\lambda) $$
とする。
このとき、任意の $s,t\ge0$ に対して、
$$ \mathbb P(X>s+t\mid X>s)=\mathbb P(X>t) $$
が成り立つ。

指数分布の累積分布関数より、任意の $u\ge0$ に対して
$$ \mathbb P(X\le u)=1-e^{-\lambda u} $$
である。
したがって、任意の $u\ge0$ に対して
$$ \mathbb P(X>u) = 1-\mathbb P(X\le u) = 1-(1-e^{-\lambda u}) = e^{-\lambda u}\cdots① $$
である( 確率の補集合式 )。特に、任意の $s\ge0$ に対して
$$ \mathbb P(X>s)=e^{-\lambda s}>0 $$
である。よって、条件付き確率 $\mathbb P(X>s+t\mid X>s)$ は定義される。
条件付き確率の定義より、
$$ \mathbb P(X>s+t\mid X>s) = \frac{\mathbb P(\{X>s+t\}\cap\{X>s\})}{\mathbb P(X>s)} $$
である。
ここで、$t\ge0$ であるから、
$$ s+t\ge s $$
である。したがって、
$$ \{X>s+t\}\subseteq\{X>s\} $$
である。ゆえに、
$$ \{X>s+t\}\cap\{X>s\} = \{X>s+t\} $$
である。したがって、
$$ \mathbb P(X>s+t\mid X>s) = \frac{\mathbb P(X>s+t)}{\mathbb P(X>s)} $$
である。
式①を用いると、
$$ \mathbb P(X>s+t)=e^{-\lambda(s+t)} $$
かつ
$$ \mathbb P(X>s)=e^{-\lambda s} $$
である。よって、
$$ \begin{aligned} \mathbb P(X>s+t\mid X>s) &= \frac{e^{-\lambda(s+t)}}{e^{-\lambda s}}\\ &= e^{-\lambda(s+t)-(-\lambda s)}\\ &= e^{-\lambda(s+t)+\lambda s}\\ &= e^{-\lambda t} \end{aligned} $$
である。
一方、再び式①より、
$$ \mathbb P(X>t)=e^{-\lambda t} $$
である。
したがって、
$$ \mathbb P(X>s+t\mid X>s)=\mathbb P(X>t) $$
が成り立つ。
以上より、指数分布に従う確率変数 $X$ は無記憶性をもつ。
$$ \Box$$

条件付き確率が定義される理由

条件付き確率 $\mathbb P(X>s+t\mid X>s)$ を定義するには、
$$ \mathbb P(X>s)>0 $$
が必要である。
指数分布では、任意の $s\ge0$ に対して
$$ \mathbb P(X>s)=e^{-\lambda s}>0 $$
であるため、条件付き確率は常に定義される。

残余待ち時間としての意味

この命題は、すでに $s$ 時間を超えて待ったという条件のもとで、
さらに $t$ 時間を超えて待つ確率が、最初から $t$ 時間を超えて待つ確率と同じであることを意味する。
すなわち、任意の $s,t\ge0$ に対して、
$$ \mathbb P(X-s>t\mid X>s)=\mathbb P(X>t) $$
が成り立つ。
実際、
$$ \{X-s>t\}\cap\{X>s\} = \{X>s+t\}\cap\{X>s\} = \{X>s+t\} $$
である。
したがって、事象 $\{X>s\}$ のもとでの残余待ち時間 $X-s$ の条件付き分布は、もとの $X$ の分布と一致する。

投稿日：12日前

数学の力で現場を変えるアルゴリズムエンジニア募集 - Mathlog served by OptHub

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

かぐら

4511

■ 分野を問わず数学の証明が好きです。あとで自分が読み返したときに、きちんと理解できるノートを作ることを心がけています。不定期に過去のノートを確認し、修正&更新 (追加&削除) しています。定義、命題、証明などに誤りや不正確な点がございましたら、ご指摘いただけますと幸いです(2025年12月28日)。

他の人のコメント

コメントはありません。

読み込み中

かぐら

指数分布の性質。無記憶性とか。