$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。また、$\lambda>0$ とする。
$X$ がパラメーター $\lambda$ の指数分布に従うとは、$X$ が確率密度関数 $f_X:\mathbb R\to[0,\infty)$ をもち、その確率密度関数が
$$
f_X(x)
=
\begin{cases}
\lambda e^{-\lambda x}, & x\ge0,\\
0, & x<0
\end{cases}
$$
で与えられることをいう。
このとき、
$$
X\sim\operatorname{Exp}(\lambda)
$$
と書く。
上の定義と同値に、$X$ がパラメーター $\lambda$ の指数分布に従うとは、$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$ が、任意の $x\in\mathbb R$ に対して
$$
F_X(x)
=
\mathbb P(X\le x)
=
\begin{cases}
0, & x<0,\\
1-e^{-\lambda x}, & x\ge0
\end{cases}
$$
で与えられることをいう。
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to[0,\infty)$ を非負実数値確率変数とする。
$X$ が無記憶性をもつとは、任意の $s,t\ge0$ について、$\mathbb P(X>s)>0$ ならば、
$$
\mathbb P(X>s+t\mid X>s)=\mathbb P(X>t)
$$
が成り立つことをいう。
$ $
ここで、条件付き確率は
$$
\mathbb P(X>s+t\mid X>s)
=
\frac{\mathbb P(\{X>s+t\}\cap\{X>s\})}{\mathbb P(X>s)}
$$
で定義される。
さらに、$t\ge0$ であるから、
$$
\{X>s+t\}\subseteq\{X>s\}
$$
であり、したがって
$$
\mathbb P(X>s+t\mid X>s)
=
\frac{\mathbb P(X>s+t)}{\mathbb P(X>s)}
$$
である。
無記憶性とは、すでに $s$ 時間待ったという情報を与えられても、
さらに $t$ 時間を超えて待つ条件付き確率が、最初から $t$ 時間を超えて待つ確率と同じであるという性質である。
任意の $n\in\mathbb N\cup\{0\}$ に対して、
$$
\lim_{x\to\infty}\frac{x^n}{e^x}=0
$$
が成り立つ。
$k\in\mathbb N$ を任意に固定し、$x\ge0$ に対して
$$
f_k(x):=\frac{x^k}{e^x}
$$
と定義する。このとき、$f_k$ は $[0,\infty)$ 上で連続であり、$(0,\infty)$ 上で微分可能である。
$x>0$ において、商の微分公式より、
$$
\begin{aligned}
f'_k(x)
&=
\frac{kx^{k-1}e^x-x^ke^x}{e^{2x}}\\
&=
\frac{kx^{k-1}-x^k}{e^x}\\
&=
\frac{x^{k-1}(k-x)}{e^x}
\end{aligned}
$$
である。
ここで、$x>0$ では
$$
x^{k-1}>0,\qquad e^x>0
$$
であるから、$f'_k(x)$ の符号は $k-x$ の符号に一致する。
したがって、
$$
\begin{array}{c|ccc}
x & 0< x< k & x=k & x>k \\
\hline
f'_k(x) & + & 0 & -
\end{array}
$$
である。よって、$f_k$ は $(0,k)$ で増加し、$(k,\infty)$ で減少に転ずる。
また、
$$
f_k(0)=0
$$
であり、
$$
f_k(k)=\frac{k^k}{e^k}>0
$$
である。したがって、$f_k$ は $[0,\infty)$ 上で $x=k$ において最大値をとる。
ゆえに、任意の $x\ge0$ に対して、
$$
0\le f_k(x)\le f_k(k)=\frac{k^k}{e^k}=\left(\frac{k}{e}\right)^k
$$
が成り立つ。
特に、$x>0$ に対して両辺を $x$ で割ると、
$$
0
\le
\frac{f_k(x)}{x}
\le
\frac{1}{x}\left(\frac{k}{e}\right)^k
$$
である。
右辺について、
$$
\lim_{x\to\infty}
\frac{1}{x}\left(\frac{k}{e}\right)^k
=
0
$$
であるから、はさみうちの原理より、
$$
\lim_{x\to\infty}\frac{f_k(x)}{x}=0
$$
が成り立つ。ここで、
$$
\frac{f_k(x)}{x}
=
\frac{x^k}{xe^x}
=
\frac{x^{k-1}}{e^x}
$$
であるから、
$$
\lim_{x\to\infty}\frac{x^{k-1}}{e^x}=0
$$
が成り立つ。
ここで、$k\in\mathbb N$ は任意であるから、任意に $n\in\mathbb N\cup\{0\}$ をとり、
$$
k:=n+1
$$
とおけば、$k\in\mathbb N$ であり、$k-1=n$ である。
したがって、
$$
\lim_{x\to\infty}\frac{x^n}{e^x}=0
$$
が従う。
$$ \Box$$
任意の $n\in\mathbb N\cup\{0\}$ に対して、
$$
\lim_{x\to\infty}\frac{x^n}{e^x}=0
$$
である。
したがって、極限の定義において $\varepsilon=1$ と取れば、ある $R>0$ が存在して、$x>R$ ならば
$$
\left|\frac{x^n}{e^x}\right|<1
$$
が成り立つ。
また、$x>0$ では
$$
\frac{x^n}{e^x}\ge0
$$
であるから、
$$
0\le\frac{x^n}{e^x}<1
$$
である。
$e^x>0$ より、
$$
x^n< e^x
$$
が従う。
すなわち、任意の $n\in\mathbb N\cup\{0\}$ に対して、十分大きな $x>0$ について
$$
x^n< e^x
$$
が成り立つ。
$\lambda>0$ とし、$X$ をパラメーター $\lambda$ の指数分布に従う確率変数とする。
すなわち、$X$ の確率密度関数 $f:\mathbb R\to[0,\infty)$ が
$$
f(x)
=
\begin{cases}
\lambda e^{-\lambda x}, & x\ge0,\\
0, & x<0
\end{cases}
$$
で与えられているとする。
このとき、$X$ は可積分であり、
$$
\mathbb E[X]=\frac{1}{\lambda}
$$
が成り立つ。
指数分布の密度関数は $x<0$ で $0$ であるから、
$$
\mathbb P(X<0)
=
\int_{-\infty}^0 f(x)\,dx
=
0
$$
である。したがって、$X\ge0$ がほとんど確実に成り立つ。
よって、$X$ の期待値は非負確率変数の期待値として
$$
\mathbb E[X]
=
\int_{-\infty}^{\infty}x f(x)\,dx
=
\lambda\int_0^\infty x e^{-\lambda x}\,dx
$$
で与えられる。
ここで、任意の $b>0$ に対して
$$
I_b:=\int_0^b x e^{-\lambda x}\,dx
$$
とおく。
部分積分により、
$$
\begin{aligned}
I_b
&=
\int_0^b x e^{-\lambda x}\,dx\\
&=
\left[-\frac{x}{\lambda}e^{-\lambda x}\right]_0^b
+
\frac{1}{\lambda}\int_0^b e^{-\lambda x}\,dx\quad \because \int_a^b u(x)v'(x)\ dx=[u(x)v(x)]_a^b-\int_a^b u'(x)v(x)\ dx \\
&=
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda}\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^b\\
&=
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda^2}(1-e^{-\lambda b})
\end{aligned}
$$
である。
ここで、$y=\lambda b$ とおくと、$b\to\infty$ のとき $y\to\infty$ であり、
$$
b e^{-\lambda b}
=
\frac{1}{\lambda}y e^{-y}
=
\frac{1}{\lambda}\frac{y}{e^y}
$$
である。
既知の極限($1$つ上で示した命題)
$$
\lim_{y\to\infty}\frac{y}{e^y}=0
$$
より、
$$
\lim_{b\to\infty}b e^{-\lambda b}
=
0
$$
が成り立つ。また、指数関数の極限についての性質から
$$
\lim_{b\to\infty}e^{-\lambda b}=0
$$
である。したがって、
$$
\begin{aligned}
\int_0^\infty x e^{-\lambda x}\,dx
&=
\lim_{b\to\infty}I_b\\
&=
\lim_{b\to\infty}
\left(
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda^2}(1-e^{-\lambda b})
\right)\\
&=
\frac{1}{\lambda^2}
\end{aligned}
$$
である。ゆえに、
$$
\mathbb E[X]
=
\lambda\int_0^\infty x e^{-\lambda x}\,dx
=
\lambda\cdot\frac{1}{\lambda^2}
=
\frac{1}{\lambda}
$$
である。さらに、
$$
\int_{-\infty}^{\infty}|x|f(x)\,dx
=
\int_0^\infty x\lambda e^{-\lambda x}\,dx
=
\frac{1}{\lambda}
<
\infty
$$
であるから、$X$ は可積分である。
以上より、
$$
\mathbb E[X]=\frac{1}{\lambda}
$$
が成り立つ。
$$ \Box$$
$\lambda>0$ とし、$X$ をパラメーター $\lambda$ の指数分布に従う確率変数とする。
すなわち、$X$ の確率密度関数 $f:\mathbb R\to[0,\infty)$ が
$$
f(x)
=
\begin{cases}
\lambda e^{-\lambda x}, & x\ge0,\\
0, & x<0
\end{cases}
$$
で与えられているとする。
このとき、$X$ は二乗可積分であり、
$$
\mathbb V(X)=\frac{1}{\lambda^2}
$$
が成り立つ。
また、標準偏差 $\sigma(X)$ は
$$
\sigma(X)=\frac{1}{\lambda}
$$
である。
まず、$X^2$ は非負確率変数であるから、その期待値は
$$
\mathbb E[X^2]
=
\int_{-\infty}^{\infty}x^2f(x)\,dx
$$
で与えられる。
密度関数の定義より、$x<0$ では $f(x)=0$ であり、$x\ge0$ では $f(x)=\lambda e^{-\lambda x}$ であるから、
$$
\mathbb E[X^2]
=
\lambda\int_0^\infty x^2e^{-\lambda x}\,dx
$$
である。任意の $b>0$ に対して、
$$
I_b:=\int_0^b x^2e^{-\lambda x}\,dx
$$
とおく。部分積分により、
$$
\begin{aligned}
I_b
&=
\int_0^b x^2e^{-\lambda x}\,dx\\
&=
\left[-\frac{x^2}{\lambda}e^{-\lambda x}\right]_0^b
+
\frac{2}{\lambda}\int_0^b xe^{-\lambda x}\,dx\quad \because \int_a^b u(x)v'(x)\ dx=[u(x)v(x)]_a^b-\int_a^b u'(x)v(x)\ dx \\
\end{aligned}
$$
である。
さらに、再び部分積分により、
$$
\begin{align}
\int_0^b xe^{-\lambda x}\,dx
&=
\int_0^b x\cdot e^{-\lambda x}\,dx\\
&=
\left[
x\left(-\frac{1}{\lambda}e^{-\lambda x}\right)
\right]_0^b
-
\int_0^b
1\cdot\left(-\frac{1}{\lambda}e^{-\lambda x}\right)\,dx
\qquad
\because
u=x,\quad v' = e^{-\lambda x}\\
&=
\left[-\frac{x}{\lambda}e^{-\lambda x}\right]_0^b
+
\frac{1}{\lambda}\int_0^b e^{-\lambda x}\,dx\\
&=
\left(
-\frac{b}{\lambda}e^{-\lambda b}
\right)
-
\left(
-\frac{0}{\lambda}e^{-\lambda\cdot0}
\right)
+
\frac{1}{\lambda}
\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^b\\
&=
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda}
\left(
-\frac{1}{\lambda}e^{-\lambda b}
-
\left(
-\frac{1}{\lambda}e^{-\lambda\cdot0}
\right)
\right)\\
&=
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda}
\left(
-\frac{1}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda}
\right)\\
&=
-\frac{b}{\lambda}e^{-\lambda b}
+
\left(
-\frac{1}{\lambda^2}e^{-\lambda b}
+
\frac{1}{\lambda^2}
\right)\\
&=
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda^2}(1-e^{-\lambda b})
\end{align}
$$
である。したがって、
$$
\begin{aligned}
I_b
&=
-\frac{b^2}{\lambda}e^{-\lambda b}
+
\frac{2}{\lambda}
\left(
-\frac{b}{\lambda}e^{-\lambda b}
+
\frac{1}{\lambda^2}(1-e^{-\lambda b})
\right)\\
&=
-\frac{b^2}{\lambda}e^{-\lambda b}
-
\frac{2b}{\lambda^2}e^{-\lambda b}
+
\frac{2}{\lambda^3}(1-e^{-\lambda b})
\end{aligned}
$$
である。ここで、$y=\lambda b$ とおく。
$\lambda>0$ であるから、$b\to\infty$ のとき $y\to\infty$ である。
-したがって、
$$
\begin{aligned}
\int_0^\infty x^2e^{-\lambda x}\,dx
&=
\lim_{b\to\infty}I_b\\
&=
\lim_{b\to\infty}
\left(
-\frac{b^2}{\lambda}e^{-\lambda b}
-
\frac{2b}{\lambda^2}e^{-\lambda b}
+
\frac{2}{\lambda^3}(1-e^{-\lambda b})
\right)\\
&=
\frac{2}{\lambda^3}
\end{aligned}
$$
である。ゆえに、
$$
\mathbb E[X^2]
=
\lambda\int_0^\infty x^2e^{-\lambda x}\,dx
=
\lambda\cdot\frac{2}{\lambda^3}
=
\frac{2}{\lambda^2}
<
\infty
$$
である。したがって、$X$ は二乗可積分である。
また、すでに示した指数分布の期待値($1$つ上で示した命題)より、
$$
\mathbb E[X]=\frac{1}{\lambda}
$$
である。$X$ は二乗可積分であるから、分散の公式(
証明はコチラ
)
$$
\mathbb V(X)=\mathbb E[X^2]-(\mathbb E[X])^2
$$
を用いることができる。
したがって、
$$
\begin{aligned}
\mathbb V(X)
&=
\mathbb E[X^2]-(\mathbb E[X])^2\\
&=
\frac{2}{\lambda^2}
-
\left(\frac{1}{\lambda}\right)^2\\
&=
\frac{1}{\lambda^2}
\end{aligned}
$$
である。また、$\lambda>0$ であるから、
$$
\begin{aligned}
\sigma(X)
&=
\sqrt{\mathbb V(X)}\\
&=
\sqrt{\frac{1}{\lambda^2}}\\
&=
\frac{1}{\lambda}
\end{aligned}
$$
である。
以上より、
$$
\mathbb V(X)=\frac{1}{\lambda^2},
\qquad
\sigma(X)=\frac{1}{\lambda}
$$
が成り立つ。
$$ \Box$$
分散公式
$$
\mathbb V(X)=\mathbb E[X^2]-(\mathbb E[X])^2
$$
を有限な実数の等式として使うには、$X$ が二乗可積分であること、すなわち
$$
\mathbb E[X^2]<\infty
$$
が必要である。
そのため、まず $\mathbb E[X^2]$ を計算して有限性を確認し、その後に分散公式を用いるのが厳密である。
$\lambda>0$ とし、$X$ をパラメーター $\lambda$ の指数分布に従う確率変数とする。
すなわち、$X$ の確率密度関数 $f_X:\mathbb R\to[0,\infty)$ が
$$
f_X(x)
=
\begin{cases}
\lambda e^{-\lambda x}, & x\ge0,\\
0, & x<0
\end{cases}
$$
で与えられているとする。
このとき、$X$ の累積分布関数 $F_X:\mathbb R\to[0,1]$ は
$$
F_X(x)
=
\begin{cases}
0, & x<0,\\
1-e^{-\lambda x}, & x\ge0
\end{cases}
$$
で与えられる。
累積分布関数の定義より、任意の $x\in\mathbb R$ に対して
$$
F_X(x)=\mathbb P(X\le x)
$$
である。
また、$X$ は確率密度関数 $f_X$ をもつので、
$$
F_X(x)
=
\int_{-\infty}^{x}f_X(t)\,dt
$$
が成り立つ。
以下、$x$ の範囲で場合分けする。
-以上より、
$$
F_X(x)
=
\begin{cases}
0, & x<0,\\
1-e^{-\lambda x}, & x\ge0
\end{cases}
$$
が成り立つ。
$$ \Box$$
$\lambda>0$ とし、確率変数 $X$ がパラメーター $\lambda$ の指数分布に従うとする。すなわち、
$$
X\sim\operatorname{Exp}(\lambda)
$$
とする。
このとき、任意の $s,t\ge0$ に対して、
$$
\mathbb P(X>s+t\mid X>s)=\mathbb P(X>t)
$$
が成り立つ。
指数分布の累積分布関数より、任意の $u\ge0$ に対して
$$
\mathbb P(X\le u)=1-e^{-\lambda u}
$$
である。
したがって、任意の $u\ge0$ に対して
$$
\mathbb P(X>u)
=
1-\mathbb P(X\le u)
=
1-(1-e^{-\lambda u})
=
e^{-\lambda u}\cdots①
$$
である(
確率の補集合式
)。特に、任意の $s\ge0$ に対して
$$
\mathbb P(X>s)=e^{-\lambda s}>0
$$
である。よって、条件付き確率 $\mathbb P(X>s+t\mid X>s)$ は定義される。
条件付き確率の定義より、
$$
\mathbb P(X>s+t\mid X>s)
=
\frac{\mathbb P(\{X>s+t\}\cap\{X>s\})}{\mathbb P(X>s)}
$$
である。
ここで、$t\ge0$ であるから、
$$
s+t\ge s
$$
である。したがって、
$$
\{X>s+t\}\subseteq\{X>s\}
$$
である。ゆえに、
$$
\{X>s+t\}\cap\{X>s\}
=
\{X>s+t\}
$$
である。したがって、
$$
\mathbb P(X>s+t\mid X>s)
=
\frac{\mathbb P(X>s+t)}{\mathbb P(X>s)}
$$
である。
式①を用いると、
$$
\mathbb P(X>s+t)=e^{-\lambda(s+t)}
$$
かつ
$$
\mathbb P(X>s)=e^{-\lambda s}
$$
である。よって、
$$
\begin{aligned}
\mathbb P(X>s+t\mid X>s)
&=
\frac{e^{-\lambda(s+t)}}{e^{-\lambda s}}\\
&=
e^{-\lambda(s+t)-(-\lambda s)}\\
&=
e^{-\lambda(s+t)+\lambda s}\\
&=
e^{-\lambda t}
\end{aligned}
$$
である。
一方、再び式①より、
$$
\mathbb P(X>t)=e^{-\lambda t}
$$
である。
したがって、
$$
\mathbb P(X>s+t\mid X>s)=\mathbb P(X>t)
$$
が成り立つ。
以上より、指数分布に従う確率変数 $X$ は無記憶性をもつ。
$$ \Box$$
条件付き確率 $\mathbb P(X>s+t\mid X>s)$ を定義するには、
$$
\mathbb P(X>s)>0
$$
が必要である。
指数分布では、任意の $s\ge0$ に対して
$$
\mathbb P(X>s)=e^{-\lambda s}>0
$$
であるため、条件付き確率は常に定義される。
この命題は、すでに $s$ 時間を超えて待ったという条件のもとで、
さらに $t$ 時間を超えて待つ確率が、最初から $t$ 時間を超えて待つ確率と同じであることを意味する。
すなわち、任意の $s,t\ge0$ に対して、
$$
\mathbb P(X-s>t\mid X>s)=\mathbb P(X>t)
$$
が成り立つ。
実際、
$$
\{X-s>t\}\cap\{X>s\}
=
\{X>s+t\}\cap\{X>s\}
=
\{X>s+t\}
$$
である。
したがって、事象 $\{X>s\}$ のもとでの残余待ち時間 $X-s$ の条件付き分布は、もとの $X$ の分布と一致する。