$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を非負の実数値確率変数とする。すなわち、任意の $\omega\in\Omega$ に対して
$$
X(\omega)\ge 0
$$
が成り立つとする。さらに、
$$
\mathbb E[X]<\infty
$$
を仮定する。このとき、任意の $a>0$ に対して
$$
\mathbb P(\{\omega\in\Omega:X(\omega)\ge a\})
\le
\frac{\mathbb E[X]}{a}
$$
が成り立つ。
任意に $a>0$ をとる。
事象
$$
A:=\{\omega\in\Omega:X(\omega)\ge a\}
$$
を定める。
$X$ は確率変数であり、$[a,\infty)$ は $\mathbb R$ のボレル集合であるから、
$$
A=X^{-1}([a,\infty))\in\mathcal F
$$
である。したがって、$A$ は事象である。
ここで、$A$ の指示関数 $1_A:\Omega\to\mathbb R$ を
$$
1_A(\omega):=
\begin{cases}
1, & \omega\in A,\\
0, & \omega\notin A
\end{cases}
$$
で定める。
任意の $\omega\in\Omega$ に対して、
$$
a1_A(\omega)\le X(\omega)
$$
が成り立つことを示す。
-以上より、任意の $\omega\in\Omega$ に対して
$$
a1_A(\omega)\le X(\omega)
$$
が成り立つ。
また、$X\ge0$ かつ $\mathbb E[X]<\infty$ であるから、$X$ は可積分である。
さらに、$A\in\mathcal F$ であるから $1_A$ は可測であり、
$$
0\le 1_A\le 1
$$
であるから $1_A$ は有界可測関数である。したがって、$1_A$ は可積分であり、$a1_A$ も可積分である。
$ $
よって、期待値の単調性より、
$$
\mathbb E[a1_A]\le \mathbb E[X]
$$
である。期待値の線形性より、
$$
\mathbb E[a1_A]=a\mathbb E[1_A]
$$
である。また、指示関数の期待値の性質より、指示関数 $1_A$ は$A$ 上で $1$ で、$A^c$ 上で $0$ となるので、
$$
\mathbb{E}[1_A] =\int_\Omega 1_A(\omega)\,d\mathbb P(\omega) =\int_A 1\,d\mathbb P(\omega)+\int_{A^c} 0\,d\mathbb P(\omega) =\mathbb P(A)+0 =\mathbb P(A)
$$
である。したがって、
$$
a\mathbb P(A)\le \mathbb E[X]
$$
を得る。
ここで、
$$
A=\{\omega\in\Omega:X(\omega)\ge a\}
$$
であるから、
$$
a\,\mathbb P(\{\omega\in\Omega:X(\omega)\ge a\})\le \mathbb E[X]
$$
である。
$a>0$ なので、両辺を $a$ で割ることができる。したがって、
$$
\mathbb P(\{\omega\in\Omega:X(\omega)\ge a\})
\le
\frac{\mathbb E[X]}{a}
$$
を得る。
以上より、任意の $a>0$ に対して
$$
\mathbb P(\{\omega\in\Omega:X(\omega)\ge a\})
\le
\frac{\mathbb E[X]}{a}
$$
が成り立つ。
$$ \Box$$
$(\Omega,\mathcal F,\mathbb P)$ を確率空間とし、$X:\Omega\to\mathbb R$ を実数値確率変数とする。$X$ が有限な期待値
$$
\mu:=\mathbb E[X]
$$
と有限な分散
$$
\sigma^2:=\mathbb V(X)=\mathbb E[(X-\mu)^2]
$$
をもつとする。このとき、任意の $a>0$ に対して
$$
\mathbb P(|X-\mu|\ge a)\le \frac{\sigma^2}{a^2}
$$
が成り立つ。
$\sigma>0$ であるとする。このとき、任意の $k>0$ に対して $a=k\sigma>0$ であるから、チェビシェフの不等式より
$$
\mathbb P(|X-\mu|\ge k\sigma)\le \frac{1}{k^2}
$$
が成り立つ。
$a>0$ を任意に固定する。ここで
$$
Y:=(X-\mu)^2
$$
とおく。
$X$ は実数値確率変数であり、写像
$$
x\mapsto (x-\mu)^2
$$
は $\mathbb R$ 上の連続関数である。したがって、連続関数と可測関数の合成は可測であるから、$Y$ は確率変数である。
また、任意の $\omega\in\Omega$ に対して平方は非負なので、
$$
Y(\omega)=(X(\omega)-\mu)^2\ge 0
$$
である。したがって、$Y$ は非負の確率変数である。
さらに、分散の定義より、
$$
\mathbb E[Y]
=
\mathbb E[(X-\mu)^2]
=
\sigma^2
$$
である。仮定より $\sigma^2<\infty$ なので、
$$
\mathbb E[Y]<\infty
$$
である。
よって、非負確率変数 $Y$ にマルコフの不等式を適用できる。
マルコフの不等式より、任意の $c>0$ に対して
$$
\mathbb P(Y\ge c)\le \frac{\mathbb E[Y]}{c}
$$
が成り立つ。
ここで、$c=a^2$ とおく。$a>0$ より $a^2>0$ であるから、
$$
\mathbb P(Y\ge a^2)
\le
\frac{\mathbb E[Y]}{a^2}
=
\frac{\sigma^2}{a^2}
$$
を得る。
$Y=(X-\mu)^2$ であるから、
$$
\mathbb P((X-\mu)^2\ge a^2)
\le
\frac{\sigma^2}{a^2}
$$
である。
最後に、
$$
\{\,|X-\mu|\ge a\,\}=\{\,(X-\mu)^2\ge a^2\,\}
$$
を確認する。
任意の $\omega\in\Omega$ に対して、$r=X(\omega)-\mu$ とおくと、$r\in\mathbb R$ である。$a>0$ なので、
$$
|r|\ge a\ \Leftrightarrow\ r^2\ge a^2
$$
が成り立つ。したがって、
$$
|X(\omega)-\mu|\ge a
\ \Leftrightarrow\
(X(\omega)-\mu)^2\ge a^2
$$
である。
よって、集合の外延性より、
$$
\{\,|X-\mu|\ge a\,\}=\{\,(X-\mu)^2\ge a^2\,\}
$$
である。
したがって、
$$
\mathbb P(|X-\mu|\ge a)
=
\mathbb P((X-\mu)^2\ge a^2)
\le
\frac{\sigma^2}{a^2}
$$
を得る。
以上より、任意の $a>0$ に対して
$$
\mathbb P(|X-\mu|\ge a)\le \frac{\sigma^2}{a^2}
$$
が成り立つ。
$$ \Box$$