本稿では,確率論の記法を用いて「平均収束」や「$L^p$空間」について述べます.ただし,個人的な学習のメモなので,内容が体系的ではないことに注意してください.
以下,確率空間$(\Omega,\mathcal{F},P)$上の確率変数$X$および確率変数列$(X_n:n\geq1)$を考える.
$1\leq p<\infty$に対して,$E(|X|^p)<\infty$であることを$X\in\mathcal{L}^p$と表す.
$\mathcal{L}^p$は線形空間である.
$a,b\in\mathbb{R}$および$X,Y\in\mathcal{L}^p$に対して$aX+bY\in\mathcal{L}^p$であることを示せばよい.
$s,t\geq0$に対して$(s+t)^p\leq(2\max\{s,t\})^p\leq2^p(s^p+t^p)$が成り立つ.実際,最初の不等号は$s+t\leq2\max\{s,t\}$であることからわかり,2番目の不等号は$s^p\leq s^p+t^p$,$t^p\leq s^p+t^p$より$\max\{s,t\}^p=\max\{s^p,t^p\}\leq s^p+t^p$であることからわかる.
三角不等式と1より$|aX+bY|^p\leq(|a||X|+|b||Y|)^p\leq2^p(|a|^p|X|^p+|b|^p|Y|^p)$であるから$E(|aX+bY|^p)\leq2^pE(|a|^p|X|^p+|b|^p|Y|^p)=2^p\{|a|^pE(|X|^p)+|b|^pE(|Y|^p)\}<\infty$となり,$aX+bY\in\mathcal{L}^p$であることが従う.
以上より,$\mathcal{L}^p$は線形空間である.
$X\in\mathcal{L}^p$に対して$\|X\|_p:=E(|X|^p)^{1/p}$と定める.
$\|\cdot\|_p$は$\mathcal{L}^p$上の半ノルムである.
$\|\cdot\|_p$が半ノルムの定義を満たすことを示す.
$a\in\mathbb{R}$と$X\in\mathcal{L}^p$に対して,$\|aX\|_p=E(|aX|^p)^{1/p}=E(|a|^p|X|^p)^{1/p}=\{|a|^pE(|X|^p)\}^{1/p}=|a|E(|X|^p)^{1/p}=|a|\|X\|_p$となる.
$X,Y\in\mathcal{L}^p$に対して,Minkowskiの不等式より$\|X+Y\|_p\leq\|X\|_p+\|Y\|_p$が成り立つ.
以上より,$\|\cdot\|_p$は$\mathcal{L}^p$上の半ノルムである.
$X,Y\in\mathcal{L}^p$に対して$|\|X\|_p-\|Y\|_p|\leq\|X-Y\|_p$が成り立つ.
Minkowskiの不等式より$\|X\|_p=\|(X-Y)+Y\|_p\leq\|X-Y\|_p+\|Y\|_p$すなわち$\|X\|_p-\|Y\|_p\leq\|X-Y\|_p$,$\|Y\|_p=\|(Y-X)+X\|_p\leq\|Y-X\|_p+\|X\|_p=\|X-Y\|_p+\|X\|_p$すなわち$\|Y\|_p-\|X\|_p\leq\|X-Y\|_p$である.従って$|\|X\|_p-\|Y\|_p|\leq\|X-Y\|_p$が成り立つ.
$\mathcal{L}^p$の元の列$(X_n:n\geq1)$および$X\in\mathcal{L}^p$に対して,$X_n$が$X$に$p$次平均収束するとは
$$\lim_{n\to\infty}\|X_n-X\|_p=0 すなわち \lim_{n\to\infty}E(|X_n-X|^p)=0$$であることをいい,このことを$X_n\to X$ in $\mathcal{L}^p$と書く.
$X_n\to X$ in $\mathcal{L}^p$ならば$E(|X_n|^p)$は$E(|X|^p)$に収束する.
命題3より$|\|X_n\|_p-\|X\|_p|\leq\|X_n-X\|_p$が成り立つ.よって$X_n\to X$ in$\mathcal{L}^p$より$\|X_n\|_p$は$\|X\|_p$に収束する.従って,$E(|X_n|^p)$は$E(|X|^p)$に収束する.
$N=\{X\in\mathcal{L}^p:P(X=0)=1\}$とおく.
$L^p:=\mathcal{L}^p/N$と定め,$X\in\mathcal{L}^p$の同値類を$[X]_p$と書く.
$L^p$は$X\sim Y\Leftrightarrow X-Y\in N$によって定義される$\mathcal{L}^p$上の二項関係$\sim$による商空間である.すなわち,$\mathcal{L}^p$のほとんど確実に等しい元を同一視した空間が$L^p$である.
$L^p$は線形演算について閉じている.すなわち,次が成り立つ.
$X,Y\in\mathcal{L}^p$に対して$[X]_p+[Y]_p=[X+Y]_p$である.ただし,左辺の集合を次のように定義する.
$$[X]_p+[Y]_p:={\tilde{X}+\tilde{Y}:\tilde{X}\in[X]_p, \tilde{Y}\in[Y]_p}$$
$a\in\mathbb{R}$,$X\in\mathcal{L}^p$に対して$a[X]_p=[aX]_p$である.ただし,左辺の集合を次のように定義する. $$a[X]_p:= \begin{cases} \{a\tilde{X}:\tilde{X}\in[X]_p\} & (a\neq0) \\ [0]_p & (a=0) \end{cases}$$
以下,$\tilde{X}\in[X]_p, \tilde{Y}\in[Y]_p, \tilde{W}\in[X+Y]_p, \tilde{Z}\in[aX]_p$とする.
$P(\tilde{X}+\tilde{Y}=X+Y)=P(\tilde{X}-X=Y-\tilde{Y})\geq P(\tilde{X}-X=Y-\tilde{Y}=0)=1$より$\tilde{X}+\tilde{Y}\in[X+Y]_p$である.また,$1=P(\tilde{W}=X+Y)=P(X=\tilde{W}-Y)$かつ$\tilde{W}=(\tilde{W}-Y)+Y$より$\tilde{W}\in[X]_p+[Y]_p$である.
以上より,$L^p$は線形演算について閉じていることがわかる.
$L^p$は線形空間である.
$a,b\in\mathbb{R}$および$[X]_p,[Y]_p\in L^p$に対して,命題5より$a[X]_p+b[Y]_p=[aX+bY]_p\in L^p$であるから,$L^p$は線形空間である.
$[X]_p\in L^p$に対して$\|[X]_p\|_p:=\|X\|_p$と定める.$\|[X]_p\|_p$はwell-definedである.
任意の$\tilde{X}\in[X]_p$に対して,$P(\tilde{X}=X)=1$より$\|\tilde{X}\|_p=E(|\tilde{X}|^p)^{1/p}=E(|X|^p)^{1/p}=\|X\|_p$であることからわかる.
$\|\cdot\|_p$は$L^p$上のノルムである.
$\|\cdot\|_p$がノルムの定義を満たすことを示す.
$\|[0]_p\|_p=\|0\|_p=E(|0|^p)^{1/p}=0$である.逆に$[X]_p\neq[0]_p$のとき,$P(X\neq0)>0$より$\|[X]_p\|_p=\|X\|_p>0$すなわち$\|[X]\|_p\neq0$である.よって$\|[X]_p\|_p=0$ならば$[X]_p=[0]_p$である.
$a\in\mathbb{R}$と$[X]_p\in L^p$に対して,$\|a[X]_p\|_p=\|[aX]_p\|_p=\|aX\|_p=|a|\|X\|_p=|a|\|[X]_p\|_p$となる.
$[X]_p,[Y]_p\in L^p$に対して,$\|[X]_p+[Y]_p\|_p=\|[X+Y]_p\|_p=\|X+Y\|_p\leq\|X\|_p+\|Y\|_p=\|[X]_p\|_p+\|[Y]_p\|_p$となる.
以上より,$\|\cdot\|_p$は$L^p$上のノルムである.
写像$d\colon L^p\times L^p\to\mathbb{R}$を$d([X]_p,[Y]_p):=\|X-Y\|_p$で定める.
$d$は$L^p$上の距離である.
$d$が距離の定義を満たすことを示す.
定義より$d([X]_p,[Y]_p)\geq0$,$d([X]_p,[X]_p)=0$である.$d([X]_p,[Y]_p)=0$のとき,$\|X-Y\|_p=0$より$P(X=Y)=1$であるから$[X]_p=[Y]_p$となる.
$d([X]_p,[Y]_p)=\|X-Y\|_p=\|Y-X\|_p=d([Y]_p,[X]_p)$である.
$d([X]_p,[Y]_p)+d([Y]_p,[Z]_p)=\|X-Y\|_p+\|Y-Z\|_p\geq\|(X-Y)+(Y-Z)\|_p=\|X-Z\|_p=d([X]_p,[Z]_p)$である.
以上より,$d$は$L^p$上の距離である.
命題3が(半)ノルムの連続性と呼ばれる理由は次の命題である.
写像$\|\cdot\|_p\colon(L^p,d)\to(\mathbb{R},|\cdot|)$は連続である.
任意の$\varepsilon>0$に対して$\delta=\varepsilon$とおけば,$d([X]_p,[Y]_p)<\delta$を満たす$[X]_p,[Y]_p\in L^p$に対して,命題3より$|\|[X]_p\|_p-\|[Y]_p\|_p|=|\|X\|_p-\|Y\|_p|\leq\|X-Y\|_p=d([X]_p,[Y]_p)<\delta=\varepsilon$すなわち$|\|[X]_p\|_p-\|[Y]_p\|_p|<\varepsilon$となる.従って,写像$\|\cdot\|_p\colon(L^p,d)\to(\mathbb{R},|\cdot|)$は連続である.