0
大学数学基礎解説
文献あり

確率空間における平均収束とノルム,そしてL^p空間

1009
0
$$$$

概要

本稿では,確率論の記法を用いて「平均収束」や「$L^p$空間」について述べます.ただし,個人的な学習のメモなので,内容が体系的ではないことに注意してください.

$\mathcal{L}^p$半ノルム

以下,確率空間$(\Omega,\mathcal{F},P)$上の確率変数$X$および確率変数列$(X_n:n\geq1)$を考える.

$\mathcal{L}^p$空間

$1\leq p<\infty$に対して,$E(|X|^p)<\infty$であることを$X\in\mathcal{L}^p$と表す.

$\mathcal{L}^p$は線形空間である.

$a,b\in\mathbb{R}$および$X,Y\in\mathcal{L}^p$に対して$aX+bY\in\mathcal{L}^p$であることを示せばよい.

  1. $s,t\geq0$に対して$(s+t)^p\leq(2\max\{s,t\})^p\leq2^p(s^p+t^p)$が成り立つ.実際,最初の不等号は$s+t\leq2\max\{s,t\}$であることからわかり,2番目の不等号は$s^p\leq s^p+t^p$$t^p\leq s^p+t^p$より$\max\{s,t\}^p=\max\{s^p,t^p\}\leq s^p+t^p$であることからわかる.

  2. 三角不等式と1より$|aX+bY|^p\leq(|a||X|+|b||Y|)^p\leq2^p(|a|^p|X|^p+|b|^p|Y|^p)$であるから$E(|aX+bY|^p)\leq2^pE(|a|^p|X|^p+|b|^p|Y|^p)=2^p\{|a|^pE(|X|^p)+|b|^pE(|Y|^p)\}<\infty$となり,$aX+bY\in\mathcal{L}^p$であることが従う.

以上より,$\mathcal{L}^p$は線形空間である.

$X\in\mathcal{L}^p$に対して$\|X\|_p:=E(|X|^p)^{1/p}$と定める.

$\|\cdot\|_p$$\mathcal{L}^p$上の半ノルムである.

$\|\cdot\|_p$が半ノルムの定義を満たすことを示す.

  1. $a\in\mathbb{R}$$X\in\mathcal{L}^p$に対して,$\|aX\|_p=E(|aX|^p)^{1/p}=E(|a|^p|X|^p)^{1/p}=\{|a|^pE(|X|^p)\}^{1/p}=|a|E(|X|^p)^{1/p}=|a|\|X\|_p$となる.

  2. $X,Y\in\mathcal{L}^p$に対して,Minkowskiの不等式より$\|X+Y\|_p\leq\|X\|_p+\|Y\|_p$が成り立つ.

以上より,$\|\cdot\|_p$$\mathcal{L}^p$上の半ノルムである.

半ノルムの連続性

$X,Y\in\mathcal{L}^p$に対して$|\|X\|_p-\|Y\|_p|\leq\|X-Y\|_p$が成り立つ.

Minkowskiの不等式より$\|X\|_p=\|(X-Y)+Y\|_p\leq\|X-Y\|_p+\|Y\|_p$すなわち$\|X\|_p-\|Y\|_p\leq\|X-Y\|_p$$\|Y\|_p=\|(Y-X)+X\|_p\leq\|Y-X\|_p+\|X\|_p=\|X-Y\|_p+\|X\|_p$すなわち$\|Y\|_p-\|X\|_p\leq\|X-Y\|_p$である.従って$|\|X\|_p-\|Y\|_p|\leq\|X-Y\|_p$が成り立つ.

平均収束

$p$次平均収束

$\mathcal{L}^p$の元の列$(X_n:n\geq1)$および$X\in\mathcal{L}^p$に対して,$X_n$$X$$p$次平均収束するとは
$$\lim_{n\to\infty}\|X_n-X\|_p=0 すなわち \lim_{n\to\infty}E(|X_n-X|^p)=0$$であることをいい,このことを$X_n\to X$ in $\mathcal{L}^p$と書く.

$X_n\to X$ in $\mathcal{L}^p$ならば$E(|X_n|^p)$$E(|X|^p)$に収束する.

命題3より$|\|X_n\|_p-\|X\|_p|\leq\|X_n-X\|_p$が成り立つ.よって$X_n\to X$ in$\mathcal{L}^p$より$\|X_n\|_p$$\|X\|_p$に収束する.従って,$E(|X_n|^p)$$E(|X|^p)$に収束する.

$L^p$空間

$N=\{X\in\mathcal{L}^p:P(X=0)=1\}$とおく.

$L^p$空間

$L^p:=\mathcal{L}^p/N$と定め,$X\in\mathcal{L}^p$の同値類を$[X]_p$と書く.

$L^p$$X\sim Y\Leftrightarrow X-Y\in N$によって定義される$\mathcal{L}^p$上の二項関係$\sim$による商空間である.すなわち,$\mathcal{L}^p$のほとんど確実に等しい元を同一視した空間が$L^p$である.

$L^p$は線形演算について閉じている.すなわち,次が成り立つ.

  1. $X,Y\in\mathcal{L}^p$に対して$[X]_p+[Y]_p=[X+Y]_p$である.ただし,左辺の集合を次のように定義する.
    $$[X]_p+[Y]_p:={\tilde{X}+\tilde{Y}:\tilde{X}\in[X]_p, \tilde{Y}\in[Y]_p}$$

  2. $a\in\mathbb{R}$$X\in\mathcal{L}^p$に対して$a[X]_p=[aX]_p$である.ただし,左辺の集合を次のように定義する. $$a[X]_p:= \begin{cases} \{a\tilde{X}:\tilde{X}\in[X]_p\} & (a\neq0) \\ [0]_p & (a=0) \end{cases}$$

以下,$\tilde{X}\in[X]_p, \tilde{Y}\in[Y]_p, \tilde{W}\in[X+Y]_p, \tilde{Z}\in[aX]_p$とする.

  1. $P(\tilde{X}+\tilde{Y}=X+Y)=P(\tilde{X}-X=Y-\tilde{Y})\geq P(\tilde{X}-X=Y-\tilde{Y}=0)=1$より$\tilde{X}+\tilde{Y}\in[X+Y]_p$である.また,$1=P(\tilde{W}=X+Y)=P(X=\tilde{W}-Y)$かつ$\tilde{W}=(\tilde{W}-Y)+Y$より$\tilde{W}\in[X]_p+[Y]_p$である.

    • $a\neq0$のとき,$P(a\tilde{X}=aX)=P(\tilde{X}=X)=1$より$a\tilde{X}\in[aX]_p$である.また,$1=P(\tilde{Z}=aX)=P(X=a^{-1}\tilde{Z})$かつ$\tilde{Z}=a(a^{-1}\tilde{Z})$より$\tilde{Z}\in a[X]_p$である.
      • $a=0$のときは定義から直ちに従う.

以上より,$L^p$は線形演算について閉じていることがわかる.

$L^p$は線形空間である.

$a,b\in\mathbb{R}$および$[X]_p,[Y]_p\in L^p$に対して,命題5より$a[X]_p+b[Y]_p=[aX+bY]_p\in L^p$であるから,$L^p$は線形空間である.

$[X]_p\in L^p$に対して$\|[X]_p\|_p:=\|X\|_p$と定める.$\|[X]_p\|_p$はwell-definedである.

well-definedness

任意の$\tilde{X}\in[X]_p$に対して,$P(\tilde{X}=X)=1$より$\|\tilde{X}\|_p=E(|\tilde{X}|^p)^{1/p}=E(|X|^p)^{1/p}=\|X\|_p$であることからわかる.

$\|\cdot\|_p$$L^p$上のノルムである.

$\|\cdot\|_p$がノルムの定義を満たすことを示す.

  1. $\|[0]_p\|_p=\|0\|_p=E(|0|^p)^{1/p}=0$である.逆に$[X]_p\neq[0]_p$のとき,$P(X\neq0)>0$より$\|[X]_p\|_p=\|X\|_p>0$すなわち$\|[X]\|_p\neq0$である.よって$\|[X]_p\|_p=0$ならば$[X]_p=[0]_p$である.

  2. $a\in\mathbb{R}$$[X]_p\in L^p$に対して,$\|a[X]_p\|_p=\|[aX]_p\|_p=\|aX\|_p=|a|\|X\|_p=|a|\|[X]_p\|_p$となる.

  3. $[X]_p,[Y]_p\in L^p$に対して,$\|[X]_p+[Y]_p\|_p=\|[X+Y]_p\|_p=\|X+Y\|_p\leq\|X\|_p+\|Y\|_p=\|[X]_p\|_p+\|[Y]_p\|_p$となる.

以上より,$\|\cdot\|_p$$L^p$上のノルムである.

写像$d\colon L^p\times L^p\to\mathbb{R}$$d([X]_p,[Y]_p):=\|X-Y\|_p$で定める.

$d$$L^p$上の距離である.

$d$が距離の定義を満たすことを示す.

  1. 定義より$d([X]_p,[Y]_p)\geq0$$d([X]_p,[X]_p)=0$である.$d([X]_p,[Y]_p)=0$のとき,$\|X-Y\|_p=0$より$P(X=Y)=1$であるから$[X]_p=[Y]_p$となる.

  2. $d([X]_p,[Y]_p)=\|X-Y\|_p=\|Y-X\|_p=d([Y]_p,[X]_p)$である.

  3. $d([X]_p,[Y]_p)+d([Y]_p,[Z]_p)=\|X-Y\|_p+\|Y-Z\|_p\geq\|(X-Y)+(Y-Z)\|_p=\|X-Z\|_p=d([X]_p,[Z]_p)$である.

以上より,$d$$L^p$上の距離である.

命題3が(半)ノルムの連続性と呼ばれる理由は次の命題である.

写像$\|\cdot\|_p\colon(L^p,d)\to(\mathbb{R},|\cdot|)$は連続である.

任意の$\varepsilon>0$に対して$\delta=\varepsilon$とおけば,$d([X]_p,[Y]_p)<\delta$を満たす$[X]_p,[Y]_p\in L^p$に対して,命題3より$|\|[X]_p\|_p-\|[Y]_p\|_p|=|\|X\|_p-\|Y\|_p|\leq\|X-Y\|_p=d([X]_p,[Y]_p)<\delta=\varepsilon$すなわち$|\|[X]_p\|_p-\|[Y]_p\|_p|<\varepsilon$となる.従って,写像$\|\cdot\|_p\colon(L^p,d)\to(\mathbb{R},|\cdot|)$は連続である.

参考文献

[1]
David Williams, Probability with Martingales, Cambridge University Press, 1991
[2]
谷島賢二, ルベーグ積分と関数解析, 朝倉書店, 2015
投稿日:20201117
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

電気魚
電気魚
21
26642

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中