私は今大学院に所属しており、確率論、特に確率微分方程式(或いはより専門的にラフ微分方程式)の研究をしています。そこでよく「具体的にどんな研究をされてるの?」という質問をされるんですが、語彙力不足もあり非専門の方への回答がうまくいかないことがしばしばあります。そこで、再びそのような場面になったときに対応できるよう、自分の考えを整理しておきたいと思ったのがこのノートの目的です。
あとは、せっかく大学院にまで行って専門的に学ぶ期間を頂いて、何か形にできる物でも残しておきたいなと思ったことも、このノートの動機でもあります。
あとは、何とか1年半近くかけてですが修論に載せられる程度の結果も出せて、精神的に時間的に余裕ができたので、暇つぶし・自己満として。
あとは、確率論・確率微分方程式についてもっと広まって欲しいなという思いもあります。昔「確率解析」について知りたいなと思ってGoogleで調べてみたことがあるんですが、ゴリゴリ理論中心だったりモチベがわからなかったり、という記事ばかりでなかなか取っ付きづらかった記憶があるんですが、もしかしたらこのノートが入門のそんな人の手助けになるかも?という思いです。
対象者は学部3年以上かと思いますが、気持ち的なことなら日本語が読めれば誰でも読めるとは思います。数学的に意味のあるノートにもしたいとも思って、難しい話をする箇所もありますが、取捨選択して読んでもらえれば。
1がノートで必要な用語の土台作りパート。2がモチベ向上パート。3がおまけパート。
ここでは確率論の基礎中の基礎中の基礎概念を2つ紹介します。詳細は舟木伊藤を参照されると良いです。
確率論では確率空間(大抵は$(\Omega,\mathscr{F},P)$で表される)を基礎となる対象とします。ここで、確率空間とは全測度が1となるような測度空間のことを指します。
例えばサイコロを$n$回振る試行を考えると$\Omega=\{1,2,3,4,5,6\}^n$となる。区間$[0,1]$から“ランダムに“数を取り出す試行は、ボレル集合族と標準的なLebesgue測度を用いて$\left([0,1],\mathscr{B}([0,1]),dt\right)$で表現できます。
&
このとき、試行結果$\omega\in\Omega$ごとに何らかのアウトプット$X(\omega)$を与えるようなマップ$X:\Omega\rightarrow E$を考えたくなるのが世の常だと思います。$E$は何らかの可測空間、例えば$\mathbb{R},\mathbb{R}^n$などです。$X$が可測であるときこれを確率変数と呼びます。
ちなみに、確率変数$X$は$E$上の確率測度を誘導します。具体的には、
$$\begin{equation}Q(A)=P(X^{-1}(A))=P(\{\omega\in\Omega\mid X(\omega)\in A\}),A\in\mathscr{B}(E)\end{equation}$$
と言った具合に。この$Q$を$X$の分布と呼びます。
ここで、マップの可測性とは、そのマップの性質の良さを表していると思ってください。
確率変数は「不確実なもの」の記述を可能にします。さらに踏み込んで「時間経過とともに変化する不確実のもの」の記述に確率過程が使われます。
$\mathbb{T}=\mathbb{N},[0,T],[0,\infty)$などとして確率過程とは、任意の$t\in\mathbb{T}$に対して$X(t, \cdot )=X_t$が確率変数になるようなマップ$X:\mathbb{T}\cross\Omega\rightarrow E$のことを言います。
例えば、$\Omega=\{1,2,3,4,5,6\}^n$として$n$回サイコロを振る試行を考えます。$t\in\{1,2,…,n\}$回目までででた目のうちの最大値を記述する確率過程は
$$ X_t(\omega)=\max\{\omega_i,1\leq i\leq t\}, \omega=(\omega_i)\in\Omega$$
で表現できます。
他だと、株価の変動、車の速度、粒子の運動、人口の推移などがあるかと思います。
連続時間での確率過程には、例えば連続性_つまり$\omega\in\Omega$ごとに$X_t(\omega)$の$t$についての連続性_や可測性_つまりマップ$X:\mathbb{T}\cross\Omega\rightarrow E$の組みとしての可測性_といった概念があるのですが、詳細は省略します。以下で扱う確率過程では概ねこれらの“良い“性質を満たすもののみを対象にすることにします。
ちなみに、$\Omega$上の実数値連続確率過程$X$を、$C([0,\infty),\mathbb{R})$-値確率変数と見做すことにより、$X$は$C([0,\infty),\mathbb{R})$上の確率測度つまり分布$ Q=Q^X$を誘導します。
以下は確率過程は実数値のみを扱うことにします。
ここからようやく確率解析の話に入っていきます。「確率解析」という分野の具体的な定義はよく知らないんですが笑、だいたいマルチンゲール理論や確率微分方程式論あたりを指すことが多いのかなと感じています。
確率解析の有名な応用先としてファイナンスがあるので、それを例にモチベーションを沸かせたいと思います。
まず前提として一つ有価証券(例えば株式、債券など)があるとして、$S=(S_t)_{t\in\mathbb{T}}$でその価値を表すものとします。ここでは連続時間$\mathbb{T}=[0,T]$を仮定しますが、イメージでは離散時間で考えてもらっても良いです。
「私」は時刻$t\in\mathbb{T}$でこの有価証券を$f_t$枚保有することにします。$f=(f_t)$は保有枚数を表す確率過程で、連続性を持つ確率過程(以下これを単に連続過程)でなくても良いです。
このとき時刻$t=0$から$t=T$にかけて増える私の資産はいくらか、ということを計算できるでしょうか?答えは「イエス」で、この計算がまさに確率積分な訳ですが、まずは簡単な例で見て見ましょう。
$f$が離散時間的に変動する場合、例えば取引時刻を1日おき1時間おきにするなどの場合を考えてみます。$0=t_0< t_1<…< t_m=T$として
$$ f_t=f_{t_i},t\in[t_i,t_{i+1}],i\geq0$$
とします。すると$t=0$から$t=T$にかけて増える私の資産は、
$$\begin{equation}\sum_{i=0}^{m-1}\end{equation}f_{t_i}(S_{t_{i+1}}-S_{t_i})=\int_0^Tf_tdS_t\tag{1}\label{1}$$
となります。
このように、投資行動による資産の増加量は$(\ref{1})$右辺の積分を使って表すことができます。この例では$(\ref{1})$はRiemann-Stieltjes積分として右辺の積分を捉えることができます。
では、$f$を例えば連続過程として、$(\ref{1})$の右辺をRiemann-Stieltjes積分として捉えることはできるでしょうか?$S$が十分滑らかであれば可能なんですが、今$S$は株価の変動のようなギザギザした曲線を想定しているので、答えは「ノー」です。例えば後に紹介するブラウン運動を用いると、このことがわかります。
ですからまた違った枠組みで$(\ref{1})$右辺の積分を構築する必要があり、それがまさに確率積分というものになります。理論的な構成は複雑なので多くは書けませんが、まあそういう積分があるんだな程度で捉えてもらうと良いと思います。
イメージしやすいように一つ“主張”を載せておきます。
$S$を良い性質を持つマルチンゲールとし、$f$を連続過程とする。$[0,T]$の分割の幅を狭めていったとき、$(\ref{1})$の左辺Riemann和は$(\ref{1})$右辺の確率積分に確率収束する。
Riemann和では小区間の左端の時刻での値を用いるという点が一つのポイントです。
マルチンゲールとは何か、必要な可測性は何か、確率収束の意味は何か、などの課題は残りますが、この”主張”によりイメージしやすくなったのではないでしょうか。
ちなみに、マルチンゲールとは公平性を持つような過程$S$を指します。つまり、$u< t$として、時刻$u$までの$S$の情報からは、$S_t$の増減を期待値的に予想することができない過程ということです。$\sigma(S_r,r\leq u)$を時刻$u$までの$S$の情報として、これを数式で表せば、
$$E[S_t-S_u\mid \sigma(S_r,r\leq u)]=0$$
と書くことができます。
また、$f$に対する連続性の仮定は実は不要で、より弱く(適切な)可測性さえ課してあれば十分です。
流石に確率積分の定義、構成などを述べないままでは何も主張できていないことと同等なので、構成をざっくりと述べます。唯一の理論パートなのでノートの趣旨とズレた節になるため読み飛ばしOK。詳細はKusuokaを参照。
$\mathcal{M}_{2,c}$を良い性質を持つマルチンゲール全体の集合とし、$M\in\mathcal{M}_{2,c}$をとる。例3のような確率過程$f$で有界なもの全体を$\mathcal{L}_0$とおき、適切な可測性と($M$依存の)可積分性を持つ確率過程全体を$\mathcal{L}_2([M])$と置く。
$\mathcal{M}_{2,c}$にマルチンゲールのノルムを、$\mathcal{L}_2([M])$に2乗積分値のノルムを入れると$\mathcal{L}_0$は$ \mathcal{L}_{2}([M])$の稠密な部分集合になる。
$(\ref{1})$により$I:\mathcal{L}_0\rightarrow\mathcal{M}_{2,c}$を定めると、これは等長作用素になる。よって$I$の$\mathcal{L}_2([M])$上への自然な等長拡張が存在し、これが確率積分を定義する。
先ほどマルチンゲールという確率過程を軽く説明しましたが、その一つの代表的なものがブラウン運動と呼ばれるものになります。これは、世の中至る所に存在する(存在せざるを得ない)正規分布が分布の要となる確率過程です。ここでは、おまけとしてその構成例を述べます。
標準的なランダムウォークとは、時刻0で0、時刻が1増えるごとにランダムに(つまり$1/2$の確率で)1ずつ増減する、という確率過程$Z_1$です。
これを時刻でスケーリングして、時刻0で0、時刻が$1/n$増えるごとにランダムに$1/\sqrt{n}$ずつ増減する、という確率過程$Z_n$を作ります。
その収束極限としてブラウン運動が実現されます。ここでの収束とは、$C([0,\infty),\mathbb{R})$上の確率測度の分布収束の意味です。(構成終)
さて、確率積分$I_t=I_0+\int_0^t f_udS_u$における被積分部分$f$は数理ファイナンスでは「ポートフォリオ」と呼ばれる部分ですが、これは投資家である「私」が決める項になります。つまり「私」の投資戦略を反映する項になります。
もしも立てた投資戦略が資産の増減$I_t$に依存するものだとしたら、最終的な利益$I_T$はどう計算できるでしょうか。つまり、例えば、$f_u=g(u,I_u)$と与えられるとした場合、
$$I_t =I_0+\int_0^tg(u,I_u)dS_u$$
という式が出てきますがこれは果たして解けるのでしょうか。これがまさに確率微分方程式と呼ばれるものになるわけですが、続きは次回書きたいと思います。
続きは 次回のノート で。