はじめに
本稿は、E資格の受験資格の取得を目的としたラビットチャレンジの受講に伴うレポート記事である。
線形代数
ベクトル・スカラー
の要素をスカラーという。
任意の に対して、個の数 (=1,2,,)を縦に並べたを次元ベクトルという。
行列
任意の, に対して、個の数 (ここで=1,2,,, =1,2,,)を以下のように並べたを行列という。
特にのとき、次正方行列という。
単位行列
対角成分がすべて、ほかの成分がの正方行列を単位行列という。
逆行列
ある正方行列に対して、以下のようにとの積が単位行列となるような行列を逆行列という。
行列式
正方行列に対する行列式はやと表記がよく用いられる。
計算方法として代表的なものとして余因子展開があり、2次正方行列の行列式と3次正方行列の行列式は以下のような形になる。
なお、正方行列が逆行列を持つ必要十分条件は、が成り立つことである。
1.6. 固有値・固有ベクトル
正方行列に対して以下を満たすスカラーを固有値、ベクトル()を固有ベクトルという。
固有値分解
次正方行列の固有値・固有ベクトルの存在する(ただし、値の重複は認め、複素数の場合もある)と仮定する。
次正方行列の固有値, ,を対角成分に持ち、対角成分以外は0となる行列と、対応する固有ベクトルを並べた行列が以下の通り表される。
これに対して、以下が成り立つ。
これを行列の固有値分解という。
特異値・特異ベクトル
行列()に対して、以下を満たす非負の実数を特異値、単位ベクトルを左特異ベクトル、を右特異ベクトルという。
ここではの転置行列である。
特異値分解
ここでは行列(、=)の特異値・特異ベクトルの存在を仮定する。
行列の特異値, ,を対角成分に持ち、他の成分がとなる対角行列
と対応する左特異ベクトルを並べた以下の行列
および、右特異ベクトルを並べた以下の行列
を定義する。
これに対して、以下が成り立つ。
これを行列の特異値分解という。
確率・統計
条件付き確率
事象が起こったという条件のもとで、事象が起こる確率をで表し、
で定義する。ただし。これを事象のもとでの事象の条件付き確率という。
独立な事象の同時確率
事象、について、
が成り立つとき、とは独立であるという。
ベイズの定理
を標本空間、、をの事象とし、と仮定する。
このとき、事象について以下の式が成立する。
ただし、とする。
これをベイズの定理という。
確率変数
試行の根元事象により値が定まる変数を確率変数といい、特に値を連続的には取らない確率変数を離散的な確率変数、連続的に値を取る確率変数を連続的な確率変数という。
確率分布
離散的な確率分布
離散的な確率変数について、
により定まる関数を確率変数の確率分布という。
連続的な確率分布
連続的な確率変数が、任意の実数、()に対して、
となるような関数を持つとき、を確率変数の確率密度関数といい、は確率分布に従うという。
(注:測度を用いた論理展開という意味では、積分値は必ず定まるかが最初のポイントになる。もし、定まることが示せたのであれば、とおいて、をとすることより、確率密度関数を定義する。すなわち、確率密度関数は積分の結果に対して積分をすることで求められる)
期待値
離散的な確率変数の期待値
離散的な確率変数の確率分布をとするとき、
をの期待値という。
連続的な確率変数の期待値
連続的な確率変数の確率密度関数をとするとき、
をの期待値という。
分散と標準偏差
確率変数に対して、
をの分散という。
式変形すると、以下が成り立つこともわかる。
また、分散の平方根
をの標準偏差という。
共分散
2つの確率変数、に対して、
をとの共分散という。
式変形をすることで、以下が成り立つことがわかる。
情報理論
自己情報量
事象の起こる確率がであるとき、事象が起こることの自己情報量は以下によって定義される。
注:公理に基づいて導出されるものであるがゆえ、扱う対象によって底の値が異なることに注意する。
本稿では底を記載しないが、状況に応じていくつを用いるかは確認すること。
シャノンエントロピー
離散的な確率変数において、としたとき、以下の式をのシャノンエントロピーという。
連続的な確率変数の場合、確率密度関数をもつとすると、シャノンエントロピーは以下のように定義される。
コメント:テキスト53ページに「微分してるわけではない」とあるが、シャノンエントロピーは確率密度導関数の導出のアナロジーとして、分位点関数を微分した値の積分で求められる量が定義となっている(確率密度関数が明示的に表せる場合は上記の通り表すことができるのは、この帰結として言えることである)。
確率密度関数が明示的にわからなくても(測度論の観点からwell-definedに)定義でき、離散における性質を比較的継承しているのが特徴である。
カルバック・ライブラーダイバージェンス
とを確率変数の確率とする。
が離散型の場合、、としたとき、カルバック・ライブラーダイバージェンスは以下のように定義される。
が連続型の場合、のもとでの確率密度関数を、のもとでの確率密度関数をとしたとき、カルバック・ライブラーダイバージェンスは以下のように定義される。
交差エントロピー
とを確率変数の確率とする。
が離散型の場合、、としたとき、交差エントロピーは以下のように定義される。
が連続型の場合、のもとでの確率密度関数を、のもとでの確率密度関数をとしたとき、交差エントロピーは以下のように定義される。
のシャノンエントロピーをとすると、交差エントロピーはカルバック・ライブラーダイバージェンスを用いて以下のように表現できる。