0

[ラビットチャレンジ] 応用数学 レポート

371
0

はじめに

本稿は、E資格の受験資格の取得を目的としたラビットチャレンジの受講に伴うレポート記事である。

線形代数

ベクトル・スカラー

Rの要素をスカラーという。

任意のn N に対して、n個の数xi (i=1,2,,n)を縦に並べたxn次元ベクトルという。
x=(x1x2xn)

行列

任意のm,n N に対して、mn個の数ai,j (ここでi=1,2,,m, j=1,2,,n)を以下のように並べたAm×n行列という。
A=(a11a12a1na21a22a2nam1am2amn)

特にm=nのとき、n次正方行列という。

単位行列

対角成分がすべて1、ほかの成分が0の正方行列Eを単位行列という。
E=(100010001)

逆行列

ある正方行列Aに対して、以下のようにAとの積が単位行列Eとなるような行列A1を逆行列という。
AA1=A1A=E

行列式

正方行列Aに対する行列式はdetA|A|と表記がよく用いられる。

計算方法として代表的なものとして余因子展開があり、2次正方行列の行列式と3次正方行列の行列式は以下のような形になる。
det(a11a12a21a22)=a11a22a12a21det(a11a12a13a21a22a23a31a32a33)=a11a22a33+a12a23a31+a13a21a32a11a23a32a12a21a33a13a22a31

なお、正方行列Aが逆行列を持つ必要十分条件は、detA0が成り立つことである。

1.6. 固有値・固有ベクトル

正方行列Aに対して以下を満たすスカラーλを固有値、ベクトルv(0)を固有ベクトルという。

Av=λv

固有値分解

n次正方行列Aの固有値・固有ベクトルの存在する(ただし、値の重複は認め、複素数の場合もある)と仮定する。

n次正方行列Aの固有値λ1, ,λnを対角成分に持ち、対角成分以外は0となる行列Λと、対応する固有ベクトルを並べた行列Vが以下の通り表される。
Λ=(λ1λ2λn)V=(v1v2vn)

これに対して、以下が成り立つ。
A=VΛV1

これを行列Aの固有値分解という。

特異値・特異ベクトル

m×n行列Mmn)に対して、以下を満たす非負の実数σを特異値、単位ベクトルuを左特異ベクトル、vを右特異ベクトルという。

ここでMTMの転置行列である。

Mu=σuMTv=σv

特異値分解

ここではm×n行列MmnrankM=r)の特異値・特異ベクトルの存在を仮定する。
行列Mの特異値σ1, ,σrを対角成分に持ち、他の成分が0となる対角行列
Σ=(σ1σ2σr)
と対応する左特異ベクトルを並べた以下の行列
U=(u1u2ur)
および、右特異ベクトルを並べた以下の行列
V=(v1v2vr)
を定義する。

これに対して、以下が成り立つ。
M=UΣVT

これを行列Mの特異値分解という。

確率・統計

条件付き確率

事象Bが起こったという条件のもとで、事象Aが起こる確率をP(A|B)で表し、

P(A|B)=P(AB)P(B)

で定義する。ただしP(B)0。これを事象Bのもとでの事象Aの条件付き確率という。

独立な事象の同時確率

事象ABについて、
P(AB)=P(A)P(B)
が成り立つとき、ABは独立であるという。

ベイズの定理

Uを標本空間、B1B2Uの事象とし、U=B1B2(B1B2=)と仮定する。

このとき、事象Aについて以下の式が成立する。
P(B1|A)=P(A|B1)P(B1)P(A|B1)P(B1)+P(A|B2)P(B2)
ただし、P(A)0,P(B1)0,P(B2)0とする。

これをベイズの定理という。

確率変数

試行の根元事象により値が定まる変数Xを確率変数といい、特に値を連続的には取らない確率変数を離散的な確率変数、連続的に値を取る確率変数を連続的な確率変数という。

確率分布

離散的な確率分布

離散的な確率変数Xについて、
f(xi)=P(X=xi) (i=1,2,,n)
により定まる関数fを確率変数Xの確率分布という。

連続的な確率分布

連続的な確率変数Xが、任意の実数aba<b)に対して、
P(a<Xb)=abf(x)dx

となるような関数fを持つとき、fを確率変数Xの確率密度関数といい、Xは確率分布fに従うという。

(注:測度を用いた論理展開という意味では、積分値は必ず定まるかが最初のポイントになる。もし、定まることが示せたのであれば、b=a+tとおいて、P(a<x<a+t)/tt0とすることより、確率密度関数f(a)を定義する。すなわち、確率密度関数は積分の結果に対して積分をすることで求められる)

期待値

離散的な確率変数の期待値

離散的な確率変数Xの確率分布をfとするとき、
E[X]=i=1nxif(xi)
Xの期待値という。

連続的な確率変数の期待値

連続的な確率変数Xの確率密度関数をfとするとき、
E[X]=xf(x)dx
Xの期待値という。

分散と標準偏差

確率変数Xに対して、
V[X]=E[(XE(X))2]
Xの分散という。

式変形すると、以下が成り立つこともわかる。
V[X]=E[X2]E[X]2

また、分散の平方根
σ=V[X]
Xの標準偏差という。

共分散

2つの確率変数XYに対して、
Cov[X,Y]=E[(XE[X])(YE[Y])]
XYの共分散という。

式変形をすることで、以下が成り立つことがわかる。
Cov[X,Y]=E[XY]E[X]E[Y]

情報理論

自己情報量

事象Aの起こる確率がP(A)であるとき、事象Aが起こることの自己情報量は以下によって定義される。
I(A)=logP(A)

注:公理に基づいて導出されるものであるがゆえ、扱う対象によって底の値が異なることに注意する。
本稿では底を記載しないが、状況に応じていくつを用いるかは確認すること。

シャノンエントロピー

離散的な確率変数Xにおいて、p(x)=P(X=x)としたとき、以下の式をXのシャノンエントロピーという。
H(X)=xp(x)logp(x)

連続的な確率変数Xの場合、確率密度関数p(x)をもつとすると、シャノンエントロピーは以下のように定義される。
H(X)=p(x)logp(x)dx

コメント:テキスト53ページに「微分してるわけではない」とあるが、シャノンエントロピーは確率密度導関数の導出のアナロジーとして、分位点関数を微分した値の積分で求められる量が定義となっている(確率密度関数が明示的に表せる場合は上記の通り表すことができるのは、この帰結として言えることである)。
確率密度関数が明示的にわからなくても(測度論の観点からwell-definedに)定義でき、離散における性質を比較的継承しているのが特徴である。

カルバック・ライブラーダイバージェンス

PQを確率変数Xの確率とする。

Xが離散型の場合、p(x)=P(X=x)q(x)=Q(X=x)としたとき、カルバック・ライブラーダイバージェンスは以下のように定義される。
DKL(P|Q)=xp(x)logp(x)q(x)

Xが連続型の場合、Pのもとでの確率密度関数をp(x)Qのもとでの確率密度関数をq(x)としたとき、カルバック・ライブラーダイバージェンスは以下のように定義される。

DKL(P|Q)=p(x)logp(x)q(x)dx

交差エントロピー

PQを確率変数Xの確率とする。

Xが離散型の場合、p(x)=P(X=x)q(x)=Q(X=x)としたとき、交差エントロピーは以下のように定義される。
H(P,Q)=xp(x)logq(x)

Xが連続型の場合、Pのもとでの確率密度関数をp(x)Qのもとでの確率密度関数をq(x)としたとき、交差エントロピーは以下のように定義される。
H(P,Q)=p(x)logq(x)dx

PのシャノンエントロピーをH(P)とすると、交差エントロピーはカルバック・ライブラーダイバージェンスを用いて以下のように表現できる。
H(P,Q)=H(P)+DKL(P|Q)

投稿日:2021622
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

hiroto
0
2116

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. 線形代数
  3. ベクトル・スカラー
  4. 行列
  5. 行列式
  6. 1.6. 固有値・固有ベクトル
  7. 固有値分解
  8. 特異値・特異ベクトル
  9. 特異値分解
  10. 確率・統計
  11. 条件付き確率
  12. 独立な事象の同時確率
  13. ベイズの定理
  14. 確率変数
  15. 確率分布
  16. 期待値
  17. 分散と標準偏差
  18. 共分散
  19. 情報理論
  20. 自己情報量
  21. シャノンエントロピー
  22. カルバック・ライブラーダイバージェンス
  23. 交差エントロピー