0
大学数学基礎解説
文献あり

Kullback-Leiblerダイバージェンスに基づく不確実性集合

131
0
Kullback-Leiblerダイバージェンスに基づく不確実性集合

Q(ϵ)={qRn:1Tq=1,q0,i=1nqilnqipiϵ}

maxQQEQ[f]=|maxqfTqs.t.i=1nqilnqipiϵ1Tq=1qi>0,i=1,2,,n

は以下のように簡約化される。

maxQQEQ[f]=minλ>0,η{ϵλ+η+λi=1npiexp(fiηλ1)}

|maxqfTqs.t.i=1nqilnqipiϵ1Tq=1qi>0,i=1,2,,n

主問題の標準形式に書き直すと

(1)|minqfTqs.t.i=1nqilnqipiϵ01Tq1=0qi>0,i=1,2,,n

式(1)に対するLagrange関数は

(2)L(q,λ,η)=fTq+λ(i=1nqilnqipiϵ)+η(1Tq1)

である。ただし、双対変数を(λ,η)としている。λは不等式制約に対応し、λ0である。ηは等式制約に対応する。

双対問題は
(3)maxλ0,ηminqL(q,λ,η)

と定義される。
minqL(q,λ,η)qに関する無制約最小化であるから、

L(q,λ,η)q=0

以下細かい計算をしていく。
L(q,λ,η)q=q(fTq+λ(i=1nqilnqipiϵ)+η(1Tq1))=f+λ(lnqipi+1)+η=0

よって、
fi+λ(lnqipi+1)+η=0

式変形すると、
lnqipi+1=fiηλ

よって、
(4)lnqipi=fiηλ1

(5)qi=piexp(fiηλ1)

(6)λ0

式(2)Lagrange関数を式(3)の双対問題に代入すれば、

maxλ0,ηminqL(q,λ,η)=maxλ0,ηminqfTq+λ(i=1nqilnqipiϵ)+η(1Tq1)=maxλ0,ηminq(,fi+λlnqipi+η,)qϵλη=maxλ0,ηλi=1npiexp(fiηλ1)ϵλη  ((4)(5))=minλ0,ηϵλ+η+λi=1npiexp(fiηλ1)=minλ>0,ηϵλ+η+λi=1npiexp(fiηλ1)  ((6))

参考文献

[1]
S.Boyd and L.Vandenberghe, Convex Optimization
投稿日:2022818
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

hdk105
hdk105
14
15052
計測・制御・情報に興味があります. 備忘録として残していきます.

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中