凸関数の定義の仕方が3種類あるそうです。よく知られた定義は定義1です。
以下の条件を満たす関数fは凸関数である。
f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y) ,∀x,y∈Rn,λ∈[0,1]
動画では厳密に定義してないので、細かな設定は必要だとは思うのですが、ざっくりいうと定理1が成り立つそうです。
fは凸関数であるとする。以下の条件は同値である。
一部のみ証明する。
3が成り立つならば2が成り立つことを証明する。
証明の流れとしては、3が成り立つならば∇fは単調であることを証明する。その後、∇fが単調であれば2が成り立つことを証明する。
∫01(x−y)T∇2f(tx+(1−t)y)dt=∫01ddt∇f(t(x−y)+y)dt=∇f(x)−∇f(y)
0≤∫01(x−y)T∇2f(tx+(1−t)y)(x−y)dt=⟨∇f(x)−∇f(y),x−y⟩
よって、3が成り立つならば∇fは単調である。
∫01∇f((y−x)t+x)T(y−x)dt=∫01ddtf((y−x)t+x)dt=f(y)−f(x)
f(y)=f(x)+∫01∇f((y−x)t+x)T(y−x)dt
関数h(t)を以下のように定義する。
h(t):=∇f((y−x)t+x)T(y−x)h(0):=∇f(x)T(y−x)
∇fは単調であるので、⟨∇f((y−x)t+x)−∇f(x),(y−x)t+x−x⟩≥0
つまり、
⟨∇f((y−x)t+x)−∇f(x),(y−x)t⟩≥0
t≥0であるので、
⟨∇f((y−x)t+x)−∇f(x),y−x⟩≥0
よって、h(t)−h(0)≥0
両辺を積分して式変形すれば、∫01h(t)dt≥∫01h(0)dt=h(0)∫01dt=h(0)
よって、
f(y)=f(x)+∫01h(t)dt≥f(x)+h(0)=f(x)+f(x)T(y−x)
よって、∇fが単調であれば2が成り立つ。
バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。