はじめに
『機械学習のための連続最適化』 p.30には補題 2.10として以下の補題が記述されている。
ここでは集合の凸包を表し、は集合の下限を表す。1次関数の最適値は凸包で探しても変わらないことを主張している。しかしながら、同書では本補題の証明が省略されていたため、それを補ってみようというのが本記事の主旨である。できるだけself-containedとするため、冗長さを厭わずに説明を書く方針である。
前提知識
凸集合について
まずは凸集合を定義する。
凸集合
空でない集合において、以下が成り立つとき、を凸集合とよぶ。
要するに2点を結ぶ線分が「すっかりに含まれる」ということである。続いて凸集合の共通部分に関する補題を述べる。
を任意にとり、を任意にとる。示すべきは
である。
であるから、は凸集合という仮定よりとなる。またであるから、は凸集合という仮定よりとなる。
したがって
が言えて、補題が示された。
任意個数の凸集合の共通部分について同様のことが成り立つ。
任意個の凸集合の共通部分はまた凸集合
を有限濃度の添字集合とし、凸集合の族を
とする。このとき各凸集合の共通部分
も凸集合である。
補題1を繰り返し用いると、3つの凸集合についてその共通部分が凸集合であることがいえる。つまり, , をそれぞれ凸集合とすればが凸集合であり、が凸集合であることが補題1からいえる。以降、4つの凸集合の共通部分、5つの凸集合の共通部分、のように同様の手続きをの要素数(=濃度)まで繰り返せば補題が示される。
数学的帰納法を用いれば以下も成り立つ。
任意個の凸集合の共通部分はまた凸集合
を可算濃度の添字集合とし、凸集合の族を
とする。このとき各凸集合の共通部分
も凸集合である。
添字集合が非可算無限のときも同様の補題が成り立つ。
を非可算濃度の添字集合とし、凸集合の族を
とする。このとき各凸集合の共通部分
も凸集合である。
ただし選択公理は仮定している。
を任意にとり、を任意にとる。各について、であるから、は凸集合という仮定よりとなる。したがって
が言えて、補題が示された。
凸包について
凸集合を用いて、凸包を定義することができる。
凸包
空でない集合について、を含む最小の凸集合を凸包とよぶ。
本記事ではの凸包をと書く。凸包の最小性を明示的に書くと以下を得る。
凸包
空でない集合について、を含む全ての凸集合の族をとし、その添字集合をとする。すなわち
凸包はに属する各凸集合 () の共通部分として
と書くことができる。
に属する各集合はを含むから、右辺もまたを含む。補題1から4により、右辺もまた凸集合である。したがって凸包の最小性により
が成り立つ。一方、凸包もまたを含む凸集合であるからである。つまりあるが存在してである。ゆえに、
が成り立つ。よって補題は示された。
凸集合の定義に現れた「二点を結ぶ線分」を複数点に一般化することで、凸結合が定義される。
凸結合
個の実数をを満たすようにとる。ただしである。対応してとする。このとき、次式で定義されるをの凸結合という。
の場合が上で述べた「二点を結ぶ線分」であり、の場合が「三角形の周および内部」である。
さて凸包は凸結合を用いて書くこともできる。補題2.10を示すときのカギとなる定理である。
凸結合による凸包の表現
空でない集合をとる。の凸包はに属する有限個の点の凸結合全体の集合に等しい。すなわち、
右辺はから取ってくる点の個数をとしたときの各凸結合から和集合をつくる、という意味である。またはの直積集合であり、「から点を(一斉に)個選びだすこと」はから1点を選び出すことに等しい。本定理は『機械学習のための連続最適化』においては補題2.6として紹介されていたが、あいにく証明は省略されている。よってここで証明をつける。
定理の右辺で表される集合をとする。を示したい。
(i)について:
は明らかである()。が凸集合であることを示せば、の最小性によりが言える。以下はその証明である。
をそれぞれの元とし,とする。を示したい。
まずととしてそれぞれの凸結合の表現を得る。各はの制約に従う。すると
のように書ける。ただしであり、
である。各はかのいずれかでありである。また各であることも明らかである。さらに
をも満たしている。よっては凸結合であり、はの元であることがわかった。
(ii)について:
についての数学的帰納法により示す。
以上により、任意のと任意のについて、その凸結合がに含まれることが示された。(i)と(ii)によりがいえて、証明が終わる。
補題2.10の証明
以上の長い前置きを経て、ようやく本記事の目的である補題2.10の証明に入ることができる(メインパートなので定理扱い)。
左辺を、右辺をと置く。かつをそれぞれ示すことでを証明する方針を取ることにする。
(i):
に関する下限の定義により、任意の実数に対してあるが存在し、
が成り立つ。このとき補題6により、あるとを満たす実数()が存在して
と書けるから、
が成り立つ。左辺の各の下限がであるから
である()。さては任意だったから、特にを自然数として右辺をと置いてみる。するとは単調減少数列で下に有界だからある極限値に収束するが、これがに他ならない。はに対する1つの下界であり、は最大下界の意味でが成り立つ。
(ii):
に関する下限の定義より、任意の実数に対してあるが存在し、
が成り立つ。凸包の定義よりであり、左辺の下限がであるから
である。あとは(i)の最後と同じ論法でが示されるわけだが、背理法で示すこともできる。仮にとしてとしてみる。するととなり、矛盾するのである。
以上、(i)と(ii)により、補題2.10が示された。
おわりに
本記事では『機械学習のための連続最適化』 補題2.10に証明をつけることを目的として、凸集合や凸結合の定義や補題をいくつか紹介した。それらの補題をもとにして一応の証明をつけることができ、当初の目的は達成されたと考えている。
肝心の「補題2.10」が、このあと補題としてどのように用いられるかについては、場所を改めて説明する機会を持ちたい(先延ばし!)。