0
大学数学基礎解説
文献あり

Tree Metric and Ultra Metric

165
0

はじめに

頂点集合と正の重みのついた辺集合からなるグラフを考え、2頂点間の最短距離を考えると、それは有限距離空間になっています。逆に、有限距離空間が与えられたとき、頂点集合を距離空間の元、頂点間には距離の重みを持つ辺を張ることでグラフを考えることができます。
この記事では、有限距離空間がグラフの中でも特に閉路を含まないグラフである木で表されるための必要十分条件について説明します。

距離空間 (metric space)

Xを有限集合、d:X×XR0としたとき、(X,d)が次の3つの条件を満たす時、距離空間(metric space)であるという。

  • xX d(x,y)=0x=y
  • x,yX d(x,y)=d(y,x)
  • x,y,zX d(x,z)d(x,y)+d(y,z)

辺に重みのついた木T=(V,E)が与えられた時、x,yVについてdT(x,y)Tに存在するx,yパスに含まれる辺の重みの総和を表すことにします。

木距離 (Tree Metric)

有限距離空間(X,d)が木距離(Tree Metric)であるとは、辺重み付き木T=(V,E) (XV)が存在して、
x,yX dT(x,y)=d(x,y)が成り立つことである。

木距離を考える際は、必ずしもX=Vではありません。例えば距離空間として
X={1,2...n}, ijX,d(i,j)=1を考えます。
このとき頂点を1つ付け足し、n+1頂点のstar graphをつくり、各辺に重み1/2を割り当てることで、木距離として表せます。

VXの頂点をSteiner Nodeといいます。次数2のSteiner Nodeは自明に消すことができるため、考えません。

4PC (four point condition)

有限距離空間(X,d)が4PCを満たすとは、すべての異なる4点x,y,z,wXについて、d(x,y)+d(z,w)max(d(x,z)+d(y,w),d(x,w)+d(y,z))
が成り立つことである。

4PCの条件を言い換えることもできます。
dxy,zw=d(x,y)+d(z,w)と書きます。4PCの条件を書いてみると、
dxy,zwmax(dxz,yw,dxw,yz)
dxz,ywmax(dxy,zw,dxw,yz)
dxw,yzmax(dxy,zw,dxz,yw)
が成り立ちますが、これはdxy,zw,dxz,yw,dxw,yzの最大値がユニークではないこと(e.g. 7, 7, 3 や 7, 7, 7など)と同値です。こちらの条件の方がわかりやすかったりするので、こちらを使うときもあります。

実は4PCを満たすこととTree Metricであることは同値です。
まず、補題を示します。

x,y,w,zXdxy,zwdxz,yw=dxw,yzを満たす。
 x,y,z,wは図1のような木Tで距離を表せる (必ずしも uxなどとは限らない)。
木!FORMULA[38][37236][0] T
また、特に等号が成り立つ時、u=uである。

を示す。
d(x,y)+d(z,w)=dT(x,u)+dT(u,y)+dT(z,u)+dT(u,w)
d(x,z)+d(y,w)=d(x,w)+d(y,z)=dT(x,u)+dT(u,y)+dT(z,u)+dT(u,w)+2dT(u,u)
より、d(x,z)+d(y,w)=d(x,w)+d(y,z)d(x,y)+d(z,w)だから4PCを満たす。またu=uのとき、dT(u,u)=0より等号が成り立つ。
を示す。
図1のような木Tを考え、
dT(x,u)=d(x,y)+d(x,z)d(y,z)2
dT(y,u)=d(y,x)+d(y,z)d(x,z)2
dT(z,u)=d(z,w)+d(z,x)d(x,w)2
dT(w,u)=d(w,z)+d(w,x)d(x,z)2
dT(u,u)=d(x,z)+d(y,w)d(x,y)d(z,w)2
とすれば、T上の距離とdは等しくなっている。(dT(x,u),dT(y,u),dT(z,u),dT(w,u)0は三角不等式より、dT(u,u)0は4PCの条件より成り立つ。)
例えば、
dT(x,z)=dT(x,u)+dT(u,u)+dT(u,z)=d(x,z)+d(x,z)+d(y,w)d(y,z)d(x,w)=d(x,z)
他も同様。
また等号が成り立つ時dT(u,u)=0よりu=u

有限距離空間(X,d)がTree Metricである。 4PCを満たす。

を示す。
木距離で表されるのだから、木T=(V,E)が存在して、T上の距離はdと一致している。
任意の4点x,y,z,wXVを取る。距離は木Tで表されているから、4点の全点対間パスからなる部分グラフを取ると一般性を失わず、補題1図1のようになっている。(必ずしもuu,uxなど、とは限らない。)つまり、4PCを満たす。

を示す。
距離空間の集合の元の数に関する帰納法で示す。
|X|3のときは自明である。
|X|4のとき、
帰納法の仮定より|X|1個の元を含む木T=(V,E)が存在している。
新たに頂点vXを距離dにあうようにTに付け足す。
2つの場合に分ける。
(1) すべてのx,y,zVXについて、dxy,zv=dxz,yv=dxv,yzのとき。
あるx,y,zVXをとり、T上のxy,yz,zxパスが誘導するグラフを考える。
Tは木であるから、一般性を失うことなく、図2のように書ける(必ずしも xuなど、とは限らない)。

頂点vuからw=d(x,v)+d(y,v)d(x,y)2の重みの辺でつなぎ新たに木Tを作る。Tが求めていた木になっていることを示す。
補題1とwの選び方より、x,y,zvの間ではddTが等しいことがわかる。
よってx,y,z以外のzVXについてdT(z,v)=d(z,v)を示す。
T上のxy,yz,zxパスが誘導するグラフを考える。一般性を失わず、図3のようになっている。

wz同様にwzを定める。この時次の3式が成り立つ。

  • dT(x,u)+wz=dT(x,u)+wz(=d(x,v))
  • dT(y,u)+wz=dT(y,u)+wz(=d(y,v))
    この式を満たすにはdT(x,u)=dT(x,u),dT(y,u)=dT(y,u)となるしかない。よってu=uつまりzzと同様の議論でd(z,v)=dT(z,v)である。

(2) (1)でないとき
あるx,y,zXVが存在して、dxy,zv<dxz,yv=dxv,yzとなっている。T上のxy,yz,zxパスが誘導するグラフを考えると図2のようなグラフになっているとしてよい。
uを取り除くとTはいくつかの連結成分に分かれる。zを含む連結成分をC0として、
その他の連結成分をC1,...,Ckとする。
このとき、1ik,wCiについて、d(w,v)=dT(w,u)+d(x,v)+d(y,v)d(x,y)2 ・・・(i)であることを示す。
これを示せば、距離の条件にd(u,v)=d(x,v)+d(y,v)d(x,y)2を加えu+C0について同様の手続き(3点選んでvを挿入する適切な位置を探す)をすれば良い。u+C0Tよりも真に頂点数が少なくなっているので、(1)のケースが起きるか、頂点数が2となる時に操作が終了する。頂点数が2となった時は2点の間の辺を距離に応じて適当に分割して新たな頂点を作り、そこから辺を伸ばしてvを付け足せば良い。

(i)を示す。

wyと同じ連結成分に属する時以外は図4のような位置関係にあるとして良い。(uuとは限らないことに注意)
また真に不等号が成り立っているからuuである。
x,y,z,vx,y,z,wの4PCより、
d(x,y)+d(z,v)<d(x,z)+d(y,v)=d(x,v)+d(y,z) (ii)
d(x,w)+d(y,z)d(x,y)+d(w,z)=d(x,z)+d(w,y) (iii)
が成り立つ。
よって
d(x,w)+d(z,v)<(d(x,y)+d(w,z)d(y,z))+(d(x,v)+d(y,z)d(x,y)) (ii),(iii)=d(x,v)+d(w,z)
よってx,w,z,vの4PCを考えると、
d(x,w)+d(z,v)<d(x,v)+d(w,z)=d(x,z)+d(w,v) (iv)
が成り立つ。
dT(w,u)+d(x,v)+d(y,v)d(x,y)2=dT(w,y)+dT(w,z)dT(y,z)2+d(x,v)+d(y,v)d(x,y)2=d(w,y)+d(w,z)d(y,z)2+d(x,v)+d(y,v)d(x,y)2=(d(x,y)+d(w,z)d(x,z))+d(w,z)d(y,z)2+d(x,v)+(d(x,v)+d(y,z)d(x,z))d(x,y)2 (ii),(iii)=d(x,v)+d(w,z)d(x,z)=d(w,v) (iv)
wyと同じ連結成分に属する時はx,yを入れ替えて、同様の議論をすれば良い。

上の命題の証明から次のこともわかる。

Tree Metricを表現する木の一意性

有限距離空間(X,d)がTree Metricであるとき、距離を表現する木は一意である。

4PCと似た条件で3PCが知られています。

3PC (three point condition)

有限距離空間(X,d)が3PCを満たすとは、すべての異なる3点x,y,zXについて、
d(x,y)max(d(x,z),d(y,z))が成り立つことである。

4PC同様、この条件はd(x,y),d(x,z),d(y,z)の最大値がユニークではないことと同値です。また3PCの条件を繰り返し適用することで以下も分かります。

UltraMetricの性質1

t0,t1,...,tkXとする。
このとき、d(t0,tk)max0i<kd(ti,ti+1)が成り立つ。

3PCを満たす距離はUltra Metricと呼ばれます。

Ultra Metric

有限距離空間(X,d)がUltra Metricである。 (X,d)が3PCを満たす。

3PC 4PC

有限距離空間(X,d)が3PCを満たすなら、4PCを満たす。

ひたすら、場合分けして証明します。3PCの条件によってx,y,z,wの位置関係を見て、成り立つであろう4PCの式を推定して、証明していく気持ちです。

異なる4点x,y,z,wXを任意に取る。
3PCを満たすから、一般性を失うことなく、d(x,y)d(x,z)=d(y,z)・・(i)としてよい。
x,y,wの3PCの条件について、2通りの場合を考える。
(1) d(x,y)d(x,w)=d(y,w)・・(1)のとき、
(i),(1)より、d(y,z)+d(x,w)=d(y,w)+d(x,z)である。
x,w,zの3PCの条件より、d(w,z)max(d(x,w),d(x,z))である。
d(w,z)d(x,w)のときは、d(x,y)+d(w,z)d(y,z)+d(x,w)(i)より
d(w,z)d(x,z)のときは、d(x,y)+d(w,z)d(y,w)+d(x,z)(1)より
が成り立つ。
いずれの場合もd(x,y)+d(w,z)d(y,z)+d(x,w)=d(y,w)+d(x,z)となり、4PCが成り立つ。
(2) d(x,w)d(x,y)=d(y,w)・・(2)のとき、
(i),(2)より、d(x,w)d(x,y)d(x,z)・・(ii)が成り立つ。
(ii)の不等号が全て等号であるとき、d(x,w)=d(x,z)となる。x,w,zの3PCの条件より、d(w,z)d(x,w)=d(x,z)である。このとき、(i),(2)の等号もすべて成立し、d(x,y)+d(w,z)d(y,z)+d(x,w)=d(y,w)+d(x,z)となり、4PCが成り立つ。
(ii)の不等号が等号でないことがあるとき、d(x,w)<d(x,z)となる。x,w,zの3PCの条件より、d(x,w)<d(x,z)=d(w,z)・・(iii)である。このとき、(2)と合わせると、
d(x,y)+d(w,z)=d(y,w)+d(x,z)である。(i),(2)より、d(x,w)+d(y,z)d(y,w)+d(x,z)だから4PCが成立する。

命題3よりUltra MeticはTree Metricです!つまり、Ultra Metricであるような距離はなんらかの木で距離を表すことができます。さらにUltra Metricは特別な性質を持つ木で表せるTree Metricになっていることが示せます。そのことを示すために、以下の補題を示します。

辺重み付きの木をT=(V,E)としたとき、x,yVについて、δT(x,y)T上のx,yパスに含まれる辺で最大の辺重みとします。δTは距離の公理を満たします。

Ultra Metric を生成する木

有限距離空間(X,d)がUltra Meticである。 ある木M=(X,E)が存在して、x,yX d(x,y)=δM(x,y)が成り立つ。

を示す。
Xの各頂点対x,yd(x,y)の辺重みで繋いだグラフGMGの最小全域木とする。
Ultra Metricの性質1より、M上のx,yパスをx=t0,t1,...,tk=yとすると、
d(x,y)max0i<kd(ti,ti+1)=max0i<kδM(ti,ti+1)=δM(x,y)
また、MGの最小全域木であることから、δM(x,y)d(x,y)である。
つまりd(x,y)=δM(x,y)
を示す。
x,y,zXをとり、M上のxy,yz,zxパスが誘導するグラフを考える。そのグラフ上で最大辺重みである辺を考えると、それはxy,yz,zsパスの少なくとも2つに属している。よってδM(x,y),δM(y,z),δM(z,x)の最大値はユニークではない。つまり3PCを満たす。

補題4で存在が示される木を「Ultra Metricを生成する木(generating tree for ultrametric)」と言います。

有限距離空間(X,d)がUltra Meticであるなら、距離dを表す木T=(V,E)と根rVが存在して、すべてのxXについて、dT(r,x)が等しい。

|X|に関する帰納法で、命題5の条件に「dT(r,x)12maxx,yXd(x,y)以下である。」も加えた命題を示す。

|X|=1の時は自明である。|X|>1の場合を示す。
Ultra Metric(X,d)を生成する木をMとする。Mの辺で重みが最大であるような辺をe=xyとし、その重みをweとする。Mからeを取り除くと、2つの木ができる。これをM1,M2とする。帰納法の仮定からδMiについて、Ti=(Vi,Ei)riViが存在して、帰納法の条件を満たす。eの選び方より、すべてのxViについて、dTi(ri,x)12weを満たす。よって、T=(V1V2{r},E1E2{rr1,rr2})として、辺rriの重みをそれぞれ、12wedTi(ri,x)とすれば、条件を満たす。

Ultra Metricはevolutionaly biology(進化生物学)などに応用があるそうです。生命がある1つの起源から生まれたとしたとき、進化のスピードが一定なら、現在の生物の間の距離空間は命題5の根rを起源としたUltra Metricで書けるからだそうです。

まとめ

  • Tree Metric 4PCを満たす。
  • Ultra Metric 3PCを満たす。
  • Tree Metric Ultra Metric

条件がきれいで面白いと思いました。何か間違っているところやわからないところがありましたら、ぜひ教えてください。

参考文献

投稿日:202356
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. はじめに
  2. まとめ
  3. 参考文献