やぁやぁ皆さん.陽袮 柊です.
前回の記事
にて「直積」という名を冠する数学的な対象はどれも似たような普遍性を持つことを見ました.今回は,この「直積」という概念を統一します.直積集合も,直積位相空間も,直積ベクトル空間も,そのすべてが一般的な「直積」という概念の特別な場合であることをご紹介しましょう.
なお,この記事でももちろん$0 \in \N$とします.0は自然数なんです.
この記事では,一般的な「直積」を定義するために圏論の言葉を使います.なので,必要最低限の知識として,いくつかの用語の定義を与えておきましょう.
まずは,圏そのものの定義です.
$\C$が次の3つ:
の組$(\Ob{\C}, \Mor{\C}, {\circ})$であり,次の3条件:
をみたしていて,次の2つの公理:
をみたすとき,$\C$を圏 (category) という.
圏を定義する際の対象・射たちはとある「集まり」だと話を濁していますが,次にあげる圏の例からも分かるように,これらとして,集合よりも真に大きな集まり,つまり,真クラスを考えたいという場合は幾度となく出てきます.しかし,真クラスに対して素朴集合論的な操作を施してしまうと簡単に矛盾が出てきてしまいます.
この問題を回避する主な方法として,真クラスをも扱うことのできる公理を設定した集合論を基礎とするものと,そもそも現実的に考える数学的対象は集合の範囲で収まっているはずなのだから,そういったものたちを含んでいる十分に大きな集合(これをGrothendieck宇宙といいます)の存在を仮定して,その中でのみ議論を行うというものとがあります.圏論の研究者であるEmily Riehl氏によれば,これらの話はとても魅惑的なものらしいのですが,こんなことまで考えているとこの記事の本題から逸れに逸れまくりますし,そもそも私がこのあたりの話について詳しくないので,ここは濁したままで先に進むことにします.
いくつか圏の例を見てみましょう.
大方の予想どおり,対象を集合,射を写像,合成則を写像の合成とし,射のドメイン・コドメインをそれぞれ写像の始域・終域,恒等射を恒等写像とすると,これは明らかに圏になります.この圏はよく$\Set$と表されます.
対象を位相空間,射を連続写像,合成則を写像の合成とし,射のドメイン・コドメインをそれぞれ写像の始域・終域,恒等射を恒等写像とすると,連続写像の合成はふたたび連続写像なので,これは圏になります.この圏はよく$\Top$と表されます.
また,位相空間を基点付き位相空間に,連続写像を基点を保つ連続写像に取りかえると,これらも圏をなします.これはふつう$\bTop$と表されます.
$K$を体とし,対象を$K$ベクトル空間,射を$K$線形写像,合成則を写像の合成とし,射のドメイン・コドメインをそれぞれ写像の始域・終域,恒等射を恒等写像とすると,$K$線型写像の合成はふたたび$K$線型写像なので,これは圏になります.この圏はふつう$\Vect_K$と表されます.
また,$K$を環$R$に取り換えてできる左$R$加群とその準同型とも圏をなします.これはふつう$R \text{-} \Mod$や${}_R \Mod$と表されます.右$R$加群なら$\Mod \text{-} R$, $\Mod_R$といった具合です.
$\Vect_K$と同様に,群と群準同型,(結合的かつ単位的な)環と環準同型,体と体準同型とは圏をなします.これらはよく$\Grp$,$\Ring$, $\Field$と表されます.
また,群をAbel群に,環を可換環に取りかえたものも当然圏をなします.これらはふつう$\Ab$, $\CRing$と表されます.
ここまでの例は「まぁ,集合と写像とが圏をなすんだからそりゃそうだろう」というものばかりでした.もう少し$\Set$っぽくない圏の例も挙げておきます.
$(P, \leqslant)$を順序集合とします(前順序でも半順序でも全順序でもよいです).そこで,$P$の元を対象とし,各対象$x$, $y$について,射$x \to y$が存在することを$x \leqslant y$であることとして定め,射$x \to y$は存在するなら1つだけとすると,$(P, \leqslant)$は1つの圏と見なせます.確認してみましょう.
まず,$(P, \leqslant)$の射$x \to y$, $y \to z$があったときに,これらの合成射$x \to z$が存在しなければなりませんが,これはたしかに存在します.なぜなら,$x \to y$, $y \to z$は$x \leqslant y$, $y \leqslant z$と同値で,順序関係は推移的なので,$x \leqslant z$が成り立ちます.ですから,射$x \to z$があります.この合成則が結合的なのは大丈夫だと思います.
また,$(P, \leqslant)$の各対象$x$に対して,その恒等射$\id_x \colon x \to x$が存在しなければなりませんが,順序関係は反射的でもあったので,$x \leqslant x$が成り立ちます.なので,$\id_x$はたしかに存在します.これが単位的な射であることもよいでしょう.
$(G, {\cdot})$を群とします(モノイドでもよいです).そこで,何かしらの1つのもの$\bullet$を対象とし,$g \in G$たちを射$g \colon \bullet \to \bullet$として,2つの射$g, h \colon \bullet \rightrightarrows \bullet$の合成射$g \circ h \colon \bullet \to \bullet$を$g, h$の積$g \cdot h$とすることにより,$(G, {\cdot})$は1つの圏$\mathcal{G}$をなします.これも確認してみましょう.
まず,$\mathcal{G}$の任意の射$g, h, k \colon \bullet \to \bullet$について$(g \circ h) \circ k = g \circ (h \circ k)$が成り立たなければなりませんが,これは$(g \cdot h) \cdot k = g \cdot (h \cdot k)$を意味しており,群の演算は結合的なので問題ありません.
そして,射の合成について単位的である恒等射$\id_\bullet \colon \bullet \to \bullet$が存在しなければなりません.つまり,$\id_\bullet$は$\mathcal{G}$の任意の射$g \colon \bullet \to \bullet$について$g \circ \id_\bullet = \id_\bullet \circ g = g$とならなければなりませんが,これは,任意の$g \in G$について$g \cdot \id_\bullet = \id_\bullet \cdot g = g$となることを意味しており,この条件は$(G, {\cdot})$の単位元$e$のみがみたします.よって,$\id_\bullet$は$e$として存在するのです.
また,圏があると,その双対的な圏を考えられます.
$\C$を圏とする.このとき,$\C$の反対圏 (opposite category) $\C\op$が次のように構成される:
つまり,すべての射の向きを形式的に反対にして得られる圏が反対圏です.あくまでも形式的であることに注意をしてください.たとえば,$X$を空でない集合とするとき,$\Set$の射として$\emptyset \to X$はただ1つ存在しますが,$X \to \emptyset$は存在しません.しかし,$\Set\op$においては$X \to \emptyset$は$(\emptyset \to X)\op$として存在します.
前回の記事で「本質的に同じである」という意味の集合の「同型」という概念を,全単射が存在することとして導入しました.この概念は,むしろ集合論以外でよく耳にすると思います.位相空間の同型(位相同型,同相),ベクトル空間の同型(線型同型),群・環・体の同型などなど.これらは,じつは「特別な射が間に存在する」という形で,一般的に定義されます.
$\C$を圏,$X$, $Y$を$\C$の対象とする.このとき,$X$, $Y$が同型 (isomorphic) であるとは,$g \circ f = \id_X$かつ$f \circ g = \id_Y$となる$\C$の射$f \colon X \to Y$, $g \colon Y \to X$が存在することをいい,このことを$X \cong Y$と表す.そして,この射$f$, $g$を同型射 (isomorphism) といい,$g$は$f$の,$f$は$g$の逆射 (inverse) といって,$f^{-1} \coloneqq g$, $g^{-1} \coloneqq f$とする.
$\Set$における同型射は,$g \circ f$も$f \circ g$も恒等写像になるような写像$f$, $g$のことですが,これは,$g$が$f$の($f$が$g$の)逆写像であるということで,つまり,全単射が同型射になります.
$\Vect_K$における同型射は,$g \circ f$も$f \circ g$も恒等写像になるような線型写像$f$, $g$のことですが,これは結局,線形全単射のことと同値です.$\Grp$・$\Ring$・$\Field$などにおいても,全単射準同型であることが同型射であることと同値になります.
$\Top$における同型射は,$g \circ f$も$f \circ g$も恒等写像になるような連続写像$f$, $g$のことで,これは連続全単射と同値なものではありません.
$(P, \leqslant)$を順序集合とし,これを圏をと見なします.そして,$\mathcal{P}$の2つの射$x \rightleftarrows y$が存在したとしましょう.このとき,これらの合成射$x \to x$, $y \to y$が考えられますが,これらはそれぞれ$\id_x$, $\id_y$なので,$x \rightleftarrows y$は同型射になります.つまり,$x \leqslant y$かつ$y \leqslant x$のときに$\mathcal{P}$において$x \cong y$となるのです.
とくに,$\leqslant$が半順序関係のときは,$x \leqslant y$かつ$y \leqslant x$なら$x = y$なので,$x \cong y$は$x = y$のことになります.
$(G, {\cdot})$を群とし,これがなす圏を$\mathcal{G}$とします.このとき,$\mathcal{G}$の2つの射$g, h \colon \bullet \rightrightarrows \bullet$に対して合成射$g \cdot h, h \cdot g \colon \bullet \rightrightarrows \bullet$が考えられます.これらが$\id_\bullet = e$になるということは,$(G, {\cdot})$において$g \cdot h = h \cdot g = e$となるということなので,圏$\mathcal{G}$における$g$の逆射$g^{-1}$は,群$(G, {\cdot})$における$g$の逆元$g^{-1}$のことです.群は任意の元が逆元をもつので,群がなす圏における射はすべてが同型射になります.
では,いよいよ本題です.まずは,集合・位相空間・ベクトル空間の直積の持つ普遍性を思い出しましょう.
2つの数学的対象$X$, $Y$の直積$X \times Y$を考える際には,それ単体ではなく,それが他のものたちとどう関係しあっているのかをはかるために,適当な数学的な繋がりもあわせて考えるのでした.集合たちの場合であればそれは写像で,位相空間たちの場合なら連続写像といった具合です.そして,$X \times Y$が直積のもととなる$X$, $Y$と関係していないと話にならないので,下の図のような繋がり$p \colon X \times Y \to X$, $q \colon X \times Y \to Y$を考えます.
$$ \xymatrix@C=15pt{ & {X \, \times \, Y} \ar[ld]_p \ar[rd]^q & \\ X & & Y }$$
ここで,上の図はなんだか上部がとんがっている錐のように見えるので,この図を構成している$(X \times Y, (p, q))$のことを錐とよび,$X \times Y$をその頂点,$(p, q)$をその脚とよぶのでした.
さて,$X$, $Y$と繋がりを持っているものは$X \times Y$の他にもあるかもしれません.様々な場合が考えられますが,とくに,上の図と同じような繋がりを持っている数学的対象$A$と,その繋がり$f \colon A \to X$, $g \colon A \to Y$,つまり,錐$(A, (f, g))$について見てみましょう.
$$ \xymatrix@C=20pt{ & A \ar[ld]_f \ar[rd]^g & \\ X & & Y }$$
$X \times Y$は,上の図のような繋がりをもつ数学的対象の中でも特別なものなはずです.特別だから名前がついているのです.では,どのように特別なのか.集合たちの話から得られた帰結は,$(X \times Y, (p, q))$が「どんな錐$(A, (f, g))$に対しても,下の図が可換になる,つまり,$p \circ u = f$, $q \circ u = g$が成り立つ繋がり$u \colon A \to X \times Y$が必ず1つずつ存在する」という普遍性を持つというものでした.
$$ \xymatrix @C=15pt{ & A \ar@/_10pt/[ldd]_f \ar@/^10pt/[rdd]^g \ar@[red][d]|{\color{red}u} & \\ & X \, \times \, Y \ar[ld]^p \ar[rd]_q & \\ X & & Y }$$
ここまでの一般論で登場したものは,数学的対象とそれらの間の繋がりだけです.それらが具体的にどんな構造を持っているかとか,繋がりとはいったい何なのかとかは関係ないのです.とにかく大事なのは「直積とは,2つの数学的対象の上の錐の中でも普遍性をもっているような特別なもののことだ」という解釈です.そして,これはすぐに圏論のレベルまで一般化することができます.
$\C$を圏,$X$, $Y$を$\C$の対象とする.このとき,$\C$の対象$A$と$\C$の射$f \colon A \to X$, $g \colon A \to Y$のペア$(f, g)$との組$(A, (f, g))$のことを$X$, $Y$上の錐 (cone) といい,$A$をその頂点 (summit),$(f, g)$をその脚 (legs) とよぶ.
そして,$X$, $Y$上の錐$(L, (p, q))$が次の普遍性:
をみたすとき,$(L, (p, q))$を$X$, $Y$の積 (product) とよび,$L$を$X \times Y$と表す.そして,$(p, q)$を射影 (projections) とよぶ.
$$ \xymatrix @C=15pt{ & {^{\forall} A} \ar@/_10pt/[ldd]_{^{\forall} f} \ar@/^10pt/[rdd]^{^{\forall}g} \ar@[red][d]|{\color{red}{^{\exists!} u}} & \\ & X \, \times \, Y \ar[ld]^p \ar[rd]_q & \\ X & & Y }$$
ここで,すごく慎重にこの一連の記事を読んでくださっている方々の中には「おいおい,はじめはこの普遍性って同型であることの必要十分条件として定めていたのに,いつの間にか話がすりかわっていないか!?」となっている方もいらっしゃるかもしれません.安心してください.必要十分条件であることには変わりありません.前回の記事をよく読み返してくだされば分かるのですが,じつは,普遍性が同型であることの必要十分条件を与えることの前回の証明は,集合の元の細かな対応を見るような集合論的な証明ではまったくなく,合成と,写像の存在・一意性としか使っていない,きわめて圏論的なものになっています.ですから,まったく同じ手順を踏むことによって問題は解決されるわけです.とくに,積の頂点$L$は同型を除いて一意であると分かりますから,$L$を$X \times Y$という1つの記号で表しても問題ありません.
$\Set$の対象$X$, $Y$の上の定義の意味での積の1つは,直積集合$X \times Y$と,射影$\pr_X$, $\pr_Y$のペア$(\pr_X, \pr_Y)$との組$(X \times Y, (\pr_X, \pr_Y))$です.頂点$X \times Y$単体ではなく,これと$X$, $Y$とを繋げる脚$(\pr_X, \pr_Y)$もあわせて考えるのです.
なお,普遍性をもつ錐はみな積なので,$Y \times X$や$X \times Y \times \{0\}$なども,適当な脚を考えればきちんと積になります.
$\Top$の対象$(X, \mathcal{O}_X)$, $(Y, \mathcal{O}_Y)$の上の定義の意味での積の1つは,直積位相空間$(X \times Y, \mathcal{O})$と$(\pr_X, \pr_Y)$との組$((X \times Y, \mathcal{O}), (\pr_X, \pr_Y))$になります.そもそも,直積位相は脚$(\pr_X, \pr_Y)$をもとに構成されていたので,頂点$(X \times Y, \mathcal{O})$だけではなく,脚も明示的に表したものを「積」とよぶほうが自然で親切な気さえするのは私だけでしょうか.
$\Vect_K$の対象$(V, +_V, \cdot_V)$, $(W, +_W, \cdot_W)$の上の定義の意味での積の1つは,直積ベクトル空間$(V \times W, +, \cdot)$と$(\pr_X, \pr_Y)$との組$((V \times W, +, \cdot), (\pr_X, \pr_Y))$になります.
$\Grp$, $\Ring$などにおいても同様です.
このように,前回の記事で考えた3種の直積は,たった1つの概念の具体例となるのです.
また,一般的に積を定めたことにより,他のいくつかの概念も「積」として統一されることになります.
$(P, \leqslant)$を順序集合とし,これを圏と見なします.圏$(P, \leqslant)$の対象$x, y$の積とはいったいどんなものになるのでしょうか.まず,その積の頂点$x \times y$が存在したとすると,その錐の脚は$(x \times y \to x, x \times y \to y)$となるわけで,これは$x \times y \leqslant x$かつ$x \times y \leqslant y$と同値です.また,直積は普遍性をもっていたので,他の錐$(a, (a \to x, a \to y))$に対して,射$a \to x \times y$が存在するわけですが,これは$a \leqslant x$かつ$a \leqslant y$ならば$a \leqslant x \times y$と同値です.つまり,$x \times y$は,$x$, $y$以下である$P$の元の中で最大なものとなり,これは$\inf{\{x, y\}}$のことですね.これは順序集合$(P, \leqslant)$における$x$, $y$の交わり (meet) ともよばれます.
$$ \xymatrix @C=15pt{ & {^{\forall} a} \ar@/_10pt/[ldd] \ar@/^10pt/[rdd] \ar@[red][d]|{\color{red}\exists} & \\ & x \, \times \, y \ar[ld] \ar[rd] & \\ x & & y }$$
具体例として,$S$を集合とし,その冪集合$\mathcal{P}(S)$に包含関係で順序を入れた$(\mathcal{P}(S), \subseteq)$を考えてみましょう.このとき,この順序集合がなす圏における対象$X$, $Y$の交わりは,集合$X \cap Y$になります.この記号をまねて,先の交わり$\inf{\{x, y\}}$はよく$x \wedge y$と表されます.
ちなみに,解析学の本などで,2つの関数$f, g \colon \R \rightrightarrows \R$に対して,関数$f \wedge g \colon \R \to \R$を$(f \wedge g)(x) \coloneqq \min{\{f(x), g(x)\}}$($x \in \R$)により定めるということを見たことがあるかもしれませんが,この記法は上で述べたことに由来しています.
もう1つの順序集合の例として,$\N$の元$x$, $y$について「$x$が$y$を割りきる」ということを$x \mid y$で表して,この整除関係$\mid$を$\N$に入れた順序集合$(\N, {\mid})$について考えてみます.この順序集合における$x$, $y$の交わり$x \wedge y$は,$x$, $y$を割りきるものの中で最大のものなので,最大公約数$\gcd{(x, y)}$になります.
また,圏論的な積は,対象が2つよりもたくさんあっても同様に定義できます.
$\C$を圏,$\varLambda$を集合,$(X_\lambda)_{\lambda \in \Lambda}$を$\varLambda$を添字集合とする$\C$の対象の族とする.このとき,$\C$の対象$A$と,$\varLambda$を添字集合とする$\C$の射の族$f = (f_\lambda \colon A \to X_\lambda)_{\lambda \in \varLambda}$との組$(A, f)$のことを$(X_\lambda)_{\lambda \in \Lambda}$上の錐といい,$A$をその頂点,$f$をその脚とよぶ.
そして,$(X_\lambda)_{\lambda \in \Lambda}$上の錐$(L, p = (p_\lambda \colon L \to X_\lambda)_{\lambda \in \varLambda})$が次の普遍性:
をみたすとき,$(L, p)$を$(X_\lambda)_{\lambda \in \Lambda}$の積とよび,$L$を$\prod_{\lambda \in \varLambda} X_\lambda$と表す.そして,$p$を射影とよぶ.
$$ \xymatrix @C=20pt{ & {^{\forall}A} \ar@/_10pt/[ldd]_{^{\forall}f_\lambda} \ar@[red][d]^{\color{red}^{\exists!}u} \\ & \prod\limits_{\lambda \in \varLambda} X_\lambda \ar[ld]^{p_\lambda} \\ X_\lambda & }$$
$\Set$, $\Top$, $\Vect_K$などにおける定義5の意味での積はご想像のとおりです.順序集合$(P, \leqslant)$のなす圏における対象の族$(x_\lambda)_{\lambda \in \varLambda}$の今の意味での積はまた交わりとよばれ,その頂点$\inf_{\lambda \in \varLambda} x_\lambda$は$\bigwedge_{\lambda \in \varLambda} x_\lambda$と表されます.
ここで,極端な場合を1つ考えてみましょう.$\varLambda = \emptyset$の場合です.圏$\C$において,その対象の空族$(X_\lambda)_{\lambda \in \emptyset}$がただ1つ存在するので,その積$(L, (p_\lambda \colon L \to X_\lambda)_{\lambda \in \emptyset})$について考えてみます.
まず,これは定義5で述べた普遍性を有していますから,$(X_\lambda)_{\lambda \in \emptyset}$上の任意の錐$(A, (f_\lambda \colon A \to X_\lambda)_{\lambda \in \emptyset})$に対して,各$\lambda \in \emptyset$について$p_\lambda \circ u = f_\lambda$が成り立つ$\C$の射$u \colon A \to L$がただ1つ存在します.ここでの$u$の条件
$$
\forall \lambda (\lambda \in \emptyset \to p_\lambda \circ u = f_\lambda)
$$
は「$\lambda \in \emptyset$」が常に偽なので,全体としては常に真になります.この含意命題は,どんな脚を考えていても真になってしまいますから,もはや情報としては無いに等しいです.
さらにいえば,先の$(A, (f_\lambda)_{\lambda \in \emptyset})$の脚$(f_\lambda)_{\lambda \in \emptyset}$は空族なので,存在はしていますが,意味はもっていません.
以上で述べた意味の無い部分をすべて削ぎ落とすと,$(X_\lambda)_{\lambda \in \emptyset}$の積とは,次の普遍性をみたすような$\C$の対象$L$のこととなります:
この$L$は$\C$の終対象 (terminal object) とよばれ「$a^0 = 1$」のような数の計算と同様に「無の積をとる」という意味でよく$1$と表されます.
$\Set$の終対象$1$は1元集合$\{\ast\}$のことです.実際,任意の集合$A$に対して,写像$A \to \{\ast\}$は$a \mapsto \ast$という対応をとるもののみが存在します.この意味でも,終対象を$1$と表すことは気持ちが良いですね.(実際は,終対象の概念自体は積を持ち出さなくても定義できるので「1元集合が$\Set$の終対象になるから$1$と表す」という説明のほうが妥当です.)
$\Top$, $\Vect_K$などにおいても同様です.
$(P, \leqslant)$を順序集合とし,これを圏と見なして,その終対象$1$について考えてみます.定義から,任意の対象$x$に対して射$x \to 1$が(ただ1つ)存在するわけですが,これはつまり,任意の$x \in P$について$x \leqslant 1$が成り立つということなので,$1$は順序集合$(P, \leqslant)$の最大元$\max{P}$になります.最大元は英語だとtopと表されることもあるので,その頭文字tをまねて,$\max{P}$は$\top$と表されることもあります.
具体例として,$S$を集合とし,その冪集合$\mathcal{P}(S)$に包含関係で順序を入れた$(\mathcal{P}(S), \subseteq)$では,$\top = S$です.
また,$\N$に整除関係で順序を入れた$(\N, {\mid})$での$\top$は,すべての自然数に割りきられる自然数のことなので,0となります.終対象を$1$と表す記法を使うと「$1 = 0$」となりますね.
積が統一的に定義されました.大変喜ばしいですね.祝杯でも挙げたいところですが,もう少し深堀してみます.定義2でも話したとおり,圏論では「射の向きをすべて反対にする」という操作により,元の圏$\C$の双対となる反対圏$\C\op$というものが考えられるのでした.なので,$\C\op$での積を考えて,それを$\C$に戻したものを考えてみましょう.
$$ \xymatrix @C=20pt{ & {^{\forall} A} \ar@/_10pt/[ldd]_{^{\forall} f\op} \ar@/^10pt/[rdd]^{^{\forall}g\op} \ar@[red][d]|{\color{red}{^{\exists!} u\op}} & & & & {^{\forall} A} &\\ & C \ar[ld]^{i\op} \ar[rd]_{j\op} & & \xleftrightarrow[\quad\quad\quad]{\text{op}} & & C \ar@[red][u]|{\color{red} {^{\exists!} u}} & \\ X & & Y & & X \ar[ru]_i \ar@/^10pt/[ruu]^{^{\forall} f} & & Y \ar[lu]^j \ar@/_10pt/[luu]_{^{\forall} g} }$$
上の図は,左が$\C\op$での$X$, $Y$の積$(C, (i\op, j\op))$の図で,右が$\C$での図です.
このように,反対圏を介することにより,元の圏において,既存の概念の双対にあたる新たな概念が考察の対象に挙がります.今回の場合は積の双対なので,$(C, (i, j))$を$X$, $Y$の余積 (coproduct) とよばれます.ちなみに,「余 (co-)」という接頭辞がついている数学の用語の多くは,ついていないものの双対であることが多いです.「domain」と「codomain」とや,「$\sin$ (sine)」と「$\cos$ (cosine)」となどが例です.
さて,余積という新たな概念が誕生しましたが,これは具体的な圏においてどんなものにあたるでしょうか?例えば,ここまで中心的に考えてきた$\Set$・$\Top$・$\Vect_K$や,順序集合のなす圏では,どんなものが余積の普遍性をみたすのでしょうか?これも面白い話題ですが,区切りが良いので,この考察は次回の記事までの宿題にしようと思います.興味のある方はぜひ考えてみてください.
ここまでご覧くださりありがとうございました!