$n$次対称群$\mathfrak{S}_{n}$の元$\sigma$に対して,線型変換$p_{\sigma} \colon \mathbb{C}^{n} \to \mathbb{C}^{n}$を
$$
p_{\sigma} \epsilon_{j} \coloneqq \epsilon_{\sigma(j)}$$
で定め,$\mathbb{C}^{n}$の標準基底に関する$p_{\sigma}$の表現行列を$P_{\sigma}$で表わす:
$$
P_{\sigma}(i,j) = \delta_{i,\sigma(j)} = \begin{cases}
1 & i = \sigma(j)\\
0 & i \neq \sigma(j)
\end{cases}.$$
明らかに$p_{\sigma}$は全単射であるから,$P_{\sigma}$は可逆行列である.したがって,写像$P \colon \mathfrak{S}_{n} \to \mathrm{GL}(n,\mathbb{C})$を
$$
P(\sigma) \coloneqq P_{\sigma}$$
で定めることができる.
$P$は単射群準同型である.
repより
$$
\mathfrak{S}_{n} \cong \mathrm{Perm}(n) := \Im(P) < \mathrm{GL}(n,\mathbb{C})$$
が成り立つ.$\mathrm{Perm}(n)$の元を($n$次)置換行列という.
置換$\sigma \in \mathfrak{S}_{n}$に対して,
\begin{align}
\det p_{\sigma}
&= \det P_{\sigma} \\
&= \sum_{\tau \in \mathfrak{S}_{n}} \sgn(\tau) \cdot P_{\sigma}(1,\tau(1)) \cdots P_{\sigma}(n,\tau(n)) \\
&= \sum_{\tau \in \mathfrak{S}_{n}} \sgn(\tau) \cdot \delta_{1,\sigma(\tau(1))} \cdots \delta_{n,\sigma(\tau(n))} \\
&= \sgn(\sigma^{-1}) \\
&= \sgn(\sigma)
\end{align}
が成り立つ.また,
$$
\tr p_{\sigma} = \tr P_{\sigma} = \sum_{i=1}^{n} \delta_{i,\sigma(i)} = \#\{i \in \{1,\ldots,n\} : \sigma(i) = i\}$$
が成り立つ.
置換行列は直交行列である:
$$
\mathrm{Perm}(n) < \mathrm{O}(n).$$
$\sigma \in \mathfrak{S}_{n}$とする.このとき
$$
P_{\sigma}^{\transpose}(i,j) = P_{\sigma}(j,i) = \delta_{j,\sigma(i)} = \delta_{i,\sigma^{-1}(j)} = P_{\sigma^{-1}}(i,j)$$
より,
$$
P_{\sigma}^{\transpose} = P_{\sigma^{-1}} = P(\sigma^{-1}) = P(\sigma)^{-1} = P_{\sigma}^{-1}$$
が成り立つ.
$\sigma \in \mathfrak{S}_{n}$とする.
$x = \sum_{i} \epsilon_{i}x_{i} \in \mathbb{C}^{n}$に対して
$$
p_{\sigma}x = \sum_{i=1}^{n} (p_{\sigma}\epsilon_{i})x_{i} = \sum_{i=1}^{n} \epsilon_{\sigma(i)}x_{i} = \sum_{i=1}^{n} \epsilon_{i}x_{\sigma^{-1}(i)}$$
が成り立つので,置換行列$P_{\sigma}$による列ベクトルへの作用は
$$
P_{\sigma}\begin{bmatrix}
x_{1} \\ \vdots \\ x_{n}
\end{bmatrix}
= \begin{bmatrix}
x_{\sigma^{-1}(1)} \\ \vdots \\ x_{\sigma^{-1}(n)}
\end{bmatrix}$$
で与えられる(cf. action例11).したがって
$$
P_{\sigma^{-1}}\begin{bmatrix}
a_{1,1} & \cdots & a_{1,m}\\
\vdots & \ddots & \vdots \\
a_{n,1} & \cdots & a_{n,m}
\end{bmatrix} = \begin{bmatrix}
a_{\sigma(1),1} & \cdots & a_{\sigma(1),m}\\
\vdots & \ddots & \vdots \\
a_{\sigma(n),1} & \cdots & a_{\sigma(n),m}
\end{bmatrix}$$
が成り立つ(行ベクトルの入れ替え).
$A \in \mathrm{Mat}(m,n;\mathbb{C})$に対して
\begin{align}
(AP_{\sigma})(i,j)
&= \sum_{k=1}^{n} A(i,k)P_{\sigma}(k,j) \\
&= \sum_{k=1}^{n} A(i,k)\delta_{k,\sigma(j)} \\
&= A(i,\sigma(j))
\end{align}
が成り立つ.したがって,$\cdot P_{\sigma}$は$A$の列ベクトルを入れ替える:
$$
A = \begin{bmatrix}
\hat{A}(1) & \cdots & \hat{A}(n)
\end{bmatrix} \implies AP_{\sigma} = \begin{bmatrix}
\hat{A}(\sigma(1)) & \cdots & \hat{A}(\sigma(n))
\end{bmatrix}.$$
置換$\sigma \in \mathfrak{S}_{n}$の巡回置換分解に現れる長さ$\ell \in \{2,\ldots,n\}$の巡回置換の個数を$N_{\ell} \in \{0,\ldots,n\}$とおくと,線型変換$p_{\sigma}$の固有多項式$f_{\sigma}$は
$$
f_{\sigma}(t) = (t - 1)^{\tr p_{\sigma}} \cdot \prod_{\ell=2}^{n} (t^{\ell}-1)^{N_{\ell}}$$
で与えられる.
“長さ$1$の巡回置換”も考えて
$$
N_{1} \coloneqq \#\{i \in \{1,\ldots,n\} : \sigma(i) = i\}$$
とおくと,$N_{1} = \tr p_{\sigma}$であったから,
$$
f_{\sigma}(t) = \prod_{\ell=1}^{n} (t^{\ell}-1)^{N_{\ell}}$$
とまとめられる.
正整数$\ell \in \mathbb{N}_{>0}$に対して$\ell$次置換行列$C_{\ell} \in \mathrm{Perm}(\ell)$を
$$
C_{\ell} \coloneqq P((12\cdots \ell)) = \begin{bmatrix}
0 & 0 & \cdots & 0 & 1 \\
1 & 0 & \cdots & 0 & 0 \\
0 & 1 & \cdots & 0 & 0 \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
0 & 0 & \cdots & 1 & 0
\end{bmatrix}$$
で定めると,
\begin{align}
\det(t I_{\ell}-C_{\ell})
&= \det\begin{bmatrix}
t & 0 & \cdots & 0 & -1 \\
-1 & t & \cdots & 0 & 0 \\
0 & -1 & \cdots & 0 & 0 \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
0 & 0 & \cdots & -1 & t
\end{bmatrix} \\
&= t \cdot \det\begin{bmatrix}
t & \cdots & 0 & 0 \\
-1 & \cdots & 0 & 0 \\
\vdots & \ddots & \vdots & \vdots \\
0 & \cdots & -1 & t
\end{bmatrix} + (-1)^{1+\ell}(-1)\cdot \det\begin{bmatrix}
-1 & t & \cdots & 0 \\
0 & -1 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & -1
\end{bmatrix} \\
&= t \cdot t^{\ell-1} + (-1)^{1+\ell}(-1) \cdot (-1)^{\ell-1} \\
&= t^{\ell} -1
\end{align}
が成り立つ.
置換$\sigma \in \mathfrak{S}_{n}$の“広義”巡回置換分解を
$$
\sigma = \sigma_{\ell_{1}} \cdots \sigma_{\ell_{m}}$$
とする:
$$
\sigma_{\ell_{j}} \coloneqq (i_{1,j} \cdots i_{\ell_{j},j}),\ 1 \leq j \leq m,\ 1 \leq \ell_{j} \leq n.$$
このとき,$\mathbb{C}^{n}$の基底$(\epsilon_{i_{1,1}},\ldots,\epsilon_{i_{\ell_{1},1}},\ldots,\epsilon_{i_{1,m}},\ldots,\epsilon_{i_{\ell_{m},m}})$に関する$p_{\sigma}$の表現行列は
$$
C_{\ell_{1}} \oplus\cdots\oplus C_{\ell_{m}}$$
となる.したがって
\begin{align}
f_{\sigma}(t)
&= \det(t I_{n} - (C_{\ell_{1}} \oplus\cdots\oplus C_{\ell_{m}})) \\
&= \det((t I_{\ell_{1}} - C_{\ell_{1}}) \oplus\cdots\oplus (t I_{\ell_{m}} - C_{\ell_{m}})) \\
&= \prod_{j=1}^{m} \det(t I_{\ell_{j}} - C_{\ell_{j}}) \\
&= \prod_{j=1}^{m} (t^{\ell_{j}} - 1) \\
&= \prod_{\ell=1}^{n} (t^{\ell}-1)^{\#\{j \in \{1,\ldots,m\} \,:\, \ell_{j}=\ell\}} \\
&= \prod_{\ell=1}^{n} (t^{\ell}-1)^{N_{\ell}}
\end{align}
が成り立つ.
$\sigma \coloneqq (13)(24) \in \mathfrak{S}_{4}$とおく.このとき
$$
P_{\sigma} = \begin{bmatrix}
0 & 0 & 1 & 0 \\
0 & 0 & 0 & 1 \\
1 & 0 & 0 & 0 \\
0 & 1 & 0 & 0
\end{bmatrix}$$
より
\begin{align}
f_{\sigma}(t)
&= \det \begin{bmatrix}
t & 0 & -1 & 0 \\
0 & t & 0 & -1 \\
-1 & 0 & t & 0 \\
0 & -1 & 0 & t
\end{bmatrix} \\
&= t \cdot \det \begin{bmatrix}
t & 0 & -1 \\
0 & t & 0 \\
-1 & 0 & t
\end{bmatrix}
+ (-1)\cdot \det \begin{bmatrix}
0 & t & -1 \\
-1 & 0 & 0 \\
0 & -1 & t
\end{bmatrix} \\
&= t(t^{3}-t) - (-1+t^{2}) \\
&= t^{4} - 2t^{2} + 1 \\
&= (t^{2}-1)^{2}
\end{align}
となるので,確かに
$$
f_{\sigma}(t) = \prod_{\ell=1}^{4} (t^{\ell}-1)^{N_{\ell}}$$
が成り立っている.
置換$\sigma \in \mathfrak{S}_{n}$の巡回置換分解を
$$
\sigma = \sigma_{\ell_{1}} \cdots \sigma_{\ell_{m}}$$
とすると,線型変換$p_{\sigma}$の最小多項式$\mu_{\sigma}$は
$$
\mu_{\sigma} = \prod\{\Phi_{k} : \exists\,j \in \{1,\ldots,m\},\ k \mid \ell_{j}\}$$
で与えられる.ただし$\Phi_{k}$は$k$番目の
円分多項式
である.
$\ell$次置換行列$C_{\ell} \in \mathrm{Perm}(\ell)$の最小多項式$\mu_{\ell} \coloneqq \mu_{(12 \cdots \ell)}$は
$$
\mu_{\ell}(t) = t^{\ell}-1 = \prod_{k \mid \ell} \Phi_{k}(t)$$
で与えられる.実際,
$\mathbb{C}^{n}$の適当な基底に関する$p_{\sigma}$の表現行列は
$$
I_{\ell_{0}} \oplus C_{\ell_{1}} \oplus\cdots\oplus C_{\ell_{m}}$$
となる(のだった).よって
\begin{align}
\mu_{\sigma} &= \mathrm{LCM}\{\mu_{1},\mu_{\ell_{1}},\ldots,\mu_{\ell_{m}}\} \\
&= \mathrm{LCM}\left\{\Phi_{1},\prod_{k_{1} \mid \ell_{1}} \Phi_{k_{1}}, \ldots, \prod_{k_{m} \mid \ell_{m}} \Phi_{k_{m}}\right\} \\
&= \prod\{\Phi_{k} : \exists\,j \in \{1,\ldots,m\},\ k \mid \ell_{j}\}\\
\end{align}
が成り立つ.
$\sigma \coloneqq (23)(456) \in \mathfrak{S}_{6}$とおく.このとき,
\begin{align}
P_{\sigma} &= I_{1} \oplus C_{2} \oplus C_{3};\\
P_{\sigma}^{2} &= I_{1} \oplus I_{2} \oplus C_{3}^{2};\\
P_{\sigma}^{3} &= I_{1} \oplus C_{2} \oplus I_{3};\\
P_{\sigma}^{4} &= I_{1} \oplus I_{2} \oplus C_{3};
\end{align}
より
$$
P_{\sigma}^{4} + P_{\sigma}^{3} = P_{\sigma} + I_{6}$$
が成り立つので
$$
\mu_{\sigma}(t) \mid t^{4} + t^{3} - t - 1$$
を得る.ここで,$\deg \mu_{\sigma} \leq 3$として
$$
\mu_{\sigma}(t) \coloneqq at^{3} + bt^{2} + ct +d$$
とおくと,
$$
O_{6} = \mu_{\sigma}(P_{\sigma}) = aP_{\sigma}^{3} + bP_{\sigma}^{2} + cP_{\sigma} + dI_{6}$$
であるから,
\begin{align}
0 &= (aP_{\sigma}^{3} + bP_{\sigma}^{2} + cP_{\sigma} + dI_{6})\epsilon_{4} \\
&= a\epsilon_{4} + b\epsilon_{6} + c\epsilon_{5} + d\epsilon_{4}
\end{align}
より$b = c = 0$が得られ,
$$
0 = (aP_{\sigma}^{3} + dI_{6})\epsilon_{2} = a\epsilon_{3} + d\epsilon_{2}$$
より$a = d = 0$が得られるが,これは不合理である.ところで
$$
\Phi_{1}(t)\Phi_{2}(t)\Phi_{3}(t) = (t -1)(t+1)(t^{2}+t+1) = t^{4} +t^{3} - t - 1$$
であるから,確かに
$$
\mu_{\sigma} = \Phi_{1}\Phi_{2}\Phi_{3}$$
が成り立っている.
置換$\sigma \in \mathfrak{S}_{n}$の巡回置換分解を
$$
\sigma = \sigma_{\ell_{1}} \cdots \sigma_{\ell_{m}}$$
とすると,線型変換$p_{\sigma}$の固有値全体のなす集合は
$$
\{\text{$1$ の原始 $k$ 乗根}:\exists\,j \in \{1,\ldots,m\},\ k \mid \ell_{j}\}$$
に一致する.
$a = \sum_{i}\epsilon_{i}a_{i-1} \in \mathbb{C}^{n}$に対して,多項式
$$
\Gamma_{a}(t) \coloneqq a_{0} + a_{1}t +\cdots+ a_{n-1}t^{n-1}$$
に置換行列$C_{n}$を代入して得られる$n$次正方行列
$$
\Gamma_{a}(C_{n}) = a_{0}I_{n} + a_{1}C_{n} +\cdots+ a_{n-1}C_{n}^{n-1} =
\begin{bmatrix}
a_{0} & a_{n-1} & \cdots & a_{2} & a_{1} \\
a_{1} & a_{0} & \ddots & & a_{2} \\
a_{2} & \ddots & \ddots & \ddots & \vdots \\
\vdots & \ddots & \ddots & \ddots & a_{n-1} \\
a_{n-1} & \cdots & a_{2} & a_{1} & a_{0}
\end{bmatrix}$$
を,$a$から定まる巡回行列という.
$a = \sum_{i}\epsilon_{i}a_{i-1} \in \mathbb{C}^{n}$から定まる巡回行列$\Gamma_{a}(C_{n})$のディターミナントは
$$
\Gamma_{a}(1)\Gamma_{a}(\zeta_{n}) \cdots \Gamma_{a}(\zeta_{n}^{n-1})$$
に等しい.
可逆行列$Z \in \mathrm{GL}(n,\mathbb{C})$を
$$
Z(j,k) \coloneqq \zeta_{n}^{(n-j+1)k}\quad \leadsto\quad \hat{Z}(k) = \begin{bmatrix}
\zeta_{n}^{nk} \\ \zeta_{n}^{(n-1)k} \\ \vdots \\ \zeta_{n}^{2k} \\ \zeta_{n}^{k}
\end{bmatrix} = v_{n}^{k}$$
で定める.このとき
\begin{align}
\Gamma_{a}(C_{n})\hat{Z}(k)
&= (a_{0}I_{n} + a_{1}C_{n} +\cdots+ a_{n-1}C_{n}^{n-1})v_{n}^{k} \\
&= a_{0}v_{n}^{k} + a_{1}\zeta_{n}^{k}v_{n}^{k} +\cdots+ a_{n-1}(\zeta_{n}^{k})^{n-1}v_{n}^{k} \\
&= (a_{0}+a_{1}\zeta_{n}^{k} +\cdots+ a_{n-1}(\zeta_{n}^{k})^{n-1})v_{n}^{k} \\
&= \Gamma_{a}(\zeta_{n}^{k})v_{n}^{k}\\
&= \Gamma_{a}(\zeta_{n}^{k}) \hat{Z}(k)
\end{align}
より
$$
\Gamma_{a}(C_{n})Z = Z \begin{bmatrix}
\,\Gamma_{a}(\zeta_{n}) & & & \\
& \ddots && \\
&& \Gamma_{a}(\zeta_{n}^{n-1}) & \\
&&& \Gamma_{a}(\zeta_{n}^{n})
\end{bmatrix}$$
となるので,
$$
\det \Gamma_{a}(C_{n}) = \Gamma_{a}(1)\Gamma_{a}(\zeta_{n}) \cdots \Gamma_{a}(\zeta_{n}^{n-1})$$
が成り立つ.
巡回行列$\Gamma_{a}(C_{n})$の固有値は
$$
\Gamma_{a}(1), \Gamma_{a}(\zeta_{n}),\ldots, \Gamma_{a}(\zeta_{n}^{n-1})$$
であり,固有値$\Gamma_{a}(\zeta_{n}^{k}),\ 0\leq k \leq n-1,$に属する固有ベクトル(のひとつ)は
$$
\begin{bmatrix}
1 \\ \zeta_{n}^{(n-1)k} \\ \vdots \\ \zeta_{n}^{2k} \\ \zeta_{n}^{k}
\end{bmatrix}$$
である.
$\Gamma_{a}(\zeta_{n}^{k})$は相異なるとは限らない.たとえば$a \coloneqq (1,1,\omega)$とおくと,
$$
\Gamma_{a}(1) = 1+1\cdot 1^{1} +\omega\cdot 1^{2} = 2+\omega = 1 +1\cdot\omega^{1} +\omega\cdot\omega^{2} = \Gamma_{a}(\omega)$$
が成り立つ.
$n \in \mathbb{N}_{>0}$とし$\epsilon \coloneqq \sum_{j}\epsilon_{j} \in \mathbb{R}^{n}$とおく.このとき,集合
$$
\mathrm{DS}(n) \coloneqq \{S \in \mathrm{Mat}(n,n;\mathbb{R}) : S(i,j) \geq 0,\ S\epsilon = \epsilon = S^{\transpose}\epsilon\}$$
の元を二重確率行列という.
置換行列$P_{\sigma} \in \mathrm{Perm}(n)$は二重確率行列である.実際,明らかに
$$
P_{\sigma}(i,j) = \delta_{i,\sigma(j)} \geq 0,\ P_{\sigma}\epsilon = \sum_{j=1}^{n} \epsilon_{\sigma(j)} = \epsilon$$
が成り立ち,さらに
$$
P_{\sigma}^{\transpose}\epsilon = P_{\sigma^{-1}}\epsilon = \epsilon$$
も成り立つ.
置換行列の凸結合は二重確率行列である:
$$
\forall (a_{\sigma})_{\sigma} \in [0,1]^{\mathfrak{S}_{n}},\ \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma} = 1 \implies S \coloneqq \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}P_{\sigma} \in \mathrm{DS}(n).$$
実際,明らかに$S(i,j) \geq 0$であり,perm-dsより
$$
S\epsilon = \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}P_{\sigma}\epsilon = \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}\epsilon = \left(\sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}\right) \epsilon = \epsilon,$$
および
$$
S^{\transpose}\epsilon = \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}P_{\sigma}^{\transpose}\epsilon = \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}\epsilon = \left(\sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}\right) \epsilon = \epsilon$$
が成り立つ.
$S \in \mathrm{Mat}(n,n;\mathbb{R})$とする.このとき次は同値である:
不等式の左辺は$A$と$S$とのFrobenius内積である(cf. tr-det例7):
$$
\sum_{i,j=1}^{n} A(i,j)S(i,j) = \tr(AS^{\transpose}) = \langle A \mid S \rangle.$$
まづ
$$
\mathrm{Conv}(\mathrm{Perm}(n)) \coloneqq \left\{X \in \mathrm{Mat}(n,n;\mathbb{R}) : \exists\,(a_{\sigma})_{\sigma} \in [0,1]^{\mathfrak{S}_{n}},\ \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma} = 1,\ X = \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}P_{\sigma}\right\}$$
とおき,写像$h \colon \mathrm{Mat}(n,n;\mathbb{R}) \to \mathbb{R}$を
$$
h(A) \coloneqq \max_{\sigma\in\mathfrak{S}_{n}}\,\langle A \mid P_{\sigma} \rangle = \sup\,\{\langle A \mid X \rangle : X\in\mathrm{Conv}(\mathrm{Perm}(n))\}$$
で定める(これを$\mathrm{Conv}(\mathrm{Perm}(n))$の支持函数(support function)という).このとき
$$
\mathrm{Conv}(\mathrm{Perm}(n)) = \{S \in \mathrm{Mat}(n,n;\mathbb{R}) : \forall A \in \mathrm{Mat}(n,n;\mathbb{R}),\ \langle A \mid S \rangle \leq h(A)\}$$
が成り立つことを示せばよい.
任意の二重確率行列は置換行列の凸結合で書ける.
任意の$S \in \mathrm{DS}(n)\smallsetminus\{I_{n}\}$に対して,$\sigma_{S}\in\mathfrak{S}_{n}\smallsetminus\{\id\}$であって
$$
0 \notin \{S(i,\sigma_{S}(i)) : 1 \leq i \leq n,\ i \neq \sigma_{S}(i)\}$$
なるものが存在することを示す.
$S \in \mathrm{DS}(n)$とする.このとき任意の$A \in \mathrm{Mat}(n,n;\mathbb{R})$に対して
$$
\sum_{i,j=1}^{n} A(i,j)S(i,j) \leq \max_{\sigma\in\mathfrak{S}_{n}} \sum_{i=1}^{n} A(i,\sigma(i))$$
が成り立つことを示せばよい(cf. conv-hull).
正方行列$A \in \mathrm{Mat}(n,n;\mathbb{R})$に対して
$$
\per A \coloneqq \sum_{\sigma\in\mathfrak{S}_{n}} A(1,\sigma(1)) \cdots A(n,\sigma(n))$$
を$A$のパーマネントという.二重確率行列$S = \sum_{\tau} a_{\tau}P_{\tau} \in \mathrm{DS}(n)$のパーマネントについて,
$$
S(i,\sigma(i)) = \sum_{\tau\in\mathfrak{S}_{n}} a_{\tau}\delta_{i,\tau(\sigma(i))} \geq a_{\sigma^{-1}}$$
より,
$$
\per S = \sum_{\sigma\in\mathfrak{S}_{n}} S(1,\sigma(1)) \cdots S(n,\sigma(n)) \geq \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma^{-1}} \cdots a_{\sigma^{-1}} = \sum_{\sigma\in\mathfrak{S}_{n}} a_{\sigma}^{n} > 0$$
が成り立つ.よって$\sigma_{S} \in \mathfrak{S}_{n}$であって
$$
0 \notin \{S(1,\sigma_{S}(1)), \ldots, S(n,\sigma_{S}(n))\}$$
を満たすもの(すなわち$SP_{\sigma_{S}}$の対角成分がすべて正となるもの)が存在する.