16 级高代 II 思考题九 设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, $f(\lambda),m(\lambda)$ 分别是 $\varphi$ 的特征多项式和极小多项式. 设 $f(\lambda)=m(\lambda)=P_1(\lambda)^{r_1}P_2(\lambda)^{r_2}\cdots P_k(\lambda)^{r_k}$, 其中 $P_1(\lambda),P_2(\lambda),\cdots,P_k(\lambda)$ 是 $\mathbb{K}$ 上互异的首一不可约多项式, $r_i\geq 1$, 试求 $V$ 的所有 $\varphi$-不变子空间.
解法一 利用发展起来的循环子空间理论, 请参考教学论文 [1] 的例 2.
为了阐述接下去的几种解法, 我们先做一个化简, 把问题归结到一个初等因子的情形.
设 $V_i=\mathrm{Ker\,}P_i(\varphi)^{r_i}$, $f_i(\lambda),m_i(\lambda)$ 分别是 $\varphi|_{V_i}$ 的特征多项式和极小多项式, 则由高代白皮书的例 7.21 可得, $V=V_1\oplus V_2\oplus\cdots\oplus V_k$, 且 $f_i(\lambda)=m_i(\lambda)=P_i(\lambda)^{r_i}$.
引理 1 任取 $V$ 的 $\varphi$-不变子空间 $U$, 则 $U=U_1\oplus U_2\oplus\cdots\oplus U_k$, 其中 $U_i$ 是 $V_i$ 的 $\varphi$-不变子空间.
引理 1 的证明 令 $U_i=U\cap V_i$, 则 $U_i$ 是 $V_i$ 的 $\varphi$-不变子空间. 由 $V_i$ 的和是直和易证 $U_i$ 的和也是直和. 一方面, $U_1+U_2+\cdots+U_k\subseteq U$ 是显然的. 另一方面, 任取 $u\in U$, 设 $u=v_1+v_2+\cdots+v_k$, 其中 $v_i\in V_i$, 我们只要证明 $v_i\in U_i$, 就能得到 $U\subseteq U_1+U_2+\cdots+U_k$, 从而 $U=U_1+U_2+\cdots+U_k=U_1\oplus U_2\oplus\cdots\oplus U_k$. 注意到 $P_i(\lambda)^{r_i}$ 是两两互素的多项式, 由中国剩余定理可知, 存在多项式 $g(\lambda),q_i(\lambda)$, 使得 $$g(\lambda)=P_1(\lambda)^{r_1}q_1(\lambda)+1,\,\,\,\,g(\lambda)=P_i(\lambda)^{r_i}q_i(\lambda),\,\,i\geq 2,$$ 于是 $$g(\varphi)(u)=(q_1(\varphi)P_1(\varphi)^{r_1}+I_V)(v_1)+\sum_{i=2}^kq_i(\varphi)P_i(\varphi)^{r_i}(v_i)=v_1,$$ 即 $v_1=g(\varphi)(u)\in U$, 从而 $v_1\in U_1$. 同理可证其他情形. $\Box$
以下我们不妨假设 $\varphi$ 的特征多项式 $f(\lambda)$ 和极小多项式 $m(\lambda)$ 满足 $f(\lambda)=m(\lambda)=P(\lambda)^r$, 其中 $P(\lambda)=\lambda^d+a_1\lambda^{d-1}+\cdots+a_{d-1}\lambda+a_d$ 是 $\mathbb{K}$ 上的 $d$ 次首一不可约多项式, $r\geq 1$.
任取 $V$ 的非零 $\varphi$-不变子空间 $U$, 容易验证限制变换 $\varphi|_U$ 的特征多项式是 $\varphi$ 的特征多项式的因式, 故可设 $\varphi|_U$ 的特征多项式为 $P(\lambda)^s$, 其中 $1\leq s\leq r$. 由 Cayley-Hamilton 定理可知, $U\subseteq\mathrm{Ker\,}P(\varphi)^s$. 注意到 $\dim U=\deg P(\lambda)^s=sd$, 如果我们能证明 $$(*)\qquad\dim\mathrm{Ker\,}P(\varphi)^s=sd\,\,\text{对任意的}\,\,1\leq s\leq r\,\,\text{都成立},$$ 那么 $U=\mathrm{Ker\,}P(\varphi)^s$, 从而 $V$ 的所有 $\varphi$-不变子空间就是 $\{\mathrm{Ker\,}P(\varphi)^s,\,\,0\leq s\leq r\}$, 共有 $r+1$ 个.
解法二 (由王雨程同学提供) 令 $K_i=\mathrm{Ker\,}P(\varphi)^i$, 则 $K_i$ 是 $\varphi$-不变子空间, 若设 $\varphi|_{K_i}$ 的特征多项式为 $P(\lambda)^{t_i}$, 则 $\dim K_i=\deg P(\lambda)^{t_i}=t_id$. 注意到 $0=K_0\subseteq K_1\subseteq K_2\subseteq\cdots\subseteq K_r=V$, 并且 $K_1\neq 0$ (否则, $P(\varphi)$ 为同构, 这与 $P(\varphi)^r=0$ 矛盾), 于是有不等式 $1\leq t_1\leq t_2\leq\cdots\leq t_r=r$. 我们断言 $t_i<t_{i+1}$ 对任意的 $1\leq i<r$ 都成立. 用反证法, 若存在 $1\leq j<r$, 使得 $t_j=t_{j+1}$, 则由高代白皮书的例 4.32 完全类似的讨论可得 $K_j=K_{j+1}=\cdots=K_r=V$, 于是 $\varphi$ 适合多项式 $P(\lambda)^j$, 这与 $\varphi$ 的极小多项式 $m(\lambda)=P(\lambda)^r$ 矛盾. 由上述断言即得 $t_i=i\,(1\leq i\leq r)$ 成立, $(*)$ 式得证. $\Box$
我们也可以把 $\varphi|_{K_i}$ 的极小多项式先求出来, 下面的引理是 16 级高代 II 期中考试第六大题.
引理 2 设 $W$ 是非零 $\varphi$-不变子空间, 则 $\varphi|_W$ 的极小多项式等于其特征多项式.
引理 2 的证明 取 $W$ 的一组基, 并延拓为 $V$ 的一组基, 则 $\varphi$ 在这组基下的表示矩阵为 $M=\begin{pmatrix} A & C \\ 0 & B \end{pmatrix}$. 已知 $M$ 的极小多项式等于其特征多项式, 我们只要证明 $A$ 的极小多项式也等于其特征多项式即可. 由于极小多项式在基域扩张下不改变 (参考教学论文 [2]), 所以我们可以把涉及到的矩阵都看成复矩阵来处理. 用反证法, 若 $A$ 的极小多项式不等于其特征多项式, 那么必存在 $A$ 的特征值 $\lambda_0$, 使得属于它的 Jordan 块至少有两个, 从而 $\lambda_0$ 至少有两个线性无关的特征向量. 把这些特征向量延拓一下, 可以得到 $\lambda_0$ 作为 $M$ 的特征值, 它至少有两个线性无关的特征向量, 从而至少有两个 Jordan 块, 但这与 $M$ 的极小多项式等于其特征多项式相矛盾. $\Box$
解法三 (由冯雅颂同学提供) 令 $K_s=\mathrm{Ker\,}P(\varphi)^s$, 则 $\varphi|_{K_s}$ 适合多项式 $P(\lambda)^s$, 从而其极小多项式整除 $P(\lambda)^s$. 由引理 2 可知, $\varphi|_{K_s}$ 的极小多项式等于其特征多项式, 于是其特征多项式的次数小于等于 $\deg P(\lambda)^s=sd$, 从而 $sd=\dim U\leq\dim K_s\leq sd$, 故 $U=K_s$. $\Box$
设 $\varphi$ 在某组基下的表示矩阵为 $A$, 则由线性变换的维数公式可知 $\dim\mathrm{Ker\,}P(\varphi)^s=n-r(P(A)^s)$. 下面的解法四根据矩阵的秩在基域扩张下的不变性 (参考教学论文 [2]), 利用 $A$ 的 Jordan 标准型来计算 $P(A)^s$ 的秩, 而解法五则利用数域 $\mathbb{K}$ 上 $A$ 的第一类广义 Jordan 标准型来计算 $P(A)^s$ 的秩.
解法四 由假设 $A$ 的特征多项式 $f(\lambda)$ 和极小多项式 $m(\lambda)$ 满足 $$f(\lambda)=m(\lambda)=P(\lambda)^r=(\lambda-\lambda_1)^r(\lambda-\lambda_2)^r\cdots(\lambda-\lambda_d)^r,$$ 其中 $\lambda_1,\lambda_2,\cdots,\lambda_d$ 是 $P(\lambda)$ 的 $d$ 个不同的复数根, 于是 $A$ 的 Jordan 标准型为 $J=\mathrm{diag}\{J_r(\lambda_1),J_r(\lambda_2),\cdots,J_r(\lambda_d)\}$, 从而 $P(J)^s=(J-\lambda_1I)^s(J-\lambda_2I)^s\cdots(J-\lambda_dI)^s$. 由简单的计算可得 $r(P(A)^s)=r(P(J)^s)=(r-s)d=n-sd$, 从而 $\dim\mathrm{Ker\,}P(\varphi)^s=sd$. $\Box$
解法五 (由徐钰伦同学提供) 由高代白皮书的例 7.67 可知, $A$ 的第一类广义 Jordan 标准型为 $$J=J_r(P(\lambda))=\begin{pmatrix} F(P(\lambda)) & I & & & \\ & F(P(\lambda)) & I & & \\ & & \ddots & \ddots & \\ & & & \ddots & I \\ & & & & F(P(\lambda)) \end{pmatrix},$$ 其中 $F(P(\lambda))$ 是对应于 $P(\lambda)$ 的有理块, $I$ 是单位阵. 根据通常的 Jordan 块带入多项式的计算可知, $P(J)^s$ 是一个上三角矩阵, 上 $i$ 次分块对角线上的元素均为 $\dfrac{1}{i!}(P(\lambda)^s)^{(i)}|_{\lambda=F(P(\lambda))}$, $0\leq i\leq r-1$. 注意到 $F=F(P(\lambda))$ 适合其特征多项式 $P(\lambda)$, 并由 $P(\lambda)$ 不可约可知 $(P(\lambda),P'(\lambda))=1$, 从而 $P'(F)$ 为可逆阵. 于是由简单的计算可知, 当 $0\leq i<s$ 时, $P(J)^s$ 的上 $i$ 次分块对角线上的元素全为零, 而 $P(J)^s$ 的上 $s$ 次分块对角线上的元素全为 $P'(F)^s$, 这是一个非异阵, 从而 $r(P(A)^s)=r(P(J)^s)=(r-s)d=n-sd$, 从而 $\dim\mathrm{Ker\,}P(\varphi)^s=sd$. $\Box$
利用数域 $\mathbb{K}$ 上 $\varphi$ 的第二类广义 Jordan 标准型, 我们可以给出最后两种解法, 它们分别对应于博文《Jordan 块的几何》中 Part B 的两种方法. 我们惊奇的发现, 第一类广义 Jordan 块继承了通常 Jordan 块在矩阵运算中的便利, 而第二类广义 Jordan 块则继承了通常 Jordan 块在循环空间框架下的几何意义.
由高代白皮书的例 7.67 可知, 存在 $V$ 的一组基 $\{e_{1,1},e_{1,2},\cdots,e_{1,d};e_{2,1},e_{2,2},\cdots,e_{2,d};\cdots;e_{r,1},e_{r,2},\cdots,e_{r,d}\}$, 使得 $\varphi$ 在这组基下的表示矩阵为第二类广义 Jordan 标准型 $$J=\widetilde{J}_r(P(\lambda))=\begin{pmatrix} F(P(\lambda)) & C & & & \\ & F(P(\lambda)) & C & & \\ & & \ddots & \ddots & \\ & & & \ddots & C \\ & & & & F(P(\lambda)) \end{pmatrix},$$ 其中 $C$ 是左下角元素为 1, 其余元素为 0 的矩阵. 为了表达式的统一性, 约定 $e_{0,j}=0\,(1\leq j\leq d)$, 则有 $$\varphi(e_{i,d})=e_{i,d-1}-a_1e_{i,d},\,\,\varphi(e_{i,d-1})=e_{i,d-2}-a_2e_{i,d},\,\,\cdots,\\ \varphi(e_{i,2})=e_{i,1}-a_{d-1}e_{2,d},\,\,\varphi(e_{i,1})=e_{i-1,d}-a_de_{i,d},\,\,1\leq i\leq r.$$ 整理后可得 $$e_{i,d-1}=(\varphi+a_1I_V)(e_{i,d}),\,\,e_{i,d-2}=(\varphi^2+a_1\varphi+a_2I_V)(e_{i,d}),\,\,\cdots,\\ e_{i,1}=(\varphi^{d-1}+a_1\varphi^{d-2}+\cdots+a_{d-1}I_V)(e_{i,d}),\,\,e_{i-1,d}=P(\varphi)(e_{i,d}),\,\,1\leq i\leq r.\qquad (**)$$
令 $V_i=L(e_{i,1},e_{i,2},\cdots,e_{i,d})$, 则 $V=V_1\oplus V_2\oplus\cdots\oplus V_r$. 根据上面的关系式 $(**)$ 可知, 在 $V_i$ 中, $e_{i,d}$ 可通过 $\varphi$ 的次数小于 $n$ 的多项式映到每一个基向量 $e_{i,j}\,(1\leq j\leq d)$, 并且 $e_{i,d}$ 可通过 $P(\varphi)$ 映到 $e_{i-1,d}$, 进一步还有 $P(\varphi)(e_{i,j})=e_{i-1,j}$, 从而 $P(\varphi)^i(e_{i,j})=0\,(1\leq i\leq r,\,1\leq j\leq d)$.
解法六 (由何陶然同学和颜匡萱同学提供) 由上面的关系式易证 $\mathrm{Ker\,}P(\varphi)^s=V_1\oplus V_2\oplus\cdots\oplus V_s$, 特别的, $\dim\mathrm{Ker\,}P(\varphi)^s=sd$, 从而 $(*)$ 式得证. 进一步, 每一个 $\mathrm{Ker\,}P(\varphi)^s\,(1\leq s\leq r)$ 都是一个循环子空间, 其循环向量是 $e_{s,d}$, 它的极小多项式是 $P(\lambda)^s$. $\Box$
解法七 任取 $V$ 的非零 $\varphi$-不变子空间 $U$, 令 $$s=\max\{\,i\,|\,u=u_1+u_2+\cdots+u_i,\,\,\text{其中}\,u\in U,\,u_j\in V_j\,(1\leq j\leq i)\,\text{且}\,u_i\neq 0\},$$ 则 $U\subseteq V_1\oplus V_2\oplus\cdots\oplus V_s$. 反之, 可取到 $u\in U$, $u=u_1+u_2+\cdots+u_s$, 其中 $u_j\in V_j\,(1\leq j\leq s)$ 且 $u_s\neq 0$. 由上面的关系式可知, 存在不能被 $P(\lambda)$ 整除的多项式 $g(\lambda)$, 使得 $u=g(\varphi)(e_{s,d})$. 由于 $(g(\lambda),P(\lambda)^s)=1$, 故存在 $u(\lambda),v(\lambda)$, 使得 $g(\lambda)u(\lambda)+P(\lambda)^sv(\lambda)=1$. 上式代入 $\lambda=\varphi$ 并作用在 $e_{s,d}$ 上可得 $$e_{s,d}=u(\varphi)g(\varphi)(e_{s,d})+v(\varphi)P(\varphi)^s(e_{s,d})=u(\varphi)(u)\in U,$$ 于是 $U=V_1\oplus V_2\oplus\cdots\oplus V_s=\mathrm{Ker\,}P(\varphi)^s$. $\Box$
综合以上证明, $V$ 的任一 $\varphi$-不变子空间 $U$ 必为 $\mathrm{Ker\,}(P_1(\varphi)^{s_1}P_2(\varphi)^{s_2}\cdots P_k(\varphi)^{s_k})$ 的形式, 其中 $0\leq s_i\leq r_i\,(1\leq i\leq k)$, 这样的 $\varphi$-不变子空间一共有 $(r_1+1)(r_2+1)\cdots(r_k+1)$ 个. $\Box$
参考文献
[1] 谢启鸿, 循环子空间的进一步应用, 大学数学, 2017, 33(1), 17–25.
[2] 谢启鸿, 高等代数中若干概念在基域扩张下的不变性, 大学数学, 2015, 31(6), 50–55.