设 $V$ 是复数域 $\mathbb{C}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, $A\in M_n(\mathbb{C})$ 是 $\varphi$ 在某组基下的表示矩阵, 则有线性变换或矩阵的 Jordan 标准型理论. 具体的, 设 $\varphi$ 或 $A$ 的初等因子组为 $(\lambda-\lambda_1)^{r_1}$, $(\lambda-\lambda_2)^{r_2}$, $\cdots$, $(\lambda-\lambda_k)^{r_k}$, 则存在 $V$ 的一组基 $\{e_1,e_2,\cdots,e_n\}$, 使得 $\varphi$ 在这组基下的表示矩阵为 Jordan 标准型 $$J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\},$$ 或者等价地, $A$ 相似于其 Jordan 标准型 $J$.
Jordan 标准型理论是深入研究线性变换的几何性质和矩阵的代数性质的重要工具. 注意到 Jordan 块是构成 Jordan 标准型的基本成分, 因此我们有必要仔细研究一下 Jordan 块背后具体的几何结构是什么呢?
为了叙述方便, 以下不妨设 $\varphi$ 在一组基 $\{e_1,e_2,\cdots,e_n\}$ 下的表示矩阵就是一个 Jordan 块 $$J_n(\lambda_0)=\begin{pmatrix} \lambda_0 & 1 & & & \\ & \lambda_0 & 1 & & \\ & & \ddots & \ddots & \\ & & & \ddots & 1 \\ & & & & \lambda_0 \end{pmatrix},$$ 由表示矩阵的定义可得 $$\varphi(e_1)=\lambda_0e_1,\,\,\varphi(e_2)=e_1+\lambda_0e_2,\,\,\cdots,\,\,\varphi(e_n)=e_{n-1}+\lambda_0e_n.$$
Part A 循环子空间
显然, $\varphi$ 的所有特征值都是 $\lambda_0$, 再由简单的计算可知, $\varphi$ 关于特征值 $\lambda_0$ 只有一个线性无关的特征向量 $e_1$, 其余的向量 $e_2,\cdots,e_n$ 都称为广义特征向量. 令 $\psi=\varphi-\lambda_0I_V$, 则有如下关系图: $$e_n\stackrel{\psi}{\rightarrow}e_{n-1}\stackrel{\psi}{\rightarrow}\cdots\stackrel{\psi}{\rightarrow}e_1\stackrel{\psi}{\rightarrow}0,$$ 这说明 $V=L(e_1,e_2,\cdots,e_n)=C(\psi,e_n)$ 是关于线性变换 $\psi$ 的循环空间, 其循环向量是 $e_n$. Jordan 块对应的循环子空间许多有趣的应用, 比如可以巧妙地求出 $J_n(0)^m\,(m\geq 1)$ 的 Jordan 标准型等, 具体请参考教学论文 [1].
Part B 不变子空间
我们知道 $\varphi$ 的特征多项式和极小多项式都等于 $(\lambda-\lambda_0)^n$, 下面我们来找出 $V$ 的所有 $\varphi$-不变子空间.
方法一 显然 $V_i=L(e_1,e_2,\cdots,e_i)\,(0\leq i\leq n)$ 都是 $\varphi$-不变子空间, 我们来证明 $V$ 只有这 $n+1$ 个 $\varphi$-不变子空间. 注意到 $\varphi$-不变子空间等价于 $\psi$-不变子空间, 任取非零 $\psi$-不变子空间 $U$, 设 $$k=\max\{\,\,i\,\,|\,\,\exists\,u\in U,\,\,u=c_1e_1+\cdots+c_ie_i+\cdots+c_ne_n,\,\,\text{其中}\,c_i\neq 0\},$$ 则 $U\subseteq L(e_1,e_2,\cdots,e_k)$. 另一方面, 取 $u\in U$, 使得 $u=c_1e_1+c_2e_2+\cdots+c_ke_k$, 其中 $c_k\neq 0$, 则由循环关系可得 $u=(c_1\psi^{k-1}+c_2\psi^{k-2}+\cdots+c_kI_V)(e_k)$. 令 $g(\lambda)=c_1\lambda^{k-1}+c_2\lambda^{k-2}+\cdots+c_k$, 则 $(g(\lambda),\lambda^n)=1$, 于是存在 $u(\lambda),v(\lambda)$, 使得 $g(\lambda)u(\lambda)+\lambda^nv(\lambda)=1$. 在上式中带入 $\lambda=\psi$ 并作用在 $e_k$ 上可得 $$e_k=u(\psi)g(\psi)(e_k)+v(\psi)\psi^n(e_k)=u(\psi)(u)\in U,$$ 于是由循环关系可得 $e_i\in U\,(1\leq i\leq k)$, 从而 $U=L(e_1,e_2,\cdots,e_k)$.
方法二 任取非零 $\varphi$-不变子空间 $U$, 容易证明限制变换 $\varphi|_U$ 的特征多项式是 $\varphi$ 的特征多项式 $(\lambda-\lambda_0)^n$ 的因式, 不妨设为 $(\lambda-\lambda_0)^k$, 其中 $1\leq k\leq n$, 由 Cayley-Hamilton 定理可知 $U\subseteq \mathrm{Ker}(\varphi-\lambda_0I_V)^k=\mathrm{Ker\,}\psi^k$. 任取 $v=\sum_{i=1}^nc_ie_i\in\mathrm{Ker\,}\psi^k$, 则 $$0=\psi^k(v)=c_{k+1}\psi^k(e_{k+1})+\cdots+c_n\psi^k(e_n)=c_{k+1}e_1+\cdots+c_ne_{n-k},$$ 于是 $c_{k+1}=\cdots=c_n=0$, 从而 $\mathrm{Ker\,}\psi^k=L(e_1,\cdots,e_k)$. 注意到 $\dim U=\deg(\lambda-\lambda_0)^k=k$, $\dim\mathrm{Ker\,}\psi^k=k$, 于是 $U=\mathrm{Ker\,}\psi^k=L(e_1,\cdots,e_k)$.
Part C 极小性或不可再分性
由 Jordan 标准型理论可知, Jordan 块在相似关系下应该具有极小性, 或者称为不可再分性. 换言之, 不存在两个非零的 $\varphi$-不变子空间 $U,W$, 使得 $V=U\oplus W$.
证法一 由 Part B 的结论可知, 任一非零 $\varphi$-不变子空间都要包含特征向量 $e_1$, 故 $U\cap W\neq 0$, 因此它们不可能是直和.
证法二 如果有上述 $\varphi$-不变直和分解, 那么 $\varphi$ 限制在 $U,W$ 上都有关于特征值 $\lambda_0$ 的特征向量, 从而至少有两个线性无关的特征向量, 这与 $\varphi$ 只有一个线性无关的特征向量相矛盾.
Part D 不可对角性
若 $n\geq 2$, 则由五条可对角化判定准则中的任何一条可知, $\varphi$ 不可对角化. 我们再从另一个角度来看这个问题, 复旦高代教材复习题七的第 24 题告诉我们: $\varphi$ 可对角化的充要条件是对 $V$ 的任一 $\varphi$-不变子空间 $U$, 存在 $\varphi$-不变子空间 $W$, 使得 $V=U\oplus W$, 于是由 Part C 的结论可知, $\varphi$ 不可对角化.
Part E 从局部到整体的推广
接下去设 $\varphi$ 的初等因子组为 $(\lambda-\lambda_1)^{r_1}$, $(\lambda-\lambda_2)^{r_2}$, $\cdots$, $(\lambda-\lambda_k)^{r_k}$, 特征多项式为 $f(\lambda)$, 极小多项式为 $m(\lambda)$. 首先, 全空间是 $k$ 个循环子空间的直和, 即有 $$V=C(\varphi-\lambda_1I_V,e_{r_1})\oplus C(\varphi-\lambda_2I_V,e_{r_1+r_2})\oplus\cdots\oplus C(\varphi-\lambda_kI_V,e_n).$$
其次, 若 $m(\lambda)\neq f(\lambda)$, 则存在某个特征值 $\lambda_0$, 它至少有两个初等因子, 从而其特征子空间的维数大于等于 2, 由此可看出 $V$ 有无穷个 $\varphi$-不变子空间. 若 $$f(\lambda)=m(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}\cdots(\lambda-\lambda_k)^{r_k},$$ 其中 $\lambda_1,\lambda_2,\cdots,\lambda_k$ 是 $\varphi$ 的全体互异特征值, 令 $V_i=\mathrm{Ker}(\varphi-\lambda_iI_V)^{r_i}$ 为对应的根子空间, 则 $V=V_1\oplus V_2\oplus\cdots\oplus V_k$. 设 $\varphi|_{V_i}$ 的特征多项式为 $f_i(\lambda)$, 极小多项式为 $m_i(\lambda)$, 则由高代白皮书的例 7.21 可知, $f_i(\lambda)=m_i(\lambda)=(\lambda-\lambda_i)^{r_i}$. 任取 $V$ 的 $\varphi$-不变子空间 $U$, 设 $\varphi|_U$ 的特征多项式为 $g(\lambda)$, 则 $g(\lambda)\mid f(\lambda)$, 若设 $$g(\lambda)=(\lambda-\lambda_1)^{s_1}(\lambda-\lambda_2)^{s_2}\cdots(\lambda-\lambda_k)^{s_k},\,\,\,\,U_i=\mathrm{Ker}(\varphi-\lambda_iI_V)^{s_i},$$ 则由高代白皮书的例 7.21 可知, $U=U_1\oplus U_2\oplus\cdots\oplus U_k$, 其中 $U_i$ 是 $V_i$ 的 $\varphi$-不变子空间. 由 Part B 的结论不难写出 $U$ 的形状, 这样的 $\varphi$-不变子空间一共有 $(r_1+1)(r_2+1)\cdots(r_k+1)$ 个.
Part F 从复数域到一般数域的推广
设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, $\varphi$ 的初等因子组为 $P_1(\lambda)^{r_1}$, $P_2(\lambda)^{r_2}$, $\cdots$, $P_k(\lambda)^{r_k}$, 其中 $P_i(\lambda)$ 是 $\mathbb{K}$ 上的首一不可约多项式, $r_i\geq 1$. 在高代白皮书的例 7.66 和例 7.67 中, 我们给出了一般数域上基于初等因子的两种广义 Jordan 标准型, 其中两种广义 Jordan 块为 $$(\mathrm{I})\,\,\,\,\,\,\,\,J_{r_i}(P_i(\lambda))=\begin{pmatrix} F(P_i(\lambda)) & I & & & \\ & F(P_i(\lambda)) & I & & \\ & & \ddots & \ddots & \\ & & & \ddots & I \\ & & & & F(P_i(\lambda)) \end{pmatrix},$$ $$(\mathrm{II})\,\,\,\,\,\,\,\,\widetilde{J}_{r_i}(P_i(\lambda))=\begin{pmatrix} F(P_i(\lambda)) & C & & & \\ & F(P_i(\lambda)) & C & & \\ & & \ddots & \ddots & \\ & & & \ddots & C \\ & & & & F(P_i(\lambda)) \end{pmatrix},$$ 其中 $I$ 表示单位阵, $C$ 表示左下角元素为 1, 其余元素为零的矩阵.
在随后推出的 16 级高代 II 思考题 9 的博文 (一题多解) 中, 我们会看到: 第一类广义 Jordan 块比较适合矩阵带入多项式或幂级数进行整体计算 (由于单位阵的交换性); 而第二类广义 Jordan 块比较适合考虑基向量在线性变换作用下的关系, 此时第二类广义 Jordan 块对应的空间是一个循环空间, 最后一个基向量就是循环向量.
根据教学论文 [2] 中关于循环子空间的讨论, 或者根据上面第二类广义 Jordan 块和 Part B 完全类似的讨论可得: 设 $\varphi$ 的特征多项式为 $f(\lambda)$, 极小多项式为 $m(\lambda)$, 若 $$f(\lambda)=m(\lambda)=P_1(\lambda)^{r_1}P_2(\lambda)^{r_2}\cdots P_k(\lambda)^{r_k},$$ 其中 $P_i(\lambda)$ 是 $\mathbb{K}$ 上互异的首一不可约多项式, 则 $\varphi$-不变子空间共有 $(r_1+1)(r_2+1)\cdots (r_k+1)$ 个; 否则 $V$ 有无穷个 $\varphi$-不变子空间.
数域 $\mathbb{K}$ 上线性变换的不可再分性由下列命题刻画, 请参考教学论文 [3] 的例 2.
命题 设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, $\varphi$ 的特征多项式为 $f(\lambda)$, 极小多项式为 $m(\lambda)$, 则 $V$ 不能分解成两个非零 $\varphi$-不变子空间的直和的充要条件是 $f(\lambda)=m(\lambda)=P(\lambda)^r$, 其中 $P(\lambda)$ 是 $\mathbb{K}$ 上的首一不可约多项式, $r\geq 1$.
16 级高代 II 期中考试第六大题也和不可再分性有着密切的关系.
第六大题 设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, 满足 $\varphi$ 的特征多项式等于其极小多项式, 证明: 对 $V$ 的任一非零 $\varphi$-不变子空间 $U$, 限制变换 $\varphi|_U$ 的特征多项式也等于其极小多项式.
最后, 广义 Jordan 块也具有不可对角性, 这与 16 级高代 II 思考题 10 有一定的联系, 请大家注意随后推出的博文 (一题多解).
参考文献
[1] 谢启鸿, 循环子空间的若干应用, 大学数学, 2016, 32(1), 1–6.
[2] 谢启鸿, 循环子空间的进一步应用, 大学数学, 2017, 33(1), 17–25.
[3] 谢启鸿, 杨翎, 线性变换的特征多项式诱导的直和分解, 高等数学研究, 2015, 18(1), 40–43.