Jordan标准型
Jordan 分解
设 𝑇
是 𝑛
维空间 𝑉
上的一个线性变换。如果 𝑇
的最小多项式为:
𝑚𝐴(𝜆)=(𝜆−𝜆1)𝑟1(𝜆−𝜆2)𝑟2⋯(𝜆−𝜆𝑘)𝑟𝑘
那么由准素分解可知,空间 𝑉
可以分解为子空间的直和:
𝑉=𝑉1⊕𝑉2⊕⋯⊕𝑉𝑘
其中 𝑉𝑖 =𝑁((𝐴−𝜆𝑖𝐼)𝑟𝑖)
,式中 𝐴
为 𝑇
对应的矩阵,这些子空间都在 𝑇
作用下不变。
令变换 𝑇𝑖
为 𝑉
在子空间 𝑉𝑖
上的射影,即构造多项式 𝑢𝑖(𝑇)
使得:
- 𝑇𝑖=𝑢𝑖(𝑇)𝑚𝐴(𝑇)(𝑇−𝜆𝑖𝑇𝑒)𝑟𝑖

- 𝑇1+𝑇2+⋯+𝑇𝑘=𝑇𝑒

式中 𝑇𝑒
表示空间 𝑉
的恒等变换。于是有性质:
- 变换 𝑇𝑖
在空间 𝑉𝑖
上的限制 𝑇𝑖|𝑉𝑖
为空间 𝑉𝑖
的恒等变换。 - 如果 𝑖
与 𝑗
不相等,变换 𝑇𝑖
在空间 𝑉𝑗
上的限制 𝑇𝑖|𝑉𝑗
为空间 𝑉𝑗
的零变换。
于是变换 𝑇𝑖
将空间 𝑉
的每一个向量 𝜉
映射为它在空间 𝑉𝑖
中的分量 𝜉𝑖
。
构造变换:
𝑇𝐷=𝜆1𝑇1+𝜆2𝑇2+⋯+𝜆𝑘𝑇𝑘
由于每一个变换 𝑇𝑖
都是变换 𝑇
的一个多项式,所以变换 𝑇𝐷
也是变换 𝑇
的一个多项式,于是每一个子空间 𝑉𝑖
在变换 𝑇𝐷
下不变。
由上述等式可知,变换 𝑇𝐷
在子空间 𝑉𝑖
上的限制 𝑇𝐷|𝑉𝑖
是子空间 𝑉𝑖
的一个位似,位似系数为 𝜆𝑖
。因此,变换 𝑇𝐷
可以对角化。
构造:
𝑇𝑁=𝑇−𝑇𝐷
于是变换 𝑇𝑁
也是变换 𝑇
的一个多项式,所以每一个子空间 𝑉𝑖
在变换 𝑇𝑁
下不变。对于子空间 𝑉𝑖
中的任意向量 𝜉𝑖
,有:
𝑇𝑁𝑟𝑖(𝜉𝑖)=𝑇−𝑇𝐷𝑟𝑖(𝜉𝑖)=𝑇−𝜆𝑖𝑇𝑖𝑟𝑖(𝜉𝑖)=0
令 𝑟
为全体 𝑟𝑖
的最大值,那么对于空间 𝑉
中的任意向量 𝜉
,变换 𝑇𝑁
的 𝑟
次方将向量 𝜉
映射至零向量。因此变换 𝑇𝑁
是一个幂零变换。
这样,空间 𝑉
的每一个变换 𝑇
都可以写成:
𝑇=𝑇𝐷+𝑇𝑁
其中 𝑇𝐷
可以对角化,而 𝑇𝑁
是一个幂零变换。因为 𝑇𝐷
和 𝑇𝑁
都是变换 𝑇
的多项式,所以它们的乘积可交换:
𝑇𝐷𝑇𝑁=𝑇𝑁𝑇𝐷
定理:设 𝑇1
和 𝑇2
是空间 𝑉
的两个可对角化变换,且 𝑇1𝑇2 =𝑇2𝑇1
,那么存在一个基,使得 𝑇1
和 𝑇2
关于这同一个基的矩阵是对角形式。
定理:设 𝑇
是 𝑛
维空间 𝑉
上的一个线性变换,那么存在一个可对角化变换 𝑇𝐷
和一个幂零变换 𝑇𝑁
,使得:
- 𝑇=𝑇𝐷+𝑇𝑁

- 𝑇𝐷𝑇𝑁=𝑇𝑁𝑇𝐷

它们都是变换 𝑇
的多项式,并且它们由变换 𝑇
唯一确定。
该定理给出关于变换 𝑇
的分解,称为 𝑇
的若尔当(Jordan)分解,𝑇𝐷
叫做 𝑇
的可对角化部分,𝑇𝑁
叫做 𝑇
的幂零部分。
同样地,有矩阵的 Jordan 分解:
定理:设 𝐴
是一个 𝑛
阶矩阵,那么存在一个可对角化矩阵 𝐷
和一个幂零矩阵 𝑁
,使得:
- 𝐴=𝐷+𝑁

- 𝐷𝑁=𝑁𝐷

它们都是矩阵 𝐴
的多项式,并且它们由矩阵 𝐴
唯一确定。
该定理给出关于矩阵 𝐴
的分解,称为 𝐴
的若尔当(Jordan)分解,𝐷
叫做 𝐴
的可对角化部分,𝑁
叫做 𝐴
的幂零部分。
lambda 矩阵
接下来引入的部分是含有变元参量 𝜆
的更广义的矩阵,不仅仅是一个数表。这部分讨论相较单纯由数构成的矩阵而言,更加广泛一些。
对于 𝜆
矩阵,对应空间相应的域,变为含有一个变元 𝜆
的有理式域。
以 𝜆
的多项式为元素的矩阵称为 𝜆
矩阵,记为 𝐴(𝜆)
。
由于多项式域包含数域,数字矩阵是特殊的 𝜆
矩阵,数字矩阵 𝐴
的特征矩阵 𝜆𝐼 −𝐴
是一种 𝜆
矩阵。
lambda 矩阵的初等变换
对于 𝜆
矩阵,同样可以定义加减法、乘法、初等变换、秩。对于 𝜆
方阵,同样可以定义行列式、余子式、代数余子式。
对于 𝜆
矩阵,初等变换与数阵大多相同,仅将倍加变换改为(这里以行变换为例):
- 用 𝜆
的多项式 𝜑(𝜆)
乘某行并加到另一行上。
注意倍乘变换不进行修改。这是因为倍加变换不改变行列式,而倍乘变换改变行列式。为了保持多项式域的秩的性质,行列式只能在数域上进行改变。
相应的初等矩阵也一并进行修改。
易见三种初等阵的行列式均为非零常数,因此均为满秩。所以它们左乘或右乘,不改变 𝜆
矩阵的秩。
若 𝐴(𝜆)
经过有限次初等变换变为 𝐵(𝜆)
,则称 𝐴(𝜆)
和 𝐵(𝜆)
等价。
对于 𝜆
矩阵,如果等价,则秩相同。反之则不然,这与数字矩阵有区别。
Smith 标准型
定理:设 𝜆
矩阵的秩是 𝑟
,则 𝐴(𝜆)
一定等价于:
(𝐷(𝜆)000)
其中:
𝐷(𝜆)=⎛⎜ ⎜ ⎜⎝𝑑1(𝜆)⋱𝑑𝑟(𝜆)⎞⎟ ⎟ ⎟⎠
每一个 𝑑𝑖(𝜆)
是一个首 1
多项式,并且相邻两个多项式有整除关系 𝑑𝑖(𝜆)|𝑑𝑖+1(𝜆)
。
称此标准型为 Smith 标准型,称 𝑑𝑖(𝜆)
为不变因子。
具体求解 Smith 标准型的办法是,从左上角到右下角进行消元,每次左上角的元素是右下方剩余的全体多项式的最大公因式,并借助左上角的元素将该行该列全部消为 0
。
定理:条件 𝐴(𝜆)
和 𝐵(𝜆)
等价,等价于条件 𝐴(𝜆)
和 𝐵(𝜆)
拥有完全一样的不变因子。
初等因子
由代数基本定理,设 𝐴(𝜆)
的不变因子 𝑑1(𝜆),𝑑2(𝜆),⋯,𝑑𝑚(𝜆)
的分解为:
𝑑𝑖(𝜆)=(𝜆−𝜆1)𝑒𝑖1(𝜆−𝜆2)𝑒𝑖2⋯(𝜆−𝜆𝑆)𝑒𝑖𝑆
其中 𝜆1,⋯,𝜆𝑆
互不相同。由于:
𝑑𝑖(𝜆)|𝑑𝑖+1(𝜆)
因此指数 𝑒1𝑗,𝑒2𝑗,⋯,𝑒𝑚𝑗
递增,并且最后一项 𝑑𝑚(𝜆)
的各项指数均非零。
上式中指数大于零的全部因子,统称为 𝐴(𝜆)
的初等因子。
注意,初等因子计重数。如果对于某个 𝑗
,指数 𝑒𝑖𝑗
出现了若干次,则对应的初等因子 (𝜆−𝜆𝑗)𝑒𝑖𝑗
也应当出现相应次数。
之前的定理说明,𝐴(𝜆)
与 𝐵(𝜆)
等价,等价于他们两个拥有完全一致的不变因子。不变因子完全相同,自然初等因子也完全相同,但是反之则不然。事实上有结论:
定理:𝐴(𝜆)
与 𝐵(𝜆)
不变因子完全相同,等价于初等因子和秩均完全相同。
于是「初等因子和秩均完全相同」也成为判断 𝜆
矩阵等价性的条件。
在初等变换的时候,也可以先将 𝐴(𝜆)
变换为对角阵,再求出初等因子和秩,再求出不变因子得到标准型。有结论:
定理:设 𝐴(𝜆)
等价于对角阵:
diag{𝑓1(𝜆),𝑓2(𝜆),⋯,𝑓𝑟(𝜆),0,⋯,0}
那么有 𝑓1(𝜆),𝑓2(𝜆),⋯,𝑓𝑟(𝜆)
的全体一次因子的幂 (𝜆−𝜆𝑗)𝑒𝑖𝑗
,构成 𝐴(𝜆)
的初等因子。
由初等因子和秩构造不变因子的具体方法为:先将初等因子按照因式分类,排成表格,把同类因式进行降幂排列放到同一行,各类因式的最高次幂放到一列,把列数用 1
补齐至秩 𝑟
,那么每一列的乘积构成一个不变因子。
在特征矩阵中的应用
如果 𝐴
与 𝐵
是数阵,那么它们的特征矩阵是 𝜆
矩阵。有结论:
定理:条件数阵 𝐴
与 𝐵
相似,等价于条件特征矩阵 𝜆𝐼 −𝐴
和 𝜆𝐼 −𝐵
等价。
由于特征矩阵 𝜆𝐼 −𝐴
只在主对角线含有 𝑛
个 𝜆
,所以秩为 𝑛
。由上述推理,同型的数阵的特征矩阵的秩始终相等,于是有等价性:
数阵 𝐴
与 𝐵
相似,等价于特征矩阵 𝜆𝐼 −𝐴
和 𝜆𝐼 −𝐵
有完全相同的初等因子。
对于特征矩阵 𝜆𝐼 −𝐴
,初等变换保持等价性,所以不改变秩。
观察三种初等变换,由于唯一被改写的倍加变换不改变行列式,事实上三种初等变换仅对行列式的结果多项式改变常数倍,因此不改变行列式的结果多项式的因式分解与次数。
因此特征矩阵 𝜆𝐼 −𝐴
的行列式为 𝑛
次多项式,初等变换化为 Smith 标准型后,由于秩为 𝑛
,行列式就是主对角线全体不变因子的乘积,也等于全体初等因子的乘积。因此,特征矩阵 𝜆𝐼 −𝐴
的全体初等因子的次数之和等于 𝑛
。
Jordan 标准型
矩阵
⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜆10⋯000𝜆1⋯0000𝜆⋯00⋮⋮⋮⋮⋮000⋯𝜆1000⋯0𝜆⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
主对角线上的元素都是 𝜆
,紧邻主对角线上方的元素都是 1
,其余位置都是 0
,叫做属于 𝜆
的一个 Jordan 矩阵,或称 Jordan 块。
显然,幂零 Jordan 矩阵是 Jordan 矩阵的特例,即 𝜆
为 0
的情形。
定理:设 𝑇
是 𝑛
维空间 𝑉
的一个变换,𝜆1,⋯,𝜆𝑘
是 𝑇
的一切互不相同的特征值,那么存在一个基,使得 𝑇
关于这个基的矩阵有形状:
⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝐵10𝐵2⋱0𝐵𝑘⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
其中
𝐵𝑖=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝐽𝑖10𝐽𝑖2⋱0𝐽𝑖𝑠𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
其中 𝐽𝑖1,⋯,𝐽𝑖𝑠𝑖
都是属于 𝜆𝑖
的 Jordan 块。
这是因为,首先根据最小多项式:
𝑚𝐴(𝜆)=(𝜆−𝜆1)𝑟1(𝜆−𝜆2)𝑟2⋯(𝜆−𝜆𝑘)𝑟𝑘
有准素分解:
𝑉=𝑉1⊕𝑉2⊕⋯⊕𝑉𝑘
其中:
𝑉𝑖=𝑁((𝐴−𝜆𝑖𝐼)𝑟𝑖)
式中 𝐴
为 𝑇
对应的矩阵。
令变换 𝑆𝑖
为 𝑇
在 𝑉𝑖
上的限制 𝑇|𝑉𝑖
,接下来试图对每一个 𝑆𝑖
进行 Jordan 分解。
记 𝑇𝑒
为 𝑉
上的恒等变换。与前文的 Jordan 分解不同,记 𝑇𝑖
为 𝑆𝑖
的 Jordan 分解中的幂零部分:
𝑆𝑖=𝜆𝑖𝑇𝑒+𝑇𝑖
于是 𝑇𝑖
为子空间 𝑉𝑖
的一个幂零变换,事实上也是 𝑇 −𝜆𝑖𝑇𝑒
在 𝑉𝑖
上的限制 (𝑇−𝜆𝑖𝑇𝑒)|𝑉𝑖
。
子空间 𝑉𝑖
可以分解为幂零变换 𝑇𝑖
循环子空间的直和:
𝑉𝑖=𝑊𝑖1⊕𝑊𝑖2⊕⋯⊕𝑊𝑖𝑠𝑖
在每一个循环子空间 𝑊𝑖𝑗
里,取一个循环基并倒序排列,凑成 𝑉𝑖
的一个基,于是 𝑇𝑖
关于这个基的矩阵有形状:
𝑁𝑖=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑁𝑖10𝑁𝑖2⋱0𝑁𝑖𝑠𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
全体 𝑁𝑖𝑗
均为幂零 Jordan 块。于是对于 𝑉𝑖
上述选取的基,𝑆𝑖
对应的矩阵是:
𝐵𝑖=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜆𝑖0𝜆𝑖⋱0𝜆𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠+⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑁𝑖10𝑁𝑖2⋱0𝑁𝑖𝑠𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝐽𝑖10𝐽𝑖2⋱0𝐽𝑖𝑠𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
这里 𝐽𝑖1,𝐽𝑖2,⋯,𝐽𝑖𝑠𝑖
都是属于 𝜆𝑖
的 Jordan 块。
对于每一个子空间 𝑉𝑖
,按照以上方式选取一个基,凑起来成为 𝑉
的基,那么 𝑇
关于这个基的矩阵即构成定理规定的形式。
形如:
⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝐽10𝐽2⋱0𝐽𝑚⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
的 𝑛
阶矩阵,其中每一个 𝐽𝑖
都是一个 Jordan 块,叫做一个 Jordan 标准型。
定理:每一个 𝑛
阶矩阵 𝐴
都与一个 Jordan 标准型相似。除了各个 Jordan 块排列的次序以外,与 𝐴
相似的 Jordan 标准型是由 𝐴
唯一确定的。
注意在上述构造的矩阵 𝐵𝑖
中,第一项是一个单位阵的若干倍,自然可以和第二项交换。因此,第一项就是 𝐵𝑖
的 Jordan 分解的可对角化部分,第二项就是 𝐵𝑖
的 Jordan 分解的幂零部分。
在一个矩阵对应的 Jordan 标准型里面,主对角线上的元素构成的对角阵是这个矩阵对应的 Jordan 标准型的可对角化部分,把主对角线上的元素换成 0
就得到这个矩阵对应的 Jordan 标准型的幂零部分。
定理:对于矩阵 𝐴
的 Jordan 标准型中,每一个 Jordan 块:
𝐽𝑖=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜆𝑖1𝜆𝑖1⋱⋱⋱1𝜆𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
对应于特征矩阵 𝜆𝐼 −𝐴
的一个初等因子 (𝜆−𝜆𝑖)𝑛𝑖
,特征矩阵 𝜆𝐼 −𝐴
的全体初等因子对应于矩阵 𝐴
的 Jordan 标准型中的全体 Jordan 块。
这是因为,矩阵 𝐴
相似于它的 Jordan 标准型,因此两者的特征矩阵也等价,将 Jordan 标准型的特征矩阵化为 Smith 标准型即可看出。
由这个定理,借助特征矩阵 𝜆𝐼 −𝐴
的初等因子,可以写出矩阵 𝐴
的 Jordan 标准型。
一个推论是,矩阵 𝐴
可对角化,等价于特征矩阵 𝜆𝐼 −𝐴
的初等因子均为一次的。
弗罗贝尼乌斯(Forbenious)定理
上文指出,𝑛
阶特征矩阵的 Smith 标准形的秩为 𝑛
。
定理:设矩阵 𝐴
的特征矩阵 𝜆𝐼 −𝐴
的 Smith 标准形为:
diag{𝑑1(𝜆),𝑑2(𝜆),⋯,𝑑𝑛(𝜆)}
则最后一个不变因子 𝑑𝑛(𝜆)
恰好为矩阵 𝐴
的最小多项式 𝑚𝐴(𝜆)
。
推论:矩阵 𝐴
可对角化的等价条件为:
- 最小多项式 𝑚𝐴(𝜆)
无重根。 - 特征矩阵 𝜆𝐼 −𝐴
的不变因子无重根。 - 特征矩阵 𝜆𝐼 −𝐴
的初等因子均为一次的。
本页面最近更新:2023/7/30 10:47:50,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:Tiphereth-A, CCXXXI, Great-designer
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用