矩阵分解
三角分解(QR分解)(需要是非奇异矩阵)
正交三角分解(通过Schmidt正交化)
若 \(n\) 阶实矩阵 \(A\in \mathbb {C}^{n\times n}\) 满秩,且 \[A = [\alpha_1,...,\alpha_n]\]
其中 \(\alpha_1,...,\alpha_n\) 是 \(\mathbb {C}^{n\times n}\) 中线性无关向量组
正交化
令
\[ \begin{aligned} \beta_1&=\alpha_1\\ \beta_2&=\alpha_2 - \frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}\beta_1 \\ \vdots \\ \beta_n &= \alpha_n - \frac{\left<\beta_n,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}\beta_1-\cdots-\frac{\left<\beta_{n-1},\alpha_n\right>}{\left<\beta_{n-1},\alpha_{n-1}\right>}\beta_{n-1} \end{aligned} \]
变形得
\[ \begin{aligned} \alpha_1 &= \beta_1\\ \alpha_2 &= \frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}\beta_1 + \beta_2\\ \vdots \\ \alpha_n &= \frac{\left<\beta_n,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}\beta_1-\cdots-\frac{\left<\beta_{n-1},\alpha_n\right>}{\left<\beta_{n-1},\alpha_{n-1}\right>}\beta_{n-1} + \beta_n \end{aligned} \]
写成矩阵形式
\[ \begin{aligned} \begin{bmatrix}\alpha_1,\alpha_2,...,\alpha_n\end{bmatrix} &= \begin{bmatrix}\beta_1,\beta_2,...,\beta_n\end{bmatrix}\begin{bmatrix}1&\frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}&\cdots &\frac{\left<\beta_1,\alpha_n\right>}{\left<\beta_1,\beta_1\right>}\\0&1&\cdots&\frac{\left<\beta_2,\alpha_n\right>}{\left<\beta_2,\beta_2\right>}\\ &&\ddots\\0&&\cdots& 1\end{bmatrix}\\ &\triangleq B\begin{bmatrix}1&\frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}&\cdots &\frac{\left<\beta_1,\alpha_n\right>}{\left<\beta_1,\beta_1\right>}\\0&1&\cdots&\frac{\left<\beta_2,\alpha_n\right>}{\left<\beta_2,\beta_2\right>}\\ &&\ddots\\0&&\cdots& 1\end{bmatrix} \end{aligned} \]
单位化
令
\[ \begin{aligned} q_1=&\frac{\beta_1}{||\beta_1||} \\ &\vdots \\ q_n = & \frac{\beta_n}{||\beta_n||} \end{aligned} \]
变形得
\[ \begin{aligned} \beta_1 =& q_1||\beta_1|| \\ &\vdots \\ \beta_n =& q_n ||\beta_n|| \end{aligned}\]
写成矩阵形式
\[ \begin{aligned} \begin{bmatrix}\beta_1,\beta_2,...,\beta_n\end{bmatrix} &= \begin{bmatrix}q_1,q_2,...,q_n\end{bmatrix}\begin{bmatrix}||\beta_1||&0&\cdots &0\\0&||\beta_2||&\cdots&0\\ &&\ddots\\0&&\cdots& ||\beta_n||\end{bmatrix}\\ &\triangleq Q\begin{bmatrix}||\beta_1||&0&\cdots &0\\0&||\beta_2||&\cdots&0\\ &&\ddots\\0&&\cdots& ||\beta_n||\end{bmatrix} \end{aligned} \]
综上,结合正交化和单位化可得
\[ \begin{aligned} A &= B\begin{bmatrix}1&\frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}&\cdots &\frac{\left<\beta_1,\alpha_n\right>}{\left<\beta_1,\beta_1\right>}\\0&1&\cdots&\frac{\left<\beta_2,\alpha_n\right>}{\left<\beta_2,\beta_2\right>}\\ &&\ddots\\0&&\cdots& 1\end{bmatrix}\\ &=Q\begin{bmatrix}||\beta_1||&0&\cdots &0\\0&||\beta_2||&\cdots&0\\ &&\ddots\\0&&\cdots& ||\beta_n||\end{bmatrix}\begin{bmatrix}1&\frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}&\cdots &\frac{\left<\beta_1,\alpha_n\right>}{\left<\beta_1,\beta_1\right>}\\0&1&\cdots&\frac{\left<\beta_2,\alpha_n\right>}{\left<\beta_2,\beta_2\right>}\\ &&\ddots\\0&&\cdots& 1\end{bmatrix}\\ &=Q\begin{bmatrix}||\beta_1||&\frac{\left<\beta_1,\alpha_1\right>}{\left<\beta_1,\beta_1\right>}&\cdots &\frac{\left<\beta_1,\alpha_n\right>}{\left<\beta_1,\beta_1\right>}\\0&||\beta_2||&\cdots&\frac{\left<\beta_2,\alpha_n\right>}{\left<\beta_2,\beta_2\right>}\\ &&\ddots\\0&&\cdots& ||\beta_n||\end{bmatrix}\\ &\triangleq QR \end{aligned} \]
QR 分解定理 : \(A\in \mathbb {C}^{n\times n}\) ,则存在酉矩阵 \(Q\) 和正线上三角阵 \(R\) ,使 \[A=QR\]
且分解唯一
正交三角分解的求法 1. 取矩阵 \(A=(A_1,A_2,...,A_n)\) 的列向量,进行 Schmidt 标准正交化,得 \(v_1,v_2,...,v_n\) ,有 \[Q=(v_1,v_2,...,v_n)\] 2. 再由 \(R=Q^HA\) 得到 \(R\) , 于是 \(A=QR\)
HouseHolder变换分解
将矩阵A按列划分为 \((\alpha_1,\alpha_2,\dots,\alpha_n)\),以4阶方阵为例,
第一步 令 \[\omega_1=\frac{\alpha_1-a_1*e_1}{||\alpha_1-a_1*e_1||_2},a_1=||\alpha_1||_2\]
于是 \[H_1A=(H_1\alpha_1,H_1\alpha_2,...,H_1\alpha_n) =\left\{\begin{matrix} a_1 & * & \cdots & * \\ 0 & \\ \vdots & &B_1 \\ 0\end{matrix}\right\}\]
第二步
从第一步中得到 \(B_1=(\beta_2,\beta_2,\cdots,\beta_n)\in R^{n-1}\)
取 \[\omega_2=\frac{\beta_2-b_2*e_1}{||\beta_2-b_2*e_1||_2},b_1=||\beta_2||_2\]
则 \[\widehat{H_2}=I-2*\omega_2*\omega_2^T,H_2=\left\{\begin{matrix} 1 & 0^T \\ 0 & \widehat{H_2}, \end{matrix} \right\}\]
得到 \[H_2(H_1*A) = \begin{bmatrix} a_1 & * & * & \cdots &* \\ 0 & a_2 & * & \cdots &* \\ 0 & 0 & &\\ \vdots & \vdots & &C_2& \\ 0 & 0 \end{bmatrix} , C_2\in R^{n-2}\]
依次类推,进行第n步时,得到第n-1个 \(H_{n-1}\)阵,使得 \[H_{n-1} \cdots H_2H_1*A = \begin{bmatrix} a_1 & * & * & \cdots & * \\ 0 & a_2 & * & \cdots & * \\ 0 & 0 & a_3 & \cdots & *\\ \vdots & \vdots & &\ddots \\ 0 & 0 & 0 & \cdots &a_n \end{bmatrix}=R\]
其中 \(H_{n-1} \cdots H_2H_1*A=H\)也称为HouseHolder矩阵,也为自逆矩阵 \(H=H^{-1}\)
\[H_{n-1} \cdots H_2H_1*A=R\] \[\Rightarrow (H_{n-1} \cdots H_2*H_1)^{-1}*H_{n-1} \cdots H_2H_1*A=(H_{n-1} \cdots H_2*H_1)^{-1}*R\] \[\Rightarrow A=H_1^{-1} \cdots H_{n-1}^{-1}*R\] \[\Rightarrow A=H_1\cdots H_{n-1}*R\]
得到 \(A=QR\),其中 \(Q\)为正交矩阵, \(R\)为上三角矩阵 \[\begin{cases} Q = H_1\cdots H_{n-1}\\ R = Q^{-1}A=QA \end{cases}\]
三角分解的性质
定理1:设 \(A\in \mathbb {C}_r^{m\times n}\),则 \(A\) 可以唯一地分解为 \[A=U_1 R\]
其中 \(U_1\)是酉矩阵, \(R\) 是正线上三角复矩阵,或 \(A\) 可以唯一地分解为 \[A=L U_2\]
其中 \(L\)是正线下三角复矩阵, \(U_2\)是酉矩阵
推论1:设 \(A \in \mathbb {R}^{n × n}_n\),则 \(A\)可以唯一地分解为 \[A=Q_1 R\]
其中 \(Q_1\)是则正交矩阵,\(R\)是正线上三角实矩阵,或 \(A\)可以唯一地分解为 \[A=L Q_2\]
其中 \(L\)是正线下三角实矩阵, \(Q_2\)是正交矩阵。
推论2:设A是实对称正定矩阵,则存在唯一正线上三角实矩阵 \(R\),使得 \[A=R^T R\]
推论3:设 \(A\)是正定Hermite矩阵,则存在唯一正线上三角复矩阵\(R\),使得 \[A=R^H R\]
矩阵的满秩分解
设 \(A\in \mathbb {C}_r^{m\times n}\),则存在 \(B\in \mathbb {C}_r^{m\times r}, C\in \mathbb {C}_r^{r\times n}\),满足 \[ A = BC \]
\(\mathbb {C}_r\) 表示矩阵的秩为 \(r\)
实际上上述定理用文字描述就是,一个亏秩的矩阵可以分解成一个列满秩与行满秩矩阵的乘积
证明:因为 \(rank (A)=r\),所以一定可以找到与 \(A\) 相似的一个矩阵
\[ A \simeq \begin{bmatrix}E_r&0_{r\times (n-r)}\\0_{(m-r)\times r}&0_{(m-r)\times (n-r)}\end{bmatrix}=\begin{bmatrix}E_r\\0_{(m-r)\times r}\end{bmatrix}\begin{bmatrix}E_r&0_{r\times (n-r)}\end{bmatrix} \]
因此存在两个可逆矩阵 \(P,Q\),使 \(PAQ=\begin {bmatrix} E_r&0\\0&0\end {bmatrix}\),则
\[ \begin{aligned} A &= P^{-1}\begin{bmatrix}E_r\\0\end{bmatrix}\begin{bmatrix}E_r&0\end{bmatrix}Q^{-1}\\ &\triangleq BC \end{aligned} \]
因为 \(P^{-1}\) 是可逆矩阵,\(\begin {bmatrix} E_r\\0\end {bmatrix}\) 是一个列满秩矩阵,所以 \(B=P^{-1}\begin {bmatrix} E_r\\0\end {bmatrix}\) 仍是一个列满秩矩阵;同理,\(C=\begin {bmatrix} E_r&0\end {bmatrix} Q^{-1}\) 是一个行满秩矩阵
矩阵满秩分解的计算
如何在给定矩阵 \(A\) 的情况下,求出矩阵 \(B,C\) 呢?
设
\[ \begin{align} &A = [\alpha_1,\alpha_2,...,\alpha_n]\\ &B = [\beta_1,\beta_2,...,\beta_r] \end{align} \]
其中 \(\beta_1,...,\beta_r\) 线性无关
所以 \[ \begin{aligned} &A=BC\\ &\Rightarrow[\alpha_1,\alpha_2,...,\alpha_n]=[\beta_1,...,\beta_r]\begin{bmatrix}c_{11}&\cdots &c_{1n}\\\vdots &\ddots&\vdots\\c_{r1}&\cdots &c_{rn}\end{bmatrix} \end{aligned} \]
实际上我们可以取 \(\beta_1,...,\beta_r\) 为 \(\alpha_1,...,\alpha_n\) 的一个极大线性无关组,因此 \(B\) 就是矩阵 \(A\) 列向量组的一个极大线性无关组,\(C\) 就是用该线性无关组去表示 \(A\) 时的系数
例 1
求矩阵 \(A=\begin {bmatrix} 1&4&-1&5&6\\2&0&0&0&-14\\-1&2&-4&0&1\\2&6&-5&5&-7\end {bmatrix}\) 的满秩分解
解:对矩阵 \(A\) 只作初等行变换 \[ A=\begin{bmatrix}1&4&-1&5&6\\2&0&0&0&-14\\-1&2&-4&0&1\\2&6&-5&5&-7\end{bmatrix}\to ···\to\begin{bmatrix}1&0&0&0&-7\\0&1&0&\frac{10}{7}&\frac{29}{7}\\0&0&1&\frac{5}{7}&\frac{25}{7}\\0&0&0&0&0\end{bmatrix} \]
\(A\) 的秩为 3,且前三个列向量线性无关,故 \[ B = \begin{bmatrix}1&4&-1\\2&0&0\\-1&2&-4\\2&6&-5\end{bmatrix},C=\begin{bmatrix}1&0&0&0&-7\\0&1&0&\frac{10}{7}&\frac{29}{7}\\0&0&1&\frac{5}{7}&\frac{25}{7}\end{bmatrix} \]
例 2
求矩阵 \(A=\begin {bmatrix} 2&1&-2&3&1\\2&5&-1&4&1\\1&3&-1&2&1\end {bmatrix}\) 的满秩分解
解:对矩阵 \(A\) 只作初等行变换
\[ A=\begin{bmatrix}2&1&-2&3&1\\2&5&-1&4&1\\1&3&-1&2&1\end{bmatrix}\to ···\to \begin{bmatrix}1&0&0&\frac{8}{5}&-\frac{2}{5}\\0&1&0&\frac{1}{5}&\frac{1}{5}\\0&0&1&\frac{1}{5}&-\frac{4}{5}\end{bmatrix} \]
\(A\) 的秩为 3,且前三个列向量线性无关,故 \[ B = \begin{bmatrix}2&1&-2\\2&5&-1\\1&3&-1\end{bmatrix},C = \begin{bmatrix}1&0&0&\frac{8}{5}&-\frac{2}{5}\\0&1&0&\frac{1}{5}&\frac{1}{5}\\0&0&1&\frac{1}{5}&-\frac{4}{5}\end{bmatrix} \]
矩阵的LU分解
LU 分解(LU Decomposition)是矩阵分解的一种,可以将一个矩阵分解为一个单位下三角矩阵和一个上三角矩阵的乘积,以四阶矩阵为例 \[ L = \begin{bmatrix}1&0&0&0 \\ *&1&0&0\\ *&*&1&0\\ *&*&*&1\end{bmatrix}, U=\begin{bmatrix}*&*&*&*\\0&*&*&*\\0&0&*&*\\0&0&0&*\end{bmatrix} \]
LU 矩阵是否一定存在?答案是否,具体看下面的例子
设 \(\begin {bmatrix} 0&1 \\1&0\end {bmatrix}=\begin {bmatrix} a&0\\b&c\end {bmatrix}\begin {bmatrix} l&m\\0&n\end {bmatrix}\),则应该满足如下 4 个式子
\[ \begin{cases} al=0\\ am=1\\ bl=1\\ bm+cn=0 \end{cases} \]
由 \(al=0\) 得 \(a=0\) 或 \(l=0\),但实际上这两种情况带入上面的式子都会推出矛盾,因此不是所有情况 LU 分解都存在
LU 分解定理 :设 \(A\in \mathbb {C}_n^{n\times n}\),\(A\) 有唯一的 LU 分解 \(\Leftrightarrow A\) 的各阶顺序主子式 \(\Delta k \neq 0,\ k=1,2...,n\)
\(k\) 阶顺序主子式指的是矩阵左上角 \(k\times k\) 个元素组成的行列式
将矩阵 \(A\) 分解为 \(L\) 和 \(U\) 之后,解方程组 \(Ax=b\) 就变得简单了,因为 \(A=LU\),所以 \((LU) x=b\Rightarrow L (Ux)=b\Rightarrow \begin {cases} Ly=b\\Ux=y\end {cases}\)
所以 \(x=U^{-1} y=U^{-1} L^{-1} b\)
LU 矩阵的求法
实际上 LU 矩阵有非常多的求法,这里列举一种比较简单的待定系数法
设 \(A = \begin {bmatrix} 2&3&4\\1&1&9\\1&2&-6\end {bmatrix}\),求矩阵 \(A\) 的 LU 分解矩阵 \(L\) 和 \(U\)
解:令 \[ L=\begin{bmatrix}1&0&0\\l_1&1&0\\l_2&l_3&1\end{bmatrix},U = \begin{bmatrix}u_1&u_2&u_3\\0&u_4&u_5\\0&0&u_6\end{bmatrix} \]
由于 \(A=LU\),所以有
\[ \begin{cases} u_1=2\\ u_2=3\\ u_3=4\\ l_1u_1=1\\ l_1u_2+u_4=1\\ l_1u_3+u_5=9\\ l_2u_1=1\\ l_2u_2+l_3u_4=2\\ l_2u_3+l_3u_5+u_6=-6 \end{cases} \]
上面的方程组非常容易解,最后求出
\[ L = \begin{bmatrix}1&0&0\\\frac{1}{2}&1&0\\\frac{1}{2}&-1&1\end{bmatrix},U=\begin{bmatrix}2&3&4\\0&-\frac{1}{2}&7\\0&0&-1\end{bmatrix} \]
奇异值分解
奇异值:设 \(A \in \mathbb{C}^{m × n}_r,AA^H\) 的特征值为 \[\lambda_1 \ge \lambda_2 \ge \dots \ge \lambda_n = 0\]
则称 \(\sigma_i=\sqrt{\lambda_i}\) 为矩阵A的正奇异值。\(A\) 和\(A^H\)相同的奇异值。
奇异值分解:当给定一个大小为\(m × n\)的矩阵\(A\),虽然矩阵\(A\)不一定是方阵,但大小为\(m × m\)的\(AA^T\)和\(n × n\)的\(AA^T\)是对称矩阵,若\(AA^T=P \Lambda_1 Q^T\),\(A^T A=Q\Lambda_2 Q^T\),则矩阵A的奇异值分解为 \[A=P\Sigma Q^T\]
其中,矩阵\(P=(\overrightarrow{p_1}, \overrightarrow{p_2}, \dots, \overrightarrow{p_m})\)的大小为 \(m × m\),列向量 \(\overrightarrow{p_1}, \overrightarrow{p_2}, \dots, \overrightarrow{p_m}\)是 \(AA^T\)的特征向量,也被称为矩阵\(A\)的左奇异向量(left singular vector);矩阵\(Q=(\overrightarrow{q_1}, \overrightarrow{q_2}, \dots, \overrightarrow{q_m})\)的大小为 \(n × n\),列向量 \(\overrightarrow{q_1}, \overrightarrow{q_2}, \dots, \overrightarrow{q_m}\)是 \(A^TA\)的特征向量,也被称为矩阵\(A\)的右奇异向量(left singular vector);矩阵\(\Lambda_1\)的大小为\(m × m\),矩阵\(\Lambda_2\)的大小为\(n × n\),两个矩阵对角线上的非零元素相同(即矩阵\(AA^T\)和\(A^TA\)的非零特征值相同);矩阵\(\Sigma\)的大小为\(m × n\),位于对角线上的元素被称为奇异值(singular value)。
设\(A\)的秩为r,当 \(m \ne n\)时,矩阵\(\Lambda_1\)和\(\Lambda_2\)的大小显然是不同的,但是他们对角线上的非零元素是相同的,记矩阵\(\Lambda_1\)(或\(\Lambda_2\))对角线上的非零元素为\(\lambda_1,\lambda_2,\dots,\lambda_r\),这些数皆为非负数,又记矩阵\(\Sigma\)对角线上的非零元素分别为\(\sigma_1,\sigma_2,\dots,\sigma_r\),则 \[\sigma_1=\sqrt{\lambda_1},\sigma_2=\sqrt{\lambda_2},\dots,\sigma_r=\sqrt{\lambda_r}\]
即非零奇异值的平方对应着矩阵\(\Lambda_1\)(或矩阵\(\Lambda_2\))的非零特征值,到这里,我们就不难看出奇异值分解与对称对角化分解的关系了,即我们可以由对称对角化分解得到我们想要的奇异值分解。
例1:一个\(3×2\)的矩阵\(A=\begin{bmatrix} 1&2 \\ 0&0 \\ 0&0 \end{bmatrix}\),求其奇异值分解。
由 \[AA^T=\begin{bmatrix} 5&0&0 \\ 0&0&0 \\ 0&0&0 \end{bmatrix}\]
得到其特征值\(\lambda_1=5,\lambda_2=\lambda_3=0\),特征向量为\(\overrightarrow{p_1}=(1,0,0)^T,\overrightarrow{p_2}=(0,1,0)^T,\overrightarrow{p_3}=(0,0,1)^T\)
由 \[A^TA=\begin{bmatrix} 1&2 \\ 2&4 \end{bmatrix}\]
得到其特征值\(\lambda_1=5,\lambda_2=0\),特征向量为\(\overrightarrow{q_1}=(\frac{\sqrt{5}}{5},\frac{2\sqrt{5}}{5})^T,\overrightarrow{q_2}=(-\frac{\sqrt{5}}{5},\frac{2\sqrt{5}}{5})^T\)
令 \[\Sigma=\begin{bmatrix} \sqrt{5}&0 \\ 0&0 \\ 0&0 \end{bmatrix}\]
注意矩阵\(\Sigma\)的大小为\(3 × 2\),此时,矩阵\(A\)的奇异值分解为 \[A=P\Sigma Q^T=(\overrightarrow{p_1}, \overrightarrow{p_2}, \overrightarrow{p_3})\Sigma (\overrightarrow{q_1}, \overrightarrow{q_2})^T \\ =\begin{bmatrix} 1&0&0 \\ 0&1&0 \\ 0&0&1 \end{bmatrix} \begin{bmatrix} \sqrt{5}&0 \\ 0&0 \\ 0&0 \end{bmatrix} \begin{bmatrix} \frac{\sqrt{5}}{5}&\frac{2\sqrt{5}}{5} \\ \frac{-2\sqrt{5}}{5}&\frac{\sqrt{5}}{5} \end{bmatrix} = \begin{bmatrix} 1&2 \\ 0&0 \\ 0&0 \end{bmatrix}\]
例2:求对称矩阵\(A=\begin{bmatrix} 2&1 \\ 1&2 \end{bmatrix}\)的奇异值分解。
经计算可以发现\(A^TA=AA^T=\begin{bmatrix} 2&1 \\ 1&2 \end{bmatrix} \begin{bmatrix} 2&1 \\ 1&2 \end{bmatrix}=\begin{bmatrix} 5&4 \\ 4&5 \end{bmatrix}\),左奇异向量和右奇异向量构成的矩阵也是相等的,即 \[P=Q=\begin{bmatrix} \frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2} \\ -\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2} \end{bmatrix}\]
则其奇异值分解为 \[A=P\Sigma Q^T=\begin{bmatrix} \frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2} \\ - \frac{\sqrt{2}}{2}& \frac{\sqrt{2}}{2} \end{bmatrix} \begin{bmatrix} 3&0 \\ 0&1 \end{bmatrix}\begin{bmatrix} \frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2} \\ -\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2} \end{bmatrix}\]
注:这是由于当矩阵\(A\)为对称矩阵时,其可以被正交对角化,这时奇异值分解等于正交对角化分解。
谱分解
谱分解:设 \(A \in \mathbb{C}^{n × n}\)是单纯矩阵,则 \(A\)可以分解为一系列幂等矩阵 \(A_i(i=1,2, \dots,n)\)的加权和 \[A=\sum_{i=1}^n \lambda_i A_i\]
其中 \(\lambda_i(i=1,2,\dots,n)\)是A的特征值。
单纯矩阵:若矩阵 \(A\)的代数重数等于几何重数,则称\(A\)为单纯矩阵。代数重数为矩阵 \(A\)特征值的重数,几何重数为齐次方程组\(Ax=\lambda_i x(i=1,2,\dots,k)\)的解空间\(V_{\lambda_i}\)的维数,也即特征值对应的最多无关特征向量数。
幂等矩阵:若 \(A\)为方阵,且 \(A^2=A\),则称\(A\)为幂等矩阵。所有幂等矩阵都相似与对角元全为0或1的对角阵。
更一般的单纯矩阵谱分解定理:设 \(A \in \mathbb{C}^{n × n}\),他有 \(k\)个相异特征值 \(\lambda_i(i=1,2,\dots,k)\),则 \(A\)是单纯矩阵的充要条件是存在\(k\)个矩阵\(A_i(i=1,2,\dots,k)\)满足
- \(A_i A_j = \begin{cases} A_i, i=j \\ 0, i\ne j \end{cases}\)
- \(\sum_{i=1}^k A_i = E_n\)
- \(A=\sum_{i=1}^k \lambda_i A_i\)
该定理比定理3要求放宽了,不再要求必须要有n个特征值了,这里的k可以小于等于n。
例1:求正规矩阵 \(A = \begin{bmatrix} 0&1&1&1 \\ 1&0&-1&1 \\ 1&-1&0&1 \\ -1&1&1&0 \end{bmatrix}\)的谱分解表达式。
解:首先计算 \(A\)的特征值和特征向量 \[|\lambda_ I - A |=(\lambda - 1)^3 (\lambda + 3)\]
从而 \(A\)的特征值为 \[\lambda_1=\lambda_2=\lambda_3=1,\lambda_4=-3\]
当\(\lambda=1\)时,求得无关的特征向量为 \[\alpha_1=(1,1,0,0)^T \\ \alpha_2=(1,0,1,0)^T \\ \alpha_3=(-1,0,0,1)^T\]
当\(\lambda=-3\)时,求得无关的特征向量为 \[\alpha_4=(1,-1,-1,1)^T\]
将 \(\alpha_1,\alpha_2,\alpha_3\)正交化并单位化得 \[\eta_1=(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}},0,0)^T \\ \eta_2=(\frac{1}{\sqrt{6}},\frac{1}{\sqrt{6}},\frac{2}{\sqrt{6}},0)^T \\ \eta_3=(-\frac{1}{2\sqrt{3}},\frac{1}{2\sqrt{3}},\frac{1}{\sqrt{3}},\frac{3}{2\sqrt{3}})^T\]
将\(\alpha_4\)单位话得 \[\eta_4=(\frac{1}{2}, -\frac{1}{2},-\frac{1}{2},\frac{1}{2})\]
故有 \[G_1=\eta_1 \eta_1^H+\eta_2 \eta_2^H +\eta_3 \eta_3^H \\ = \begin{bmatrix} \frac{3}{4}&\frac{1}{4}&\frac{1}{4}&-\frac{1}{4} \\ \frac{1}{4}&\frac{3}{4}&-\frac{1}{4}&\frac{1}{4} \\ \frac{1}{4}&-\frac{1}{4}&\frac{3}{4}&\frac{1}{4} \\ -\frac{1}{4}&\frac{1}{4}&\frac{1}{4}&\frac{3}{4} \end{bmatrix}\]
\[G_2=\eta_4 \eta_4^H \\ =\begin{bmatrix} \frac{1}{4}&-\frac{1}{4}&-\frac{1}{4}&\frac{1}{4} \\ -\frac{1}{4}&\frac{1}{4}&\frac{1}{4}&-\frac{1}{4} \\ -\frac{1}{4}&\frac{1}{4}&\frac{1}{4}&-\frac{1}{4} \\ \frac{1}{4}&-\frac{1}{4}&-\frac{1}{4}&\frac{1}{4} \end{bmatrix}\]
这样其谱分解表达式为 \[A=G_1 - 3G_2\]
注意\(G_1\)和\(G_2\)的系数\(\lambda_i\)为其对应的特征值。