如何对矩阵进行对角化

在此页面上,您将找到有关可对角化矩阵的所有内容:它们是什么,何时可以对角化以及何时不能对角化矩阵,对角化矩阵的方法,这些特定矩阵的应用和属性等。您甚至还可以逐步解决几个练习,以便您可以练习并完全理解它们是如何对角化的。最后,我们还学习如何使用计算机程序 MATLAB 执行矩阵对角化,因为它的使用非常频繁。

什么是可对角化矩阵?

正如我们将在下面看到的,对角化矩阵在线性代数领域非常有用。这就是为什么很多人问……什么是矩阵对角化?好吧,可对角化矩阵的定义是:

可对角化矩阵是可以变换为对角矩阵的方阵,即除了主对角线以外都用零填充的矩阵。矩阵的对角化分解如下:

A = PDP^{-1}

或同等学历,

D = P^{-1}AP

金子

A

是要对角化的矩阵,

P

是矩阵,其列是以下特征向量(或多个特征向量)

A

,

P^{-1}

它的逆矩阵和

D

是由特征值(或特征值)形成的对角矩阵

A

矩阵

P

充当基数变化矩阵,因此实际上通过这个公式,我们将基数更改为矩阵

A

,使得矩阵变成对角矩阵(

D

)在新基地。

因此,矩阵

A

和矩阵

D

它们是相似的矩阵。显然,

P

它是一个正则或非简并矩阵。

什么时候可以对矩阵进行对角化?

并非所有矩阵都可以对角化;只有满足某些特征的矩阵才能对角化。您可以通过不同的方式判断矩阵是否可对角化:

  • 如果n阶方阵具有n 个线性独立的特征向量(或多个特征向量) ,或者换句话说,如果这些向量形成基,则该方阵可对角化。这是因为矩阵

    P

    ,用于对矩阵进行对角化,由所述矩阵的特征向量形成。要知道特征向量是否为 LI,只需矩阵的行列式即可

    P

    不等于0,表示矩阵具有最大秩。

\text{si} \quad \text{det}(P)\neq 0 \ \longrightarrow \ \text{matriz diagonalizable}

  • 特征值和特征向量的一个性质是不同特征值的特征向量是线性无关的。因此,如果矩阵的所有特征值都是唯一的,则该矩阵可对角化。
  • 确定一个矩阵是否可以容纳在对角矩阵中的另一种方法是使用代数和几何重数。代数重数是一个特征值(或特征值)重复的次数,几何重数是矩阵的核(或核)的维数减去其主对角线上的特征值。因此,如果对于每个特征值,代数重数等于几何重数,则矩阵可对角化。

\alpha_\lambda = \text{multiplicidad algebraica} = \text{multiplicidad del valor propio}

m_\lambda = \text{multiplicidad geom\'etrica} = \text{dim } Ker(A-\lambda I) = n -rg(A-\lambda I)

\alpha_\lambda \geq m_\lambda \geq 1

\text{si} \quad \alpha_\lambda = m_\lambda \quad \forall \lambda \ \longrightarrow \ \text{matriz diagonalizable}

  • 最后,有一个定理,即谱定理,它保证实数对称矩阵的对角化。换句话说,任何实数对称矩阵都是可对角化的

如何对矩阵进行对角化

对角化矩阵的过程基于查找矩阵的特征值(或特征值)和特征向量(或特征向量)。这就是为什么掌握 如何计算任何矩阵的特征值(或特征值)和特征向量(或特征向量)很重要。您可以通过单击链接来记住它是如何完成的,我们在其中逐步解释如何找到它们以及一些使计算更容易的技巧。此外,您还会找到已解决的练习来练习。

使用以下方法,您可以对任意维度的矩阵进行对角化:2×2、3×3、4×4 等。对角化矩阵的步骤如下:

  1. 获取矩阵的特征值(或特征值)。
  2. 计算与每个特征值相关的特征向量。
  3. 构建矩阵

    P

    ,其列是要对角化的矩阵的特征向量。

  4. 检查矩阵是否可以对角化(它必须满足上一节中解释的条件之一)。
  5. 构造对角矩阵

    D

    ,其元素除了主对角线上的元素全部为0,即步骤1中找到的特征值。

警告:矩阵的特征向量

P

可以任意顺序放置,但是对角矩阵的特征值

D

它们必须按相同的顺序放置。例如,对角矩阵的第一个特征值

D

必须是对应于矩阵第一列的特征向量

P

以下是您可以练习的几个分步矩阵对角化练习。

矩阵对角化练习已解决

练习1

对以下维度为 2×2 的方阵进行对角化:

\displaystyle A= \begin{pmatrix}2&2\\[1.1ex] 1&3\end{pmatrix}

我们首先必须确定矩阵A的特征值。因此,我们通过求解以下行列式来计算特征方程:

\displaystyle \text{det}(A-\lambda I)= \begin{vmatrix}2- \lambda &2\\[1.1ex] 1&3-\lambda \end{vmatrix} = \lambda^2-5\lambda +4

现在我们来计算特征多项式的根:

\displaystyle \lambda^2-5\lambda +4=0 \ \longrightarrow \ \begin{cases} \lambda = 4 \\[2ex] \lambda = 1 \end{cases}

一旦获得特征值,我们就计算与每个特征值相关的特征向量。首先,特征值1对应的特征向量:

\displaystyle (A-I)v=0

\displaystyle \begin{pmatrix}1&2\\[1.1ex] 1&2\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \end{pmatrix} =}\begin{pmatrix}0 \\[1.1ex] 0 \end{pmatrix}

\displaystyle \left.\begin{array}{l} x+2y = 0 \\[2ex] x+2y = 0\end{array}\right\} \longrightarrow \ x=-2y

\displaystyle v = \begin{pmatrix}-2 \\[1.1ex] 1 \end{pmatrix}

然后我们计算与特征值 4 相关的特征向量:

\displaystyle (A-4I)v=0

\displaystyle \begin{pmatrix}-2&2\\[1.1ex] 1&-1\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \end{pmatrix} =}\begin{pmatrix}0 \\[1.1ex] 0 \end{pmatrix}

\displaystyle \left.\begin{array}{l} -2x+2y = 0 \\[2ex] x-y = 0\end{array}\right\} \longrightarrow \ y=x

\displaystyle v = \begin{pmatrix}1 \\[1.1ex] 1 \end{pmatrix}

我们构建矩阵

P

,由矩阵的特征向量形成:

\displaystyle  P = \begin{pmatrix}-2&1 \\[1.1ex] 1&1 \end{pmatrix}

由于所有特征值都不同,因此矩阵 A 可对角化。因此,相应的对角矩阵就是主对角线上具有特征值的矩阵:

\displaystyle D= \begin{pmatrix}1&0\\[1.1ex] 0&4\end{pmatrix}

请记住,特征值的放置顺序必须与特征向量在矩阵中的放置顺序相同

P

综上所述,基变化矩阵和对角化矩阵为:

\displaystyle P = \begin{pmatrix}-2&1 \\[1.1ex] 1&1 \end{pmatrix} \qquad D= \begin{pmatrix}1&0\\[1.1ex] 0&4\end{pmatrix}

练习2

对以下 2 阶方阵进行对角化:

\displaystyle A= \begin{pmatrix}3&4\\[1.1ex] -1&-2\end{pmatrix}

我们首先必须确定矩阵A的特征值。因此,我们通过求解以下行列式来计算特征方程:

\displaystyle \text{det}(A-\lambda I)= \begin{vmatrix}3- \lambda &4\\[1.1ex] -1&-2-\lambda \end{vmatrix} = \lambda^2-\lambda -2

现在我们来计算特征多项式的根:

\displaystyle \lambda^2-\lambda -2=0 \ \longrightarrow \ \begin{cases} \lambda = -1 \\[2ex] \lambda = 2 \end{cases}

一旦获得特征值,我们就计算与每个特征值相关的特征向量。首先,特征值-1对应的特征向量:

\displaystyle (A+I)v=0

\displaystyle \begin{pmatrix}4&4\\[1.1ex] -1&-1\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \end{pmatrix} =}\begin{pmatrix}0 \\[1.1ex] 0 \end{pmatrix}

\displaystyle \left.\begin{array}{l} 4x+4y = 0 \\[2ex] -x-y = 0\end{array}\right\} \longrightarrow \ x=-y

\displaystyle v = \begin{pmatrix}-1 \\[1.1ex] 1 \end{pmatrix}

然后我们计算与特征值 2 相关的特征向量:

\displaystyle (A-2I)v=0

\displaystyle \begin{pmatrix}1&4\\[1.1ex] -1&-4\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \end{pmatrix} =}\begin{pmatrix}0 \\[1.1ex] 0 \end{pmatrix}

\displaystyle \left.\begin{array}{l} x+4y = 0 \\[2ex] -x-4y = 0\end{array}\right\} \longrightarrow \ x=-4y

\displaystyle v = \begin{pmatrix}-4 \\[1.1ex] 1 \end{pmatrix}

我们构建矩阵

P

,由矩阵的特征向量形成:

\displaystyle  P = \begin{pmatrix}-1&-4 \\[1.1ex] 1&1 \end{pmatrix}

由于所有特征值彼此不同,因此矩阵 A 可对角化。因此,对应的对角矩阵是包含主对角线上特征值的矩阵:

\displaystyle D= \begin{pmatrix}-1&0\\[1.1ex] 0&2\end{pmatrix}

请记住,特征值的放置顺序必须与特征向量在矩阵中的放置顺序相同

P

综上所述,基变化矩阵和对角化矩阵为:

\displaystyle P = \begin{pmatrix}-1&-4 \\[1.1ex] 1&1\end{pmatrix} \qquad D= \begin{pmatrix}-1&0\\[1.1ex] 0&2\end{pmatrix}

练习3

对以下维度为 3×3 的方阵进行对角化:

\displaystyle A= \begin{pmatrix}2&0&2\\[1.1ex] -1&2&1\\[1.1ex] 0&1&4\end{pmatrix}

第一步包括找到矩阵 A 的特征值。因此,我们通过求解以下矩阵的行列式来计算特征方程:

\displaystyle \text{det}(A-\lambda I)= \begin{vmatrix}2-\lambda&0&2\\[1.1ex] -1&2-\lambda&1\\[1.1ex] 0&1&4-\lambda \end{vmatrix} = -\lambda^3+8\lambda^2-19\lambda+12

我们现在必须计算特征多项式的根。由于它是三次多项式,因此我们应用鲁菲尼规则:

\displaystyle \begin{array}{r|rrrr} & -1&8&-19& 12 \\[2ex] 1 & & -1&7&-12 \\ \hline &-1\vphantom{\Bigl)}&7&-12&0 \end{array}

然后我们求得到的多项式的根:

\displaystyle -\lambda^2+7\lambda -12=0 \ \longrightarrow \ \begin{cases} \lambda = 3 \\[2ex] \lambda = 4 \end{cases}

所以矩阵的特征值为:

\lambda=1 \qquad \lambda =3 \qquad \lambda = 4

一旦找到特征值,我们就计算与每个特征值相关的特征向量。首先,特征值1对应的特征向量:

\displaystyle (A-I)v=0

\displaystyle \begin{pmatrix}1&0&2\\[1.1ex] -1&1&1\\[1.1ex] 0&1&3\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} x+2z = 0 \\[2ex] -x+y+z = 0\\[2ex] y+3z = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}x=-2z \\[2ex] y = -3z \end{array}

\displaystyle v = \begin{pmatrix}-2 \\[1.1ex] -3 \\[1.1ex] 1\end{pmatrix}

然后我们计算与特征值 3 相关的特征向量:

\displaystyle (A-3I)v=0

\displaystyle \begin{pmatrix}-1&0&2\\[1.1ex] -1&-1&1\\[1.1ex] 0&1&1\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} -x+2z = 0 \\[2ex] -x-y+z = 0\\[2ex] y+z = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}x=2z \\[2ex] y = -z \end{array}

\displaystyle v = \begin{pmatrix}2 \\[1.1ex] -1 \\[1.1ex] 1\end{pmatrix}

最后,我们计算与特征值 4 相关的特征向量:

\displaystyle (A-4I)v=0

\displaystyle \begin{pmatrix}-2&0&2\\[1.1ex] -1&-2&1\\[1.1ex] 0&1&0\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} -2x+2z = 0 \\[2ex] -x-2y+z = 0\\[2ex] y = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}x=z \\[2ex] y = 0 \end{array}

\displaystyle v = \begin{pmatrix}1 \\[1.1ex] 0 \\[1.1ex] 1\end{pmatrix}

我们构建矩阵

P

,由矩阵的特征向量形成:

\displaystyle  P = \begin{pmatrix}-2&2&1 \\[1.1ex] -3&-1&0 \\[1.1ex] 1&1&1 \end{pmatrix}

由于所有特征值彼此不同,因此矩阵 A 可对角化。因此,相应的对角矩阵就是主对角线上具有特征值的矩阵:

\displaystyle D= \begin{pmatrix}1&0&0\\[1.1ex] 0&3&0 \\[1.1ex] 0&0&4\end{pmatrix}

请记住,特征值的放置顺序必须与特征向量在矩阵中的放置顺序相同

P

简而言之,基变化矩阵和对角化矩阵为:

\displaystyle P = \begin{pmatrix}-2&2&1 \\[1.1ex] -3&-1&0 \\[1.1ex] 1&1&1\end{pmatrix} \qquad D= \begin{pmatrix}1&0&0\\[1.1ex] 0&3&0 \\[1.1ex] 0&0&4\end{pmatrix}

练习4

如果可能的话,对以下 3 阶方阵进行对角化:

\displaystyle A= \begin{pmatrix}-1&3&1\\[1.1ex] 0&2&0\\[1.1ex] 3&-1&1\end{pmatrix}

第一步包括找到矩阵 A 的特征值。因此,我们通过求解以下矩阵的行列式来计算特征方程:

\displaystyle \text{det}(A-\lambda I)= \begin{vmatrix}-1-\lambda&3&1\\[1.1ex] 0&2-\lambda&0\\[1.1ex] 3&-1&1-\lambda \end{vmatrix} = -\lambda^3+2\lambda^2+4\lambda-8

我们现在必须计算最小多项式的根。由于它是三次多项式,我们应用鲁菲尼规则对其进行因式分解:

\displaystyle \begin{array}{r|rrrr} & -1&2&\phantom{-}4& -8 \\[2ex] 2 & & -2&0&8 \\ \hline &-1\vphantom{\Bigl)}&0&4&0 \end{array}

然后我们求得到的多项式的根:

\displaystyle -\lambda^2+4=0 \ \longrightarrow \ \begin{cases} \lambda = +2 \\[2ex] \lambda = -2 \end{cases}

所以矩阵的特征值为:

\lambda=2 \qquad \lambda =2 \qquad \lambda = -2

-2 的特征值具有简单代数重数,而 2 的特征值具有双重数。

一旦找到特征值,我们就计算与每个特征值相关的特征向量。首先,特征值-2对应的特征向量:

\displaystyle (A+2I)v=0

\displaystyle \begin{pmatrix}1&3&1\\[1.1ex] 0&4&0\\[1.1ex] 3&-1&3\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} x+3y+z = 0 \\[2ex] 4y = 0\\[2ex] 3x-y+3z = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}y=0 \\[2ex] x = -z \end{array}

\displaystyle v = \begin{pmatrix}1 \\[1.1ex] 0 \\[1.1ex] -1\end{pmatrix}

现在让我们计算与特征值 2 相关的特征向量。

\displaystyle (A-2I)v=0

\displaystyle \begin{pmatrix}-3&3&1\\[1.1ex] 0&0&0\\[1.1ex] 3&-1&-1\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} -3x+3y+z = 0 \\[2ex] 0= 0\\[2ex] 3x-y-z = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}y=0 \\[2ex] z=3x \end{array}

\displaystyle v = \begin{pmatrix}1 \\[1.1ex] 0 \\[1.1ex] 3\end{pmatrix}

由于特征值 2 重复两次,我们需要计算另一个满足子空间(或特征空间)方程的特征向量:

\displaystyle v = \begin{pmatrix}-1 \\[1.1ex] 0 \\[1.1ex] -3\end{pmatrix}

我们构建矩阵

P

,由矩阵的三个特征向量组成:

\displaystyle  P = \begin{pmatrix}1&1&-1 \\[1.1ex] 0&0&0 \\[1.1ex] -1&3&-3 \end{pmatrix}

然而,这三个向量并不是线性独立的,因为显然特征值为 2 的两个特征向量是彼此的线性组合。这也可以证明,因为矩阵的行列式

P

等于 0(一行全是零):

\displaystyle \text{det}(P) = \begin{vmatrix}1&1&-1 \\[1.1ex] 0&0&0 \\[1.1ex] -1&3&-3 \end{vmatrix}=0

因此,由于特征向量是线性相关的,因此矩阵 A 不可对角化

练习5

如果可能,将以下大小为 3×3 的方阵对角化:

\displaystyle A= \begin{pmatrix}3&0&0\\[1.1ex] 0&2&1\\[1.1ex] 0&1&2\end{pmatrix}

第一步包括找到矩阵 A 的特征值。因此,我们通过求解以下矩阵的行列式来计算特征方程:

\displaystyle \text{det}(A-\lambda I)= \begin{vmatrix}3-\lambda&0&0\\[1.1ex] 0&2-\lambda&1\\[1.1ex] 0&1&2-\lambda \end{vmatrix}

由于第一行完全由除 3 之外的 0 组成,我们将利用这一点通过余因子(或伴随)求解矩阵的行列式:

\displaystyle \begin{aligned} \begin{vmatrix}3-\lambda&0&0\\[1.1ex] 0&2-\lambda&1\\[1.1ex] 0&1&2-\lambda \end{vmatrix}& = (3-\lambda)\cdot  \begin{vmatrix} 2-\lambda&1\\[1.1ex]1&2-\lambda \end{vmatrix} \\[3ex] & = (3-\lambda)[\lambda^2 -4\lambda +3] \end{aligned}

我们现在需要计算特征多项式的根。最好不要将括号相乘,因为这样您将获得三次多项式。另一方面,如果将两个因素分开求解,则更容易获得特征值:

\displaystyle (3-\lambda)[\lambda^2 -4\lambda +3]=0 \ \longrightarrow \ \begin{cases} 3-\lambda=0 \ \longrightarrow \ \lambda = 3 \\[2ex] \lambda^2 -4\lambda +3=0 \ \longrightarrow \begin{cases}\lambda = 1 \\[2ex] \lambda = 3 \end{cases} \end{cases}

所以矩阵的特征值为:

\lambda=1 \qquad \lambda =3 \qquad \lambda = 3

一旦找到特征值,我们就计算与每个特征值相关的特征向量。首先,特征值1对应的特征向量:

\displaystyle (A-I)v=0

\displaystyle \begin{pmatrix}2&0&0\\[1.1ex] 0&1&1\\[1.1ex] 0&1&1\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} 2x = 0 \\[2ex] y+z = 0\\[2ex] y+z = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}x=0 \\[2ex] y = -z \end{array}

\displaystyle v = \begin{pmatrix}0 \\[1.1ex] -1 \\[1.1ex] 1\end{pmatrix}

然后我们计算与特征值3相关的特征向量:

\displaystyle (A-3I)v=0

\displaystyle \begin{pmatrix}0&0&0\\[1.1ex] 0&-1&1\\[1.1ex] 0&1&-1\end{pmatrix}\begin{pmatrix}x \\[1.1ex] y \\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} 0 = 0 \\[2ex] -y+z = 0\\[2ex] y-z = 0\end{array}\right\} \longrightarrow \ \begin{array}{l}y=z  \end{array}

\displaystyle v = \begin{pmatrix}0 \\[1.1ex] 1 \\[1.1ex] 1\end{pmatrix}

由于特征值 3 重复两次,我们需要计算另一个满足特征空间方程的特征向量:

\displaystyle v = \begin{pmatrix}1 \\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

我们构建矩阵

P

,由矩阵的特征向量形成:

\displaystyle  P = \begin{pmatrix}0&0&1 \\[1.1ex] -1&1&0 \\[1.1ex] 1&1&0 \end{pmatrix}

与练习 4 不同,在本例中,尽管特征值 3 的代数重数是双倍,但我们能够形成 3 个线性独立向量。这可以通过查看矩阵的行列式来验证

P

给出与 0 不同的结果:

\displaystyle \text{det}(P) = \begin{vmatrix}0&0&1 \\[1.1ex] -1&1&0 \\[1.1ex] 1&1&0 \end{vmatrix} =-2 \neq 0

这样我们就可以对矩阵A进行对角分解。对应的对角矩阵就是主对角线上有特征值的矩阵:

\displaystyle D= \begin{pmatrix}1&0&0\\[1.1ex] 0&3&0 \\[1.1ex] 0&0&3\end{pmatrix}

请记住,特征值的放置顺序必须与特征向量在矩阵中的放置顺序相同

P

简而言之,对角化矩阵所需的基变化矩阵及其对角化形式为:

\displaystyle P = \begin{pmatrix}0&0&1 \\[1.1ex] -1&1&0 \\[1.1ex] 1&1&0 \end{pmatrix}\qquad D= \begin{pmatrix}1&0&0\\[1.1ex] 0&3&0 \\[1.1ex] 0&0&3\end{pmatrix}

练习6

如果可能的话,对以下 4×4 维矩阵进行对角化:

\displaystyle A=\begin{pmatrix}2&1&2&0\\[1.1ex] 1&-3&1&0\\[1.1ex] 0&-1&0&0\\[1.1ex] 0&0&0&5\end{pmatrix}

第一步包括找到矩阵 A 的特征值。因此,我们通过求解以下矩阵的行列式来计算特征方程:

\displaystyle \text{det}(A-\lambda I)= \begin{vmatrix}2-\lambda&1&2&0\\[1.1ex] 1&-3-\lambda&1&0\\[1.1ex] 0&-1&-\lambda&0\\[1.1ex] 0&0&0&5-\lambda\end{vmatrix}

在这种情况下,行列式的最后一列除了一个元素外仅由零组成,因此我们将利用这一点通过该列通过辅因子计算行列式:

\displaystyle \begin{aligned} \begin{vmatrix}2-\lambda&1&2&0\\[1.1ex] 1&-3-\lambda&1&0\\[1.1ex] 0&-1&-\lambda&0\\[1.1ex] 0&0&0&5-\lambda\end{vmatrix}& = (5-\lambda)\cdot  \begin{vmatrix}2-\lambda&1&2\\[1.1ex] 1&-3-\lambda&1\\[1.1ex] 0&-1&-\lambda\end{vmatrix}\\[3ex] & = (5-\lambda)[-\lambda^3 -\lambda^2 +6\lambda] \end{aligned}

我们现在必须计算特征多项式的根。最好不要计算括号的乘积,因为这样您将获得四次多项式。然而,如果分别求解这两个因素,则计算特征值会更容易:

\displaystyle (5-\lambda)[-\lambda^3 -\lambda^2 +6\lambda]=0 \ \longrightarrow \ \begin{cases} 5-\lambda=0 \ \longrightarrow \ \lambda = 5 \\[2ex] -\lambda^3 -\lambda^2 +6\lambda =0 \ \longrightarrow \ \lambda(-\lambda^2 -\lambda +6) =0 \end{cases}

\displaystyle \lambda(-\lambda^2 -\lambda +6)=0 \ \longrightarrow \ \begin{cases} \lambda=0  \\[2ex] -\lambda^2 -\lambda +6=0 \ \longrightarrow \ \begin{cases} \lambda=2 \\[2ex] \lambda = -3 \end{cases}\end{cases}

所以矩阵的特征值为:

\lambda=0 \qquad \lambda =-3 \qquad \lambda = 2\qquad \lambda = 5

一旦找到所有特征值,我们就转向特征向量。我们计算与特征值 0 相关的特征向量:

\displaystyle (A-0I)v=0

\displaystyle \begin{pmatrix} 2&1&2&0\\[1.1ex] 1&-3&1&0\\[1.1ex] 0&-1&0&0\\[1.1ex] 0&0&0&5\end{pmatrix}\begin{pmatrix}w \\[1.1ex] x \\[1.1ex] y\\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0\\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} 2w+x+2y = 0 \\[2ex] w-3x+y = 0\\[2ex] -x=0 \\[2ex] 5z=0 \end{array}\right\} \longrightarrow \ \begin{array}{l} x=0 \\[2ex] z=0  \\[2ex]w=-y \end{array}

\displaystyle v = \begin{pmatrix}-1 \\[1.1ex] 0 \\[1.1ex] 1  \\[1.1ex]0 \end{pmatrix}

我们计算与特征值 -3 相关的特征向量:

\displaystyle (A+3I)v=0

\displaystyle \begin{pmatrix} 5&1&2&0\\[1.1ex] 1&0&1&0\\[1.1ex] 0&-1&3&0\\[1.1ex] 0&0&0&8\end{pmatrix}\begin{pmatrix}w \\[1.1ex] x \\[1.1ex] y\\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0\\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} 5w+x+2y = 0 \\[2ex] w+y = 0\\[2ex] -x+3y=0 \\[2ex] 8z=0 \end{array}\right\} \longrightarrow \ \begin{array}{l} w=-y  \\[2ex]x=3y \\[2ex] z=0 \end{array}

\displaystyle v = \begin{pmatrix}-1 \\[1.1ex] 3 \\[1.1ex] 1  \\[1.1ex]0 \end{pmatrix}

我们计算与特征值 2 相关的特征向量:

\displaystyle (A-2I)v=0

\displaystyle \begin{pmatrix} 0&1&2&0\\[1.1ex] 1&-5&1&0\\[1.1ex] 0&-1&-2&0\\[1.1ex] 0&0&0&3\end{pmatrix}\begin{pmatrix}w \\[1.1ex] x \\[1.1ex] y\\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0\\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} x+2y = 0 \\[2ex] w-5x+y = 0\\[2ex] -x-2y=0 \\[2ex] 3z=0 \end{array}\right\} \longrightarrow \ \begin{array}{l} x=-2y \\[2ex] w=-11y \\[2ex] z=0  \end{array}

\displaystyle v = \begin{pmatrix}-11 \\[1.1ex] -2 \\[1.1ex] 1  \\[1.1ex]0 \end{pmatrix}

我们计算与特征值 5 相关的特征向量:

\displaystyle (A-5I)v=0

\displaystyle \begin{pmatrix} -3&1&2&0\\[1.1ex] 1&-8&1&0\\[1.1ex] 0&-1&-5&0\\[1.1ex] 0&0&0&0\end{pmatrix}\begin{pmatrix}w \\[1.1ex] x \\[1.1ex] y\\[1.1ex] z \end{pmatrix} =\begin{pmatrix}0 \\[1.1ex] 0\\[1.1ex] 0 \\[1.1ex] 0\end{pmatrix}

\displaystyle \left.\begin{array}{l} -3w+x+2y = 0 \\[2ex] w-8x+y = 0\\[2ex] -x-5y=0 \\[2ex] 0=0 \end{array}\right\} \longrightarrow \ \begin{array}{l} w=x=y=0 \end{array}

\displaystyle v = \begin{pmatrix}0 \\[1.1ex] 0 \\[1.1ex] 0 \\[1.1ex]1 \end{pmatrix}

我们制作矩阵

P

,由矩阵的特征向量组成:

\displaystyle  P = \begin{pmatrix}-1&-1&-11&0 \\[1.1ex] 0&3&-2&0 \\[1.1ex] 1&1&1&0  \\[1.1ex]0&0&0&1\end{pmatrix}

由于所有特征值彼此不同,因此矩阵 A 可对角化。因此,相应的对角矩阵就是主对角线上具有特征值的矩阵:

\displaystyle D= \begin{pmatrix}0&0&0&0\\[1.1ex] 0&-3&0&0 \\[1.1ex] 0&0&2&0\\[1.1ex] 0&0&0&5\end{pmatrix}

请记住,特征值的放置顺序必须与特征向量在矩阵中的放置顺序相同

P

综上所述,将矩阵A和对角形式的矩阵对角化所需的基本矩阵变化为:

\displaystyle P = \begin{pmatrix}-1&-1&-11&0 \\[1.1ex] 0&3&-2&0 \\[1.1ex] 1&1&1&0  \\[1.1ex]0&0&0&1\end{pmatrix} \qquad D=\begin{pmatrix}0&0&0&0\\[1.1ex] 0&-3&0&0 \\[1.1ex] 0&0&2&0\\[1.1ex] 0&0&0&5\end{pmatrix}

可对角化矩阵的应用

如果您已经了解了这么多,您可能想知道:可对角化矩阵有什么用?

可对角化矩阵在数学中非常有用且广泛使用。原因是对角矩阵实际上充满了零,因此使计算变得更加容易。

一个明显的例子是可对角化矩阵的幂,因为它们的结果可以通过以下公式简化:

\displaystyle  A^k=PD^kP^{-1}

这种等式可以很容易地通过归纳法来证明。因此,提高矩阵就足够了

D

给参展商。由于它是对角矩阵,因此运算简化为将主对角线的每一项求指数:

\displaystyle  D^k = diag(\lambda_1^k,\lambda_2^k, \ldots , \lambda_n^k)

可对角化矩阵的幂示例

为了更好地理解,我们以计算可对角化矩阵的幂为例:

\displaystyle A= \begin{pmatrix}2&0\\[1.1ex] 3&1\end{pmatrix}

基本变化矩阵

P

,由其特征向量和对角化矩阵组成

D

,由它自己的值组成,是:

\displaystyle P = \begin{pmatrix}0&1 \\[1.1ex] 1&3 \end{pmatrix} \qquad D= \begin{pmatrix}1&0\\[1.1ex] 0&2\end{pmatrix}

因此,举个例子,矩阵 A 提高到 7 相当于:

\displaystyle  A^7=PD^7P^{-1}

\displaystyle  A^7=\begin{pmatrix}0&1 \\[1.1ex] 1&3\end{pmatrix}\begin{pmatrix}1&0\\[1.1ex] 0&2\end{pmatrix}^7\left.\begin{pmatrix}0&1 \\[1.1ex] 1&3 \end{pmatrix}\right.^{-1}

现在我们反转矩阵

P:

\displaystyle  A^7=\begin{pmatrix}0&1 \\[1.1ex] 1&3 \end{pmatrix}\begin{pmatrix}1&0\\[1.1ex] 0&2\end{pmatrix}^7\begin{pmatrix}-3&1 \\[1.1ex] 1&0 \end{pmatrix}

我们求解矩阵的幂

D:

\displaystyle  A^7=\begin{pmatrix}0&1 \\[1.1ex] 1&3\end{pmatrix}\begin{pmatrix}1^7&0\\[1.1ex] 0&2^7\end{pmatrix} \begin{pmatrix}-3&1 \\[1.1ex] 1&0 \end{pmatrix}

\displaystyle  A^7=\begin{pmatrix}0&1 \\[1.1ex] 1&3 \end{pmatrix}\begin{pmatrix}1&0\\[1.1ex] 0&128\end{pmatrix} \begin{pmatrix}-3&1 \\[1.1ex] 1&0 \end{pmatrix}

最后,我们执行矩阵的乘法:

\displaystyle  \bm{A^7=}\begin{pmatrix}\bm{128}&\bm{0}\\[1.1ex] \bm{381}&\bm{1}\end{pmatrix}

正如您所看到的,使用对角矩阵计算幂比将同一矩阵连续乘以七次更方便。然后想象一下更大的指数值。

可对角化矩阵的性质

此类矩阵的特点是:

  • 如果矩阵

    A

    是可对角化的,任何幂

    A

  • 在复杂环境下几乎所有矩阵都可以对角化

    \mathbb{C}

    。尽管下面有一些永远不能对角化的例外情况。

  • 如果矩阵

    P

    是一个正交矩阵,那么我们称该矩阵

    A

    正交对角化的,因此,方程可以重写:

\displaystyle  A=PDP^t

  • 一个矩阵可以被酉矩阵对角化当且仅当它是一个正规矩阵。
  • 给定两个可对角化的矩阵,当且仅当它们可以同时对角化时,即它们共享相同的特征向量(或特征向量)的正交基时,它们才是可交换的。
  • 如果自同态是可对角化的,我们说它可通过相似性对角化。然而,并非所有自同态都是可对角化的,或者换句话说,自同态的对角化是不确定的。

同时对角化

如果存在一个可逆矩阵作为对角化矩阵中任何矩阵的基础,则称一组矩阵可同时对角化。换句话说,如果两个矩阵在相同的特征向量基础上对角化,则意味着它们可以同时对角化。

此外,正如我们在矩阵对角化的性质中评论的那样,如果两个矩阵能够同时对角化,它们必须彼此交换。

例如,以下两个矩阵是可交换的,因此它们在相同的特征向量或特征向量基础上进行对角化。

\displaystyle  A=\begin{pmatrix}2&0 \\[1.1ex] 1&-1 \end{pmatrix} \qquad B=\begin{pmatrix}3&0\\[1.1ex] 1&0 \end{pmatrix}

即使它们具有相同的特征向量,也不意味着它们具有相同的特征值。事实上,虽然上面的矩阵A和B具有相似的特征向量,但它们具有不同的特征值。

不可对角矩阵

尽管绝大多数矩阵在复数环境中都可以对角化,但有些矩阵永远不能对角化。

当特征值(或特征值)的代数重数与几何重数不一致时,就会出现这种情况。

例如,以下矩阵不能以任何方式对角化,它是“可对角化的”:

\displaystyle \begin{pmatrix}0&1 \\[1.1ex] 0&0 \end{pmatrix}

此外,有些矩阵无法在实数环境中进行对角化,但在处理复数时会进行对角化,例如以下矩阵:

\displaystyle  \begin{pmatrix}0&1 \\[1.1ex] -1&0 \end{pmatrix}

最后,有一些矩阵块对角化过程不是纯粹对角化的,而是稍微复杂一些。最著名的方法是乔丹规范形式的对角化。

使用 MATLAB 对矩阵进行对角化

在对矩阵进行对角化时,计算机程序非常方便,尤其是当它们非常大时。最著名的软件肯定是MATLAB ,所以接下来我们将了解如何使用该程序对矩阵进行对角因式分解。

使用 MATLAB 对矩阵进行对角化的指令是:

\displaystyle  \text{[P, D] = eig(A)}

金子

A

是要对角化的矩阵,

P

D

是程序返回的矩阵:

P

是由特征向量形成的矩阵,

D

是对角形式的矩阵,其主对角项是特征值。

因此,您只需将此代码输入到程序中即可。

另一方面,如果您只想知道特征值,可以使用以下语句:

\displaystyle  e= eig(A)}

金子

e

是MATLAB返回的带有矩阵特征值的列向量

A

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

Scroll to Top