欢迎来到高等矩阵代数(Further Matrix Algebra)!
你好!如果你已经学到了 Further Pure 3,说明你已经是一位数学高手了。本章“高等矩阵代数”的内容看似抽象,但它其实是应用数学中最强大的工具之一。
如果之前你觉得矩阵很难,不必担心。我们将聚焦于两个既迷人又核心的概念:如何利用 3x3 矩阵描述三维空间中的变换,以及如何寻找简化一切复杂问题的“稳定方向”(即特征向量,Eigenvectors)。
把矩阵想象成几何图形的高级“指令手册”。让我们深入学习,解锁它们的奥秘吧!
第 1 节:重温三维变换
在 FP1 和 FP2 中,你已经掌握了用于二维变换(反射、旋转、拉伸)的 2x2 矩阵。现在,我们将使用 3x3 矩阵将这一概念扩展到三维空间。
1.1 理解 3x3 变换矩阵
一个 3x3 矩阵 \(\mathbf{A}\) 可以将一个三维位置向量 \(\mathbf{r} = \begin{pmatrix} x \\ y \\ z \end{pmatrix}\) 变换为新的位置向量 \(\mathbf{r}' = \mathbf{A}\mathbf{r}\)。
矩阵的结构取决于三个基向量变换后的位置:
- 第 1 列:\(\mathbf{i} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}\) 变换后的位置。
- 第 2 列:\(\mathbf{j} = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix}\) 变换后的位置。
- 第 3 列:\(\mathbf{k} = \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix}\) 变换后的位置。
核心要点: 如果你需要求出一个变换矩阵,只需追踪单位轴向量(\(\mathbf{i}\), \(\mathbf{j}\), \(\mathbf{k}\))最终移动到了哪里。这些新的向量就是变换矩阵的列。
1.2 标准三维变换矩阵
你必须熟练掌握标准的变换矩阵。以下是几个必不可少的例子:
绕轴旋转
在三维空间旋转时,旋转轴保持不变。
例子:绕 z 轴旋转角度 \(\theta\)。
z 轴保持固定,因此 \(\mathbf{k}\) 映射到自身:\(\begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix}\)。左上角的 2x2 部分处理 xy 平面内的标准二维旋转。
\[ \mathbf{R}_z = \begin{pmatrix} \cos \theta & -\sin \theta & 0 \\ \sin \theta & \cos \theta & 0 \\ 0 & 0 & 1 \end{pmatrix} \]
在平面内的反射
反射矩阵会翻转垂直于该平面的分量。
例子:在 \(xy\) 平面(即 \(z=0\))内的反射。
\(\mathbf{i}\) 和 \(\mathbf{j}\) 位于平面内,因此它们保持不变。\(\mathbf{k}\) 映射到 \(-\mathbf{k}\)。
\[ \mathbf{M}_{xy} = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -1 \end{pmatrix} \]
放大(缩放)
以原点为中心,按比例因子 \(k\) 进行放大(或拉伸):
\[ \mathbf{E} = \begin{pmatrix} k & 0 & 0 \\ 0 & k & 0 \\ 0 & 0 & k \end{pmatrix} \]
快速回顾:几何意义
变换矩阵的行列式 \(\det(\mathbf{A})\),代表了变换后体积的缩放因子。
- 如果 \(\det(\mathbf{A}) = 1\),体积保持不变(例如旋转)。
- 如果 \(\det(\mathbf{A}) = -1\),体积保持不变,但方向发生反转(例如反射)。
- 如果 \(\det(\mathbf{A}) = k^3\),体积被缩放了 \(k^3\) 倍(例如以因子 \(k\) 放大)。
第 2 节:特征值与特征向量
这是 FP3 矩阵代数的核心概念。它研究的是寻找那些在变换后保持方向不变,仅发生比例缩放的特殊向量。
类比:想象一块被拉伸的橡胶(变换过程)。大多数点都会移动并改变方向,但“特征向量”就像是画在橡胶上的线,它们只会被拉长或缩短,始终保持在原来的直线上。
2.1 定义特征值与特征向量
这种关系通过以下方程定义:
\[ \mathbf{A}\mathbf{v} = \lambda\mathbf{v} \]
- \(\mathbf{A}\) 是矩阵(通常为 2x2 或 3x3)。
- \(\mathbf{v}\) 是特征向量(即那个特殊的方向)。
- \(\lambda\) (lambda) 是特征值(即缩放因子)。
注意:特征向量不能是零向量(即 \(\mathbf{v} \ne \mathbf{0}\))。
2.2 逐步求解:求特征值 (\(\lambda\))
为了求缩放因子 (\(\lambda\)),我们要对关键方程进行变形:
\(\mathbf{A}\mathbf{v} = \lambda\mathbf{v}\)
\(\mathbf{A}\mathbf{v} - \lambda\mathbf{v} = \mathbf{0}\)
为了正确提取 \(\mathbf{v}\),必须引入单位矩阵 \(\mathbf{I}\):
\[ (\mathbf{A} - \lambda\mathbf{I})\mathbf{v} = \mathbf{0} \]
对于非零解(即当 \(\mathbf{v} \ne \mathbf{0}\) 时),矩阵 \((\mathbf{A} - \lambda\mathbf{I})\) 必须是奇异的(不可逆)。
这导出了特征方程:
\[ \det(\mathbf{A} - \lambda\mathbf{I}) = 0 \]
计算步骤:
- 构建矩阵 \((\mathbf{A} - \lambda\mathbf{I})\): 从 \(\mathbf{A}\) 的主对角线元素中减去 \(\lambda\)。
- 计算行列式: 计算 \(\det(\mathbf{A} - \lambda\mathbf{I})\)。对于 3x3 矩阵,这将得到一个关于 \(\lambda\) 的三次多项式。
- 求解方程: 解这个多项式方程求出 \(\lambda\)。这些解就是你的特征值。(如果特征值是整数,你可能需要用到因式定理和综合除法)。
常见错误警示: 同学们在写特征方程时常忘记加入单位矩阵 \(\mathbf{I}\)。你不能直接从矩阵 \(\mathbf{A}\) 中减去标量 \(\lambda\)!
2.3 逐步求解:求特征向量 (\(\mathbf{v}\))
一旦得到了特征值 (\(\lambda\)),就可以将每个 \(\lambda\) 代入定义方程求出对应的特征向量:
\[ (\mathbf{A} - \lambda\mathbf{I})\mathbf{v} = \mathbf{0} \]
计算步骤:
- 选取特征值: 选择计算出的一个特征值 \(\lambda_1\)。
- 代入: 将 \(\lambda_1\) 代入 \((\mathbf{A} - \lambda_1\mathbf{I})\)。
- 建立方程组: 令 \(\mathbf{v} = \begin{pmatrix} x \\ y \\ z \end{pmatrix}\),根据 \((\mathbf{A} - \lambda_1\mathbf{I})\mathbf{v} = \mathbf{0}\) 建立线性方程组。
- 求解(参数化): 由于行列式为零,方程组是线性相关的。你只需要选取其中两个方程即可解出 \(x, y, z\) 的比例。
提示:令其中一个变量(通常是 \(z\) 或 \(x\))等于一个参数,比如 \(t\) 或 \(k\),然后用该参数表示其他变量。 - 定义特征向量: 将特征向量 \(\mathbf{v}\) 写成最简形式(通常通过取 \(t=1\) 或其他合适的整数,使各分量为整数)。
你知道吗? 如果 \(\mathbf{v}\) 是一个特征向量,那么 \(\mathbf{v}\) 的任何标量倍数(例如 \(3\mathbf{v}\) 或 \(-0.5\mathbf{v}\))也是对应于同一特征值 \(\lambda\) 的特征向量。我们通常寻找最简化的非零整数表示。
核心要点:特征知识
特征值 (\(\lambda\)) 是通过求解特征多项式得到的标量。特征向量 (\(\mathbf{v}\)) 是通过将这些标量代回 \((\mathbf{A} - \lambda\mathbf{I})\mathbf{v} = \mathbf{0}\) 得到的向量。
第 3 节:矩阵的对角化
对角化是将可能复杂的矩阵 \(\mathbf{A}\) 转换为更简单的矩阵 \(\mathbf{D}\) 的过程,\(\mathbf{D}\) 是一个对角矩阵(即除了主对角线外,其余所有元素均为零的矩阵)。
为什么我们关心这个?因为对角矩阵非常容易计算,特别是在求矩阵的幂时。
3.1 对角化过程
我们利用特征向量和特征值来构造两个新矩阵:
- 模态矩阵 (\(\mathbf{P}\)): 该矩阵以 \(\mathbf{A}\) 的特征向量作为其列。
- 对角矩阵 (\(\mathbf{D}\)): 该矩阵的主对角线上是 \(\mathbf{A}\) 对应的特征值,其余位置均为零。
连接这些矩阵的关系式是:
\[ \mathbf{D} = \mathbf{P}^{-1}\mathbf{A}\mathbf{P} \]
如果题目要求你将 \(\mathbf{A}\) 对角化,你需要求出 \(\mathbf{P}\)、\(\mathbf{D}\),有时还需要求 \(\mathbf{P}^{-1}\)。
关键步骤:顺序很重要!
\(\mathbf{P}\) 中特征向量的顺序必须与 \(\mathbf{D}\) 中特征值的顺序对应一致。
如果: \[ \mathbf{P} = \begin{pmatrix} | & | & | \\ \mathbf{v}_1 & \mathbf{v}_2 & \mathbf{v}_3 \\ | & | & | \end{pmatrix} \] 那么: \[ \mathbf{D} = \begin{pmatrix} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_3 \end{pmatrix} \] 其中 \(\mathbf{v}_i\) 是对应于特征值 \(\lambda_i\) 的特征向量。
3.2 利用对角化计算矩阵的幂 (\(\mathbf{A}^n\))
这是对角化的主要应用。直接计算 \(\mathbf{A}^{10}\) 非常痛苦,但计算 \(\mathbf{D}^{10}\) 却轻而易举!
从对角化公式开始: \(\mathbf{D} = \mathbf{P}^{-1}\mathbf{A}\mathbf{P}\)
变形使 \(\mathbf{A}\) 成为主项(在左侧乘以 \(\mathbf{P}\),在右侧乘以 \(\mathbf{P}^{-1}\)): \[ \mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P}^{-1} \]
现在,让我们求 \(\mathbf{A}^2\):
\(\mathbf{A}^2 = (\mathbf{P}\mathbf{D}\mathbf{P}^{-1})(\mathbf{P}\mathbf{D}\mathbf{P}^{-1})\)
因为 \(\mathbf{P}^{-1}\mathbf{P} = \mathbf{I}\)(单位矩阵),中间项抵消了:
\(\mathbf{A}^2 = \mathbf{P}\mathbf{D}(\mathbf{I})\mathbf{D}\mathbf{P}^{-1} = \mathbf{P}\mathbf{D}^2\mathbf{P}^{-1}\)
推广到任意次幂 \(n\): \[ \mathbf{A}^n = \mathbf{P}\mathbf{D}^n\mathbf{P}^{-1} \]
计算 \(\mathbf{D}^n\):
这是最简单的部分!如果 \(\mathbf{D}\) 是对角矩阵,你只需将每个对角元素分别求 \(n\) 次幂:
如果 \[ \mathbf{D} = \begin{pmatrix} a & 0 & 0 \\ 0 & b & 0 \\ 0 & 0 & c \end{pmatrix} \] 那么 \[ \mathbf{D}^n = \begin{pmatrix} a^n & 0 & 0 \\ 0 & b^n & 0 \\ 0 & 0 & c^n \end{pmatrix} \]
因此,要计算 \(\mathbf{A}^n\),你只需要执行三次矩阵乘法:\(\mathbf{P}\) 乘以 \(\mathbf{D}^n\),再乘以 \(\mathbf{P}^{-1}\)。
快速回顾:对角化步骤
- 求出所有特征值 \(\lambda_i\)。
- 求出对应的特征向量 \(\mathbf{v}_i\)。
- 构建模态矩阵 \(\mathbf{P}\)(列为 \(\mathbf{v}_i\))。
- 构建对角矩阵 \(\mathbf{D}\)(对角元素为对应的 \(\lambda_i\))。
- 求模态矩阵的逆矩阵 \(\mathbf{P}^{-1}\)。
- 利用 \(\mathbf{P}\mathbf{D}^n\mathbf{P}^{-1}\) 计算 \(\mathbf{A}^n\)。
总结与寄语
你现在已经攻克了本章最深奥的概念:利用 3x3 矩阵理解三维几何,揭示特征向量的特殊稳定性,并利用这些性质通过对角化简化计算。
记住,本章的学习重点不仅在于计算,更在于理解 \(\mathbf{A}\mathbf{v} = \lambda\mathbf{v}\) 在几何变换中的意义。多练习求解特征方程吧,那是通往成功的钥匙!你一定能行!