欢迎来到矩阵代数学习指南!

你好!既然你已经读到了这一章,说明你正在步入进阶数学(Further Mathematics)中最强大且最令人兴奋的领域之一。别担心,如果矩阵起初看起来很陌生——它们其实只是一种能够同时处理大量数字和方程的简洁、有序的方法。

矩阵使我们能够进行复杂的变换(例如在二维和三维空间中旋转图形),并高效地求解大型线性方程组。学完本章后,你将成为矩阵运算、行列式、逆矩阵,以及特征向量和特征值这些关键概念的大师。

什么是矩阵?

你可以把矩阵看作是一个数字的长方形排列(一种高级的电子表格!),按照行和列进行组织。

  • 矩阵的阶(order)由其行数和列数定义,记作 \(m \times n\)。

第 1 节:矩阵代数基础(FPP1.1 复习)

1.1 基本运算

加法与减法

只有当矩阵的阶完全相同时,你才能对它们进行加法或减法运算。只需将对应位置的元素相加或相减即可。

示例:
如果 \(A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\) 且 \(B = \begin{pmatrix} 5 & 0 \\ -1 & 2 \end{pmatrix}\),那么 \(A+B = \begin{pmatrix} 1+5 & 2+0 \\ 3+(-1) & 4+2 \end{pmatrix} = \begin{pmatrix} 6 & 2 \\ 2 & 6 \end{pmatrix}\)。

标量乘法

标量(scalar)就是一个普通的数字。要将矩阵乘以标量,只需将矩阵中的每个元素都乘以该数字。

矩阵乘法(最高至 \(3 \times 3\))

这通常是第一个主要挑战,但通过练习,它会变得非常简单!

规则检查:要将矩阵 \(A\)(阶为 \(m \times n\))乘以矩阵 \(B\)(阶为 \(p \times q\)),矩阵 \(A\) 的列数必须等于矩阵 \(B\) 的行数。即 \(n = p\)。
结果矩阵 \(AB\) 的阶将为 \(m \times q\)。

计算过程:“行乘列”
乘积矩阵 \(AB\) 中第 \(i\) 行第 \(j\) 列的元素,是通过将 \(A\) 的第 \(i\) 行的元素与 \(B\) 的第 \(j\) 列的对应元素相乘,然后对结果求和得到的。

类比:想象你正把第一个矩阵的行滑过第二个矩阵的列。每一对相遇的元素相乘,最后把结果加在一起。

重要概念:非交换性
与普通数字 \(xy = yx\) 不同,对于矩阵而言,矩阵乘法通常不满足交换律
\(\mathbf{AB \neq BA}\)(即使两个乘积都有意义)。

常见错误:假设 \(AB\) 和 \(BA\) 的结果相同。一定要检查要求的顺序!

1.2 单位矩阵与转置矩阵

单位矩阵,\(I\)

单位矩阵(Identity Matrix),记作 \(I\),是矩阵世界里的“数字 1”。当你用矩阵 \(A\) 乘以单位矩阵 \(I\) 时,你得到的还是 \(A\)。

\(AI = IA = A\)

它是一个方阵(行数 = 列数),主对角线(从左上到右下)上全是 1,其余位置全是 0。

\(2 \times 2\) 单位矩阵:\(I = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\)
\(3 \times 3\) 单位矩阵:\(I = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}\)

转置矩阵,\(A^T\)

矩阵 \(A\) 的转置(Transpose),记作 \(A^T\),通过交换矩阵的行和列得到。

示例:如果 \(A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}\),那么 \(A^T = \begin{pmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{pmatrix}\)。

关键转置结论(大纲要求):
乘积的转置会反转顺序:
\((AB)^T = B^T A^T\)

第 1 节快速小结:掌握“行乘列”的乘法,并记住矩阵通常不可交换。单位矩阵是你的好朋友,而转置会改变乘法顺序。

第 2 节:行列式与逆矩阵

行列式(determinant)是一个由方阵计算出的单一数值。它为我们提供了关于矩阵的关键信息,特别是判断该矩阵是否拥有逆矩阵。

2.1 \(2 \times 2\) 矩阵的行列式

对于矩阵 \(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\),其行列式 \(\det(A)\) 或 \(|A|\) 为:
$$\det(A) = ad - bc$$

记忆技巧:将主对角线上的元素(\(a\) 和 \(d\))相乘,然后减去另一条对角线上元素(\(b\) 和 \(c\))的乘积。

2.2 \(2 \times 2\) 矩阵的逆矩阵

逆矩阵(Inverse Matrix) \(A^{-1}\) 是满足 \(A A^{-1} = A^{-1} A = I\) 的矩阵。

对于 \(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\),其逆矩阵的公式为:
$$A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}$$

\(2 \times 2\) 逆矩阵的计算步骤:

  1. 计算行列式 \(\det(A) = ad - bc\)。
  2. 交换 \(a\) 和 \(d\) 的位置。
  3. 将 \(b\) 和 \(c\) 变号。
  4. 将得到的矩阵乘以 \(\frac{1}{\det(A)}\)。
奇异矩阵与非奇异矩阵

如果 \(\det(A) \neq 0\),则矩阵 \(A\) 是非奇异的(non-singular)。如果是非奇异的,它的逆矩阵 \(A^{-1}\) 存在。

如果 \(\det(A) = 0\),则矩阵 \(A\) 是奇异的(singular)。如果是奇异的,分数 \(\frac{1}{0}\) 是未定义的,这意味着逆矩阵不存在

2.3 \(3 \times 3\) 矩阵的行列式(FP2 水平)

计算 \(3 \times 3\) 矩阵的行列式需要用到余子式展开(cofactor expansion)法。
对于 \(A = \begin{pmatrix} a & b & c \\ d & e & f \\ g & h & i \end{pmatrix}\),你可以沿任意行或列展开。通常我们使用第一行:

$$\det(A) = a \begin{vmatrix} e & f \\ h & i \end{vmatrix} - b \begin{vmatrix} d & f \\ g & i \end{vmatrix} + c \begin{vmatrix} d & e \\ g & h \end{vmatrix}$$

余子式展开步骤:

  1. 选择一行或一列(如果可能,选包含 0 的那一行/列,这会让计算更简单!)。
  2. 使用交替符号模式(称为余子式符号):
    \(\begin{pmatrix} + & - & + \\ - & + & - \\ + & - & + \end{pmatrix}\)
  3. 对于第一个元素,将其与遮掉该元素所在行和列后剩余的 \(2 \times 2\) 矩阵的行列式(这称为子式/minor)相乘。
  4. 对第二个和第三个元素重复上述步骤,记得应用正确的符号。
  5. 将所有结果相加。

2.4 \(3 \times 3\) 矩阵的逆矩阵(FP2 水平)

求 \(3 \times 3\) 矩阵的逆矩阵过程较繁琐,但遵循其定义:
$$A^{-1} = \frac{1}{\det(A)} \text{Adj}(A)$$
其中 \(\text{Adj}(A)\) 是伴随矩阵(adjugate matrix)(即余子式矩阵的转置)。

鼓励一下:虽然步骤很多(求 9 个子式,应用符号得到 9 个余子式,转置它们,最后除以行列式),但只要拆解开来,它本质上就是反复进行 \(2 \times 2\) 行列式的计算。保持整洁和有序!

2.5 乘积的行列式

关键结论(大纲要求):
矩阵乘积的行列式等于各矩阵行列式的乘积。这对于 \(2 \times 2\) 和 \(3 \times 3\) 矩阵均适用:
$$\det(AB) = \det(A) \det(B)$$

关键逆矩阵结论(大纲要求):
乘积的逆矩阵会反转顺序:
$$(AB)^{-1} = B^{-1} A^{-1}$$

第 2 节快速小结:行列式告诉你是否存在逆矩阵(如果 \(\det \neq 0\))。\(2 \times 2\) 和 \(3 \times 3\) 的方法不同,后者依赖于余子式。

第 3 节:矩阵与几何变换

矩阵是几何变换中处理点和形状的有力工具。如果一个点用列向量 \(\mathbf{x}\) 表示,那么变换后的点 \(\mathbf{x}'\) 由 \(\mathbf{x}' = M \mathbf{x}\) 给出,其中 \(M\) 是变换矩阵。

3.1 二维变换(\(2 \times 2\) 矩阵)

教学大纲涵盖了以原点为变换中心的标准变换。你应该熟悉以下变换的矩阵:

  • 旋转(绕原点旋转 \(\theta\) 角): $$R = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$
  • 反射(关于过原点的直线,例如 x 轴、y 轴或 \(y=x\))。
  • 拉伸(平行于 x 轴或 y 轴)。
  • 放缩/扩充(中心在原点,比例因子为 \(k\)): $$\begin{pmatrix} k & 0 \\ 0 & k \end{pmatrix}$$
  • 错切(Shear)(例如,平行于 x 轴): $$\begin{pmatrix} 1 & k \\ 0 & 1 \end{pmatrix}$$
    注意:你只需要能够识别平行于 x 轴或 y 轴的错切矩阵即可。如果不变直线不是轴线之一,题目会告诉你它是一个错切。
变换的复合

如果变换 \(T_1\)(矩阵 \(M_1\))后接着进行变换 \(T_2\)(矩阵 \(M_2\)),则复合变换 \(T\) 由矩阵 \(M = M_2 M_1\) 表示。

顺序很重要!就像函数复合一样,*先*执行的变换矩阵要放在向量的右侧。

行列式与面积比例因子(二维)

行列式的绝对值 \(|\det(M)|\) 给出了变换的面积比例因子
如果 \(\det(M)\) 为负,意味着变换包含反射(它改变了图形的方向)。

3.2 三维变换(\(3 \times 3\) 矩阵,FP2 水平)

在三维空间中,矩阵变换的是 \(\begin{pmatrix} x \\ y \\ z \end{pmatrix}\) 向量。

旋转

你只需要掌握绕坐标轴(x、y 或 z)的旋转。
你知道吗?这些矩阵在公式手册里都有,但理解它们的运作原理很有帮助。绕 x 轴旋转不会改变 \(x\),所以第一列/行看起来像 \(\begin{pmatrix} 1 & 0 & 0 \end{pmatrix}\)。

反射

你必须能够处理关于以下特定平面的反射(这些平面都经过原点):
\(x=0\)(即 \(yz\) 平面)、\(y=0\)、\(z=0\)。
以及坐标相等的平面:\(x=y\)、\(x=z\)、\(y=z\)。

示例:关于 \(xy\) 平面(\(z=0\))的反射。这会翻转 \(z\) 的符号,但保持 \(x\) 和 \(y\) 不变: $$M = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -1 \end{pmatrix}$$

行列式与体积比例因子(三维)

对于 \(3 \times 3\) 矩阵 \(M\),行列式的绝对值 \(|\det(M)|\) 给出了变换的体积比例因子

3.3 不变点与不变直线

不变点(Invariant Point)是指变换 \(M\) 后位置不发生改变的点。
如果 \(\mathbf{x}\) 是一个不变点,那么:
$$M\mathbf{x} = \mathbf{x}$$

这可以改写为:
$$M\mathbf{x} = I\mathbf{x}$$
$$(M - I)\mathbf{x} = \mathbf{0}$$

不变直线(Invariant Line)是指直线上的每一个点在变换后仍落在该直线上(直线上的点可能会移动,但直线本身保持在同一位置)。

感到困惑?想象一面镜子。镜子本身就是一个不变平面。如果你站在镜面上,你就会停留在镜面上(不变直线/平面)。如果你站在铰链线上,那就是一个不变点。

第 3 节快速小结:矩阵移动点!行列式是面积(二维)或体积(三维)的比例因子。记住组合顺序 \(M_2 M_1\)。不变点满足 \((M-I)\mathbf{x} = \mathbf{0}\)。

第 4 节:特征值与特征向量(FP2 水平)

这是矩阵代数中最抽象的概念,但它们在物理和计算等高级应用中非常有用。

4.1 定义与概念

当矩阵 \(M\) 变换向量 \(\mathbf{e}\) 时,变换后的向量 \(M\mathbf{e}\) 通常指向一个完全不同的方向。

然而,某些特殊的向量(称为特征向量/Eigenvectors)在变换中只会被缩放(拉伸或压缩)。它们的方向不会改变(或者方向变为相反,这相当于乘以负数比例)。

  • 特征向量 \(\mathbf{e}\) 是一个非零向量,满足当它乘以矩阵 \(M\) 时,结果是 \(\mathbf{e}\) 的标量倍。
  • 特征值(Eigenvalue) \(\lambda\)(lambda)是特征向量被缩放的标量因子。

这种关系总结为特征值方程
$$M\mathbf{e} = \lambda \mathbf{e}$$

大纲说明:本课程只涉及实特征值,尽管复特征值也是存在的。允许存在重复的特征值。

4.2 求特征值:特征方程

为了求特征值 \(\lambda\),我们必须重组特征值方程:

$$M\mathbf{e} = \lambda I \mathbf{e}$$ $$M\mathbf{e} - \lambda I \mathbf{e} = \mathbf{0}$$ $$(M - \lambda I)\mathbf{e} = \mathbf{0}$$

由于特征向量 \(\mathbf{e}\) 被定义为非零向量,该方程组仅当矩阵 \((M - \lambda I)\) 为奇异(singular)时才有非平凡解。

因此,特征值 \(\lambda\) 是特征方程(Characteristic Equation)的解:
$$\det(M - \lambda I) = 0$$

\(2 \times 2\) 或 \(3 \times 3\) 矩阵的计算步骤:

  1. 通过从 \(M\) 的主对角线上的每个元素中减去 \(\lambda\),构成矩阵 \((M - \lambda I)\)。
  2. 计算 \((M - \lambda I)\) 的行列式。
  3. 令行列式等于零:\(\det(M - \lambda I) = 0\)。
  4. 求解所得的多项式方程(\(2 \times 2\) 为二次方程,\(3 \times 3\) 为三次方程)以求出 \(\lambda\) 的值(特征值)。

4.3 求特征向量

一旦找到特征值 \(\lambda\),就可以通过将 \(\lambda\) 代入方程来求对应的特征向量 \(\mathbf{e}\):
$$(M - \lambda I)\mathbf{e} = \mathbf{0}$$

这会导出一个线性方程组。因为 \(\det(M - \lambda I) = 0\),这些方程将是线性相关的,这意味着你会找到一整条向量线(特征向量可以乘以任何常数进行缩放)。通常,我们取特征向量的最简整数形式。

常见错误:误将 \(\mathbf{e} = \mathbf{0}\) 设为解。记住,特征向量必须是非零的

第 4 节快速小结:特征向量是矩阵缩放的特殊方向,缩放比例由特征值 \(\lambda\) 决定。首先使用特征方程 \(\det(M - \lambda I) = 0\) 求出 \(\lambda\)。