Further Pure Mathematics 1 (Paper 1) - 第 1.4 章:矩阵

你好!欢迎来到矩阵的世界!如果这些矩形数字阵列起初让你感到有些望而生畏,别担心。矩阵是数学中最强大的工具之一,从计算机图形学(3D 物体变换)到处理海量数据集以及求解复杂的方程组,它们无处不在。

在本章中,我们将建立在基础矩阵知识之上,深入掌握高级运算,理解它们与二维几何空间的联系,并攻克逆矩阵和不变直线等概念。让我们开始吧!


1. 矩阵运算与术语

1.1 理解矩阵的阶与特殊矩阵

矩阵由其维度(即)定义,表示为(行数)\( \times \)(列数)。本大纲主要关注最高为 \( 3 \times 3 \) 的矩阵。

  • 示例: 矩阵 \( A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix} \) 的阶为 \( 2 \times 3 \)。

关键术语:

  • 方阵 (Square Matrix):行数与列数相等的矩阵(例如 \( 2 \times 2 \) 或 \( 3 \times 3 \))。
  • 零矩阵 (Zero Matrix, O):仅包含零的矩阵。在加法或乘法(如果兼容)中,它的行为就像数字 0。
  • 单位矩阵 (Identity Matrix, I):主对角线上元素为 1,其余元素全为 0 的方阵。当任何矩阵 \( M \) 乘以 \( I \) 时,结果仍为 \( M \):\( MI = IM = M \)。
    示例: $$ I_2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}, \quad I_3 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix} $$

1.2 加法、减法与标量乘法

这些运算非常直观:

  1. 加法和减法:只有当矩阵的阶完全相同时,才能进行加减法。只需对对应元素进行加减即可。
  2. 标量乘法:将矩阵中的每个元素乘以标量常量。

快速回顾:这些都是逐元素运算。如果矩阵阶数不匹配,则无法进行加减法运算。

1.3 矩阵乘法

矩阵乘法虽然最棘手,但至关重要!

兼容性法则:

矩阵 \( A \)(阶为 \( m \times n \))与矩阵 \( B \)(阶为 \( p \times q \))相乘,仅当 \( n = p \) 时成立。所得矩阵 \( AB \) 的阶为 \( m \times q \)。

分步乘法(行乘列):

要计算积 \( AB \) 中第 \( i \) 行第 \( j \) 列的元素,将 \( A \) 的第 \( i \) 行的元素与 \( B \) 的第 \( j \) 列的对应元素相乘并求和。

必须记住的关键点:

矩阵乘法通常不满足交换律。在绝大多数情况下,\( AB \neq BA \)。乘法的顺序至关重要,在处理几何变换时更是如此!

运算小结:先检查阶数!对于乘法,记住“内部数字必须匹配”的原则,并且顺序决定一切。


2. 行列式与逆矩阵

行列式是一个仅与方阵相关的标量值。它提供了关于矩阵是否存在逆矩阵以及矩阵如何缩放几何变换中面积的关键信息。

2.1 二阶矩阵的行列式

对于一般 \( 2 \times 2 \) 矩阵 \( M = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \): $$ \text{det } M = ad - bc $$

记忆技巧:将主对角线(从左上到右下)的元素相乘,减去另一条对角线元素的乘积。

2.2 三阶矩阵的行列式

对于 \( 3 \times 3 \) 矩阵,行列式通过称为余子式展开 (Cofactor Expansion) 的过程计算。
对于 \( M = \begin{pmatrix} a & b & c \\ d & e & f \\ g & h & i \end{pmatrix} \),沿第一行展开(这是最常用的方法): $$ \text{det } M = a(ei - fh) - b(di - fg) + c(dh - eg) $$
如果看起来很长,别担心!记住这个模式:

  • 从第一个元素 \( a \) 开始,将其乘以划掉 \( a \) 所在行和列后剩余的 \( 2 \times 2 \) 矩阵的行列式。
  • 减去第二个元素 \( b \),乘以其对应的 \( 2 \times 2 \) 行列式。
  • 加上第三个元素 \( c \),乘以其对应的 \( 2 \times 2 \) 行列式。

2.3 奇异矩阵与非奇异矩阵

根据行列式的值,方阵 \( M \) 可分类为:

  • 非奇异矩阵 (Non-Singular Matrix):若 \( \text{det } M \neq 0 \)。这些矩阵存在逆矩阵 \( M^{-1} \)。
  • 奇异矩阵 (Singular Matrix):若 \( \text{det } M = 0 \)。这些矩阵不存在逆矩阵。在几何上,它们会将面积(或体积)映射为零,这意味着信息丢失。

2.4 求逆矩阵 (\( M^{-1} \))

逆矩阵 \( M^{-1} \) 可以“抵消” \( M \) 的效果,使得 \( M M^{-1} = M^{-1} M = I \)。

二阶矩阵的逆矩阵:

对于 \( M = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \),前提是 \( \text{det } M \neq 0 \): $$ M^{-1} = \frac{1}{\text{det } M} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix} $$

简单技巧:交换 \( a \) 和 \( d \),给 \( b \) 和 \( c \) 变号,然后将得到的矩阵除以行列式。

三阶矩阵的逆矩阵:

求 \( 3 \times 3 \) 矩阵的逆矩阵涉及计算代数余子式矩阵,对其进行转置(得到伴随矩阵),然后除以行列式。这是一个多步过程: $$ M^{-1} = \frac{1}{\text{det } M} (\text{Adj } M) $$

逆矩阵乘积法则:

对于两个非奇异矩阵 \( A \) 和 \( B \): $$ (AB)^{-1} = B^{-1}A^{-1} $$

类比:想想几何变换。如果你先穿上袜子 (\( B \)) 再穿上鞋子 (\( A \)),要撤销这个过程,你必须先脱掉鞋子 (\( A^{-1} \)) 再脱掉袜子 (\( B^{-1} \))。必须反向进行!

行列式与逆矩阵小结:如果行列式为 0,停止计算!不存在逆矩阵。逆矩阵法则 \((AB)^{-1} = B^{-1}A^{-1}\) 对于解决复合变换问题至关重要。


3. 矩阵与几何变换(二维)

\( 2 \times 2 \) 矩阵 \( M \) 将位置向量 \( \begin{pmatrix} x \\ y \end{pmatrix} \) 通过方程 \( M \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} x' \\ y' \end{pmatrix} \) 变换为新的位置向量 \( \begin{pmatrix} x' \\ y' \end{pmatrix} \)。

3.1 理解基础变换

你需要能够识别并应用标准二维变换的矩阵:

  • 旋转 (Rotation):旋转由角度 \( \theta \) 定义(正角为逆时针)。绕原点旋转 \( \theta \) 角的矩阵为: $$ R = \begin{pmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{pmatrix} $$
  • 反射 (Reflection):沿某条直线(通常经过原点)的镜像变换。
  • 缩放 (Enlargement/Scaling):以原点为中心,比例因子为 \( k \) 的缩放矩阵为: $$ E = \begin{pmatrix} k & 0 \\ 0 & k \end{pmatrix} $$
  • 拉伸 (Stretch):平行于坐标轴的拉伸。示例:平行于 x 轴,拉伸因子为 \( k \) 的矩阵: \( \begin{pmatrix} k & 0 \\ 0 & 1 \end{pmatrix} \)。
  • 错切 (Shear):一种将点沿固定直线(不变线)平行移动的变换,位移量与点到该直线的距离成正比。示例:平行于 x 轴的错切: \( \begin{pmatrix} 1 & k \\ 0 & 1 \end{pmatrix} \)。

3.2 变换的复合

若变换 \( T_1 \) 由矩阵 \( M_1 \) 表示,变换 \( T_2 \) 由矩阵 \( M_2 \) 表示,且点 \( P \) 先经过 \( T_1 \) 变换,再经过 \( T_2 \) 变换:

最终变换矩阵 \( M \) 为积 \( M_2 M_1 \)。

记住顺序!
要找到最终矩阵,需按变换发生的顺序“从右向左”书写矩阵(最左边的矩阵是最后施加的变换)。

3.3 逆变换

如果矩阵 \( A \) 代表一种变换,那么逆矩阵 \( A^{-1} \) 代表逆变换,它将图像映射回原始物体。

  • 示例: 如果 \( A \) 是顺时针旋转 \( 30^\circ \),则 \( A^{-1} \) 是逆时针旋转 \( 30^\circ \)。

3.4 面积比例因子

当一个区域通过矩阵 \( M \) 变换时,图像面积与原始区域面积的关系由 \( M \) 的行列式决定。

$$ \text{面积比例因子} = |\text{det } M| $$

我们使用行列式的绝对值,因为面积总是正数。负的行列式仅意味着发生了反射(改变了方向)。

变换小结:变换矩阵施加方式为 \( M \mathbf{x} \)。在 \( T_2 \) 接着 \( T_1 \) 的序列中,组合矩阵为 \( T_1 T_2 \)。行列式的绝对值即为面积比例因子。


4. 不变点与不变直线

对不变特征的理解常出现在考题中,需要构建并求解特定的矩阵方程。

4.1 不变点 (Invariant Points)

不变点是指在经过矩阵 \( M \) 变换后保持位置不变(不动)的点 \( P \)。

若 \( P = \begin{pmatrix} x \\ y \end{pmatrix} \) 是不变点,则: $$ M P = P $$

这可以使用单位矩阵 \( I \) 重写为: $$ M P - I P = \mathbf{0} \quad \Rightarrow \quad (M - I) P = \mathbf{0} $$

通过求解此齐次线性方程组得到 \( x \) 和 \( y \)。

  • 常见情况: 对于以原点为中心的缩放,唯一的不变点就是原点本身 \((0, 0)\)。

4.2 经过原点的不变直线 (\( y = mx \))

不变直线是指虽然直线上的点可能移动,但整条直线被映射回其自身。

对于经过原点的直线 \( y = mx \),我们将一般点 \( \begin{pmatrix} x \\ mx \end{pmatrix} \) 代入变换矩阵 \( M \)。

设 \( M = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \)。如果直线是不变的,则变换后的点 \( M \begin{pmatrix} x \\ mx \end{pmatrix} \) 也必须落在直线 \( y = mx \) 上。

变换后的点 \( \begin{pmatrix} x' \\ y' \end{pmatrix} \) 为: $$ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \begin{pmatrix} x \\ mx \end{pmatrix} = \begin{pmatrix} ax + bmx \\ cx + dmx \end{pmatrix} $$

因为这个新点必须满足斜率条件 \( y' = m x' \): $$ cx + dmx = m(ax + bmx) $$

由于这必须对任何 \( x \neq 0 \) 成立,我们可以除以 \( x \) 并求解不变斜率 \( m \): $$ c + dm = ma + bm^2 $$ $$ bm^2 + (a - d)m - c = 0 $$

求解该二次方程即可得到经过原点的不变直线的斜率 \( m \)。

4.3 不变直线(不一定经过原点)

如果题目要求所有不变直线(包括不经过原点的直线,\( y = mx + c \)),必须遵循类似的原则:将一般点 \( \begin{pmatrix} x \\ mx + c \end{pmatrix} \) 代入矩阵 \( M \),并确保变换后的坐标 \( x' \) 和 \( y' \) 满足原直线方程 \( y' = m x' + c \)。

避免常见的错误:

不要混淆不变点和不变直线。点保持不变意味着 \( P' = P \)。直线保持不变意味着 \( P' \) 仍在直线上,但 \( P' \) 不一定等于 \( P \)。

不变特征小结:不变点求解 \((M - I)P = \mathbf{0}\)。经过原点的不变直线则通过确保变换后的点维持斜率 \( m \) 而得到的二次方程来求解。