歡迎來到矩陣代數(Matrix Algebra)學習指南!

哈囉!既然你已經讀到這一章,代表你正式踏入了進階數學(Further Mathematics)中最有力且最令人興奮的領域之一。別擔心矩陣一開始看起來會很怪——它們其實只是一種整齊、有條理的方式,讓我們能同時處理大量的數字與方程式。

矩陣讓我們能夠執行複雜的變換(例如在二維和三維空間中旋轉圖形),並高效率地求解大型線性方程組。本章結束時,你將會精通矩陣運算、行列式(determinants)、逆矩陣(inverses),以及特徵向量(eigenvectors)與特徵值(eigenvalues)這些至關重要的概念。

什麼是矩陣?

想像矩陣是一個矩形的數字陣列(可以把它當成高階版的試算表!),由行(row)與列(column)排列而成。

  • 矩陣的階數(order)是由其行數和列數定義的,記作 \(m \times n\)。

第一節:矩陣代數基礎(FPP1.1 複習)

1.1 基本運算

加法與減法

只有在兩個矩陣的階數完全相同時,你才能進行加法或減法。你只需要將對應位置的元素相加或相減即可。

例子:
若 \(A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\) 且 \(B = \begin{pmatrix} 5 & 0 \\ -1 & 2 \end{pmatrix}\),則 \(A+B = \begin{pmatrix} 1+5 & 2+0 \\ 3+(-1) & 4+2 \end{pmatrix} = \begin{pmatrix} 6 & 2 \\ 2 & 6 \end{pmatrix}\)。

純量乘法(Scalar Multiplication)

純量(scalar)只是一個普通的數。要將矩陣乘以一個純量,你只需要將矩陣中的每一個元素都乘以該數。

矩陣乘法(最高至 \(3 \times 3\))

這通常是第一個主要的挑戰,但只要多加練習,它其實非常直接!

規則檢查:若要將矩陣 \(A\)(階數 \(m \times n\))乘以矩陣 \(B\)(階數 \(p \times q\)),\(A\) 的列數必須等於 \(B\) 的行數,即 \(n = p\)。
乘積矩陣 \(AB\) 的階數將會是 \(m \times q\)。

運算過程:「行乘列」(Row by Column)
乘積 \(AB\) 中第 \(i\) 行、第 \(j\) 列的元素,是透過將 \(A\) 的第 \(i\) 行元素與 \(B\) 的第 \(j\) 列對應元素相乘,最後將結果相加而得到的。

類比:想像你在第一個矩陣的行上滑動,去乘第二個矩陣的列。每一對對應到的數字相乘,然後把乘積加起來。

重要概念:非交換性(Non-Commutativity)
與一般數字 \(xy = yx\) 不同,對於矩陣而言,矩陣乘法通常不具交換性
\(\mathbf{AB \neq BA}\)(即使兩者皆存在)。

常見錯誤:假設 \(AB\) 和 \(BA\) 是一樣的。務必檢查要求的順序!

1.2 單位矩陣(Identity Matrix)與轉置矩陣(Transpose Matrix)

單位矩陣 \(I\)

單位矩陣(Identity Matrix)記作 \(I\),相當於數字裡的 1。當你將任何矩陣 \(A\) 乘以單位矩陣 \(I\) 時,你會得到 \(A\) 本身。

\(AI = IA = A\)

它是一個方陣(行數=列數),主對角線(從左上到右下)全是 1,其餘位置全是 0。

\(2 \times 2\) 單位矩陣:\(I = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\)
\(3 \times 3\) 單位矩陣:\(I = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}\)

轉置矩陣 \(A^T\)

矩陣 \(A\) 的轉置(Transpose)記作 \(A^T\),是將行與列互換而得到的。

例子:若 \(A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}\),則 \(A^T = \begin{pmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{pmatrix}\)。

關鍵轉置性質(課程大綱要求):
乘積的轉置會反轉順序:
\((AB)^T = B^T A^T\)

第一節重點回顧:熟練「行乘列」的乘法,並記住矩陣通常不可交換。單位矩陣是你的好朋友,轉置則會反轉乘法順序。

第二節:行列式與逆矩陣

行列式(Determinant)是從方陣計算出的一個單一數字。它提供了關於矩陣的關鍵資訊,特別是該矩陣是否存在逆矩陣。

2.1 \(2 \times 2\) 矩陣的行列式

對於矩陣 \(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\),其行列式 \(\det(A)\) 或 \(|A|\) 為:
$$\det(A) = ad - bc$$

記憶小撇步:將主對角線的元素(\(a\) 和 \(d\))相乘,然後減去另一條對角線(\(b\) 和 \(c\))的乘積。

2.2 \(2 \times 2\) 矩陣的逆矩陣

逆矩陣(Inverse Matrix)\(A^{-1}\) 是滿足 \(A A^{-1} = A^{-1} A = I\) 的矩陣。

\(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\) 的逆矩陣公式為:
$$A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}$$

\(2 \times 2\) 逆矩陣計算步驟:

  1. 計算行列式 \(\det(A) = ad - bc\)。
  2. 交換 \(a\) 和 \(d\)。
  3. 改變 \(b\) 和 \(c\) 的符號。
  4. 將所得矩陣乘以 \(\frac{1}{\det(A)}\)。
非奇異矩陣與奇異矩陣

若 \(\det(A) \neq 0\),矩陣 \(A\) 為非奇異矩陣(non-singular)。非奇異矩陣存在逆矩陣 \(A^{-1}\)。

若 \(\det(A) = 0\),矩陣 \(A\) 為奇異矩陣(singular)。由於 \(\frac{1}{0}\) 沒有意義,這意味著該矩陣不存在逆矩陣

2.3 \(3 \times 3\) 矩陣的行列式(FP2 水平)

計算 \(3 \times 3\) 矩陣的行列式需要使用餘因子展開(cofactor expansion)的方法。
對於 \(A = \begin{pmatrix} a & b & c \\ d & e & f \\ g & h & i \end{pmatrix}\),你可以沿著任何行或列展開。通常使用第一行:

$$\det(A) = a \begin{vmatrix} e & f \\ h & i \end{vmatrix} - b \begin{vmatrix} d & f \\ g & i \end{vmatrix} + c \begin{vmatrix} d & e \\ g & h \end{vmatrix}$$

步驟:餘因子展開

  1. 選擇一行或一列(如果該行或列有零,計算會更輕鬆!)。
  2. 使用交替的符號模式(稱為餘因子符號):
    \(\begin{pmatrix} + & - & + \\ - & + & - \\ + & - & + \end{pmatrix}\)
  3. 對於第一個元素,將其乘以該元素所處的行與列劃掉後剩下的 \(2 \times 2\) 矩陣之行列式(這稱為子式/餘子式,minor)。
  4. 對第二和第三個元素重複此步驟,記得應用符號模式中的正確符號。
  5. 將結果相加。

2.4 \(3 \times 3\) 矩陣的逆矩陣(FP2 水平)

求 \(3 \times 3\) 矩陣的逆矩陣很繁瑣,但過程遵循定義:
$$A^{-1} = \frac{1}{\det(A)} \text{Adj}(A)$$
其中 \(\text{Adj}(A)\) 是伴隨矩陣(adjugate matrix)(即餘因子矩陣的轉置)。

鼓勵一下:雖然步驟很多(需計算 9 個子式、加上符號得到 9 個餘因子、進行轉置,最後除以行列式),但只要拆解開來,其實就是重複計算 \(2 \times 2\) 行列式。保持整潔有序就沒問題!

2.5 乘積的行列式

關鍵性質(課程大綱要求):
矩陣乘積的行列式等於其各自行列式的乘積。這對於 \(2 \times 2\) 和 \(3 \times 3\) 矩陣皆成立:
$$\det(AB) = \det(A) \det(B)$$

關鍵逆矩陣性質(課程大綱要求):
乘積的逆矩陣會反轉順序:
$$(AB)^{-1} = B^{-1} A^{-1}$$

第二節重點回顧:行列式能告訴你逆矩陣是否存在(只要 \(\det \neq 0\))。\(2 \times 2\) 和 \(3 \times 3\) 的方法不同,後者依賴於餘因子。

第三節:矩陣與幾何變換

矩陣是幾何中變換點與圖形的強大工具。若點以列向量 \(\mathbf{x}\) 表示,則變換後的點 \(\mathbf{x}'\) 可由 \(\mathbf{x}' = M \mathbf{x}\) 求得,其中 \(M\) 為變換矩陣。

3.1 二維變換(\(2 \times 2\) 矩陣)

課程大綱涵蓋以原點為變換中心的標準變換。你應該熟悉以下矩陣:

  • 旋轉(Rotation)(繞原點旋轉 \(\theta\) 角): $$R = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$
  • 反射(Reflection)(沿著過原點的線,例如 x 軸、y 軸或 \(y=x\))。
  • 拉伸(Stretch)(平行於 x 軸或 y 軸)。
  • 放大(Enlargement)(中心在原點,比例因子 \(k\)): $$\begin{pmatrix} k & 0 \\ 0 & k \end{pmatrix}$$
  • 錯切(Shear)(例如平行於 x 軸): $$\begin{pmatrix} 1 & k \\ 0 & 1 \end{pmatrix}$$
    注意:你只需要能夠辨識平行於 x 或 y 軸的錯切矩陣。如果恆定直線(invariant line)不是軸線,題目會告知這是錯切變換。
變換的組合

若變換 \(T_1\)(矩陣 \(M_1\))之後接著進行變換 \(T_2\)(矩陣 \(M_2\)),則組合後的變換 \(T\) 可由矩陣 \(M = M_2 M_1\) 表示。

順序很重要!就像函數的複合一樣,*先*應用的矩陣要放在靠近向量的右側。

行列式與面積比例因子(二維)

行列式的絕對值 \(|\det(M)|\) 給出了變換的面積比例因子(area scale factor)
若 \(\det(M)\) 為負,意味著變換包含反射(它反轉了方向)。

3.2 三維變換(\(3 \times 3\) 矩陣,FP2 水平)

在三維空間中,矩陣變換的是 \(\begin{pmatrix} x \\ y \\ z \end{pmatrix}\) 向量。

旋轉

你只需要了解繞坐標軸(x、y 或 z)的旋轉。
你知道嗎?這些矩陣會提供在公式手冊中,但理解其運作原理很有幫助。繞 x 軸旋轉會使 \(x\) 不變,因此第一行/列看起來像 \(\begin{pmatrix} 1 & 0 & 0 \end{pmatrix}\)。

反射

你必須能夠處理在下列特定平面(皆過原點)的反射:
\(x=0\) (\(yz\)-平面)、\(y=0\)、\(z=0\)。
以及坐標相等平面:\(x=y\)、\(x=z\)、\(y=z\)。

例子:沿 \(xy\)-平面 (\(z=0\)) 反射。這會改變 \(z\) 的符號,但保持 \(x\) 和 \(y\) 不變: $$M = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -1 \end{pmatrix}$$

行列式與體積比例因子(三維)

對於 \(3 \times 3\) 矩陣 \(M\),行列式的絕對值 \(|\det(M)|\) 給出了變換的體積比例因子(volume scale factor)

3.3 恆定點(Invariant Points)與恆定直線(Invariant Lines)

恆定點(Invariant Point)是指變換 \(M\) 後位置不變的點。
若 \(\mathbf{x}\) 為恆定點,則:
$$M\mathbf{x} = \mathbf{x}$$

這可以改寫為:
$$M\mathbf{x} = I\mathbf{x}$$
$$(M - I)\mathbf{x} = \mathbf{0}$$

恆定直線(Invariant Line)是指線上的每一個點在變換後仍落在同一條直線上(直線上的點可能移動,但整條線維持原位)。

覺得困難嗎?想像一面鏡子。鏡子本身就是一個恆定平面。如果你正好站在鏡子上,你就會留在鏡子上(恆定線/平面)。如果你站在鉸鏈線上,那就是恆定點。

第三節重點回顧:矩陣能移動點!行列式是面積(二維)或體積(三維)的比例因子。記住組合順序 \(M_2 M_1\)。恆定點滿足 \((M-I)\mathbf{x} = \mathbf{0}\)。

第四節:特徵值與特徵向量(FP2 水平)

這是矩陣代數中最抽象的概念,但它們在物理和計算等進階應用中非常有用。

4.1 定義與概念

當矩陣 \(M\) 變換一個向量 \(\mathbf{e}\) 時,變換後的向量 \(M\mathbf{e}\) 通常會指向一個完全不同的方向。

然而,某些特殊的向量(稱為特徵向量,Eigenvectors)在變換下僅會被縮放(伸展或壓縮),它們不會改變方向(或者變為相反方向,即乘以一個負的比例因子)。

  • 特徵向量(Eigenvector)\(\mathbf{e}\) 是一個非零向量,使得當乘以矩陣 \(M\) 時,結果是 \(\mathbf{e}\) 的純量倍數。
  • 特徵值(Eigenvalue),即 \(\lambda\)(lambda),是特徵向量被縮放的純量因子。

此關係總結為特徵值方程式
$$M\mathbf{e} = \lambda \mathbf{e}$$

課程說明:在本課程中,你只會處理實數特徵值,儘管也存在複數特徵值。重複的特徵值是允許的。

4.2 尋找特徵值:特徵方程式(Characteristic Equation)

為了求出特徵值 \(\lambda\),我們必須整理特徵值方程式:

$$M\mathbf{e} = \lambda I \mathbf{e}$$ $$M\mathbf{e} - \lambda I \mathbf{e} = \mathbf{0}$$ $$(M - \lambda I)\mathbf{e} = \mathbf{0}$$

由於 \(\mathbf{e}\)(特徵向量)定義為非零向量,這個方程組只有在矩陣 \((M - \lambda I)\) 為奇異矩陣時,才有非平凡解(non-trivial solution)。

因此,特徵值 \(\lambda\) 是特徵方程式的解:
$$\det(M - \lambda I) = 0$$

\(2 \times 2\) 或 \(3 \times 3\) 矩陣計算步驟:

  1. 透過從 \(M\) 的主對角線元素減去 \(\lambda\),形成矩陣 \((M - \lambda I)\)。
  2. 計算 \((M - \lambda I)\) 的行列式。
  3. 將行列式設為零:\(\det(M - \lambda I) = 0\)。
  4. 解出多項式(\(2 \times 2\) 為二次方程,\(3 \times 3\) 為三次方程)以求出 \(\lambda\) 的值。

4.3 尋找特徵向量

一旦求得特徵值 \(\lambda\),你就可以將 \(\lambda\) 代回以下方程式來求得對應的特徵向量 \(\mathbf{e}\):
$$(M - \lambda I)\mathbf{e} = \mathbf{0}$$

這會得到一組線性方程組。由於 \(\det(M - \lambda I) = 0\),這些方程式會線性相關,意味著你會找到一整條可能的向量(特徵向量可以乘以任何常數)。你通常可以選擇最簡單的整數形式作為特徵向量。

常見錯誤:不小心將 \(\mathbf{e} = \mathbf{0}\)。記住,特徵向量必須是非零的

第四節重點回顧:特徵向量是那些僅被特徵值 \(\lambda\) 縮放的特殊方向。先利用特徵方程式 \(\det(M - \lambda I) = 0\) 求出 \(\lambda\)。