歡迎來到矩陣代數(Matrix Algebra)學習指南!
哈囉!既然你已經讀到這一章,代表你正式踏入了進階數學(Further Mathematics)中最有力且最令人興奮的領域之一。別擔心矩陣一開始看起來會很怪——它們其實只是一種整齊、有條理的方式,讓我們能同時處理大量的數字與方程式。
矩陣讓我們能夠執行複雜的變換(例如在二維和三維空間中旋轉圖形),並高效率地求解大型線性方程組。本章結束時,你將會精通矩陣運算、行列式(determinants)、逆矩陣(inverses),以及特徵向量(eigenvectors)與特徵值(eigenvalues)這些至關重要的概念。
什麼是矩陣?
想像矩陣是一個矩形的數字陣列(可以把它當成高階版的試算表!),由行(row)與列(column)排列而成。
- 矩陣的階數(order)是由其行數和列數定義的,記作 \(m \times n\)。
第一節:矩陣代數基礎(FPP1.1 複習)
1.1 基本運算
加法與減法
只有在兩個矩陣的階數完全相同時,你才能進行加法或減法。你只需要將對應位置的元素相加或相減即可。
例子:
若 \(A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\) 且 \(B = \begin{pmatrix} 5 & 0 \\ -1 & 2 \end{pmatrix}\),則 \(A+B = \begin{pmatrix} 1+5 & 2+0 \\ 3+(-1) & 4+2 \end{pmatrix} = \begin{pmatrix} 6 & 2 \\ 2 & 6 \end{pmatrix}\)。
純量乘法(Scalar Multiplication)
純量(scalar)只是一個普通的數。要將矩陣乘以一個純量,你只需要將矩陣中的每一個元素都乘以該數。
矩陣乘法(最高至 \(3 \times 3\))
這通常是第一個主要的挑戰,但只要多加練習,它其實非常直接!
規則檢查:若要將矩陣 \(A\)(階數 \(m \times n\))乘以矩陣 \(B\)(階數 \(p \times q\)),\(A\) 的列數必須等於 \(B\) 的行數,即 \(n = p\)。
乘積矩陣 \(AB\) 的階數將會是 \(m \times q\)。
運算過程:「行乘列」(Row by Column)
乘積 \(AB\) 中第 \(i\) 行、第 \(j\) 列的元素,是透過將 \(A\) 的第 \(i\) 行元素與 \(B\) 的第 \(j\) 列對應元素相乘,最後將結果相加而得到的。
類比:想像你在第一個矩陣的行上滑動,去乘第二個矩陣的列。每一對對應到的數字相乘,然後把乘積加起來。
重要概念:非交換性(Non-Commutativity)
與一般數字 \(xy = yx\) 不同,對於矩陣而言,矩陣乘法通常不具交換性。
\(\mathbf{AB \neq BA}\)(即使兩者皆存在)。
常見錯誤:假設 \(AB\) 和 \(BA\) 是一樣的。務必檢查要求的順序!
1.2 單位矩陣(Identity Matrix)與轉置矩陣(Transpose Matrix)
單位矩陣 \(I\)
單位矩陣(Identity Matrix)記作 \(I\),相當於數字裡的 1。當你將任何矩陣 \(A\) 乘以單位矩陣 \(I\) 時,你會得到 \(A\) 本身。
\(AI = IA = A\)
它是一個方陣(行數=列數),主對角線(從左上到右下)全是 1,其餘位置全是 0。
\(2 \times 2\) 單位矩陣:\(I = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\)
\(3 \times 3\) 單位矩陣:\(I = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}\)
轉置矩陣 \(A^T\)
矩陣 \(A\) 的轉置(Transpose)記作 \(A^T\),是將行與列互換而得到的。
例子:若 \(A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}\),則 \(A^T = \begin{pmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{pmatrix}\)。
關鍵轉置性質(課程大綱要求):
乘積的轉置會反轉順序:
\((AB)^T = B^T A^T\)
第一節重點回顧:熟練「行乘列」的乘法,並記住矩陣通常不可交換。單位矩陣是你的好朋友,轉置則會反轉乘法順序。
第二節:行列式與逆矩陣
行列式(Determinant)是從方陣計算出的一個單一數字。它提供了關於矩陣的關鍵資訊,特別是該矩陣是否存在逆矩陣。
2.1 \(2 \times 2\) 矩陣的行列式
對於矩陣 \(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\),其行列式 \(\det(A)\) 或 \(|A|\) 為:
$$\det(A) = ad - bc$$
記憶小撇步:將主對角線的元素(\(a\) 和 \(d\))相乘,然後減去另一條對角線(\(b\) 和 \(c\))的乘積。
2.2 \(2 \times 2\) 矩陣的逆矩陣
逆矩陣(Inverse Matrix)\(A^{-1}\) 是滿足 \(A A^{-1} = A^{-1} A = I\) 的矩陣。
\(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\) 的逆矩陣公式為:
$$A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}$$
\(2 \times 2\) 逆矩陣計算步驟:
- 計算行列式 \(\det(A) = ad - bc\)。
- 交換 \(a\) 和 \(d\)。
- 改變 \(b\) 和 \(c\) 的符號。
- 將所得矩陣乘以 \(\frac{1}{\det(A)}\)。
非奇異矩陣與奇異矩陣
若 \(\det(A) \neq 0\),矩陣 \(A\) 為非奇異矩陣(non-singular)。非奇異矩陣存在逆矩陣 \(A^{-1}\)。
若 \(\det(A) = 0\),矩陣 \(A\) 為奇異矩陣(singular)。由於 \(\frac{1}{0}\) 沒有意義,這意味著該矩陣不存在逆矩陣。
2.3 \(3 \times 3\) 矩陣的行列式(FP2 水平)
計算 \(3 \times 3\) 矩陣的行列式需要使用餘因子展開(cofactor expansion)的方法。
對於 \(A = \begin{pmatrix} a & b & c \\ d & e & f \\ g & h & i \end{pmatrix}\),你可以沿著任何行或列展開。通常使用第一行:
步驟:餘因子展開
- 選擇一行或一列(如果該行或列有零,計算會更輕鬆!)。
- 使用交替的符號模式(稱為餘因子符號):
\(\begin{pmatrix} + & - & + \\ - & + & - \\ + & - & + \end{pmatrix}\) - 對於第一個元素,將其乘以該元素所處的行與列劃掉後剩下的 \(2 \times 2\) 矩陣之行列式(這稱為子式/餘子式,minor)。
- 對第二和第三個元素重複此步驟,記得應用符號模式中的正確符號。
- 將結果相加。
2.4 \(3 \times 3\) 矩陣的逆矩陣(FP2 水平)
求 \(3 \times 3\) 矩陣的逆矩陣很繁瑣,但過程遵循定義:
$$A^{-1} = \frac{1}{\det(A)} \text{Adj}(A)$$
其中 \(\text{Adj}(A)\) 是伴隨矩陣(adjugate matrix)(即餘因子矩陣的轉置)。
鼓勵一下:雖然步驟很多(需計算 9 個子式、加上符號得到 9 個餘因子、進行轉置,最後除以行列式),但只要拆解開來,其實就是重複計算 \(2 \times 2\) 行列式。保持整潔有序就沒問題!
2.5 乘積的行列式
關鍵性質(課程大綱要求):
矩陣乘積的行列式等於其各自行列式的乘積。這對於 \(2 \times 2\) 和 \(3 \times 3\) 矩陣皆成立:
$$\det(AB) = \det(A) \det(B)$$
關鍵逆矩陣性質(課程大綱要求):
乘積的逆矩陣會反轉順序:
$$(AB)^{-1} = B^{-1} A^{-1}$$
第二節重點回顧:行列式能告訴你逆矩陣是否存在(只要 \(\det \neq 0\))。\(2 \times 2\) 和 \(3 \times 3\) 的方法不同,後者依賴於餘因子。
第三節:矩陣與幾何變換
矩陣是幾何中變換點與圖形的強大工具。若點以列向量 \(\mathbf{x}\) 表示,則變換後的點 \(\mathbf{x}'\) 可由 \(\mathbf{x}' = M \mathbf{x}\) 求得,其中 \(M\) 為變換矩陣。
3.1 二維變換(\(2 \times 2\) 矩陣)
課程大綱涵蓋以原點為變換中心的標準變換。你應該熟悉以下矩陣:
- 旋轉(Rotation)(繞原點旋轉 \(\theta\) 角): $$R = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$
- 反射(Reflection)(沿著過原點的線,例如 x 軸、y 軸或 \(y=x\))。
- 拉伸(Stretch)(平行於 x 軸或 y 軸)。
- 放大(Enlargement)(中心在原點,比例因子 \(k\)): $$\begin{pmatrix} k & 0 \\ 0 & k \end{pmatrix}$$
-
錯切(Shear)(例如平行於 x 軸):
$$\begin{pmatrix} 1 & k \\ 0 & 1 \end{pmatrix}$$
注意:你只需要能夠辨識平行於 x 或 y 軸的錯切矩陣。如果恆定直線(invariant line)不是軸線,題目會告知這是錯切變換。
變換的組合
若變換 \(T_1\)(矩陣 \(M_1\))之後接著進行變換 \(T_2\)(矩陣 \(M_2\)),則組合後的變換 \(T\) 可由矩陣 \(M = M_2 M_1\) 表示。
順序很重要!就像函數的複合一樣,*先*應用的矩陣要放在靠近向量的右側。
行列式與面積比例因子(二維)
行列式的絕對值 \(|\det(M)|\) 給出了變換的面積比例因子(area scale factor)。
若 \(\det(M)\) 為負,意味著變換包含反射(它反轉了方向)。
3.2 三維變換(\(3 \times 3\) 矩陣,FP2 水平)
在三維空間中,矩陣變換的是 \(\begin{pmatrix} x \\ y \\ z \end{pmatrix}\) 向量。
旋轉
你只需要了解繞坐標軸(x、y 或 z)的旋轉。
你知道嗎?這些矩陣會提供在公式手冊中,但理解其運作原理很有幫助。繞 x 軸旋轉會使 \(x\) 不變,因此第一行/列看起來像 \(\begin{pmatrix} 1 & 0 & 0 \end{pmatrix}\)。
反射
你必須能夠處理在下列特定平面(皆過原點)的反射:
\(x=0\) (\(yz\)-平面)、\(y=0\)、\(z=0\)。
以及坐標相等平面:\(x=y\)、\(x=z\)、\(y=z\)。
例子:沿 \(xy\)-平面 (\(z=0\)) 反射。這會改變 \(z\) 的符號,但保持 \(x\) 和 \(y\) 不變: $$M = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -1 \end{pmatrix}$$
行列式與體積比例因子(三維)
對於 \(3 \times 3\) 矩陣 \(M\),行列式的絕對值 \(|\det(M)|\) 給出了變換的體積比例因子(volume scale factor)。
3.3 恆定點(Invariant Points)與恆定直線(Invariant Lines)
恆定點(Invariant Point)是指變換 \(M\) 後位置不變的點。
若 \(\mathbf{x}\) 為恆定點,則:
$$M\mathbf{x} = \mathbf{x}$$
這可以改寫為:
$$M\mathbf{x} = I\mathbf{x}$$
$$(M - I)\mathbf{x} = \mathbf{0}$$
恆定直線(Invariant Line)是指線上的每一個點在變換後仍落在同一條直線上(直線上的點可能移動,但整條線維持原位)。
覺得困難嗎?想像一面鏡子。鏡子本身就是一個恆定平面。如果你正好站在鏡子上,你就會留在鏡子上(恆定線/平面)。如果你站在鉸鏈線上,那就是恆定點。
第三節重點回顧:矩陣能移動點!行列式是面積(二維)或體積(三維)的比例因子。記住組合順序 \(M_2 M_1\)。恆定點滿足 \((M-I)\mathbf{x} = \mathbf{0}\)。
第四節:特徵值與特徵向量(FP2 水平)
這是矩陣代數中最抽象的概念,但它們在物理和計算等進階應用中非常有用。
4.1 定義與概念
當矩陣 \(M\) 變換一個向量 \(\mathbf{e}\) 時,變換後的向量 \(M\mathbf{e}\) 通常會指向一個完全不同的方向。
然而,某些特殊的向量(稱為特徵向量,Eigenvectors)在變換下僅會被縮放(伸展或壓縮),它們不會改變方向(或者變為相反方向,即乘以一個負的比例因子)。
- 特徵向量(Eigenvector)\(\mathbf{e}\) 是一個非零向量,使得當乘以矩陣 \(M\) 時,結果是 \(\mathbf{e}\) 的純量倍數。
- 特徵值(Eigenvalue),即 \(\lambda\)(lambda),是特徵向量被縮放的純量因子。
此關係總結為特徵值方程式:
$$M\mathbf{e} = \lambda \mathbf{e}$$
課程說明:在本課程中,你只會處理實數特徵值,儘管也存在複數特徵值。重複的特徵值是允許的。
4.2 尋找特徵值:特徵方程式(Characteristic Equation)
為了求出特徵值 \(\lambda\),我們必須整理特徵值方程式:
$$M\mathbf{e} = \lambda I \mathbf{e}$$ $$M\mathbf{e} - \lambda I \mathbf{e} = \mathbf{0}$$ $$(M - \lambda I)\mathbf{e} = \mathbf{0}$$由於 \(\mathbf{e}\)(特徵向量)定義為非零向量,這個方程組只有在矩陣 \((M - \lambda I)\) 為奇異矩陣時,才有非平凡解(non-trivial solution)。
因此,特徵值 \(\lambda\) 是特徵方程式的解:
$$\det(M - \lambda I) = 0$$
\(2 \times 2\) 或 \(3 \times 3\) 矩陣計算步驟:
- 透過從 \(M\) 的主對角線元素減去 \(\lambda\),形成矩陣 \((M - \lambda I)\)。
- 計算 \((M - \lambda I)\) 的行列式。
- 將行列式設為零:\(\det(M - \lambda I) = 0\)。
- 解出多項式(\(2 \times 2\) 為二次方程,\(3 \times 3\) 為三次方程)以求出 \(\lambda\) 的值。
4.3 尋找特徵向量
一旦求得特徵值 \(\lambda\),你就可以將 \(\lambda\) 代回以下方程式來求得對應的特徵向量 \(\mathbf{e}\):
$$(M - \lambda I)\mathbf{e} = \mathbf{0}$$
這會得到一組線性方程組。由於 \(\det(M - \lambda I) = 0\),這些方程式會線性相關,意味著你會找到一整條可能的向量(特徵向量可以乘以任何常數)。你通常可以選擇最簡單的整數形式作為特徵向量。
常見錯誤:不小心將 \(\mathbf{e} = \mathbf{0}\)。記住,特徵向量必須是非零的!
第四節重點回顧:特徵向量是那些僅被特徵值 \(\lambda\) 縮放的特殊方向。先利用特徵方程式 \(\det(M - \lambda I) = 0\) 求出 \(\lambda\)。