Linear combinations of discrete random variables - Further Mathematics (9665) - Oxford AQA International A-level

📚 高等數學學習筆記：離散隨機變量的線性組合 (FS1.5)

歡迎來到高等統計學中最實用且強大的課題之一！本章的重點在於如何將兩個或多個隨機變量（例如不同產品線的利潤或不同實驗的測量結果）結合成一個全新的變量。

你已經學過如何求單個變量的期望值 (\(E(X)\)) 和變異數 (\(Var(X)\))。在這裡，我們將進一步探討當我們對變量進行縮放、平移和組合時，這些統計特性會如何變化。這項技巧對於建立現實世界的不確定性模型至關重要！

1. 快速回顧：期望值與變異數基礎

在組合變量之前，我們先重溫一下單個離散隨機變量 \(X\) 的基本概念：

期望值 (平均值)，\(E(X)\) 或 \(\mu\)： 這是變量在長期下的平均取值。
變異數，\(Var(X)\) 或 \(\sigma^2\)： 這衡量了變量圍繞平均值的離散程度。變異數越高，數據就越分散。

1.1 縮放與平移的影響

如果我們通過變換 \(X\) 來建立一個新變量 \(W\)（例如 \(W = aX + b\)），期望值和變異數的變化規律如下：

期望值法則：

\[E(aX + b) = a E(X) + b\]

（例子：如果你將所有分數乘以 2 (a=2) 並加上 5 (b=5)，平均分數也會變為原來的兩倍再加上 5。）

變異數法則：

\[Var(aX + b) = a^2 Var(X)\]

（例子：平移數據（加上 b）並不會改變分散程度，因此 \(b\) 會消失。但將數據縮放 \(a\) 倍，會使分散程度變為原來的 \(a^2\) 倍。）

⚠ 學習小貼士： 請記住，常數只會影響平均值（平移分佈位置），但永遠不會影響變異數（它們不會改變分佈的離散程度！）。

2. 兩個變量的線性組合

兩個離散隨機變量 \(X\) 和 \(Y\) 的線性組合通常寫成以下形式：

\[W = aX + bY + c\]

其中 \(a\)、\(b\) 和 \(c\) 為常數（係數）。

想像一家咖啡店，X 是拿鐵的每日銷量，Y 是卡布奇諾的每日銷量。如果拿鐵售價 £3 (a=3)，卡布奇諾售價 £4 (b=4)，那麼總營業額 (W) 就是 \(W = 3X + 4Y\)。

2.1 計算組合後的期望值

期望值的法則非常簡單明瞭。無論 \(X\) 和 \(Y\) 是否相關（相依或獨立），法則都是一樣的：

和/差的期望值法則：

\[E(aX + bY + c) = a E(X) + b E(Y) + c\]

核心重點： 組合後的期望值，就是各個期望值的線性組合。

3. 引入相依性：共變異數與相關係數

當我們談到變異數時，情況會變得複雜——除非這些變量是獨立的。我們必須考慮 \(X\) 和 \(Y\) 之間如何相互影響。

3.1 什麼是共變異數 (Covariance)？

共變異數，記作 \(Cov(X, Y)\)，告訴我們 \(X\) 和 \(Y\) 之間關係的方向。

如果 \(Cov(X, Y) > 0\)，當 \(X\) 較大時，\(Y\) 往往也較大（反之亦然）。它們同時變動。（正相關關係）
如果 \(Cov(X, Y) < 0\)，當 \(X\) 較大時，\(Y\) 往往較小（反之亦然）。它們向相反方向變動。（負相關關係）
如果 \(Cov(X, Y) = 0\)，則不存在線性關係。若 \(X\) 和 \(Y\) 獨立，則此條件必然成立。

⚠ 常見錯誤警示： 如果 \(Cov(X, Y) = 0\)，僅代表沒有「線性」關係，並不自動證明變量是獨立的（儘管在大多數高等數學考試情境中，若題目提到它們獨立，你可以假設共變異數為零）。務必檢查題目背景！

3.2 相關係數 (Correlation)

相關係數 (\(\rho\) 或 \(r\)) 是由共變異數標準化後得出的度量。它告訴你線性關係的強度和方向，數值始終在 -1 到 1 之間。

\[\rho = \frac{Cov(X, Y)}{\sqrt{Var(X)Var(Y)}}\]

課程大綱要求你理解並應用這些概念，但通常題目會給定共變異數或相關係數的值，或是要求你利用定義公式計算，而非要求推導。

冷知識： 共變異數的單位是 \(X\) 的單位乘以 \(Y\) 的單位，這通常不直觀。相關係數通過將其轉化為 -1 到 1 之間的純數，解決了這個問題。

4. 線性組合的變異數（關鍵公式）

若變量之間具相依性，計算組合後的變異數時必須加入共變異數項。這是一個通用的法則：

4.1 通用法則（相依變量）

對於兩個離散隨機變量 \(X\) 和 \(Y\)，以及新變量 \(W = aX + bY\)：

\[Var(W) = Var(aX + bY) = a^2 Var(X) + b^2 Var(Y) + 2ab Cov(X, Y)\]

如果有額外的常數 \(c\)，則忽略不計，因為常數不會影響變異數：\(Var(aX + bY + c) = Var(aX + bY)\)。

\(2ab\) 項至關重要！ 它反映了變量如何放大或抵消彼此的分散程度。

如果 \(Cov(X, Y)\) 為正，組合後的變異數會增加（分散程度累加）。
如果 \(Cov(X, Y)\) 為負，組合後的變異數會減少（變量傾向於平衡彼此的波動）。

計算變異數的步驟：

找出係數 \(a\) 和 \(b\)。
對係數取平方以計算變異數項：\(a^2 Var(X)\) 和 \(b^2 Var(Y)\)。
計算共變異數項：\(2ab Cov(X, Y)\)。
將這三項相加。

4.2 獨立變量的法則（簡化版）

如果 \(X\) 和 \(Y\) 是獨立的，它們的共變異數必為零：\(Cov(X, Y) = 0\)。這大大簡化了公式：

\[Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\]

記憶口訣 (VAA)： Variance Always Adds!（變異數永遠相加！）。當組合獨立變量時，你總是將它們的變異數（或縮放後的變異數 \(a^2 Var(X)\) 和 \(b^2 Var(Y)\)）相加。

4.3 處理減法：\(Var(X - Y)\)

減法是常見的陷阱。考慮 \(W = X - Y\)。這裡 \(a=1\)，\(b=-1\)。

減法的通用法則（相依）：

\[Var(X - Y) = (1)^2 Var(X) + (-1)^2 Var(Y) + 2(1)(-1) Cov(X, Y)\]

\[Var(X - Y) = Var(X) + Var(Y) - 2 Cov(X, Y)\]

減法的法則（獨立）：

若 \(X\) 和 \(Y\) 獨立，\(Cov(X, Y)=0\)。變異數仍然是相加的：

\[Var(X - Y) = Var(X) + Var(Y)\]

⚠ 關鍵點： 無論你是加還是減這些變量，它們的變異數總是對總散佈產生正向貢獻（因為散佈是由平方 \(a^2\) 和 \(b^2\) 衡量的）。如果是減法，你只會減去共變異數項。

🔖 快速回顧：變異數檢查清單

計算 \(Var(aX + bY)\) 時，問自己一個問題：

X 和 Y 是否獨立？
是：使用 \(a^2 Var(X) + b^2 Var(Y)\)。
否：使用 \(a^2 Var(X) + b^2 Var(Y) + 2ab Cov(X, Y)\)。（你必須先求得或題目已給定 \(Cov(X, Y)\)！）

5. 應用與推廣

這些規則在處理超過兩個變量或重複相同的變量時同樣適用。

5.1 \(n\) 個獨立變量的和

如果你有 \(n\) 個獨立同分佈 (i.i.d.) 的隨機變量 \(X_1, X_2, \dots, X_n\)，且將它們求和 \(S = X_1 + X_2 + \dots + X_n\)：

期望值：

\[E(S) = E(X_1) + E(X_2) + \dots + E(X_n) = n E(X)\]

（如果你擲一枚公正硬幣 10 次，正面出現次數的期望值就是單次擲硬幣正面期望值的 10 倍。）

變異數：

由於它們是獨立的，共變異數為零。我們只需將變異數相加：

\[Var(S) = Var(X_1) + Var(X_2) + \dots + Var(X_n) = n Var(X)\]

（此原理對於理解二項分佈至關重要，因為二項分佈本質上就是多次獨立伯努利試驗的和。）

5.2 應用例子：包裝產品

設 \(X\) 為一瓶果汁的重量（單位：kg），\(E(X) = 1.2\)，\(Var(X) = 0.04\)。
設 \(P\) 為包裝的重量，為常數 \(P = 0.05\) kg。

一個板條箱裝有 5 瓶。總重量 \(W = X_1 + X_2 + X_3 + X_4 + X_5 + 5P\)。假設瓶裝重量是獨立的。

1. 求總重量的期望值：

\[E(W) = E(X_1) + \dots + E(X_5) + E(5P)\]

因為 \(E(X) = 1.2\)：

\[E(W) = 5(1.2) + 5(0.05) = 6.0 + 0.25 = 6.25 \text{ kg}\]

2. 求總重量的變異數：

因為瓶子是獨立的，且 \(5P\) 是常數（變異數為 0）：

\[Var(W) = Var(X_1) + \dots + Var(X_5) + Var(5P)\]

\[Var(W) = 5(0.04) + 0 = 0.20\]

標準差為 \(\sqrt{0.20}\)。

核心重點： 務必將獨立變量（變異數相加）與常數（只影響平均值，不影響變異數）分開處理。

6. 關於相關係數與決策的備註

在解決應用題時，理解相關係數對於解釋結果至關重要，即使你不計算 \(\rho\)：

如果你相加的兩個變量（如投資回報）是正相關的，組合後的總風險（變異數）會高於它們獨立的情況。
如果它們是負相關的（例如某產品暢銷時另一產品銷量下降），共變異數項為負，這會導致總體變異數變小。這就是為什麼分散投資（選擇負相關資產）可以降低風險！

總結：公式的力量
線性組合規則讓我們能夠模擬複雜系統——無論它們涉及的是獨立組件（如生產線步驟），還是高度互相關的組件（如兩個競爭產品的銷售數據）——只需要使用各部分的平均值、變異數和共變異數即可。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。