歡迎來到隨機變量的線性組合!

你好!今天我們將探討如何結合不同的隨機變量。你可以把這一章想像成「統計學的樂高積木」。我們將個別的數據塊(例如一個學生的身高)組合在一起,或者將其擴大倍數(例如全班學生的總身高),來看看會發生什麼變化。

如果起初覺得有些抽象也不用擔心。學完這些筆記後,你會發現這其實只是遵循幾條黃金法則而已。讓我們開始吧!

1. 單個變量的縮放與平移

假設你有一個隨機變量 \(X\),這可以是蘋果的重量。如果我們將每個蘋果的重量加倍 (\(2X\)),或者給每個蘋果貼上一個 10g 的標籤 (\(X + 10\)),會發生什麼事呢?

期望值 (Mean)

期望值,即 \(E(X)\),非常「聽話」。它會完全按照你的預期運作。如果你將數據乘以 \(a\) 再加上 \(b\),平均值也會進行相同的運算。

公式: \(E(aX + b) = aE(X) + b\)

方差 (Variance)

方差,即 \(Var(X)\),是用來衡量數據的離散程度。如果你給每個數值加上一個常數 \(b\),離散程度是不會改變的(整個圖形只是平移了)。然而,如果你乘以一個常數 \(a\),離散程度會變為原來的 \(a^2\) 倍。

公式: \(Var(aX + b) = a^2Var(X)\)

例子: 如果 \(E(X) = 10\) 且 \(Var(X) = 4\),那麼 \(3X + 5\) 的平均值和方差分別是多少?
1. 新平均值: \(3(10) + 5 = 35\)
2. 新方差: \(3^2 \times 4 = 9 \times 4 = 36\)

小貼士: 在計算方差時,記得一定要將乘數平方!在計算方差時,常數 \(b\) 會被忽略,因為平移數據並不會讓它變得更「分散」或更「集中」。

重點總結: 平均值完全遵循公式;方差則忽略加減運算,並將乘數平方。

2. 結合兩個或多個變量

現在,如果我們有兩個不同的變量 \(X\) 和 \(Y\) 呢?例如,\(X\) 是麥片盒的重量,\(Y\) 是裡面玩具的重量。

和的期望值

再一次,平均值是非常友好的。要找出總平均值,只需將個別的平均值相加即可。

\(E(X + Y) = E(X) + E(Y)\)
\(E(X - Y) = E(X) - E(Y)\)

和的方差(針對獨立變量)

這是學生最容易絆倒的地方!如果 \(X\) 和 \(Y\) 是獨立的(意味著一個變量不會影響另一個),那麼它們的方差永遠是相加的,即使是在進行變量相減的情況下也是如此。

公式:
\(Var(X + Y) = Var(X) + Var(Y)\)
\(Var(X - Y) = Var(X) + Var(Y)\)

類比:「不確定性」規則
將方差想像成「不確定性」或「誤差」。如果你將兩個項目加在一起,你的不確定性會增加。如果你從一個項目中減去另一個,你仍然有兩個誤差來源,所以總體的不確定性仍然會增加。你不能減去不確定性!

你知道嗎? 在劍橋 9709 課程大綱中,只有當變量獨立時,你才能使用這些方差公式。做題時一定要留意這個關鍵詞!

重點總結: 平均值可以相加或相減。方差則永遠相加(前提是變量必須是獨立的)。

3. 「加倍」與「兩個不同變量」的陷阱

這是整個章節中最常見的錯誤。請務必仔細看!

情況 A: \(2X\)(單個項目加倍)
這是一個蘋果,我們透過魔法讓它變得兩倍重。
\(Var(2X) = 2^2 \times Var(X) = 4Var(X)\)

情況 B: \(X_1 + X_2\)(兩個不同的蘋果)
這是從同一棵樹上摘下的兩個獨立蘋果。它們是相互獨立的。
\(Var(X_1 + X_2) = Var(X_1) + Var(X_2) = 2Var(X)\)

注意區別: \(4Var(X)\) 遠大於 \(2Var(X)\)。將一個變量加倍,比將兩個獨立變量相加要「風險更大」(離散程度更高)。

重點總結: 將一個變量乘以 \(n\) 與將該變量的 \(n\) 個獨立副本相加並不相同。

4. 正態分佈的線性組合

如果你的變量 \(X\) 和 \(Y\) 服從正態分佈,那麼它們的任何線性組合(例如 \(2X + 3Y\))也將服從正態分佈。這非常有用,因為這意味著我們仍然可以使用 Z-表!

正態分佈問題的解題步驟:
1. 求新平均值: 使用 \(E(aX + bY)\) 規則。
2. 求新方差: 使用 \(Var(aX + bY)\) 規則。
3. 寫出新分佈: \(W \sim N(\mu_{new}, \sigma^2_{new})\)。
4. 標準化: 使用 \(Z = \frac{W - \mu}{\sigma}\)(記得使用標準差,即新方差的平方根)。
5. 求概率: 在正態分佈表中查出對應數值。

例子:
設 \(X \sim N(10, 4)\) 且 \(Y \sim N(12, 9)\)。求 \(P(X + Y > 25)\)。
- 新平均值: \(10 + 12 = 22\)
- 新方差: \(4 + 9 = 13\)
- 新分佈: \(S \sim N(22, 13)\)
- 標準化: \(Z = \frac{25 - 22}{\sqrt{13}} = \frac{3}{3.606} = 0.832\)
- 現在像平時一樣求解 \(P(Z > 0.832)\)。

重點總結: 如果輸入是正態分佈,輸出也一定是正態分佈。只需先算出新的平均值和方差即可!

5. 獨立泊松變量之和

如果你有兩個獨立的泊松變量 \(X \sim Po(\lambda_1)\) 和 \(Y \sim Po(\lambda_2)\),它們的和也服從泊松分佈!

公式: \(X + Y \sim Po(\lambda_1 + \lambda_2)\)

注意:這僅適用於變量相加,不適用於減法或乘以常數。

避免常見錯誤

忘記對 \(a\) 平方: 在方差中,\(Var(3X)\) 是 \(9Var(X)\),而不是 \(3Var(X)\)。
相減方差: 即使題目要求的是 \(Var(X - Y)\),你也必須相加方差。
標準差與方差: 正態分佈的符號是 \(N(\mu, \sigma^2)\)。如果題目說標準差是 5,那麼你的方差是 25!開始計算前,一定要檢查你手上的是哪一個。
混淆 \(nX\) 與 \(X_1 + X_2 + ... + X_n\): 仔細讀題。你是將一個測量值乘以 \(n\),還是將 \(n\) 個獨立的測量值相加?

速查箱

期望值: \(E(aX + bY + c) = aE(X) + bE(Y) + c\)
方差: \(Var(aX \pm bY \pm c) = a^2Var(X) + b^2Var(Y)\)(僅限獨立時)
正態分佈: 正態變量的組合永遠是正態分佈。
泊松分佈: 泊松變量之和仍是泊松分佈(直接相加 \(\lambda\) 值)。

你一定可以做到的!跟著這些步驟練習幾道題目,你會發現這些「線性組合」其實只是一套合乎邏輯的規則。祝你學習順利!