歡迎來到離散隨機變數的世界!
在本章中,我們將從觀察單一事件轉向從「宏觀」角度理解機率。我們利用離散隨機變數 (Discrete Random Variables) 來建立現實生活中的模型,例如商店中顧客的到達數量,或是擲硬幣直到出現「正面」所需的次數。理解這些模式能讓我們進行預測並計算風險,而這正是統計學的核心。
如果剛開始覺得公式有點深奧,別擔心!我們會將它們拆解成簡單的步驟,保證大家都能跟上!
1. 基礎概念:什麼是隨機變數?
隨機變數 (Random Variable)(通常記作 \(X\))是一個將實驗的每個結果賦予一個數值的規則。如果它只能取特定的、分離的數值(如 1, 2, 3...)而不能取範圍內的任意值,它就是離散 (discrete) 的。
機率分佈 (Probability Distributions)
機率分佈簡單來說就是一個列表或公式,列出 \(X\) 所有可能的數值及其各自發生的機率。我們將其寫為 \(P(X = x)\)。
兩大黃金法則:
1. 每個個別的機率必須介於 0 和 1 之間:\(0 \le P(X=x) \le 1\)。
2. 分佈中所有機率的總和必須等於 1:\(\sum P(X=x) = 1\)。
例子:設 \(X\) 為投擲一顆公平 4 面骰子的點數。數值為 {1, 2, 3, 4},每個數值的機率皆為 0.25。如果你將它們相加(\(0.25 \times 4\)),結果就是 1!
快速複習小撇步:如果在表中漏掉了一個機率,只要把其他的機率加起來,再用 1 減去總和即可!
2. 期望值與變異數
我們該如何找出一個模式的「平均值」呢?我們使用期望值 (Expectation) 和變異數 (Variance)。
期望值 \(E(X)\)
期望值(或平均值,\(\mu\))是長期的平均數值。要計算它,將每個數值乘以其對應的機率,然後全部加總:
\(E(X) = \mu = \sum x P(X = x)\)
變異數 \(Var(X)\)
變異數 (\(\sigma^2\)) 用來衡量數值的分佈離散程度。最容易使用的公式是:
\(Var(X) = E(X^2) - [E(X)]^2\)
計算變異數的步驟:
1. 先計算 \(E(X)\)。
2. 將每個 \(x\) 的數值平方,乘以其機率,再全部加總以得到 \(E(X^2)\)。
3. 用第二步的答案減去第一步答案的平方。
記憶口訣:你可以將變異數公式記作「平方的平均值減去平均值的平方」。
重點提示:標準差 (Standard Deviation) (\(\sigma\)) 其實就是變異數的平方根:\(\sigma = \sqrt{Var(X)}\)。
3. 編碼:變數轉換
有時候我們需要改變資料(例如,將分數轉換為現金獎勵)。我們使用以下簡單規則來處理期望值代數:
1. 期望值: \(E(a + bX) = a + bE(X)\)。(完全符合直覺!)
2. 變異數: \(Var(a + bX) = b^2 Var(X)\)。(加上常數 \(a\) 不會改變離散程度,但乘數 \(b\) 需要平方!)
常見錯誤:永遠不要從變異數中減去常數。即使你將資料平移了 -10,資料的「分佈範圍」保持不變,因此變異數不會改變!
4. 離散均勻分佈 (Discrete Uniform Distribution)
這是最簡單的模型。當每個結果發生的機率皆相等時使用,例如公平的骰子或轉盤。
若 \(X\) 在數值 \(\{1, 2, \dots, n\}\) 上呈均勻分佈:
\(E(X) = \frac{n + 1}{2}\)
\(Var(X) = \frac{1}{12}(n^2 - 1)\)
例子:對於標準的 6 面骰子(\(n=6\)),平均點數 \(E(X)\) 為 \(\frac{6+1}{2} = 3.5\)。
5. 二項分佈 \(X \sim B(n, p)\)
你在 A Level 數學中已經見過它,但在進階數學 (Further Maths) 中,我們更深入探討其性質。當你有固定次數的試驗 (\(n\)) 且只有兩種結果(成功或失敗)時使用。
核心性質:
平均值: \(E(X) = np\)
變異數: \(Var(X) = np(1 - p)\)
你知道嗎?二項分佈變數其實就是 \(n\) 個獨立伯努利試驗 (Bernoulli trials)(即 \(n=1\) 的試驗)的總和。這就是為什麼平均值簡單地等於 \(n \times p\)!
6. 卜瓦松分佈 \(X \sim Po(\lambda)\)
這用於建立在固定時間或空間區間內發生的事件次數模型(例如一小時內收到的郵件數量)。
卜瓦松模型的條件:
- 事件隨機且獨立發生。
- 事件以固定的平均速率 (\(\lambda\)) 發生。
- 事件不能同時發生。
「神奇」的性質:
在卜瓦松分佈中,平均值與變異數相等!
\(E(X) = \lambda\)
\(Var(X) = \lambda\)
快速複習:如果你被問到卜瓦松模型是否適用於某組數據,檢查計算出的平均值和變異數是否接近。如果差異很大,卜瓦松模型就不是一個好選擇!
合併卜瓦松分佈:如果 \(X \sim Po(\lambda)\) 與 \(Y \sim Po(\mu)\) 是獨立的,那麼它們的總和也符合卜瓦松分佈:\(X + Y \sim Po(\lambda + \mu)\)。
7. 幾何分佈 \(X \sim Geo(p)\)
幾何分佈用於模擬直到第一次成功為止的試驗次數。你可以把它想成是「我需要等多久?」的分佈。
公式:
- 在第 \(r\) 次試驗成功的機率: \(P(X = r) = (1 - p)^{r-1}p\)
- 成功需要超過 \(r\) 次試驗的機率: \(P(X > r) = (1 - p)^r\)
- 平均值: \(E(X) = \frac{1}{p}\)
- 變異數: \(Var(X) = \frac{1 - p}{p^2}\)
例子:如果贏得遊戲的機率是 0.2,為了贏一次平均需要玩的遊戲次數為 \(\frac{1}{0.2} = 5\) 場。
8. 獨立變數的線性組合
這就是進階數學精彩的地方!如果我們有兩個不同的隨機變數 \(X\) 和 \(Y\),想要找出它們組合後的平均值與變異數該怎麼辦?如果 \(X\) 和 \(Y\) 是獨立的:
組合平均值(期望值)
\(E(X + Y) = E(X) + E(Y)\)
\(E(X - Y) = E(X) - E(Y)\)
\(E(aX + bY) = aE(X) + bE(Y)\)
組合變異數(平方規則)
關鍵法則:當你組合變數時,變異數永遠是相加的(前提是它們必須獨立)。即使你是在減去變數,不確定性(變異數)仍然會增加!
\(Var(X + Y) = Var(X) + Var(Y)\)
\(Var(X - Y) = Var(X) + Var(Y)\)(沒錯,這裡還是加號!)
\(Var(aX \pm bY) = a^2 Var(X) + b^2 Var(Y)\)
類比:想像 \(X\) 和 \(Y\) 是兩台不同的震動機器人。如果你把一台機器人疊在另一台上面,總體的「震動程度」(變異數)會加劇,無論它們是往相同方向還是相反方向移動!
總結摘要:
- 使用期望值來求平均,使用變異數來衡量分佈程度。
- 卜瓦松分佈用於計數時間間隔內的事件;幾何分佈用於等待成功的次數。
- 對於獨立變數:平均值遵循運算符號,但變異數永遠相加!