歡迎來到離散隨機變數的世界!

在你 S1: Statistics 課程的這個章節中,我們將會從簡單的「機率是多少?」這類問題,進階到預測事件的長期行為。無論你是對遊戲設計、金融還是科學感興趣,理解「隨機性」如何遵循特定的模式是一項非常強大的技能。

我們將學習如何整理可能的結果、計算「期望值」,以及測量結果的變異程度。如果起初覺得有些抽象也不用擔心——我們會透過擲骰子和玩遊戲等簡單的例子來為你拆解!

1. 什麼是離散隨機變數 (Discrete Random Variable)?

讓我們拆解這個名稱:
離散 (Discrete): 這意味著結果是明確、個別的數值(例如 1, 2, 3),而不是連續的量度(例如身高或體重)。
隨機 (Random): 結果取決於機會。
變數 (Variable): 它能夠取不同的數值。

機率分佈 (Probability Distribution)
這簡單來說就是一個列表(通常是表格),列出了變數 \(X\) 可能取的所有數值,以及每個數值發生的機率。
例子: 如果 \(X\) 是擲兩枚硬幣時出現的正面的次數:
\(X\) 可以是 0, 1 或 2。
\(P(X=0) = 0.25\)
\(P(X=1) = 0.50\)
\(P(X=2) = 0.25\)

重要規則: 一個分佈中所有機率的總和必須等於 1。
\( \sum P(X=x) = 1 \)

快速複習:
X(大寫)代表實驗的「名稱」(例如:「得分」)。
x(小寫)代表具體的結果(例如:「得分為 5」)。

2. 期望值:代表性的「平均」結果

期望值 (Expected Value),寫作 \(E(X)\) 或希臘字母 \(\mu\) (mu),是你重複進行該實驗非常多次後,預期得到的平均值。

公式:
\( E(X) = \mu = \sum x_i p_i \)

計算步驟:
1. 將每個可能的數值 (\(x\)) 乘以它對應的機率 (\(p\))。
2. 將所有乘積相加。
類比: 這就像是一個「加權平均數」,出現機率越高的結果,對最終結果的「影響力」就越大。

函數的期望值:
如果你想找出數據經過變換後的期望值,例如 \(X^2\),你可以使用:
\( E(g(X)) = \sum g(x_i) p_i \)
例子: 若要找 \(E(X^2)\),你需要先將每個 \(x\) 值平方,然後再乘以機率。

關鍵點: \(E(X)\) 不一定會是一個「實際出現」的數值(例如:擲骰子的期望值是 3.5,儘管你不可能擲出 3.5!)。它代表的是長期平均。

3. 變異數與標準差:測量離散程度

變異數 (Variance),寫作 \(\text{Var}(X)\)\(\sigma^2\),告訴我們結果的分散程度。變異數高意味著結果「分佈得很廣」,而變異數低則意味著結果較為集中、穩定。

公式:
\( \text{Var}(X) = \sigma^2 = E(X^2) - [E(X)]^2 \)

記憶技巧: 將其想像為「平方的平均值減去平均值的平方」。

標準差 (Standard Deviation):
標準差 (\(\sigma\)) 簡單來說就是變異數的平方根。
\( \sigma = \sqrt{\text{Var}(X)} \)

常見錯誤: 在計算 \(\text{Var}(X)\) 時,學生常忘記在最後將平均值 (\(\mu\)) 平方。計算時請務必檢查這一步!

4. 編碼與線性變換 (Linear Transformations)

有時候我們想對數據進行調整——例如給每個人加額外分數,或是將所有結果翻倍。我們可以使用這些規則來找出新的平均值和變異數,而不需要從頭重新計算。

規則:
1. 期望值: \( E(aX + b) = aE(X) + b \)
(所有動作都會影響平均值:加、減、乘、除皆然。)
2. 變異數: \( \text{Var}(aX + b) = a^2 \text{Var}(X) \)
(加上或減去常數 \(b\) 不會改變離散程度。乘以 \(a\) 會使變異數變為原來的 \(a^2\) 倍。)

類比: 想像一群人站在巴士上。如果巴士向前移動了 10 公尺 (\(+b\)),「平均位置」會移動 10 公尺,但人與人之間的距離(離散程度)完全保持不變!

5. 獨立隨機變數

如果我們有兩個互不影響的隨機變數 \(X\) 和 \(Y\),會發生什麼事呢?我們可以將它們結合起來!

和與差:
• \( E(aX \pm bY) = aE(X) \pm bE(Y) \)
• \( \text{Var}(aX \pm bY) = a^2 \text{Var}(X) + b^2 \text{Var}(Y) \)

重要提示: 請注意,對於變異數,我們永遠是將組件相加,即使我們是在計算變數的差 (\(X - Y\))。這是因為結合兩個隨機事件總是會增加總體的不確定性或「混亂度」。

求和的快速複習:
如果你有多個相同的獨立變數 \(X_1, X_2... X_n\):
• \( E(\sum X_i) = \sum E(X_i) \)
• \( \text{Var}(\sum X_i) = \sum \text{Var}(X_i) \)

6. 伯努利分佈與二項分佈

這些是遵循特定規則的特殊離散分佈。

伯努利分佈 (Bernoulli Distribution)

這是最簡單的實驗:只有兩個結果,成功 (1) 或 失敗 (0)。
令 \(p\) 為成功的機率。
• \( E(X) = p \)
• \( \text{Var}(X) = p(1 - p) \)

二項分佈 (Binomial Distribution)

當你重複進行 \(n\) 次伯努利試驗(例如:擲硬幣 10 次)時,就會產生二項分佈
條件:
1. 固定次數的試驗 (\(n\))。
2. 只有兩種結果(成功/失敗)。
3. 成功的機率 (\(p\)) 是恆定的。
4. 每次試驗都是獨立的。

符號: \( X \sim B(n, p) \)

二項分佈的平均值與變異數:
平均值: \( E(X) = np \)
變異數: \( \text{Var}(X) = np(1 - p) \)
標準差: \( \sigma = \sqrt{np(1 - p)} \)

冷知識: “Binomial” 這個詞來自 “bi”(二)和 “nomen”(名稱/項)。它字面上就是指每次試驗的兩種可能結果!

關鍵點: 如果題目提到「成功次數」、「命中或未命中」或「固定次數的試驗」,請立即檢查它是否符合二項分佈的條件!

總結清單

在進入下一章之前,請確保你能:
• 檢查機率分佈是否有效(總和 = 1)。
• 從表格中計算 \(E(X)\) 和 \(\text{Var}(X)\)。
• 應用線性變換規則來處理 \(E(aX+b)\) 和 \(\text{Var}(aX+b)\)。
• 結合獨立變數 \(X\) 和 \(Y\)。
• 識別二項分佈並使用 \(np\) 和 \(np(1-p)\) 的捷徑公式。