歡迎來到機率分佈的世界!

在本章中,我們將學習如何超越簡單的「擲硬幣」概念,開始從「宏觀角度」審視數據。機率分佈本質上就像一張藍圖或地圖,告訴我們在隨機過程中各種結果發生的可能性。無論你是要預測有多少人會點擊廣告,還是要精確測量一盒穀片的重量,這些分佈都是你最強大的工具。

別擔心,如果有些公式乍看之下很「硬核」,我們會把它們拆解成簡單易懂的步驟,每個人都能學會!

1. 隨機性的語言

在我們深入計算之前,必須先統一語言。在統計學中,我們使用隨機變數 (Random Variables)(通常用大寫字母如 \(X\) 表示)來代表取決於機會的結果。

離散與連續

這是你必須掌握的最重要區別:
離散隨機變數 (Discrete Random Variables): 這些變數只能取特定的、「可數」的值。想像成樓梯——你可以站在第 1 階或第 2 階,但不能站在第 1.5 階。例子:一場比賽中的進球數,或一個家庭中的子女數量。
連續隨機變數 (Continuous Random Variables): 這些變數可以在某個範圍內取任何值。想像成溜滑梯——你隨時都可以處於任何高度。例子:跑馬拉松所需的時間,或一顆蘋果的精確質量。

獨立與相關

獨立 (Independent): 如果一個事件的發生不會改變下一個事件的機率。
相關 (Dependent): 如果第一個結果會改變第二個結果的「機率」。

快速複習:
隨機 (Random): 任何數值取決於機會變異的變數。
離散 (Discrete): 可數的 (1, 2, 3...)。
連續 (Continuous): 可測量的 (1.234...)。

2. 處理離散分佈

離散機率分佈通常以表格形式呈現,列出 \(x\) 的所有可能值及其對應的機率 \(P(X=x)\)。

黃金法則: 分佈中所有機率的總和必須精確等於 1。
\(\sum P(X=x) = 1\)

尋找「平均值」與「離散程度」

在考試中,你常會被要求求出期望值 (Expected Value)(即平均值)和變異數 (Variance)(即離散程度)。

期望值 \(E(X)\)

將其視為如果你進行數千次實驗後的長期平均值。
公式: \(E(X) = \sum x P(X=x)\)
步驟:
1. 將每個值 \(x\) 乘以其對應的機率。
2. 將所有結果相加。這就是平均值!

變異數 \(Var(X)\)

這告訴我們結果偏離平均值的程度。
公式: \(Var(X) = E(X^2) - [E(X)]^2\)
記憶口訣: 記作「平方的平均值,減去平均值的平方」。

常見錯誤提醒: 學生常忘記在最後將 \(E(X)\) 平方。務必檢查變異數是否為負數——變異數一定要為正數!

3. 連續分佈與均勻模型

對於連續數據,我們無法列出每個可能值(因為有無限多個小數!)。相反,我們使用機率密度函數 (Probability Density Function, PDF)。在圖表中,曲線下方的總面積必須等於 1。

離散均勻分佈 (Discrete Uniform Distribution)

這是最簡單的模型。當每個結果發生的可能性都相等時使用。
類比:擲一顆公平的六面骰子。從 1 到 6 的每個數字都有完全相同的機率 (\(1/6\))。

連續均勻分佈 (Continuous Uniform Distribution)

這常被稱為「矩形分佈」。當變數在兩點 \(a\) 和 \(b\) 之間任何位置發生的機率都相等時使用。
你知道嗎? 因為矩形的面積是高 × 寬,且面積必須為 1,所以均勻分佈的高度總是 \(1 / (b - a)\)。

4. 隨機變數的線性組合

有時我們需要組合不同的隨機變數。例如,如果你買了一杯咖啡 (\(X\)) 和一個三明治 (\(Y\)),總期望成本和總「風險」(變異數)是多少?

期望值的運算規則

期望值非常「友善」,運算規律正如你直覺所想:
\(E(aX \pm bY) = aE(X) \pm bE(Y)\)
例子:如果你將咖啡份量加倍,你的預期成本也會直接加倍。

變異數的運算規則(請小心!)

變異數比較敏感。重要提醒: 此公式僅在變數為獨立時才適用。
\(Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)\)

關鍵技巧: 注意即使你是將變數相減,也必須將變異數相加。為什麼?因為結合兩個不確定的事物,總會創造出更多的總不確定性(散佈),永遠不會減少!

快速複習:
• 當你將變數乘以 \(a\) 時,變異數會乘以 \(a^2\)。
• 永遠相加變異數,絕對不要相減。

5. 選擇正確的模型

在 Paper 1 中,你需要判斷哪種分佈適合真實情境。以下是一個快速指南:

二項分佈 (Binomial): 用於固定次數試驗且只有「成功或失敗」的情況。(例如:擲 10 次硬幣中正面的次數)。
卜瓦松分佈 (Poisson): 用於在時間或空間上以恆定速率發生的事件。(例如:一小時內收到的電子郵件數量)。
常態分佈 (Normal): 用於呈現鐘形曲線,且數據聚集在平均值附近的情境。(例如:成年男性的身高)。
指數分佈 (Exponential): 用於建立卜瓦松過程中事件之間時間間隔的模型。(例如:等待下一班公車所需的時間)。

考試重點總結

1. 檢查總和: 務必確保你的機率總和等於 1。
2. 常數要平方: 計算 \(Var(aX)\) 時,記得它會變成 \(a^2 Var(X)\)。
3. 獨立變數: 只有在變數互不影響時,才能將變異數相加。
4. 情境最重要: 當被要求「在情境中解釋」時,一定要用題目提到的單位(例如:「分鐘」、「公斤」或「通話次數」)。

如果起初覺得這些很棘手也不用擔心——練習計算小表格的 \(E(X)\) 和 \(Var(X)\),規律自然就會浮現了!