Probability distributions - Statistics (9ST0) - Pearson Edexcel A Level

歡迎來到機率分佈的世界！

在本章中，我們將學習如何超越簡單的「擲硬幣」概念，開始從「宏觀角度」審視數據。機率分佈本質上就像一張藍圖或地圖，告訴我們在隨機過程中各種結果發生的可能性。無論你是要預測有多少人會點擊廣告，還是要精確測量一盒穀片的重量，這些分佈都是你最強大的工具。

別擔心，如果有些公式乍看之下很「硬核」，我們會把它們拆解成簡單易懂的步驟，每個人都能學會！

1. 隨機性的語言

在我們深入計算之前，必須先統一語言。在統計學中，我們使用隨機變數 (Random Variables)（通常用大寫字母如 \(X\) 表示）來代表取決於機會的結果。

離散與連續

這是你必須掌握的最重要區別：
• 離散隨機變數 (Discrete Random Variables)： 這些變數只能取特定的、「可數」的值。想像成樓梯——你可以站在第 1 階或第 2 階，但不能站在第 1.5 階。例子：一場比賽中的進球數，或一個家庭中的子女數量。
• 連續隨機變數 (Continuous Random Variables)： 這些變數可以在某個範圍內取任何值。想像成溜滑梯——你隨時都可以處於任何高度。例子：跑馬拉松所需的時間，或一顆蘋果的精確質量。

獨立與相關

• 獨立 (Independent)： 如果一個事件的發生不會改變下一個事件的機率。
• 相關 (Dependent)： 如果第一個結果會改變第二個結果的「機率」。

快速複習：
• 隨機 (Random)： 任何數值取決於機會變異的變數。
• 離散 (Discrete)： 可數的 (1, 2, 3...)。
• 連續 (Continuous)： 可測量的 (1.234...)。

2. 處理離散分佈

離散機率分佈通常以表格形式呈現，列出 \(x\) 的所有可能值及其對應的機率 \(P(X=x)\)。

黃金法則： 分佈中所有機率的總和必須精確等於 1。
\(\sum P(X=x) = 1\)

尋找「平均值」與「離散程度」

在考試中，你常會被要求求出期望值 (Expected Value)（即平均值）和變異數 (Variance)（即離散程度）。

期望值 \(E(X)\)

將其視為如果你進行數千次實驗後的長期平均值。
公式： \(E(X) = \sum x P(X=x)\)
步驟：
1. 將每個值 \(x\) 乘以其對應的機率。
2. 將所有結果相加。這就是平均值！

變異數 \(Var(X)\)

這告訴我們結果偏離平均值的程度。
公式： \(Var(X) = E(X^2) - [E(X)]^2\)
記憶口訣： 記作「平方的平均值，減去平均值的平方」。

常見錯誤提醒： 學生常忘記在最後將 \(E(X)\) 平方。務必檢查變異數是否為負數——變異數一定要為正數！

3. 連續分佈與均勻模型

對於連續數據，我們無法列出每個可能值（因為有無限多個小數！）。相反，我們使用機率密度函數 (Probability Density Function, PDF)。在圖表中，曲線下方的總面積必須等於 1。

離散均勻分佈 (Discrete Uniform Distribution)

這是最簡單的模型。當每個結果發生的可能性都相等時使用。
類比：擲一顆公平的六面骰子。從 1 到 6 的每個數字都有完全相同的機率 (\(1/6\))。

連續均勻分佈 (Continuous Uniform Distribution)

這常被稱為「矩形分佈」。當變數在兩點 \(a\) 和 \(b\) 之間任何位置發生的機率都相等時使用。
你知道嗎？ 因為矩形的面積是高 × 寬，且面積必須為 1，所以均勻分佈的高度總是 \(1 / (b - a)\)。

4. 隨機變數的線性組合

有時我們需要組合不同的隨機變數。例如，如果你買了一杯咖啡 (\(X\)) 和一個三明治 (\(Y\))，總期望成本和總「風險」（變異數）是多少？

期望值的運算規則

期望值非常「友善」，運算規律正如你直覺所想：
\(E(aX \pm bY) = aE(X) \pm bE(Y)\)
例子：如果你將咖啡份量加倍，你的預期成本也會直接加倍。

變異數的運算規則（請小心！）

變異數比較敏感。重要提醒： 此公式僅在變數為獨立時才適用。
\(Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)\)

關鍵技巧： 注意即使你是將變數相減，也必須將變異數相加。為什麼？因為結合兩個不確定的事物，總會創造出更多的總不確定性（散佈），永遠不會減少！

快速複習：
• 當你將變數乘以 \(a\) 時，變異數會乘以 \(a^2\)。
• 永遠相加變異數，絕對不要相減。

5. 選擇正確的模型

在 Paper 1 中，你需要判斷哪種分佈適合真實情境。以下是一個快速指南：

• 二項分佈 (Binomial)： 用於固定次數試驗且只有「成功或失敗」的情況。(例如：擲 10 次硬幣中正面的次數)。
• 卜瓦松分佈 (Poisson)： 用於在時間或空間上以恆定速率發生的事件。(例如：一小時內收到的電子郵件數量)。
• 常態分佈 (Normal)： 用於呈現鐘形曲線，且數據聚集在平均值附近的情境。(例如：成年男性的身高)。
• 指數分佈 (Exponential)： 用於建立卜瓦松過程中事件之間時間間隔的模型。(例如：等待下一班公車所需的時間)。

考試重點總結

1. 檢查總和： 務必確保你的機率總和等於 1。
2. 常數要平方： 計算 \(Var(aX)\) 時，記得它會變成 \(a^2 Var(X)\)。
3. 獨立變數： 只有在變數互不影響時，才能將變異數相加。
4. 情境最重要： 當被要求「在情境中解釋」時，一定要用題目提到的單位（例如：「分鐘」、「公斤」或「通話次數」）。

如果起初覺得這些很棘手也不用擔心——練習計算小表格的 \(E(X)\) 和 \(Var(X)\)，規律自然就會浮現了！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。