Poisson & binomial distributions - Further Mathematics (9FM0) - Pearson Edexcel A Level

歡迎來到隨機事件的世界！

在本章中，我們將探討如何計算隨機發生的事件。無論是頁面上的錯別字數量、你在一小時內收到的郵件數量，還是曲奇餅裡有多少粒朱古力豆，統計學都能幫助我們預測這些「不可預測」的事物。我們將會研究卜瓦松分佈 (Poisson Distribution)，以及它與你之前學過的二項分佈 (Binomial Distribution)之間的聯繫。如果起初看到這些符號感到不知所措，請不用擔心，我們會一步步為你拆解！

1. 卜瓦松分佈：基本概念

卜瓦松分佈用於模擬在一個固定間隔的時間或空間內，某事件發生的次數。

我們什麼時候會用到它？
要使用卜瓦松分佈進行模擬，必須滿足四個條件。你可以透過首字母縮寫 RISH 來記憶：

• Randomly (隨機性)：事件是隨機發生的。
• Independently (獨立性)：一個事件的發生不會改變另一個事件發生的機率。
• Singly (單一性)：事件不能在完全相同的時間點同時發生。
• Highly uniform (高度均勻性)：事件以恆定的平均速率 (\(\lambda\)) 發生。

例子：如果你正在計算經過閘門的汽車數量，它們應該以恆定的平均速率經過（例如每分鐘 2 輛車），但每輛車經過的具體時間是隨機且獨立的。

公式：
如果一個隨機變量 \(X\) 服從平均速率為 \(\lambda\) 的卜瓦松分佈，我們記作：
\(X \sim \text{Po}(\lambda)\)

恰好觀察到 \(x\) 個事件的機率為：
\(P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}\)

記憶小技巧：在計算機上，你通常不需要輸入整個公式！請尋找 Poisson PD（用於計算特定數值）或 Poisson CD（用於計算範圍，例如「小於 3」）功能。

重點總結：卜瓦松分佈的核心在於事物在特定時間或空間「窗口」內發生的速率 (\(\lambda\))。

2. 加法性質：縮放與合併

卜瓦松分佈最酷的地方之一是它對速率 \(\lambda\) 的處理非常靈活。由於它是一個速率，你可以輕鬆地對其進行縮放。

縮放速率

如果 \(X\) 是每分鐘發生的事件數量，且 \(X \sim \text{Po}(\lambda)\)，那麼在 \(t\) 分鐘的時間段內，新的分佈為：
\(X_{new} \sim \text{Po}(\lambda t)\)

生活比喻：如果你通常每小時收到 2 條短訊 (\(\lambda = 2\))，那麼在 5 小時內，你預期會收到 10 條短訊 (\(2 \times 5 = 10\))。你這 5 小時內的目標分佈就是 \(\text{Po}(10)\)。

相加獨立變量

如果你有兩個獨立的卜瓦松變量 \(X\) 和 \(Y\)，你可以將它們相加：
如果 \(X \sim \text{Po}(\lambda)\) 且 \(Y \sim \text{Po}(\mu)\)，那麼：
\(X + Y \sim \text{Po}(\lambda + \mu)\)

例子：如果一家商店有兩個入口，A 門每小時進入的人數為 \(\text{Po}(3)\)，B 門每小時進入的人數為 \(\text{Po}(4)\)，那麼進入商店的總人數即為 \(\text{Po}(3+4) = \text{Po}(7)\) 每小時。

重點總結：只要事件是獨立的，且時間/空間間隔一致，你就可以將卜瓦松速率相加！

3. 平均值與方差：卜瓦松的「魔法」

在統計學中，我們經常研究期望值 (Expectation/Mean) 和方差 (Variance)（數據的分散程度）。以下是我們兩個常用分佈的對比：

對於二項分佈 \(B(n, p)\)：

• 平均值：\(E(X) = np\)
• 方差：\(Var(X) = np(1-p)\)

對於卜瓦松分佈 \(Po(\lambda)\)：

• 平均值：\(E(X) = \lambda\)
• 方差：\(Var(X) = \lambda\)

你知道嗎？
卜瓦松分佈的獨特之處在於它的平均值和方差完全相同！這是一個非常常見的考題。如果題目給出的數據中平均值和方差很接近，這是一個強烈的暗示，表示使用卜瓦松模型會非常合適。

快速回顧：
如果 \(Var(X) \approx E(X)\)，則卜瓦松是一個好的模型。
如果 \(Var(X) < E(X)\)，使用二項分佈模型可能會更好。

4. 二項分佈的卜瓦松近似

有時，計算二項分佈 \(B(n, p)\) 的機率會變成一場惡夢——尤其是當 \(n\) 非常大（例如 1,000）且 \(p\) 非常小（例如 0.001）時。在這些情況下，我們可以使用卜瓦松分佈作為捷徑！

什麼時候可以使用這個捷徑？
當滿足以下條件時，你可以用 \(Po(\lambda)\) 近似 \(B(n, p)\)：
1. \(n\) 很大（通常 \(n > 50\)）
2. \(p\) 很小（通常 \(p < 0.1\)）

操作步驟：
步驟 1：檢查 \(n\) 是否夠大，\(p\) 是否夠小。
步驟 2：利用公式 \(\lambda = np\) 計算速率 \(\lambda\)。
步驟 3：使用卜瓦松分佈 \(\text{Po}(np)\) 來查找你的機率。

例子：一家工廠生產 1,000 個燈泡，燈泡有瑕疵的機率是 0.005。與其使用 \(B(1000, 0.005)\)，不如使用 \(\text{Po}(1000 \times 0.005) = \text{Po}(5)\)。這樣計算會快得多！

重點總結：隨著試驗次數增加且成功機率降低，卜瓦松分佈正是二項分佈的「極限」。

5. 常見陷阱要避開

如果起初覺得棘手也別擔心，但請記住以下常見錯誤：

• 忘記縮放 \(\lambda\)：務必檢查題目中的時間間隔是否與 \(\lambda\) 的時間間隔匹配。如果 \(\lambda\) 是「每天」，但題目問的是「每週」，你必須先乘以 7。
• 獨立性：只有當變量是獨立的，你才能將卜瓦松變量相加。如果一個事件會觸發另一個事件（如傳染病），卜瓦松通常不是一個好的模型。
• 二項分佈 vs. 卜瓦松分佈：記住二項分佈有一個固定的上限 (\(n\))，而卜瓦松在理論上沒有上限（即使機率接近零，理論上也可能發生無窮多次事件）。
• 計算機模式：仔細檢查你需要的是 PD（恰好 \(x\)）還是 CD（累計至 \(x\)）。如果題目問「大於 5」，你需要計算 \(1 - P(X \leq 5)\)（使用 CD 模式）。

總結檢查清單

• 我能列出卜瓦松分佈的條件嗎？(RISH)
• 我知道對於卜瓦松分佈，平均值 = 方差 = \(\lambda\) 嗎？
• 我能針對不同的時間間隔縮放 \(\lambda\) 嗎？
• 我知道使用卜瓦松近似二項分佈的條件嗎（\(n\) 大，\(p\) 小）？
• 我能熟練使用計算機計算 \(P(X = x)\) 和 \(P(X \leq x)\) 嗎？

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。