歡迎來到隨機事件的世界!

在本章中,我們將探討如何計算隨機發生的事件。無論是頁面上的錯別字數量、你在一小時內收到的郵件數量,還是曲奇餅裡有多少粒朱古力豆,統計學都能幫助我們預測這些「不可預測」的事物。我們將會研究卜瓦松分佈 (Poisson Distribution),以及它與你之前學過的二項分佈 (Binomial Distribution)之間的聯繫。如果起初看到這些符號感到不知所措,請不用擔心,我們會一步步為你拆解!

1. 卜瓦松分佈:基本概念

卜瓦松分佈用於模擬在一個固定間隔的時間或空間內,某事件發生的次數。

我們什麼時候會用到它?
要使用卜瓦松分佈進行模擬,必須滿足四個條件。你可以透過首字母縮寫 RISH 來記憶:

Randomly (隨機性):事件是隨機發生的。
Independently (獨立性):一個事件的發生不會改變另一個事件發生的機率。
Singly (單一性):事件不能在完全相同的時間點同時發生。
Highly uniform (高度均勻性):事件以恆定的平均速率 (\(\lambda\)) 發生。

例子:如果你正在計算經過閘門的汽車數量,它們應該以恆定的平均速率經過(例如每分鐘 2 輛車),但每輛車經過的具體時間是隨機且獨立的。

公式:
如果一個隨機變量 \(X\) 服從平均速率為 \(\lambda\) 的卜瓦松分佈,我們記作:
\(X \sim \text{Po}(\lambda)\)

恰好觀察到 \(x\) 個事件的機率為:
\(P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}\)

記憶小技巧:在計算機上,你通常不需要輸入整個公式!請尋找 Poisson PD(用於計算特定數值)或 Poisson CD(用於計算範圍,例如「小於 3」)功能。

重點總結:卜瓦松分佈的核心在於事物在特定時間或空間「窗口」內發生的速率 (\(\lambda\))。

2. 加法性質:縮放與合併

卜瓦松分佈最酷的地方之一是它對速率 \(\lambda\) 的處理非常靈活。由於它是一個速率,你可以輕鬆地對其進行縮放。

縮放速率

如果 \(X\) 是每分鐘發生的事件數量,且 \(X \sim \text{Po}(\lambda)\),那麼在 \(t\) 分鐘的時間段內,新的分佈為:
\(X_{new} \sim \text{Po}(\lambda t)\)

生活比喻:如果你通常每小時收到 2 條短訊 (\(\lambda = 2\)),那麼在 5 小時內,你預期會收到 10 條短訊 (\(2 \times 5 = 10\))。你這 5 小時內的目標分佈就是 \(\text{Po}(10)\)。

相加獨立變量

如果你有兩個獨立的卜瓦松變量 \(X\) 和 \(Y\),你可以將它們相加:
如果 \(X \sim \text{Po}(\lambda)\) 且 \(Y \sim \text{Po}(\mu)\),那麼:
\(X + Y \sim \text{Po}(\lambda + \mu)\)

例子:如果一家商店有兩個入口,A 門每小時進入的人數為 \(\text{Po}(3)\),B 門每小時進入的人數為 \(\text{Po}(4)\),那麼進入商店的總人數即為 \(\text{Po}(3+4) = \text{Po}(7)\) 每小時。

重點總結:只要事件是獨立的,且時間/空間間隔一致,你就可以將卜瓦松速率相加!

3. 平均值與方差:卜瓦松的「魔法」

在統計學中,我們經常研究期望值 (Expectation/Mean)方差 (Variance)(數據的分散程度)。以下是我們兩個常用分佈的對比:

對於二項分佈 \(B(n, p)\):

平均值:\(E(X) = np\)
方差:\(Var(X) = np(1-p)\)

對於卜瓦松分佈 \(Po(\lambda)\):

平均值:\(E(X) = \lambda\)
方差:\(Var(X) = \lambda\)

你知道嗎?
卜瓦松分佈的獨特之處在於它的平均值和方差完全相同!這是一個非常常見的考題。如果題目給出的數據中平均值和方差很接近,這是一個強烈的暗示,表示使用卜瓦松模型會非常合適。

快速回顧:
如果 \(Var(X) \approx E(X)\),則卜瓦松是一個好的模型。
如果 \(Var(X) < E(X)\),使用二項分佈模型可能會更好。

4. 二項分佈的卜瓦松近似

有時,計算二項分佈 \(B(n, p)\) 的機率會變成一場惡夢——尤其是當 \(n\) 非常大(例如 1,000)且 \(p\) 非常小(例如 0.001)時。在這些情況下,我們可以使用卜瓦松分佈作為捷徑!

什麼時候可以使用這個捷徑?
當滿足以下條件時,你可以用 \(Po(\lambda)\) 近似 \(B(n, p)\):
1. \(n\) 很大(通常 \(n > 50\))
2. \(p\) 很小(通常 \(p < 0.1\))

操作步驟:
步驟 1:檢查 \(n\) 是否夠大,\(p\) 是否夠小。
步驟 2:利用公式 \(\lambda = np\) 計算速率 \(\lambda\)。
步驟 3:使用卜瓦松分佈 \(\text{Po}(np)\) 來查找你的機率。

例子:一家工廠生產 1,000 個燈泡,燈泡有瑕疵的機率是 0.005。與其使用 \(B(1000, 0.005)\),不如使用 \(\text{Po}(1000 \times 0.005) = \text{Po}(5)\)。這樣計算會快得多!

重點總結:隨著試驗次數增加且成功機率降低,卜瓦松分佈正是二項分佈的「極限」。

5. 常見陷阱要避開

如果起初覺得棘手也別擔心,但請記住以下常見錯誤:

忘記縮放 \(\lambda\):務必檢查題目中的時間間隔是否與 \(\lambda\) 的時間間隔匹配。如果 \(\lambda\) 是「每天」,但題目問的是「每週」,你必須先乘以 7。
獨立性:只有當變量是獨立的,你才能將卜瓦松變量相加。如果一個事件會觸發另一個事件(如傳染病),卜瓦松通常不是一個好的模型。
二項分佈 vs. 卜瓦松分佈:記住二項分佈有一個固定的上限 (\(n\)),而卜瓦松在理論上沒有上限(即使機率接近零,理論上也可能發生無窮多次事件)。
計算機模式:仔細檢查你需要的是 PD(恰好 \(x\))還是 CD(累計至 \(x\))。如果題目問「大於 5」,你需要計算 \(1 - P(X \leq 5)\)(使用 CD 模式)。

總結檢查清單

• 我能列出卜瓦松分佈的條件嗎?(RISH)
• 我知道對於卜瓦松分佈,平均值 = 方差 = \(\lambda\) 嗎?
• 我能針對不同的時間間隔縮放 \(\lambda\) 嗎?
• 我知道使用卜瓦松近似二項分佈的條件嗎(\(n\) 大,\(p\) 小)?
• 我能熟練使用計算機計算 \(P(X = x)\) 和 \(P(X \leq x)\) 嗎?