歡迎來到卜瓦松分佈(Poisson Distribution)的世界!

在本章中,我們要學習如何預測「不可預測」的事物。你有沒有想過,客戶服務中心是如何決定週二下午需要安排多少員工,或者醫院是如何預估急診室將會有多少病人到診的嗎?答案就是使用卜瓦松分佈

我們使用這個分佈來模擬在一個固定時段或空間區間內,某個事件發生的次數。如果現在覺得這些概念有點抽象,不用擔心——我們會循序漸進地為你拆解!

1. 什麼情況適合使用卜瓦松分佈?

在運用數學工具之前,我們必須先了解何時適合使用這個模型。若要一個情境符合卜瓦松分佈,該事件必須符合以下條件:

  • 獨立性 (Independently):一個事件的發生不會影響另一個事件發生的機率。(如果一個人走進商店,這並不代表會「導致」另一個人隨即走進來)。
  • 隨機性 (Randomly):事件可以在任何時間發生。
  • 單一性 (Singly):兩個事件不可能在同一瞬間同時發生。
  • 恆定的平均速率 (At a Constant Average Rate):事件發生的平均次數(我們稱之為 \(\lambda\),即 "lambda")在整個區間內保持不變。

小比喻:想像雨滴落在一塊特定的方形地磚上,過程就像是細雨綿綿。雨滴落下的過程是隨機的、獨立的,而且它們通常不會在同一時間精確地落在同一個點上。每分鐘的平均雨滴數量保持恆定

重點總結:

記憶口訣:記住 CRISConstant rate(恆定速率)、Random(隨機)、Independent(獨立)、Singly(單一發生)。如果這四個條件都滿足,你就可以使用卜瓦松變數了!

2. 卜瓦松公式

卜瓦松分佈的寫法為:
\(X \sim Po(\lambda)\)

這裡的 \(X\) 是我們的隨機變數(成功的次數),而 \(\lambda\) (lambda) 是在指定區間內發生的平均次數。

要找出精確發生 \(r\) 次成功的機率,我們使用以下公式:
\(P(X = r) = \frac{e^{-\lambda} \lambda^r}{r!}\)

符號拆解:

  • \(e\):一個數學常數,約等於 2.718(你的計算機上會有一個專屬按鍵!)。
  • \(\lambda\):事件發生的平均次數。
  • \(r\):你感興趣的事件發生次數(例如:「有 3 輛車經過的機率是多少?」)。
  • \(r!\):「r 的階乘」(例如:\(3! = 3 \times 2 \times 1\))。

步驟範例:
假設學生每小時平均收到 4 封電子郵件。請找出下一個小時內該學生正好收到 2 封郵件的機率。
1. 確認 \(\lambda\):這裡 \(\lambda = 4\)。
2. 確認 \(r\):我們想要 \(r = 2\)。
3. 代入公式:\(P(X=2) = \frac{e^{-4} \times 4^2}{2!}\)。
4. 計算:\(P(X=2) = \frac{0.0183 \times 16}{2} = 0.1465\)(取小數點後四位)。

快速檢查:

一定要檢查你的時間區間!如果平均值是每小時 4 次,但題目詢問的是兩小時內的機率,你必須將 \(\lambda\) 加倍變為 8。

3. 平均值與變異數:同卵雙胞胎

卜瓦松分佈最酷(也是最簡單!)的特點之一,就是它的平均值與變異數。

對於卜瓦松分佈 \(X \sim Po(\lambda)\):
平均值 \(E(X) = \lambda\)
變異數 \(Var(X) = \lambda\)

你知道嗎?如果題目告訴你一組數據的平均值與變異數大致相等,這是一個非常強烈的暗示,表示該數據符合卜瓦松分佈!

4. 加總獨立的卜瓦松變數

有時候我們會同時遇到兩個不同的卜瓦松事件。如果 \(X\) 和 \(Y\) 是獨立的卜瓦松變數:

若 \(X \sim Po(\lambda_a)\) 且 \(Y \sim Po(\lambda_b)\),
\(X + Y \sim Po(\lambda_a + \lambda_b)\)

範例:如果一家麵包店平均每小時賣出 3 個白麵包和 2 個黑麵包,則賣出麵包的總數遵循 \(Po(3 + 2) = Po(5)\)。

5. 二項分佈的近似

有時候,二項分佈 (Binomial distribution)(即有固定次數 \(n\) 的試驗)的數值太大,使用卜瓦松來處理會更容易。當符合以下情況時,我們可以這樣做:

  1. \(n\) 很大(通常 \(n > 50\))。
  2. \(p\) 很小(機率很低,通常 \(np < 5\))。

此時,我們使用 \(\lambda = np\)

為什麼要這樣做?計算 \(^{100}C_{5} \times (0.01)^5 \times (0.99)^{95}\) 比使用卜瓦松公式困難得多。這是一個數學捷徑!

常見錯誤避雷針:

如果 \(p\) 很大(接近 0.5),請不要使用卜瓦松近似。這時候我們應該改用常態分佈 (Normal distribution)!

6. 使用常態分佈近似卜瓦松分佈

等等,我們也能把卜瓦松轉為常態分佈嗎?沒錯!如果 \(\lambda\) 很大(通常 \(\lambda > 15\)),卜瓦松分佈的圖表看起來就會像對稱的鐘形曲線。

這種情況下,我們使用:
\(X \sim N(\lambda, \lambda)\)
(其中平均值為 \(\lambda\),變異數也是 \(\lambda\))。

重要:連續性修正 (Continuity Correction)!
因為卜瓦松是離散的(你不可能收到 4.5 封郵件),而常態分佈是連續的(你可以有 4.5 公分),所以兩者轉換時,必須調整數值 0.5
範例:若要使用常態近似法求 \(P(X > 20)\),你實際上要計算的是 \(P(X > 20.5)\)。

重點總結:

檢查你的 \(\lambda\):
- 如果 \(\lambda\) 很小:使用標準卜瓦松公式。
- 如果 \(\lambda\) 很大 (\(> 15\)):使用常態近似法,並記得加上連續性修正。

總結檢查清單

在參加考試前,確保你能做到以下事項:

  • 列出卜瓦松分佈的 4 個條件 (CRIS)。
  • 使用 \(e^{-\lambda}\) 公式計算機率。
  • 針對不同時間區間調整 \(\lambda\)。
  • 辨識何時該用卜瓦松來近似二項分佈。
  • 當 \(\lambda\) 很大時,使用常態分佈來近似卜瓦松(記得 0.5 的修正!)。

你一定沒問題的!卜瓦松分佈裡的希臘字母看起來可能有點嚇人,但它不過是一種計算隨機事件的方法。繼續練習歷屆試題吧!