簡介:歡迎來到泊松分佈!

你好!今天我們要深入探討泊松分佈(Poisson Distribution)。雖然這個名字聽起來有點高深(它是以法國數學家西莫恩·德尼·泊松命名),但這個概念其實非常貼近我們的日常生活。

如果你已經學過二項分佈,你就會知道它是關於在固定次數的試驗中「成功與失敗」的次數。泊松分佈則略有不同:它能協助我們計算在固定的時間或空間區間內,特定事件發生次數的機率。

別擔心,如果公式一開始看起來讓你有些困惑,我們將會一步一步拆解,直到你成為箇中高手!

什麼是泊松分佈?

泊松分佈是一種離散型機率分佈。當我們想要統計某個特定「範圍」內事件發生的次數時,就會用到它——例如一小時內有多少輛車經過路口,或者一塊曲奇餅裡有多少粒巧克力豆。

現實生活中的例子

為了讓你更容易想像,請參考以下情況:

  • 時間:晚上 9:00 至 10:00 之間醫院收到的緊急求助電話數量。
  • 空間:教科書單一頁面上出現的打字錯誤數量。
  • 體積:一毫升水中發現的細菌數量。

你知道嗎?在這些情況下,我們無法得知事件「沒發生」了多少次(例如,我們無法計算有多少人「沒有」打電話給醫院),我們只知道事件「發生了」多少次!

什麼時候可以使用泊松分佈?(條件)

要讓一個情況符合泊松分佈,必須滿足四個主要條件。你可以透過下方的清單來記憶:

  1. 獨立性(Independent):一個事件的發生不會影響另一個事件發生的機率。(例如,一個人進入商店不會「導致」另一個人進入)。
  2. 單一性(Singly):事件是逐一發生的。兩個事件不可能在同一瞬間同時發生。
  3. 恆定速率(Constant Rate):平均發生率(\( \lambda \))在整個區間內保持不變。
  4. 隨機性(Random):事件發生的過程是不可預測的。

重點提示:如果題目提到事件是獨立地恆定的平均速率發生,你的大腦應該立刻聯想到「泊松分佈!」

泊松分佈公式

如果隨機變數 \( X \) 服從泊松分佈,我們記作:
\( X \sim \text{Po}(\lambda) \)

符號 \( \lambda \) (lambda) 代表平均值(即該區間內事件發生的平均次數)。

機率計算

要計算事件剛好發生 \( x \) 次的機率,我們使用這個公式:

\( P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!} \)

符號解析:

  • \( e \):一個數學常數,大約等於 2.718(你的計算機上有專門的按鍵!)。
  • \( \lambda \):平均速率(參數)。
  • \( x \):我們想要計算的成功次數(0, 1, 2, ...)。
  • \( x! \):「\( x \) 的階乘」(例如 \( 3! = 3 \times 2 \times 1 = 6 \))。請記住 \( 0! = 1 \)。

快速複習:
如果 \( \lambda = 3 \),而我們想求事件剛好發生 2 次的機率:
\( P(X = 2) = \frac{e^{-3} \times 3^2}{2!} = \frac{e^{-3} \times 9}{2} \approx 0.224 \)

平均值與變異數:一個特別的技巧!

泊松分佈最獨特的地方之一,就是它的平均值(Mean)變異數(Variance)是完全相等的!

對於 \( X \sim \text{Po}(\lambda) \):

  • 平均值 \( E(X) = \lambda \)
  • 變異數 \( \text{Var}(X) = \lambda \)
  • 標準差 \( \sigma = \sqrt{\lambda} \)

這為什麼有用? 如果考試題目給你變異數並問你分佈的情況,你立刻就會知道 \( \lambda \) 就等於該變異數。

調整區間

這是學生最容易出錯的地方,但只要你看出了規律,其實非常簡單。\( \lambda \) 的數值必須始終對應題目中提到的區間大小

例子:
如果一家店平均每小時有 6 名顧客(\( \lambda = 6 \)),那麼 30 分鐘的平均數是多少?
由於 30 分鐘是半小時,你只需要將 lambda 除以 2:\( \lambda = 3 \)。
2 小時呢?
乘以 2:\( \lambda = 12 \)。

避免常見錯誤:開始計算前,務必先檢查題目中的時間範圍。如果題目給出的速率是「每日」,但問的是「一週」,你必須先將 \( \lambda \) 乘以 7!

泊松分佈的相加

如果你有兩個獨立的泊松變數,假設 \( X \sim \text{Po}(\lambda_1) \) 且 \( Y \sim \text{Po}(\lambda_2) \),你可以將它們合併為一個泊松變數:

\( X + Y \sim \text{Po}(\lambda_1 + \lambda_2) \)

例子: 如果第 1 章的錯誤率是 2,而第 2 章的錯誤率是 3,那麼兩章合計的錯誤數就服從 \( \lambda = 5 \) 的泊松分佈。

二項分佈逼近泊松分佈

有時候,當二項分佈的規模太大時,使用泊松分佈計算會更容易。我們可以在以下條件下使用:

  • \( n \) 很大(通常 \( n > 50 \))
  • \( p \) 很小(通常 \( p < 0.1 \))

在這種情況下,我們使用 \( \lambda = np \)

比喻: 試想你要計算一個有 100 萬人口的城市裡,有多少人會中彩券。試驗次數 \( n \) 非常巨大,但中獎機率 \( p \) 極小。這就是使用泊松逼近法的最佳時機!

總結檢查清單

在進行練習題之前,請記住這些「重點摘要」:

  • 辨識:尋找「平均速率」和「固定區間」的字眼。
  • 檢查條件:獨立性、單一性、隨機性、恆定速率。
  • 參數:你唯一需要知道的就是 \( \lambda \)(平均值)。
  • 對應區間:確保你的 \( \lambda \) 與題目中詢問的特定時間/空間區間相符。
  • 特性:平均值 = 變異數 = \( \lambda \)。
  • 至少/超過:記住 \( P(X \ge 1) = 1 - P(X = 0) \)。這可以節省大量時間!

你一定能做到!泊松分佈的核心就是「速率」。掌握區間的調整,剩下的就只是簡單的計算機操作而已。