歡迎來到卜瓦松分佈(Poisson Distribution)的世界!
在你的 A Level 統計學旅程中,你應該已經接觸過二項分佈(Binomial distribution),它用於計算在固定次數試驗中的「成功」次數。但如果沒有固定的試驗次數呢?如果我們只是想計算某件事在特定時間或空間內發生的次數,該怎麼辦?
這就是卜瓦松分佈大顯身手的時候了!無論是一小時內出現的流星數量、書頁上的錯別字數量,還是午餐時間進入商店的顧客人數,卜瓦松分佈都是我們的首選工具。如果一開始覺得它有點抽象,別擔心,我們會一步步拆解給你聽。
1. 什麼樣的情況適用「卜瓦松」?(教學大綱 SB1)
要使用卜瓦松模型,我們所計算的事件必須遵循四條嚴格的規則。你可以用記憶口訣 "RISC" 來記住它們:
R – Randomly(隨機性): 事件必須是隨機發生的。
I – Independently(獨立性): 一個事件的發生不會增加或減少另一個事件發生的可能性。
S – Singly(單一性): 事件不會在同一時間或地點同時發生。
C – Constant Rate(恆定速率): 每段間隔內的平均事件數(\(\lambda\))必須保持不變。
術語與符號
如果隨機變量 \(X\) 服從卜瓦松分佈,我們會將其寫為:
\(X \sim \text{Po}(\lambda)\)
符號 \(\lambda\)(希臘字母 "lambda")代表平均值(在給定間隔內的平均發生次數)。
比喻: 想像雨點落在單塊地磚上。如果雨勢穩定(恆定速率),一滴雨點不會「指揮」另一滴雨點落在哪裡(獨立),而且雨點是一滴一滴落下的(單一),那麼該地磚上的雨點數量就服從卜瓦松分佈。重點總結: 在開始計算之前,請務必確認該情況是否符合隨機、獨立、單一且速率恆定的條件。
2. 計算機率(教學大綱 SB2)
要找出恰好發生 \(x\) 次事件的機率,我們使用以下公式:
\(P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}\)
其中:
\(e\) 是一個常數(約等於 2.718,可在計算機上找到)。
\(\lambda\) 是平均速率。
\(x\) 是你想要尋找的成功次數。
\(x!\) 是 "\(x\) 階乘"(例如 \(4! = 4 \times 3 \times 2 \times 1\))。
使用計算機
在考試中,你大多會使用計算機的分佈函數:
1. Poisson PD: 用於計算「剛好」的題目(例如 \(P(X = 3)\))。
2. Poisson CD: 用於計算「累積」的題目(例如 \(P(X \leq 3)\))。
快速檢視:常見計算機錯誤
- 如果題目要求 \(P(X > 3)\),計算機無法直接計算。你必須計算 \(1 - P(X \leq 3)\)。
- 如果題目要求 \(P(X \geq 3)\),你必須計算 \(1 - P(X \leq 2)\)。
你知道嗎? 卜瓦松分佈是以法國數學家 Siméon Denis Poisson 的名字命名的,但他本人其實並不是用它來計算事件發生次數——他當時是用它來為法律審判建模的!
3. 平均值與變異數(教學大綱 SB3)
卜瓦松分佈最迷人(且最有幫助!)的特點之一,就是它的性質非常簡單。對於 \(X \sim \text{Po}(\lambda)\):
平均值 (Mean): \(E(X) = \lambda\)
變異數 (Variance): \(\text{Var}(X) = \lambda\)
沒錯,它們是相等的!這是卜瓦松分佈獨有的特徵。如果你手上的數據其平均值與變異數大致相等,這就是該情況適用卜瓦松模型的一個強烈訊號。
標準差 (Standard Deviation): 由於變異數為 \(\lambda\),因此標準差為 \(\sqrt{\lambda}\)。
重點總結: 如果 \(X \sim \text{Po}(5)\),那麼平均值就是 5,變異數也是 5。很簡單吧!
4. 加總獨立的卜瓦松分佈(教學大綱 SB4)
有時候你有兩個不同的卜瓦松變量,想要求總和。只要它們是獨立的,你就可以直接把平均值加起來。
如果 \(X \sim \text{Po}(\lambda_1)\) 且 \(Y \sim \text{Po}(\lambda_2)\),那麼:
\(X + Y \sim \text{Po}(\lambda_1 + \lambda_2)\)
別忘記: 這僅在事件相互獨立時有效。如果收到工作郵件會導致你收到個人郵件,你就不能使用這個規則!
5. 卜瓦松分佈的假設檢定(教學大綱 SB5)
我們使用假設檢定來觀察平均速率(\(\lambda\))是否因為某次觀測而發生了改變。
逐步流程:
1. 設定假設:
\(H_0\):\(\lambda = \text{舊速率}\)
\(H_1\):\(\lambda > \text{舊速率}\)(或是 \(< \text{舊速率}\) 或 \(\neq \text{舊速率}\))
2. 確定分佈:
假設 \(H_0\) 為真,即 \(X \sim \text{Po}(\lambda)\)。
3. 計算 P 值 (P-value):
找出觀察值或更極端情況的發生機率。
- 若測試速率增加,計算 \(P(X \geq \text{觀察值})\)。
- 若測試速率減少,計算 \(P(X \leq \text{觀察值})\)。
4. 與顯著性水平 (\(\alpha\)) 比較:
- 若 P 值 \(\leq \alpha\),拒絕 \(H_0\)。有顯著證據顯示速率已發生改變。
- 若 P 值 \(> \alpha\),接受 \(H_0\)(或稱「未能拒絕」)。沒有足夠證據顯示速率發生了改變。
快速檢視:常見錯誤
學生常會計算 \(P(X = \text{觀察值})\) 而非累積機率。在假設檢定中,我們永遠要尋找該結果或更極端情況的機率。
重點總結盒
術語: \(X \sim \text{Po}(\lambda\)條件: 隨機、獨立、單一、速率恆定。
性質: \(\text{平均值} = \text{變異數} = \lambda\)。
公式: \(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\)
總和: 對於獨立變量,直接相加 \(\lambda\) 值。
檢定: 使用卜瓦松分佈求出「尾端」機率來檢定平均值。