簡介:計算事件與測量時間
歡迎來到統計學中最實用的章節之一!在單元一:數據與概率 (Paper 1: Data and Probability) 的這一部分,我們將探討如何為「隨機」發生的事件建立數學模型。
你有沒有想過,你在一小時內可能會收到多少封電郵,或者你需要等待多久巴士才會到達?泊松分佈 (Poisson distribution) 能幫助我們計算這些事件的數量,而指數分佈 (Exponential distribution) 則能幫助我們測量事件之間的時間間隔。它們就像硬幣的兩面,息息相關!
1. 泊松分佈 (The Poisson Distribution)
泊松分佈是一種離散型 (discrete) 概率分佈。當我們想要計算在固定的時間或空間間隔內,特定事件發生了多少次時,就會使用它。
何時適合使用泊松模型?
要使用泊松分佈建立模型,必須滿足四個條件。你可以利用助記詞 CRIS 來記憶:
C – Constant Rate(固定比率):事件必須以一個固定的平均比率 (\(\lambda\)) 發生。
R – Random(隨機性):事件隨機發生;你無法準確預測下一次會在什麼時候發生。
I – Independent(獨立性):一個事件的發生不會改變另一個事件發生的可能性。
S – Singly(單一性):事件不能在同一瞬間同時發生;它們必須逐一發生。
泊松公式
如果一個隨機變量 \(X\) 服從平均比率為 \(\lambda\) 的泊松分佈,我們記作 \(X \sim \text{Po}(\lambda)\)。
觀察到恰好 \(x\) 次事件的概率為:
\(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\)
平均值與方差:泊松分佈最獨特的地方之一,就是它的平均值 (mean) 和方差 (variance) 完全相同!
\(E(X) = \lambda\)
\(Var(X) = \lambda\)
重點速覽:
- 離散型(計算整數)。
- \(\lambda\) 是平均發生次數。
- 平均值 = 方差。
關鍵總結:
當你想計算在固定的時間或空間區間內,隨機且獨立事件發生的次數時,請使用泊松分佈。
2. 指數分佈 (The Exponential Distribution)
如果說泊松分佈用於計算事件數量,那麼指數分佈則用於測量事件之間的時間間隔。由於時間和距離可以精確到任何小數位,因此這是一種連續型 (continuous) 分佈。
泊松與指數分佈的關係
它們兩者是好夥伴!如果事件發生的次數服從比率為 \(\lambda\) 的泊松分佈,那麼這些事件之間的時間間隔就服從比率同樣為 \(\lambda\) 的指數分佈。
比喻:如果泊松分佈告訴你,平均每小時有 2 輛巴士到達 (\(\lambda = 2\)),那麼指數分佈就會告訴你,巴士之間的平均等待時間是半小時 (\(1/2\))。指數分佈公式
我們記作 \(X \sim \text{Exp}(\lambda)\)。請注意,此處的 \(\lambda\) 與泊松分佈中的「比率」相同。
平均值: \(E(X) = \frac{1}{\lambda}\)
方差: \(Var(X) = \frac{1}{\lambda^2}\)
若要計算時間 \(X\) 小於某個數值 \(x\) 的概率,我們使用累積分佈函數 (Cumulative Distribution Function, CDF):
\(P(X < x) = 1 - e^{-\lambda x}\)
冷知識:
指數分佈具有「無記憶性」(memoryless)。這意味著如果你在等待放射性原子衰變,無論你已經等待了十秒鐘還是十年,它在下一分鐘內發生衰變的概率都是一樣的!
關鍵總結:
指數分佈用於模擬隨機事件之間的時間或空間間隔。如果事件發生率為 \(\lambda\),則平均等待時間為 \(1/\lambda\)。
3. 解題步驟:按部就班
如果起初覺得混淆也不用擔心,大部分錯誤都是因為搞混了這兩個分佈。請遵循以下步驟:
步驟 1:識別分佈類型
問自己:我是在計算東西的數量(泊松),還是在測量時間/距離(指數)?
步驟 2:找出 \(\lambda\)
確保 \(\lambda\) 與題目中的區間相匹配。
例子:如果比率是每小時 10 通電話,但題目問的是 30 分鐘內的窗口,那麼該題的 \(\lambda\) 就是 5。
步驟 3:使用正確的公式或計算機
對於泊松分佈,你通常會使用計算機中的 Poisson PD(用於 \(X=x\))或 Poisson CD(用於 \(X \le x\))。對於指數分佈,你幾乎總是使用公式 \(P(X < x) = 1 - e^{-\lambda x}\)。
常見錯誤:
- 單位不匹配:務必檢查 \(\lambda\) 的時間單位與題目是否一致(例如:分鐘 vs 小時)。
- 平均值 vs 比率:在指數分佈中,平均值是 \(1/\lambda\),但比率是 \(\lambda\)。如果題目說「平均時間是 10 分鐘」,那麼 \(\lambda = 1/10 = 0.1\)。
- 嚴格不等式:由於指數分佈是連續的,\(P(X < 5)\) 與 \(P(X \le 5)\) 相同。但這對於離散型的泊松分佈來說是不成立的!
關鍵總結:
開始計算前,一定要再次檢查單位,並確認你處理的是比率 (\(\lambda\)) 還是平均值 (\(1/\lambda\))。
4. 快速複習總結表
泊松分佈 \(X \sim \text{Po}(\lambda)\)
- 類型:離散型 (0, 1, 2...)
- 測量對象:事件發生的次數
- 平均值: \(\lambda\)
- 方差: \(\lambda\)
指數分佈 \(X \sim \text{Exp}(\lambda)\)
- 類型:連續型 (\(x > 0\))
- 測量對象:事件之間的時間/空間間隔
- 平均值: \(\frac{1}{\lambda}\)
- 方差: \(\frac{1}{\lambda^2}\)
最終總結:
泊松分佈計算的是有多少次,而指數分佈測量的是還要等多久。只要掌握泊松分佈的條件 (CRIS) 以及兩者之間的關係,你在 Paper 1 中就能游刃有餘!