指數分佈簡介
你好!歡迎閱讀關於指數分佈(Exponential Distribution)的學習筆記。這是你選修單元 2 – 統計(Optional application 2 – statistics)中的核心課題。雖然它看起來因為包含 \(e\) 和積分符號而顯得有些嚇人,但實際上,它是你將會學到的分佈中,邏輯最清晰且最貼近「現實世界」的分佈之一。
簡單來說,如果泊松分佈(Poisson distribution)是用來計算在特定時間內發生了多少次事件,那麼指數分佈則是衡量這些事件之間相隔的時間。如果你曾經等待過巴士或回覆訊息,你其實就已經體驗過指數分佈了!
1. 何時使用指數分佈
在查看公式之前,我們需要知道何時適合使用這個模型。指數分佈用於對以恆定平均速率(\(\lambda\))發生的獨立事件之間的時間或距離進行建模。
關鍵條件 (SF1):
要使用此分佈,事件必須滿足以下條件:
- 獨立性:一個事件的發生不會改變下一個事件發生的機率。
- 隨機性:事件是單獨發生的,且不會在同一瞬間同時發生。
- 恆定速率:單位時間內的平均事件數量,即 \(\lambda\)(lambda),必須保持不變。
與泊松分佈的聯繫 (SF4):
這兩個分佈之間有一個絕妙的聯繫:如果事件發生的次數服從泊松分佈,那麼這些事件之間的時間間隔就服從指數分佈。
例子:如果一家店平均每小時有 \(\lambda = 10\) 位顧客光臨(泊松分佈),那麼顧客之間等待的時間就服從 \(\lambda\) 相同的指數分佈。
快速回顧:記住,雖然泊松分佈的變量 \(X\) 是離散的(你不可能有 2.5 位顧客),但指數分佈的變量 \(X\) 是連續的(你可以等待 2.5 分鐘)。
2. 機率密度函數 (PDF)
機率密度函數 (Probability Density Function),即 \(f(x)\),告訴我們曲線在任何一點 \(x\) 的「高度」。對於指數分佈而言,曲線從高處開始,並隨著 \(x\) 的增加逐漸衰減趨近於零。
公式 (SF1):
對於隨機變量 \(X \sim \text{Exp}(\lambda)\):
\(f(x) = \lambda e^{-\lambda x}\),其中 \(x \ge 0\)
\(f(x) = 0\),其中 \(x < 0\)
圖形看起來如何?
想像一個滑梯,從 y 軸上的 \(\lambda\) 開始向下彎曲,並無限趨近於 x 軸但永不接觸。這顯示了短時間的等待比長時間的等待發生的機率要高得多。
3. 累積機率分佈函數 (CDF)
累積機率分佈函數 (Cumulative Distribution Function),即 \(F(x)\),在解決考試題目時非常有用。它告訴你等待時間小於或等於某個數值 \(x\) 的機率。
公式 (SF1):
\(F(x) = P(X \le x) = 1 - e^{-\lambda x}\)
計算「大於」機率 (SF2):
題目經常要求計算等待時間超過某個數值的機率。這其實更簡單:
\(P(X > x) = 1 - F(x) = e^{-\lambda x}\)
記憶小撇步:
記住 "L" 代表 Less than(小於)(包含 \(1 - e\)),"M" 代表 More than(大於)(只有 \(e\))。
\(P(X > x) = e^{-\lambda x}\)(即分佈的「尾部」)。
例題:
呼叫中心接到電話的間隔時間服從指數分佈,平均每小時接到 4 通電話。求下一次電話在 15 分鐘內打入的機率。
1. 找出 \(\lambda\):每小時 4 通電話。
2. 將時間單位換算成與 \(\lambda\) 一致:15 分鐘 = 0.25 小時。
3. 使用 \(F(x)\):\(P(X \le 0.25) = 1 - e^{-4 \times 0.25} = 1 - e^{-1} \approx 0.632\)。
4. 平均值、變異數與標準差
你需要掌握指數分佈的這三個屬性 (SF3)。它們出奇地簡單!
平均值(期望值):
\(E(X) = \mu = \frac{1}{\lambda}\)
類比:如果你每小時有 10 班巴士,你預期兩班車之間的等待時間是 \(\frac{1}{10}\) 小時(6 分鐘)。
變異數:
\(\text{Var}(X) = \sigma^2 = \frac{1}{\lambda^2}\)
標準差:
\(\text{SD}(X) = \sigma = \sqrt{\frac{1}{\lambda^2}} = \frac{1}{\lambda}\)
你知道嗎? 在指數分佈中,平均值和標準差是完全一樣的!如果題目告訴你平均值是 5,你馬上就能知道標準差也是 5。
5. 必要證明 (SF3)
在 AQA Further Maths 中,你需要能夠證明平均值和變異數。別擔心,如果這看起來很複雜,其實它們只是運用了分部積分法(Integration by Parts)。
平均值 \(E(X)\) 的證明:
回想 \(E(X) = \int_{0}^{\infty} x f(x) dx\)。
\(E(X) = \int_{0}^{\infty} x (\lambda e^{-\lambda x}) dx\)
使用分部積分法,設 \(u = x\) 且 \(\frac{dv}{dx} = \lambda e^{-\lambda x}\):
1. \(\frac{du}{dx} = 1\) 且 \(v = -e^{-\lambda x}\)
2. \(\int u v' = [uv] - \int v u'\)
3. \(E(X) = [-xe^{-\lambda x}]_{0}^{\infty} - \int_{0}^{\infty} -e^{-\lambda x} dx\)
4. 當 \(x \to \infty\) 時,\(-xe^{-\lambda x} \to 0\)。在 \(x=0\) 時,值為 \(0\)。
5. \(E(X) = 0 + [\frac{-1}{\lambda} e^{-\lambda x}]_{0}^{\infty}\)
6. \(E(X) = 0 - (0 - \frac{1}{\lambda}) = \frac{1}{\lambda}\)。
重點總結:證明平均值時,你需要對 \(x f(x)\) 進行積分。證明變異數時,先通過對 \(x^2 f(x)\) 積分求出 \(E(X^2)\),然後利用 \(\text{Var}(X) = E(X^2) - [E(X)]^2\) 進行計算。
6. 常見錯誤避坑指南
- 單位混淆:請務必確保 \(\lambda\) 和你的時間 \(x\) 使用相同的單位(例如:都用小時或都用分鐘)。
- 弄錯 \(\lambda\):記住 \(\lambda\) 是速率(例如:每小時 5 次),而平均值是 \(1/\lambda\)(0.2 小時)。如果題目說「平均時間是 10」,那麼 \(\lambda = 1/10\)。
- 忘記 \(1 - \dots\):對於 \(P(X < x)\),公式是 \(1 - e^{-\lambda x}\)。對於 \(P(X > x)\),公式只是 \(e^{-\lambda x}\)。學生經常會搞反!
總結表
參數: \(\lambda\)(速率)
PDF \(f(x)\): \(\lambda e^{-\lambda x}\)
CDF \(F(x)\): \(1 - e^{-\lambda x}\)
平均值: \(1/\lambda\)
變異數: \(1/\lambda^2\)
應用情境: 隨機且獨立的事件之間的時間/距離。