歡迎來到幾何分佈與負二項分佈的世界!
在之前的學習中,你可能已經接觸過二項分佈(Binomial Distribution),它用於計算固定次數試驗中的成功次數。這一章我們要將邏輯翻轉過來!我們不再固定試驗次數,而是等待成功的出現。這就是為什麼它們通常被稱為「等待時間(waiting time)」分佈。
如果剛開始覺得有點抽象,別擔心。無論你是在等待擲出公正骰子的「6」,還是等待生產線上出現特定數量的次品,其背後的邏輯都是一樣的。讓我們馬上開始吧!
1. 幾何分佈 (The Geometric Distribution)
當我們關注要進行多少次試驗才能得到第一次成功時,就會使用幾何分佈。
我們何時使用它?
當滿足以下條件時,我們使用此模型:
• 每次試驗只有兩種結果:成功或失敗。
• 試驗是獨立的(一個結果不會影響下一個)。
• 每次試驗的成功機率 \( p \) 是恆定的。
• 我們一旦達到第一次成功就停止試驗。
機率質量函數 (PMF)
若 \( X \) 為直至第一次成功所需的試驗次數,我們記作 \( X \sim \text{Geo}(p) \)。成功發生在第 \( x \) 次試驗的機率公式為:
\( P(X = x) = p(1 - p)^{x-1} \),其中 \( x = 1, 2, 3, ... \)
公式拆解:
想像你在第 5 次嘗試時成功。這意味著你必須失敗了 4 次,然後成功了 1 次。
• \( (1-p)^{x-1} \) 代表了 \( x-1 \) 次失敗。
• \( p \) 代表了最後那一次成功。
速查方塊:
• \( p \):成功的機率。
• \( (1-p) \):失敗的機率(通常寫作 \( q \))。
• \( x \):獲得第一次成功時的試驗次數。
現實生活例子
例子:假設用弓箭射中目標的機率是 0.2。那麼在第 3 次嘗試才第一次射中目標的機率是多少?
這裡 \( p = 0.2 \) 且 \( x = 3 \)。
使用公式:\( P(X = 3) = 0.2 \times (1 - 0.2)^{3-1} = 0.2 \times 0.8^2 = 0.128 \)。
一個非常有用的技巧:累積機率
有時你需要求成功所需次數大於 \( k \) 的機率。
\( P(X > k) = (1 - p)^k \)
類比:如果你在第 \( k \) 次試驗時還沒有成功,這意味著你已經連續失敗了 \( k \) 次!這比將各個個別機率相加要快得多。
重點總結: 幾何分佈的核心就是「我要嘗試多少次才能成功一次?」
2. 幾何分佈的平均值與變異數
我們期望需要進行多少次試驗?結果又會有多大的波動?
公式
對於 \( X \sim \text{Geo}(p) \):
• 平均值(期望值): \( E(X) = \mu = \frac{1}{p} \)
• 變異數: \( \text{Var}(X) = \sigma^2 = \frac{1 - p}{p^2} \)
你知道嗎?
如果你擲骰子得到「6」的機率是 1/6 (\( p = 1/6 \)),則平均值為 \( 1 \div (1/6) = 6 \)。這非常有道理——你預期要擲 6 次骰子才能看到一個「6」!
常見錯誤:
學生常會搞混分子和分母。只要記住:如果成功機率極小,那麼期望的試驗次數就應該極大!
3. 負二項分佈 (The Negative Binomial Distribution)
將負二項分佈視為幾何分佈的「大哥哥」。我們不再只等待第一次成功,而是等待第 \( r \) 次成功。
機率質量函數 (PMF)
若 \( X \) 為直至第 \( r \) 次成功所需的試驗次數,我們記作 \( X \sim \text{NB}(r, p) \)。公式如下:
\( P(X = x) = \binom{x-1}{r-1} p^r (1 - p)^{x-r} \),其中 \( x = r, r+1, r+2, ... \)
逐步解釋:
這個公式看起來很嚇人,但讓我們用一個例子拆解它:假設我們要在第 10 次試驗 (\( x=10 \)) 時獲得第 3 次成功 (\( r=3 \)):
1. 最後一步: 第 10 次試驗必須是成功。這貢獻了一個 \( p \)。
2. 之前的情況: 在前 9 次試驗 (\( x-1 \)) 中,你必須恰好有 2 次成功 (\( r-1 \))。這就是為什麼我們使用組合 \( \binom{9}{2} \)。
3. 其餘部分: 你總共有 \( r \) 次成功 (即 \( p^r \)) 和 \( x-r \) 次失敗 (即 \( (1-p)^{x-r} \))。
現實生活例子
例子:一名籃球運動員罰球命中的機率為 0.7。那麼他在第 8 次嘗試時才投進第 5 個球的機率是多少?
這裡 \( p = 0.7 \),\( r = 5 \),且 \( x = 8 \)。
\( P(X = 8) = \binom{8-1}{5-1} (0.7)^5 (1 - 0.7)^{8-5} = \binom{7}{4} (0.7)^5 (0.3)^3 \)。
重點總結: 當你需要不止一次成功,且想知道需要多久才能達成時,就使用負二項分佈。
4. 負二項分佈的平均值與變異數
由於負二項分佈本質上就像進行了 \( r \) 次幾何分佈,其公式也非常相似!
公式
對於 \( X \sim \text{NB}(r, p) \):
• 平均值: \( E(X) = \mu = \frac{r}{p} \)
• 變異數: \( \text{Var}(X) = \sigma^2 = \frac{r(1 - p)}{p^2} \)
記憶小撇步:
只要把幾何分佈的公式乘以 \( r \) 就行了!就是這麼簡單!
5. 幾何分佈的假設檢定
在進階統計 1 (Further Statistics 1) 中,你需要根據成功出現所需的時間,來檢定一個聲稱的機率 \( p \) 是否準確。
檢定流程
1. 設定假設:
• \( H_0: p = \text{聲稱的值} \)
• \( H_1: p < \text{值} \)、\( p > \text{值} \) 或 \( p \neq \text{值} \)。
2. 計算機率: 使用樣本中的試驗結果 \( x \)。
• 如果要檢定 \( p \) 是否低於聲稱值,你是在尋找「異常漫長」的等待:計算 \( P(X \ge x) \)。
• 如果要檢定 \( p \) 是否高於聲稱值,你是在尋找「異常短暫」的等待:計算 \( P(X \le x) \)。
3. 比較: 將你的 p-value 與顯著水準 \( \alpha \) 進行比較。
4. 結論: 如果 p-value \( < \alpha \),則拒絕 \( H_0 \)。
加油語: 這裡的假設檢定邏輯與你在 A-Level 數學中所做的二項分佈檢定完全相同——只是分佈公式變了!
6. 選擇正確的分佈
如果你卡在不知道該用哪一個分佈,問自己以下問題:
試驗次數是固定的嗎?
• 是: 使用二項分佈。
• 否: (你在等待成功) 使用幾何或負二項分佈。
你在等待多少次成功?
• 恰好一次: 使用幾何分佈。
• 超過一次 (\( r \)): 使用負二項分佈。
第 3 章總結:
• 幾何分佈: 等待第一次成功。 \( E(X) = 1/p \)。
• 負二項分佈: 等待第 \( r \) 次成功。 \( E(X) = r/p \)。
• 獨立性: 在使用這些模型之前,請務必確認各個試驗之間互不影響!
• 假設檢定: 務必根據參數 \( p \) 來陳述你的假設。