歡迎來到離散隨機變數(Discrete Random Variables)的精彩世界!在這一章中,我們將聚焦於一種特定的機率模型:幾何分佈(Geometric Distribution)。
如果機率模型有時讓你覺得抽象,請別擔心。幾何分佈非常直觀,因為它描述的是我們每天都會做的事情:等待第一次成功。
你將會學到使用此模型所需的特定條件,如何計算等待特定次數試驗的機率,以及如何找到平均等待時間(期望值 Mean)。
1. 理解幾何分佈 \(X \sim \text{Geo}(p)\)
當我們進行一系列獨立試驗,並且我們感興趣的是達到第一次成功所需的試驗次數時,就會使用幾何分佈。
隨機變數 \(X\) 定義如下:
\(X\) = 直到並包括第一次成功結果為止的試驗次數。
由於 \(X\) 是計算試驗次數,其可能取值為 \(x = 1, 2, 3, \dots\)。這是一個離散隨機變數,因為試驗次數不可能為 1.5 次!
類比:籃球罰球
想像一位罰球命中率為 30% (\(p=0.3\)) 的籃球運動員。我們持續觀察他投籃,直到他投進第一球為止。幾何分佈模擬了我們總共需要等待多少次投籃,第一球才會進。
- 如果他第一次投籃就成功,則 \(X=1\)。
- 如果他第一次失敗,第二次成功,則 \(X=2\)。
- 如果他失敗、失敗,然後成功,則 \(X=3\),以此類推。
重點提示: 幾何分佈是一種「等待時間」分佈。它計算的是直到第一次成功為止的試驗次數。
2. 應用條件(何時使用 Geo)
幾何分佈是伯努利試驗過程(Bernoulli trial process)的一個特殊情況。它需要滿足四個關鍵條件。你可以使用記憶法 SIT 來記住這些條件:
- Success or Failure(成功或失敗,伯努利試驗):每次試驗必須只有兩種可能的結果,通常稱為「成功」和「失敗」。
- Independence(獨立性):任何一次試驗的結果不得影響後續任何試驗的結果。
- Trials until First Success(直到第一次成功為止的試驗):實驗必須(理論上)無限期地持續進行,直到第一次成功出現為止。(注意:與二項分佈不同,這裡沒有固定的試驗次數 \(n\))。
- Same Probability(相同機率 \(p\)):成功的機率 \(p\) 對每一次試驗都必須保持不變。
快速檢查:幾何分佈 vs. 二項分佈
混淆幾何分佈和二項分佈是一個常見錯誤。請記住停止規則:
- 二項分佈 (\(X \sim B(n, p)\)):在固定的試驗次數 \(n\) 後停止。
- 幾何分佈 (\(X \sim \text{Geo}(p)\)):在第一次成功後停止。
3. 計算機率 \(P(X=x)\)
令 \(p\) 為成功機率,\(q = 1-p\) 為失敗機率。
如果我們希望第一次成功發生在第 \(x\) 次試驗,這意味著前 \(x-1\) 次試驗必須全部失敗,而第 \(x\) 次試驗必須是成功。
由於試驗是獨立的,我們將機率相乘:
第 1 次失敗、第 2 次失敗、...、第 (x-1) 次失敗,且第 x 次成功。
$$P(X=x) = \underbrace{q \times q \times \dots \times q}_{x-1 \text{ 次}} \times p$$
特定機率公式
若 \(X \sim \text{Geo}(p)\),則機率函數為:
$$P(X=x) = (1-p)^{x-1} p \quad \text{對於 } x = 1, 2, 3, \dots$$
或者,使用 \(q\) 表示:
$$P(X=x) = q^{x-1} p$$
計算範例(分步解析)
一枚偏差硬幣出現正面的機率為 \(P(\text{Heads}) = 0.4\)。令 \(X\) 為直到出現第一個正面為止的投擲次數。\(X \sim \text{Geo}(0.4)\)。求第一次正面出現在第 4 次投擲的機率。
第 1 步:識別 \(p\) 和 \(q\)。
\(p = 0.4\)(成功:正面)。
\(q = 1 - 0.4 = 0.6\)(失敗:反面)。
第 2 步:定義事件。
我們想要 \(X=4\)。這意味著序列必須是(失敗, 失敗, 失敗, 成功)。
第 3 步:套用公式。
$$P(X=4) = q^{4-1} p = q^3 p$$
$$P(X=4) = (0.6)^3 \times (0.4)$$
$$P(X=4) = 0.216 \times 0.4 = 0.0864$$
累積機率與尾部機率
有時你需要求等待時間超過某個特定次數的機率。這通常是幾何分佈中最簡單的計算!
如果我們要計算 \(P(X > k)\),這意味著第一次成功並沒有在前 \(k\) 次試驗中發生。換句話說,前 \(k\) 次試驗全部都是失敗。
$$P(X > k) = P(\text{第1次失敗} \cap \text{第2次失敗} \cap \dots \cap \text{第k次失敗})$$
$$P(X > k) = q \times q \times \dots \times q \quad (k \text{ 次})$$
尾部機率公式
$$P(X > k) = (1-p)^k = q^k$$
範例:使用上述硬幣(\(p=0.4\), \(q=0.6\)),求需要超過 5 次投擲才得到第一個正面的機率。
$$P(X > 5) = q^5 = (0.6)^5 = 0.07776$$
如果你需要 \(P(X \le k)\)(累積機率),你可以使用補集規則:
$$P(X \le k) = 1 - P(X > k) = 1 - q^k$$
重點提示: 機率結構很簡單:失敗機率連乘再加上最後的成功機率。公式 \(P(X > k) = q^k\) 是一個強大的快捷方式。
4. \(X \sim \text{Geo}(p)\) 的平均值與變異數
在任何隨機變數的背景下,平均值(期望值)(\(E(X)\) 或 \(\mu\))告訴我們預期的平均結果,而變異數(\(Var(X)\) 或 \(\sigma^2\))則告訴我們結果的分佈離散程度。
課程大綱要求理解這些結果,並知道如何進行推導(通常使用機率母函數,這在 FS1.4 中有涵蓋)。
4.1 平均值(預期等待時間)
直到第一次成功為止的預期試驗次數,簡單來說就是成功機率的倒數。
$$E(X) = \mu = \frac{1}{p}$$
概念檢查: 這非常合理!如果巴士平均每 10 分鐘到站一次 (\(p=0.1\)),你預期平均需要等待 10 分鐘下一班車才會到 (\(1/0.1 = 10\))。
範例:若 \(p=0.25\),則預期試驗次數為 \(E(X) = 1/0.25 = 4\)。平均來說,你預期需要等待 4 次試驗。
4.2 變異數
變異數衡量了等待時間的分散或變異程度。如果 \(p\) 非常小(難以成功),變異數會很高,意味著等待時間非常不可預測。
$$Var(X) = \sigma^2 = \frac{1-p}{p^2} = \frac{q}{p^2}$$
你知道嗎? 當 \(p\) 增加(成功變得更容易)時,平均值 (\(1/p\)) 會下降,變異數 (\(q/p^2\)) 也會下降,這意味著結果會變得更一致,且發生得更早。
Geo(\(p\)) 的關鍵公式總結
機率: \(P(X=x) = q^{x-1} p\)
尾部機率: \(P(X > k) = q^k\)
平均值: \(E(X) = \frac{1}{p}\)
變異數: \(Var(X) = \frac{q}{p^2}\)
5. 常見陷阱與記憶輔助
錯誤 1:算錯 \(x\)
學生有時會搞混 \(X\) 是指第一次成功前的失敗次數,還是指直到並包括第一次成功在內的總試驗次數。
記住: 在 OxfordAQA 高等數學(9665)中,\(X\) 定義為總試驗次數,因此 \(x \ge 1\)。如果題目定義的變數不同(例如:成功前的失敗次數),你必須相應地調整公式,但通常情況下請堅持使用 \(X \sim \text{Geo}(p)\),其中 \(x\) 從 1 開始。
錯誤 2:忘記獨立性
如果成功機率會根據先前的結果而改變(例如:不放回抽樣),則不能使用幾何模型,因為試驗並不獨立。
記憶輔助: 在套用公式之前,請務必徹底檢查 SIT 條件。
範例:從平均值求 \(p\)
如果你被告知通過考試所需的預期次數是 5,你可以立即求出 \(p\):
$$E(X) = 5$$ $$\frac{1}{p} = 5$$ $$p = \frac{1}{5} = 0.2$$
這是解答某些考試題目的快速方法!
恭喜你,你現在已經對幾何分佈有了紮實的理解。繼續練習這些計算,你一定能掌握這個課題!