Geometric distribution

歡迎來到離散隨機變數（Discrete Random Variables）的精彩世界！在這一章中，我們將聚焦於一種特定的機率模型：幾何分佈（Geometric Distribution）。

如果機率模型有時讓你覺得抽象，請別擔心。幾何分佈非常直觀，因為它描述的是我們每天都會做的事情：等待第一次成功。

你將會學到使用此模型所需的特定條件，如何計算等待特定次數試驗的機率，以及如何找到平均等待時間（期望值 Mean）。

1. 理解幾何分佈 $X \sim \text{Geo}(p)$

當我們進行一系列獨立試驗，並且我們感興趣的是達到第一次成功所需的試驗次數時，就會使用幾何分佈。

隨機變數 $X$ 定義如下：
$X$ = 直到並包括第一次成功結果為止的試驗次數。

由於 $X$ 是計算試驗次數，其可能取值為 $x = 1, 2, 3, \dots$。這是一個離散隨機變數，因為試驗次數不可能為 1.5 次！

類比：籃球罰球

想像一位罰球命中率為 30% ($p=0.3$) 的籃球運動員。我們持續觀察他投籃，直到他投進第一球為止。幾何分佈模擬了我們總共需要等待多少次投籃，第一球才會進。

如果他第一次投籃就成功，則 $X=1$。
如果他第一次失敗，第二次成功，則 $X=2$。
如果他失敗、失敗，然後成功，則 $X=3$，以此類推。

重點提示： 幾何分佈是一種「等待時間」分佈。它計算的是直到第一次成功為止的試驗次數。

2. 應用條件（何時使用 Geo）

幾何分佈是伯努利試驗過程（Bernoulli trial process）的一個特殊情況。它需要滿足四個關鍵條件。你可以使用記憶法 SIT 來記住這些條件：

Success or Failure（成功或失敗，伯努利試驗）：每次試驗必須只有兩種可能的結果，通常稱為「成功」和「失敗」。
Independence（獨立性）：任何一次試驗的結果不得影響後續任何試驗的結果。
Trials until First Success（直到第一次成功為止的試驗）：實驗必須（理論上）無限期地持續進行，直到第一次成功出現為止。（注意：與二項分佈不同，這裡沒有固定的試驗次數 $n$）。
Same Probability（相同機率 $p$）：成功的機率 $p$ 對每一次試驗都必須保持不變。

快速檢查：幾何分佈 vs. 二項分佈

混淆幾何分佈和二項分佈是一個常見錯誤。請記住停止規則：

二項分佈 ($X \sim B(n, p)$)：在固定的試驗次數 $n$ 後停止。
幾何分佈 ($X \sim \text{Geo}(p)$)：在第一次成功後停止。

3. 計算機率 $P(X=x)$

令 $p$ 為成功機率，$q = 1-p$ 為失敗機率。

如果我們希望第一次成功發生在第 $x$ 次試驗，這意味著前 $x-1$ 次試驗必須全部失敗，而第 $x$ 次試驗必須是成功。

由於試驗是獨立的，我們將機率相乘：

第 1 次失敗、第 2 次失敗、...、第 (x-1) 次失敗，且第 x 次成功。

$$P(X=x) = \underbrace{q \times q \times \dots \times q}_{x-1 \text{ 次}} \times p$$

特定機率公式

若 $X \sim \text{Geo}(p)$，則機率函數為：

$$P(X=x) = (1-p)^{x-1} p \quad \text{對於 } x = 1, 2, 3, \dots$$

或者，使用 $q$ 表示：

$$P(X=x) = q^{x-1} p$$

計算範例（分步解析）

一枚偏差硬幣出現正面的機率為 $P(\text{Heads}) = 0.4$。令 $X$ 為直到出現第一個正面為止的投擲次數。$X \sim \text{Geo}(0.4)$。求第一次正面出現在第 4 次投擲的機率。

第 1 步：識別 $p$ 和 $q$。
$p = 0.4$（成功：正面）。
$q = 1 - 0.4 = 0.6$（失敗：反面）。

第 2 步：定義事件。
我們想要 $X=4$。這意味著序列必須是（失敗, 失敗, 失敗, 成功）。

第 3 步：套用公式。
$$P(X=4) = q^{4-1} p = q^3 p$$ $$P(X=4) = (0.6)^3 \times (0.4)$$ $$P(X=4) = 0.216 \times 0.4 = 0.0864$$

累積機率與尾部機率

有時你需要求等待時間超過某個特定次數的機率。這通常是幾何分佈中最簡單的計算！

如果我們要計算 $P(X > k)$，這意味著第一次成功並沒有在前 $k$ 次試驗中發生。換句話說，前 $k$ 次試驗全部都是失敗。

$$P(X > k) = P(\text{第1次失敗} \cap \text{第2次失敗} \cap \dots \cap \text{第k次失敗})$$

$$P(X > k) = q \times q \times \dots \times q \quad (k \text{ 次})$$

尾部機率公式

$$P(X > k) = (1-p)^k = q^k$$

範例：使用上述硬幣（$p=0.4$, $q=0.6$），求需要超過 5 次投擲才得到第一個正面的機率。
$$P(X > 5) = q^5 = (0.6)^5 = 0.07776$$

如果你需要 $P(X \le k)$（累積機率），你可以使用補集規則：

$$P(X \le k) = 1 - P(X > k) = 1 - q^k$$

重點提示： 機率結構很簡單：失敗機率連乘再加上最後的成功機率。公式 $P(X > k) = q^k$ 是一個強大的快捷方式。

4. $X \sim \text{Geo}(p)$ 的平均值與變異數

在任何隨機變數的背景下，平均值（期望值）（$E(X)$ 或 $\mu$）告訴我們預期的平均結果，而變異數（$Var(X)$ 或 $\sigma^2$）則告訴我們結果的分佈離散程度。

課程大綱要求理解這些結果，並知道如何進行推導（通常使用機率母函數，這在 FS1.4 中有涵蓋）。

4.1 平均值（預期等待時間）

直到第一次成功為止的預期試驗次數，簡單來說就是成功機率的倒數。

$$E(X) = \mu = \frac{1}{p}$$

概念檢查： 這非常合理！如果巴士平均每 10 分鐘到站一次 ($p=0.1$)，你預期平均需要等待 10 分鐘下一班車才會到 ($1/0.1 = 10$)。

範例：若 $p=0.25$，則預期試驗次數為 $E(X) = 1/0.25 = 4$。平均來說，你預期需要等待 4 次試驗。

4.2 變異數

變異數衡量了等待時間的分散或變異程度。如果 $p$ 非常小（難以成功），變異數會很高，意味著等待時間非常不可預測。

$$Var(X) = \sigma^2 = \frac{1-p}{p^2} = \frac{q}{p^2}$$

你知道嗎？ 當 $p$ 增加（成功變得更容易）時，平均值 ($1/p$) 會下降，變異數 ($q/p^2$) 也會下降，這意味著結果會變得更一致，且發生得更早。

Geo($p$) 的關鍵公式總結

機率： $P(X=x) = q^{x-1} p$

尾部機率： $P(X > k) = q^k$

平均值： $E(X) = \frac{1}{p}$

變異數： $Var(X) = \frac{q}{p^2}$

5. 常見陷阱與記憶輔助

錯誤 1：算錯 $x$

學生有時會搞混 $X$ 是指第一次成功前的失敗次數，還是指直到並包括第一次成功在內的總試驗次數。

記住： 在 OxfordAQA 高等數學（9665）中，$X$ 定義為總試驗次數，因此 $x \ge 1$。如果題目定義的變數不同（例如：成功前的失敗次數），你必須相應地調整公式，但通常情況下請堅持使用 $X \sim \text{Geo}(p)$，其中 $x$ 從 1 開始。

錯誤 2：忘記獨立性

如果成功機率會根據先前的結果而改變（例如：不放回抽樣），則不能使用幾何模型，因為試驗並不獨立。

記憶輔助： 在套用公式之前，請務必徹底檢查 SIT 條件。

範例：從平均值求 $p$

如果你被告知通過考試所需的預期次數是 5，你可以立即求出 $p$：

$$E(X) = 5$$ $$\frac{1}{p} = 5$$ $$p = \frac{1}{5} = 0.2$$

這是解答某些考試題目的快速方法！

恭喜你，你現在已經對幾何分佈有了紮實的理解。繼續練習這些計算，你一定能掌握這個課題！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

1. 理解幾何分佈 \(X \sim \text{Geo}(p)\)

類比：籃球罰球

2. 應用條件（何時使用 Geo）

快速檢查：幾何分佈 vs. 二項分佈

3. 計算機率 \(P(X=x)\)

特定機率公式

計算範例（分步解析）

累積機率與尾部機率

尾部機率公式

4. \(X \sim \text{Geo}(p)\) 的平均值與變異數

4.1 平均值（預期等待時間）

4.2 變異數

Geo(\(p\)) 的關鍵公式總結

5. 常見陷阱與記憶輔助

錯誤 1：算錯 \(x\)

錯誤 2：忘記獨立性

範例：從平均值求 \(p\)

立即實踐所學