簡介:掌握伯努利分佈與二項分佈

歡迎來到統計學中最實用且最常考的課題之一!本章將探討如何為只有兩種可能結果的實驗或情境進行建模:成功或失敗。試想一下擲硬幣、檢查產品是否有瑕疵,或是回答是非題。

伯努利(Bernoulli)二項(Binomial)分佈是我們必備的關鍵工具,讓我們能精確計算在特定次數的嘗試中,獲得指定次數成功的機率。別擔心如果以前覺得機率很抽象——這些分佈為我們提供了分析現實世界隨機性的具體框架!


1. 伯努利試驗:最簡單的事件

1.1 什麼是伯努利試驗?

伯努利分佈是二項分佈的基礎。它為符合以下嚴格條件的單次簡單實驗進行建模:

  • 只有兩個互斥的結果
    • 成功(通常記作 \(X=1\))
    • 失敗(通常記作 \(X=0\))

成功的機率記作 \(p\)。因此,失敗的機率為 \(1-p\),我們常將其稱為 \(q\)。

例子:如果你擲一顆標準骰子,定義擲出 6 點為「成功」,那麼 \(p = 1/6\)。「失敗」則是指擲出其他任何點數,所以 \(q = 5/6\)。

1.2 伯努利試驗的期望值與變異數

由於伯努利分佈只涉及一次試驗,其期望值(平均值)與變異數非常簡單。你需要了解這些定義及其推導方式(雖然考試可能不要求正式推導,但理解其邏輯大有裨益!)。

關鍵公式(伯努利分佈):

期望值(Mean / Expected Value):
$$E(X) = p$$

變異數(Variance):
$$Var(X) = p(1 - p) = pq$$

快速複習:單次伯努利試驗的平均值就是成功的機率 \(p\)。如果 \(p=0.7\),那麼平均而言,試驗的結果為 0.7(比起 0/失敗,結果更偏向 1/成功)。


2. 二項分佈:重複的成功

二項分佈用於模擬當你進行固定次數的獨立伯努利試驗時,成功次數 \(X\) 的分佈。

類比:如果伯努利是擲一次硬幣,那麼二項分佈就是擲硬幣 10 次並計算出現多少次正面。

2.1 二項分佈的四個條件

在使用二項分佈 \(X \sim B(n, p)\) 之前,你的情境必須滿足以下四個關鍵條件。如果任何一個條件不符,就不能使用此模型!

記憶口訣:「BINS」

  1. Binary Outcomes(二元結果):每次試驗必須只有兩個結果(成功/失敗)。
  2. Independence(獨立性):一次試驗的結果不得影響任何其他試驗的結果。
  3. Number of trials (Fixed)(試驗次數固定):試驗次數 \(n\) 必須是固定且預先確定的。
  4. Success Probability (\(p\))(成功機率相同):每次試驗成功的機率 \(p\) 必須相同。

小知識:
如果試驗不是獨立的(例如:不放回地抽牌),則應使用超幾何分佈(Hypergeometric Distribution),不過這超出了 AS/A Level 9660 的考試範圍。

2.2 二項分佈的記號與參數

服從二項分佈的隨機變數 \(X\) 可記作:

$$X \sim B(n, p)$$

其中:

  • \(n\) 是試驗次數(或嘗試次數)。
  • \(p\) 是單次試驗成功的機率。
  • \(X\) 是我們感興趣的特定成功次數,其中 \(x = 0, 1, 2, \dots, n\)。

例子:學生參加一份 10 題的選擇題測驗。每題猜對的機率為 20%。設 X 為答對的題數,則 \(X \sim B(10, 0.2)\)。


3. 計算二項分佈機率

3.1 二項機率公式

要找出在 \(n\) 次試驗中恰好取得 \(x\) 次成功的機率,我們需結合兩個部分:該特定序列發生的機率,以及該序列可能發生的排列方式數量。

機率質量函數(PMF)為:

$$P(X=x) = \binom{n}{x} p^x (1-p)^{n-x}$$

讓我們拆解每個部分的含義:

  • \(\binom{n}{x}\)(讀作 "n choose x"):這是從 \(n\) 次試驗中選出恰好 \(x\) 次成功的組合數。這使用了組合數記號: $$ \binom{n}{x} = \frac{n!}{x!(n-x)!} $$

    別慌!你的計算機可以處理這個功能(通常標記為 nCr)。

  • \(p^x\):這是取得 \(x\) 次成功的機率。
  • \((1-p)^{n-x}\):這是剩下 \((n-x)\) 次失敗的機率。

3.2 逐步範例(使用公式)

假設你擲一枚不公平的硬幣 5 次,出現正面(成功)的機率為 \(p=0.4\)。我們想找出恰好出現 3 次正面(\(X=3\))的機率。

在此,\(n=5\),\(x=3\),\(p=0.4\),且 \(1-p = 0.6\)。

步驟 1:計算排列組合數 (\(\binom{n}{x}\))。
$$ \binom{5}{3} = \frac{5!}{3!(5-3)!} = \frac{120}{6 \times 2} = 10 $$ (有 10 種獨特的序列可以產生 3 個正面和 2 個反面,例如:HHHTT, HHTHT 等。)

步驟 2:計算成功與失敗的機率。
$$ p^x (1-p)^{n-x} = (0.4)^3 (0.6)^{5-3} = (0.064)(0.36) = 0.02304 $$

步驟 3:將結果相乘。
$$ P(X=3) = 10 \times 0.02304 = 0.2304 $$


3.3 使用累積分佈表

考試題目經常要求計算累積分佈機率(例如:獲得最多 5 次成功的機率)。累積分佈表提供了針對各種 \(n\) 和 \(p\) 值的 \(P(X \le x)\)。

使用統計表時的關鍵轉換:

  • $P(X \le x)$:直接從表中讀取。
  • $P(X < x)$:這與 \(P(X \le x-1)\) 相同。(若小於 5,代表 4 次或以下。)
  • $P(X > x)$:計算為 \(1 - P(X \le x)\)。(若大於 5,代表 1 減去 5 次或以下。)
  • $P(X \ge x)$:計算為 \(1 - P(X \le x-1)\)。(若 5 次或以上,代表 1 減去 4 次或以下。)
  • $P(a \le X \le b)$:計算為 \(P(X \le b) - P(X \le a-1)\)。

常見錯誤: 在計算 \(P(X > x)\) 或 \(P(X \ge x)\) 時,要特別注意邊界點!對於離散變數,\(P(X > 5)\) 不等於 \(1 - P(X \le 5)\);而是 \(1 - P(X \le 4)\)。


4. 二項分佈的期望值、變異數與標準差

計算二項分佈的期望值與變異數比計算一般的離散變數(需累加 \(x \cdot P(x)\) 或 \((x-\mu)^2 \cdot P(x)\))簡單得多。

由於二項分佈只是 \(n\) 次獨立伯努利試驗的總和,我們可以簡單地將這 \(n\) 次試驗的平均值與變異數相加。

回想伯努利試驗的期望值為 \(p\),變異數為 \(p(1-p)\)。

4.1 期望值 (Expected Value)

預期的成功次數 \(E(X)\),就是試驗次數乘以每次試驗的成功機率。

$$E(X) = np$$

例子:如果你射門 20 次,進球機率為 30% (\(p=0.3\)),你預期會進 \(E(X) = 20 \times 0.3 = 6\) 球。

4.2 變異數與標準差

總成功次數的變異數,就是試驗次數乘以單次伯努利試驗的變異數。

變異數(Variance): $$Var(X) = np(1 - p)$$

通常寫作: $$Var(X) = npq$$

標準差(Standard Deviation,\(\sigma\)): $$\sigma = \sqrt{np(1 - p)}$$

重點總結: 課程大綱規定將二項分佈的平均值與變異數公式視為從伯努利分佈推導而來,因此你必須能充滿信心地運用它們!與一般的離散變數計算相比,這些公式能為你節省大量時間。


快速複習:伯努利分佈 vs. 二項分佈
特徵 伯努利分佈 二項分佈
建模事件 單次試驗 固定次數 (\(n\)) 的獨立試驗
記號 通常沒有特定記號 \(X \sim B(n, p)\)
期望值 \(E(X) = p\) \(E(X) = np\)
變異數 \(Var(X) = p(1-p)\) \(Var(X) = np(1-p)\)