歡迎來到二項分佈!

在本章中,我們將探索統計學中最有用的「模型」之一。你可以把機率分佈想像成一個模板。如果一個現實生活中的情況符合這個模板,我們就可以運用特定的數學規則來預測可能發生的結果。二項分佈是模擬「是/否」或「成功/失敗」情境最著名的方法。

無論你是要預測籃球運動員能投進多少個罰球,還是檢查工廠裡有多少個燈泡是壞的,二項分佈都是你的得力工具。如果剛開始覺得這些概念有點抽象,別擔心——一旦你看出了當中的規律,就會變得簡單多了!

1. 我們何時可以使用二項分佈?

要使用這個模型,情況必須符合四個特定標準。只要缺少其中任何一項,二項分佈的模板就無法使用!要記住這些標準,一個很好的助記法是 BINS

BINS 標準

  • B – 二元性 (Binary): 每次試驗必須剛好有兩種可能的結果。我們通常稱之為成功失敗
    例子:投擲硬幣出現正面(成功)或反面(失敗)。
  • I – 獨立性 (Independent): 一次試驗的結果不得影響另一次試驗的結果。
    例子:如果你擲骰子得到 6 點,這不會改變你下一次擲出 6 點的機率。
  • N – 試驗次數 (Number of trials): 必須有固定的試驗次數(我們稱之為 \(n\))。你不能一直試驗直到得到想要的結果為止;你必須事先決定好嘗試的次數。
  • S – 成功機率 (Success probability): 成功的機率(我們稱之為 \(p\))必須在每次試驗中都相同

快速檢查盒:
要使用二項分佈模型,請問自己:是否有 2 種結果?它們是否獨立?試驗次數是否固定?機率是否恆定?如果全部答案都是「是」,那麼你就有了一個二項分佈

2. 關鍵符號與術語

在 A Level 數學中,我們使用特定的「速記法」來描述這些情況。如果一個隨機變數 \(X\) 服從二項分佈,我們會這樣寫:

\[X \sim B(n, p)\]

這些字母代表什麼意思?

  • \(X\): 這是隨機變數 (Random Variable)。在本章中,\(X\) 代表「成功的次數」。
  • \(\sim\): 這個符號的意思是「服從……的分佈」。
  • \(n\): 試驗次數
  • \(p\): 成功的機率
  • \(q\): 失敗的機率。由於總機率必須為 1,我們計算為 \(q = 1 - p\)。

例子:如果你投擲一枚公正硬幣 10 次,想知道得到多少個正面,你的模型就是 \(X \sim B(10, 0.5)\)。這裡 \(n=10\),\(p=0.5\)。

「你知道嗎?」

「成功」這個詞並不總是意味著好的事情!在統計學中,「成功」僅僅是你所尋找的事件。如果你正在研究有多少人感冒,那麼「感冒」在你的模型中就是「成功」。

3. 現實世界的例子 vs. 常見陷阱

讓我們看看兩個情境,看看它們是否符合二項分佈模型。

情境 A:品質控制檢查

一家工廠生產數以千計的螺栓,其中 5% 是次品。你隨機抽取 20 個螺栓,並計算有多少個是次品。這符合嗎?

  • 二元性? 是(次品或非次品)。
  • 獨立性? 是(一個螺栓是次品並不會讓下一個變成次品)。
  • 試驗次數固定? 是 (\(n = 20\))。
  • 機率相同? 是 (\(p = 0.05\))。

結果: 這是 \(X \sim B(20, 0.05)\)。它適用!

情境 B:一副撲克牌

你從一副牌中不放回地抽取 5 張牌,計算你得到了多少張「A」。這符合嗎?

  • 二元性? 是(是 A 或不是 A)。
  • 獨立性? 不是。 因為你不把牌放回去,機率就會改變。如果第一張牌是 A,那麼下一次抽牌時剩下的 A 就會變少。

結果:不是二項分佈,因為機率 (\(p\)) 並非恆定。

常見錯誤:
考試中最常見的陷阱是「不放回抽樣」。如果物品被拿出來而不放回去,試驗就不是獨立的,且機率會改變。這通不過 BINS 測試!

4. 期望頻率(平均值)

如果你知道試驗次數 (\(n\)) 和成功機率 (\(p\)),你可以輕鬆計算出平均預期會獲得多少次成功。這被稱為平均值 (Mean)期望值 (Expected Value)

公式非常簡單:

\[\text{平均值 } E(X) = np\]

類比:如果你進行 20 次罰球投籃 (\(n=20\)),且你的成功率是 80% (\(p=0.8\)),你預期會投進 \(20 \times 0.8 = 16\) 球。這很合理,對吧?

重點總結: 「期望頻率」只是一種比較高級的說法,意思是「我們認為成功事件平均會發生的次數」。

5. 計算機率

雖然你通常會使用計算機的 Binomial CDBinomial PD 功能,但理解求出恰好 \(r\) 次成功的機率背後的邏輯是很重要的:

\[P(X = r) = \binom{n}{r} \times p^r \times q^{n-r}\]

等等,那個 \(\binom{n}{r}\) 是什麼?

別被它嚇到了!那是二項係數 (Binomial Coefficient)(在你的計算機上通常稱為 "\(nCr\)")。它告訴我們排列成功與失敗的方法數

公式分步解析:
1. \(\binom{n}{r}\): 我有多少種方法可以選出哪些試驗是成功的?
2. \(p^r\): 得到恰好 \(r\) 次成功的機率。
3. \(q^{n-r}\): 剩下幾次試驗為失敗的機率。

例子:如果你投擲硬幣 3 次,恰好出現 2 次正面的機率是多少?
這裡 \(n=3, p=0.5, q=0.5, r=2\)。
\(P(X=2) = \binom{3}{2} \times 0.5^2 \times 0.5^1 = 3 \times 0.25 \times 0.5 = 0.375\)。

章節總結

  • 二項分佈模擬了在固定次數的獨立試驗中成功的次數。
  • 一定要檢查 BINS 標準:Binary(二元)、Independent(獨立)、Number of trials fixed(試驗次數固定)、Same probability(機率相同)。
  • 符號標記為 \(X \sim B(n, p)\)
  • 平均值(期望成功次數)為 \(np\)
  • 注意相關性——如果機率會改變(例如不放回抽牌),它就不是二項分佈!

如果公式起初看起來有點嚇人,別擔心。這一節大部分的工作都在於識別 "n" 和 "p" 的值,然後交給你的計算機來完成繁重的計算!