歡迎來到二項分佈!
在本章中,我們將探索統計學中最有用的「模型」之一。你可以把機率分佈想像成一個模板。如果一個現實生活中的情況符合這個模板,我們就可以運用特定的數學規則來預測可能發生的結果。二項分佈是模擬「是/否」或「成功/失敗」情境最著名的方法。
無論你是要預測籃球運動員能投進多少個罰球,還是檢查工廠裡有多少個燈泡是壞的,二項分佈都是你的得力工具。如果剛開始覺得這些概念有點抽象,別擔心——一旦你看出了當中的規律,就會變得簡單多了!
1. 我們何時可以使用二項分佈?
要使用這個模型,情況必須符合四個特定標準。只要缺少其中任何一項,二項分佈的模板就無法使用!要記住這些標準,一個很好的助記法是 BINS。
BINS 標準
- B – 二元性 (Binary): 每次試驗必須剛好有兩種可能的結果。我們通常稱之為成功和失敗。
例子:投擲硬幣出現正面(成功)或反面(失敗)。 - I – 獨立性 (Independent): 一次試驗的結果不得影響另一次試驗的結果。
例子:如果你擲骰子得到 6 點,這不會改變你下一次擲出 6 點的機率。 - N – 試驗次數 (Number of trials): 必須有固定的試驗次數(我們稱之為 \(n\))。你不能一直試驗直到得到想要的結果為止;你必須事先決定好嘗試的次數。
- S – 成功機率 (Success probability): 成功的機率(我們稱之為 \(p\))必須在每次試驗中都相同。
快速檢查盒:
要使用二項分佈模型,請問自己:是否有 2 種結果?它們是否獨立?試驗次數是否固定?機率是否恆定?如果全部答案都是「是」,那麼你就有了一個二項分佈!
2. 關鍵符號與術語
在 A Level 數學中,我們使用特定的「速記法」來描述這些情況。如果一個隨機變數 \(X\) 服從二項分佈,我們會這樣寫:
\[X \sim B(n, p)\]
這些字母代表什麼意思?
- \(X\): 這是隨機變數 (Random Variable)。在本章中,\(X\) 代表「成功的次數」。
- \(\sim\): 這個符號的意思是「服從……的分佈」。
- \(n\): 試驗次數。
- \(p\): 成功的機率。
- \(q\): 失敗的機率。由於總機率必須為 1,我們計算為 \(q = 1 - p\)。
例子:如果你投擲一枚公正硬幣 10 次,想知道得到多少個正面,你的模型就是 \(X \sim B(10, 0.5)\)。這裡 \(n=10\),\(p=0.5\)。
「你知道嗎?」
「成功」這個詞並不總是意味著好的事情!在統計學中,「成功」僅僅是你所尋找的事件。如果你正在研究有多少人感冒,那麼「感冒」在你的模型中就是「成功」。
3. 現實世界的例子 vs. 常見陷阱
讓我們看看兩個情境,看看它們是否符合二項分佈模型。
情境 A:品質控制檢查
一家工廠生產數以千計的螺栓,其中 5% 是次品。你隨機抽取 20 個螺栓,並計算有多少個是次品。這符合嗎?
- 二元性? 是(次品或非次品)。
- 獨立性? 是(一個螺栓是次品並不會讓下一個變成次品)。
- 試驗次數固定? 是 (\(n = 20\))。
- 機率相同? 是 (\(p = 0.05\))。
結果: 這是 \(X \sim B(20, 0.05)\)。它適用!
情境 B:一副撲克牌
你從一副牌中不放回地抽取 5 張牌,計算你得到了多少張「A」。這符合嗎?
- 二元性? 是(是 A 或不是 A)。
- 獨立性? 不是。 因為你不把牌放回去,機率就會改變。如果第一張牌是 A,那麼下一次抽牌時剩下的 A 就會變少。
結果: 這不是二項分佈,因為機率 (\(p\)) 並非恆定。
常見錯誤:
考試中最常見的陷阱是「不放回抽樣」。如果物品被拿出來而不放回去,試驗就不是獨立的,且機率會改變。這通不過 BINS 測試!
4. 期望頻率(平均值)
如果你知道試驗次數 (\(n\)) 和成功機率 (\(p\)),你可以輕鬆計算出平均預期會獲得多少次成功。這被稱為平均值 (Mean) 或期望值 (Expected Value)。
公式非常簡單:
\[\text{平均值 } E(X) = np\]
類比:如果你進行 20 次罰球投籃 (\(n=20\)),且你的成功率是 80% (\(p=0.8\)),你預期會投進 \(20 \times 0.8 = 16\) 球。這很合理,對吧?
重點總結: 「期望頻率」只是一種比較高級的說法,意思是「我們認為成功事件平均會發生的次數」。
5. 計算機率
雖然你通常會使用計算機的 Binomial CD 或 Binomial PD 功能,但理解求出恰好 \(r\) 次成功的機率背後的邏輯是很重要的:
\[P(X = r) = \binom{n}{r} \times p^r \times q^{n-r}\]
等等,那個 \(\binom{n}{r}\) 是什麼?
別被它嚇到了!那是二項係數 (Binomial Coefficient)(在你的計算機上通常稱為 "\(nCr\)")。它告訴我們排列成功與失敗的方法數。
公式分步解析:
1. \(\binom{n}{r}\): 我有多少種方法可以選出哪些試驗是成功的?
2. \(p^r\): 得到恰好 \(r\) 次成功的機率。
3. \(q^{n-r}\): 剩下幾次試驗為失敗的機率。
例子:如果你投擲硬幣 3 次,恰好出現 2 次正面的機率是多少?
這裡 \(n=3, p=0.5, q=0.5, r=2\)。
\(P(X=2) = \binom{3}{2} \times 0.5^2 \times 0.5^1 = 3 \times 0.25 \times 0.5 = 0.375\)。
章節總結
- 二項分佈模擬了在固定次數的獨立試驗中成功的次數。
- 一定要檢查 BINS 標準:Binary(二元)、Independent(獨立)、Number of trials fixed(試驗次數固定)、Same probability(機率相同)。
- 符號標記為 \(X \sim B(n, p)\)。
- 平均值(期望成功次數)為 \(np\)。
- 注意相關性——如果機率會改變(例如不放回抽牌),它就不是二項分佈!
如果公式起初看起來有點嚇人,別擔心。這一節大部分的工作都在於識別 "n" 和 "p" 的值,然後交給你的計算機來完成繁重的計算!