歡迎來到伯努利分佈與二項分佈的世界!
在本章中,我們將探索現實生活中一些最常見的機率測量方法。你有沒有想過,擲 10 次硬幣,恰好出現 3 次「公」的機率是多少?或者工廠生產線上會有多少個產品是不合格的?這正是伯努利分佈 (Bernoulli distribution) 和 二項分佈 (Binomial distribution) 能幫助我們解答的問題。
別擔心,如果統計學起初讓你覺得有些吃力,我們將會把它拆解成簡單的「是或否」步驟!
1. 伯努利分佈:單次實驗的力量
伯努利分佈是統計學中最基礎的組成部分。它描述了一次實驗(稱為試驗 (trial)),該實驗只有兩種可能的結果:成功 (Success) 或 失敗 (Failure)。
試著這樣想:你投籃一次,要麼投進(成功),要麼投失(失敗),沒有「中間地帶」。
關鍵組成部分
我們使用以下符號來描述一次伯努利試驗:
1. \(p\):成功的機率(通常以數值 1 表示)。
2. \(1 - p\):失敗的機率(通常以數值 0 表示)。我們有時稱之為 \(q\)。
3. 總機率之和必須永遠等於 1:\(p + (1 - p) = 1\)。
平均值與變異數
即使只是單次試驗,我們也可以計算其平均值 (Mean) 和離散程度(變異數, Variance):
平均值: \(E(X) = p\)
變異數: \(Var(X) = p(1 - p)\)
小貼士:如果贏得一場比賽的機率是 0.7,那麼平均來說,你每玩 1 場比賽,你就「贏」了 0.7 場。聽起來有點奇怪,但這就是平均值告訴我們的資訊!
重點總結:伯努利分佈適用於單次試驗,且只有兩種結果的情況。
2. 二項分佈:重複的成功
如果我們把那單次的伯努利試驗重複多次會怎樣呢?這就是二項分佈發揮作用的地方。它其實就是多個獨立伯努利試驗的總和。
例子:擲 10 次硬幣,計算出現多少次「公」。每一次投擲都是一次伯努利試驗;這 10 次投擲加起來就構成了二項分佈。
「BINS」準則
要使用二項分佈,情況必須滿足以下四個條件(記住單詞 BINS):
B - Binary(二元):只有兩個結果(成功/失敗)。
I - Independent(獨立):一次試驗不會影響下一次(例如,硬幣不會「記得」上一次的結果)。
N - Number(次數):有固定的試驗次數 (\(n\))。
S - Success(成功):每次試驗成功的機率 (\(p\)) 保持不變。
你知道嗎?如果你從袋子裡取出彈珠並且不放回去,這就不是二項分佈,因為每一次的機率都會改變!
3. 計算二項機率
要找出在 \(n\) 次試驗中恰好出現 \(x\) 次成功的機率,我們使用以下公式:
\(P(X = x) = \binom{n}{x} p^x (1 - p)^{n-x}\)
拆解公式
1. \(\binom{n}{x}\):這是組合 (combination)的部分。它告訴我們有多少種不同的排列成功的方式。你可以在計算機上使用 \(nCr\) 按鈕找到它。
2. \(p^x\):成功的機率的 \(x\) 次方,其中 \(x\) 是我們想要的成功次數。
3. \((1 - p)^{n-x}\):失敗的機率的餘下次數次方,代表剩餘的失敗次數。
例子:如果你拋擲一顆公平的骰子 5 次,恰好得到兩次 6 點的機率是多少?
\(n = 5\)(總拋擲次數)
\(x = 2\)(期望出現 6 點的次數)
\(p = 1/6\)(出現 6 點的機率)
\(1 - p = 5/6\)(沒有出現 6 點的機率)
計算方式:\(\binom{5}{2} \times (1/6)^2 \times (5/6)^3\)
要避免的常見錯誤
請確保指數(\(x\) 和 \(n-x\))之和永遠等於 \(n\)。在上面的例子中,\(2 + 3 = 5\)。如果它們相加不等於 \(n\),代表你遺漏了某個試驗!
重點總結:使用 \(\binom{n}{x}\) 來找出排列方式的數量,然後乘以成功和失敗的機率。
4. 平均值、變異數與標準差
對於二項分佈 \(X \sim B(n, p)\),計算「平均」結果和「離散程度」非常直接:
平均值(期望值): \(E(X) = np\)
類比:如果你拋擲一枚硬幣 100 次 (\(n=100\)),且出現正面的機率是 0.5 (\(p=0.5\)),你預期會得到 \(100 \times 0.5 = 50\) 次正面。
變異數: \(Var(X) = np(1 - p)\)
這衡量了結果偏離平均值的程度。
標準差: \(\sigma = \sqrt{np(1 - p)}\)
這只是變異數的平方根。
5. 使用統計表
有時候,逐一計算機率太慢了——特別是對於「至多 (at most)」或「小於 (less than)」類型的問題(例如 \(P(X \leq 4)\))。
在考試中,你可能會獲得累積二項分佈表 (cumulative binomial tables)。這些表格會告訴你 \(X\) 小於或等於某個數值的機率。
查表技巧:
1. 如果問題詢問 \(P(X \leq 3)\),直接在表中查找 3 對應的數值。
2. 如果問題詢問 \(P(X < 3)\),這等同於 \(P(X \leq 2)\)。
3. 如果問題詢問 \(P(X \geq 3)\),使用「補集」規則:\(1 - P(X \leq 2)\)。
快速複習盒
伯努利: 1 次試驗。平均值 = \(p\)。變異數 = \(p(1-p)\)。
二項: \(n\) 次試驗。平均值 = \(np\)。變異數 = \(np(1-p)\)。
檢查「BINS」:Binary(二元)、Independent(獨立)、Number fixed(次數固定)、Success constant(成功率固定)。
總機率: 永遠等於 1。
如果起初覺得這些很棘手,別擔心!只要你多練習識別 \(n\)、\(p\) 和 \(x\),它就會變得越來越容易。你一定可以的!