The Binomial and Poisson distributions - Mathematics (YMA01) - Pearson Edexcel International A Level

你好！歡迎來到二項分佈與泊松分佈的世界

歡迎來到單元 S2！這一章非常重要，因為我們將從基礎概率邁向強大的離散概率分佈領域。別擔心，這聽起來可能有點嚇人，但實際上我們只是在學習一些專業工具（公式和查表法），用來預測現實生活中事件發生的可能性——比如一位足球員射入十二碼的次數，或者你在一個小時內收到的電郵數量。

我們將重點討論兩個關鍵模型：二項分佈 (Binomial Distribution) 和 泊松分佈 (Poisson Distribution)。掌握這些模型，將讓你對統計學如何模擬隨機性有一個基本的理解！

第一節：二項分佈（計算成功次數）

什麼是二項分佈？

想像一下你正在重複做同一個動作，而每次都只有兩種結果：成功或失敗。如果你有固定的嘗試次數，二項分佈就能幫助你找出獲得特定成功次數的概率。

我們在數學上將其表示為：\(X \sim B(n, p)\)。
在這裡，\(X\) 是隨機變數（我們正在計算的成功次數）。
\(n\) 是總嘗試次數（固定不變）。
\(p\) 是單次嘗試中成功的概率（必須保持不變）。

二項分佈的四個關鍵條件（BINS 檢查法）

隨機變數 \(X\) 只有在滿足以下所有四個條件時，才能用二項分佈來模擬。請使用助記詞 BINS 來記住它們：

Binary outcomes（二元結果）：每次嘗試必須只有兩個結果（成功或失敗）。
Independent trials（獨立嘗試）：一次嘗試的結果不會影響任何其他嘗試的結果。
Number of trials is fixed（嘗試次數固定）：\(n\) 的值必須在實驗開始前確定。
Same probability（概率相同）：每次嘗試的成功概率 (\(p\)) 必須保持不變。

例子：擲硬幣 10 次並計算正面的次數。\(n=10\)，\(p=0.5\)。這完全符合 BINS！

計算二項分佈概率：公式

在 \(n\) 次嘗試中獲得準確 \(x\) 次成功的概率公式為：

\(P(X=x) = \binom{n}{x} p^x (1-p)^{n-x}\)

其中：

\(\binom{n}{x}\)（常寫作 \({}^n C_x\)）意為「n 選 x」。這計算了在 \(n\) 次嘗試中，出現 \(x\) 次成功的不同組合方式。
\(p^x\) 是獲得 \(x\) 次成功的概率。
\((1-p)^{n-x}\) 是獲得其餘 \((n-x)\) 次失敗的概率。

給同學的小貼士：理解 \(\binom{n}{x}\)

想像你擲硬幣 3 次 (\(n=3\))，你想要準確得到 2 次正面 (\(x=2\))。可能的情況有：HHT, HTH, THH。共有 3 種組合方式。
公式 \(\binom{3}{2}\) 正是計算這個組合數 (3)。

使用二項分佈表（累計概率）

在 Edexcel 考試中，你通常需要使用統計表，表中列出的是累計概率：

\(P(X \le x) = \text{獲得 } x \text{ 次或以下成功的概率。}\)

使用統計表時，你必須非常小心不等式：

\(P(X < 5)\) 等同於 \(P(X \le 4)\)。（查表時查找 4 的值）。
\(P(X \ge 3)\) 必須計算為：\(1 - P(X \le 2)\)。
\(P(3 \le X \le 7)\) 必須計算為：\(P(X \le 7) - P(X \le 2)\)。（減去起始數值之前的所有概率）。

二項分佈的參數（平均值與變異數）

雖然你可以使用標準離散隨機變數公式來計算平均值（期望值）和變異數，但二項分佈有簡單的捷徑：

期望值（平均值）：
\(E(X) = \mu = np\)

變異數：
\(Var(X) = \sigma^2 = np(1-p)\)

例子：如果 20% 的包裹會延誤 (\(p=0.2\))，而你寄出了 50 個包裹 (\(n=50\))。
預期延誤的包裹數量為：\(E(X) = 50 \times 0.2 = 10\)。

二項分佈重點總結：

二項分佈模擬的是固定次數的獨立嘗試，且每次只有兩種結果。記住 BINS 條件，並在查累計概率表時保持精確！

第二節：泊松分佈（時間或空間內的事件）

什麼是泊松分佈？

泊松分佈用於模擬在固定的時間間隔或空間範圍內，隨機且獨立發生的事件次數。

例子包括：一頁紙上的錯別字數量、每小時到達收銀台的顧客數量，或每月在特定路口發生的交通事故數量。

我們在數學上將其表示為：\(X \sim Po(\lambda)\)。
在這裡，\(X\) 是隨機變數（我們正在計算的事件次數）。
\(\lambda\) (Lambda) 是給定間隔內的平均發生率，即事件的平均數量。

泊松分佈的條件

要使 \(X\) 能用泊松分佈模擬，必須符合以下假設：

事件單個發生（一次一個，而不是成群結隊地發生）。
事件隨機且彼此獨立發生。
事件在間隔內以恆定速率（均勻速率）發生。

你知道嗎？ 泊松分佈是以法國數學家西莫恩·德尼·泊松 (Siméon Denis Poisson, 1781–1840) 的名字命名的。

泊松速率 (\(\lambda\)）：調整間隔是關鍵！

\(\lambda\) 的值必須與你感興趣的間隔相匹配。如果你改變了時間段，就必須調整 \(\lambda\)！

例子：如果一家店平均每小時有 4 位顧客，那麼對於 1 小時的間隔，\(\lambda = 4\)。

對於 2 小時的間隔，平均速率會加倍：\(\lambda = 4 \times 2 = 8\)。
對於 30 分鐘的間隔（半小時）：\(\lambda = 4 \times 0.5 = 2\)。

常見錯誤： 在時間或空間間隔改變時，忘記調整 \(\lambda\)！

計算泊松分佈概率：公式

當平均速率為 \(\lambda\) 時，獲得準確 \(x\) 個事件的概率為：

\(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\)

其中：

\(e\) 是歐拉數（約 2.718...）。
\(x!\) 是 \(x\) 的階乘 (\(x \times (x-1) \times ... \times 1\))。

泊松分佈的參數（神奇的等式）

泊松分佈有一個非常簡潔的特性，簡化了計算：它的平均值（期望值）總是等於它的變異數。

期望值（平均值）：
\(E(X) = \lambda\)

變異數：
\(Var(X) = \lambda\)

這個等式 (\(E(X) = Var(X)\)) 是判斷現實數據集是否能用泊松分佈準確模擬的關鍵特徵。

使用泊松分佈表

就像二項分佈一樣，泊松分佈表提供的是累計概率 \(P(X \le x)\)。使用不等式的規則同樣適用：

要計算 \(P(X > 5)\)，請計算 \(1 - P(X \le 5)\)。
要計算 \(P(X = 4)\)，請計算 \(P(X \le 4) - P(X \le 3)\)。

泊松分佈重點總結：

泊松分佈模擬的是在間隔內隨機發生的事件。核心參數是平均速率 \(\lambda\)。記得在間隔改變時調整 \(\lambda\)，並記住：平均值 = 變異數 = \(\lambda\)。

第三節：連接兩個分佈

泊松分佈對二項分佈的近似

在統計學早期（強大的計算機出現之前），當 \(n\) 非常大時，計算二項概率是非常困難的。數學家發現，在特定條件下，泊松分佈可以為二項分佈提供一個極佳且簡單得多的近似值。

什麼時候可以使用近似法？

我們只有在同時滿足以下兩個條件時，才可以使用 \(Po(\lambda)\) 來近似 \(B(n, p)\)：

\(n\) 很大： 通常 \(n > 50\)。
\(p\) 很小： 通常 \(p < 0.1\)。

你可以將此視為在大量嘗試（大 \(n\)）中模擬稀有事件（小 \(p\)）。例如：患上罕見疾病的概率，整體人口 (\(n\)) 非常巨大，但患病機率 (\(p\)) 極小。

轉換規則

如果滿足條件，我們使用 \(\lambda = np\) 來以 \(Po(\lambda)\) 近似 \(B(n, p)\)。

\(\lambda = np\)

我們只需將二項分佈的期望值作為泊松分佈的平均速率即可。

近似法逐步示例

某公司生產燈泡，燈泡有缺陷的概率為 0.005。如果一批次包含 1000 個燈泡，請估算恰好有 3 個缺陷的概率。

第 1 步：檢查二項分佈參數。
\(n = 1000\)（很大）
\(p = 0.005\)（很小）
結論：適合使用近似法。

第 2 步：計算 \(\lambda\)。
\(\lambda = np = 1000 \times 0.005 = 5\)

第 3 步：定義泊松近似模型。
\(X \sim Po(5)\)

第 4 步：使用泊松分佈計算所需概率。
我們想要 \(P(X=3)\)。使用泊松公式或查 \(\lambda=5\) 的表：
\(P(X=3) = P(X \le 3) - P(X \le 2)\)

為什麼這樣可行？（簡述）

當 \(n\) 極大且 \(p\) 極小時，同時發生兩個事件的概率變得微不足道，這些嘗試本質上變成了連續發生的獨立稀有事件——這正是泊松分佈所要求的條件！

快速回顧：關鍵參數

二項分佈 (B(n, p))：
\(E(X) = np\)
\(Var(X) = np(1-p)\)

泊松分佈 (Po(\(\lambda\)))：
\(E(X) = \lambda\)
\(Var(X) = \lambda\)

近似法： 需要大 \(n\) 和小 \(p\)，使用 \(\lambda = np\)。

你已經出色地完成了這一章的學習！透過了解二項分佈和泊松分佈的條件與參數，你現在已具備處理 Statistics 2 中複雜概率問題的能力。繼續練習查表——那通常是最容易出錯的地方！加油！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。