你好!歡迎來到二項分佈與泊松分佈的世界

歡迎來到單元 S2!這一章非常重要,因為我們將從基礎概率邁向強大的離散概率分佈領域。別擔心,這聽起來可能有點嚇人,但實際上我們只是在學習一些專業工具(公式和查表法),用來預測現實生活中事件發生的可能性——比如一位足球員射入十二碼的次數,或者你在一個小時內收到的電郵數量。

我們將重點討論兩個關鍵模型:二項分佈 (Binomial Distribution)泊松分佈 (Poisson Distribution)。掌握這些模型,將讓你對統計學如何模擬隨機性有一個基本的理解!

第一節:二項分佈(計算成功次數)

什麼是二項分佈?

想像一下你正在重複做同一個動作,而每次都只有兩種結果:成功或失敗。如果你有固定的嘗試次數,二項分佈就能幫助你找出獲得特定成功次數的概率。

我們在數學上將其表示為:\(X \sim B(n, p)\)。
在這裡,\(X\) 是隨機變數(我們正在計算的成功次數)。
\(n\) 是總嘗試次數(固定不變)。
\(p\) 是單次嘗試中成功的概率(必須保持不變)。

二項分佈的四個關鍵條件(BINS 檢查法)

隨機變數 \(X\) 只有在滿足以下所有四個條件時,才能用二項分佈來模擬。請使用助記詞 BINS 來記住它們:

  1. Binary outcomes(二元結果):每次嘗試必須只有兩個結果(成功或失敗)。
  2. Independent trials(獨立嘗試):一次嘗試的結果不會影響任何其他嘗試的結果。
  3. Number of trials is fixed(嘗試次數固定):\(n\) 的值必須在實驗開始前確定。
  4. Same probability(概率相同):每次嘗試的成功概率 (\(p\)) 必須保持不變。

例子:擲硬幣 10 次並計算正面的次數。\(n=10\),\(p=0.5\)。這完全符合 BINS!

計算二項分佈概率:公式

在 \(n\) 次嘗試中獲得準確 \(x\) 次成功的概率公式為:

\(P(X=x) = \binom{n}{x} p^x (1-p)^{n-x}\)

其中:

  • \(\binom{n}{x}\)(常寫作 \({}^n C_x\))意為「n 選 x」。這計算了在 \(n\) 次嘗試中,出現 \(x\) 次成功的不同組合方式。
  • \(p^x\) 是獲得 \(x\) 次成功的概率。
  • \((1-p)^{n-x}\) 是獲得其餘 \((n-x)\) 次失敗的概率。

給同學的小貼士:理解 \(\binom{n}{x}\)

想像你擲硬幣 3 次 (\(n=3\)),你想要準確得到 2 次正面 (\(x=2\))。 可能的情況有:HHT, HTH, THH。共有 3 種組合方式。
公式 \(\binom{3}{2}\) 正是計算這個組合數 (3)。

使用二項分佈表(累計概率)

在 Edexcel 考試中,你通常需要使用統計表,表中列出的是累計概率

\(P(X \le x) = \text{獲得 } x \text{ 次或以下成功的概率。}\)

使用統計表時,你必須非常小心不等式:

  • \(P(X < 5)\) 等同於 \(P(X \le 4)\)。(查表時查找 4 的值)。
  • \(P(X \ge 3)\) 必須計算為:\(1 - P(X \le 2)\)。
  • \(P(3 \le X \le 7)\) 必須計算為:\(P(X \le 7) - P(X \le 2)\)。(減去起始數值之前的所有概率)。

二項分佈的參數(平均值與變異數)

雖然你可以使用標準離散隨機變數公式來計算平均值(期望值)和變異數,但二項分佈有簡單的捷徑:

期望值(平均值):
\(E(X) = \mu = np\)

變異數:
\(Var(X) = \sigma^2 = np(1-p)\)

例子:如果 20% 的包裹會延誤 (\(p=0.2\)),而你寄出了 50 個包裹 (\(n=50\))。
預期延誤的包裹數量為:\(E(X) = 50 \times 0.2 = 10\)。

二項分佈重點總結:

二項分佈模擬的是固定次數的獨立嘗試,且每次只有兩種結果。記住 BINS 條件,並在查累計概率表時保持精確!


第二節:泊松分佈(時間或空間內的事件)

什麼是泊松分佈?

泊松分佈用於模擬在固定的時間間隔或空間範圍內,隨機且獨立發生的事件次數。

例子包括:一頁紙上的錯別字數量、每小時到達收銀台的顧客數量,或每月在特定路口發生的交通事故數量。

我們在數學上將其表示為:\(X \sim Po(\lambda)\)。
在這裡,\(X\) 是隨機變數(我們正在計算的事件次數)。
\(\lambda\) (Lambda) 是給定間隔內的平均發生率,即事件的平均數量。

泊松分佈的條件

要使 \(X\) 能用泊松分佈模擬,必須符合以下假設:

  • 事件單個發生(一次一個,而不是成群結隊地發生)。
  • 事件隨機且彼此獨立發生。
  • 事件在間隔內以恆定速率(均勻速率)發生。

你知道嗎? 泊松分佈是以法國數學家西莫恩·德尼·泊松 (Siméon Denis Poisson, 1781–1840) 的名字命名的。

泊松速率 (\(\lambda\)):調整間隔是關鍵!

\(\lambda\) 的值必須與你感興趣的間隔相匹配。如果你改變了時間段,就必須調整 \(\lambda\)!

例子:如果一家店平均每小時有 4 位顧客,那麼對於 1 小時的間隔,\(\lambda = 4\)。

  • 對於 2 小時的間隔,平均速率會加倍:\(\lambda = 4 \times 2 = 8\)。
  • 對於 30 分鐘的間隔(半小時):\(\lambda = 4 \times 0.5 = 2\)。
常見錯誤: 在時間或空間間隔改變時,忘記調整 \(\lambda\)!

計算泊松分佈概率:公式

當平均速率為 \(\lambda\) 時,獲得準確 \(x\) 個事件的概率為:

\(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\)

其中:

  • \(e\) 是歐拉數(約 2.718...)。
  • \(x!\) 是 \(x\) 的階乘 (\(x \times (x-1) \times ... \times 1\))。

泊松分佈的參數(神奇的等式)

泊松分佈有一個非常簡潔的特性,簡化了計算:它的平均值(期望值)總是等於它的變異數。

期望值(平均值):
\(E(X) = \lambda\)

變異數:
\(Var(X) = \lambda\)

這個等式 (\(E(X) = Var(X)\)) 是判斷現實數據集是否能用泊松分佈準確模擬的關鍵特徵。

使用泊松分佈表

就像二項分佈一樣,泊松分佈表提供的是累計概率 \(P(X \le x)\)。使用不等式的規則同樣適用:

  • 要計算 \(P(X > 5)\),請計算 \(1 - P(X \le 5)\)。
  • 要計算 \(P(X = 4)\),請計算 \(P(X \le 4) - P(X \le 3)\)。
泊松分佈重點總結:

泊松分佈模擬的是在間隔內隨機發生的事件。核心參數是平均速率 \(\lambda\)。記得在間隔改變時調整 \(\lambda\),並記住:平均值 = 變異數 = \(\lambda\)。


第三節:連接兩個分佈

泊松分佈對二項分佈的近似

在統計學早期(強大的計算機出現之前),當 \(n\) 非常大時,計算二項概率是非常困難的。數學家發現,在特定條件下,泊松分佈可以為二項分佈提供一個極佳且簡單得多的近似值。

什麼時候可以使用近似法?

我們只有在同時滿足以下兩個條件時,才可以使用 \(Po(\lambda)\) 來近似 \(B(n, p)\):

  1. \(n\) 很大: 通常 \(n > 50\)。
  2. \(p\) 很小: 通常 \(p < 0.1\)。

你可以將此視為在大量嘗試(大 \(n\))中模擬稀有事件(小 \(p\))。例如:患上罕見疾病的概率,整體人口 (\(n\)) 非常巨大,但患病機率 (\(p\)) 極小。

轉換規則

如果滿足條件,我們使用 \(\lambda = np\) 來以 \(Po(\lambda)\) 近似 \(B(n, p)\)。

\(\lambda = np\)

我們只需將二項分佈的期望值作為泊松分佈的平均速率即可。

近似法逐步示例

某公司生產燈泡,燈泡有缺陷的概率為 0.005。如果一批次包含 1000 個燈泡,請估算恰好有 3 個缺陷的概率。

第 1 步:檢查二項分佈參數。
\(n = 1000\)(很大)
\(p = 0.005\)(很小)
結論:適合使用近似法。

第 2 步:計算 \(\lambda\)。
\(\lambda = np = 1000 \times 0.005 = 5\)

第 3 步:定義泊松近似模型。
\(X \sim Po(5)\)

第 4 步:使用泊松分佈計算所需概率。
我們想要 \(P(X=3)\)。使用泊松公式或查 \(\lambda=5\) 的表:
\(P(X=3) = P(X \le 3) - P(X \le 2)\)

為什麼這樣可行?(簡述)

當 \(n\) 極大且 \(p\) 極小時,同時發生兩個事件的概率變得微不足道,這些嘗試本質上變成了連續發生的獨立稀有事件——這正是泊松分佈所要求的條件!

快速回顧:關鍵參數

二項分佈 (B(n, p)):
\(E(X) = np\)
\(Var(X) = np(1-p)\)

泊松分佈 (Po(\(\lambda\))):
\(E(X) = \lambda\)
\(Var(X) = \lambda\)

近似法: 需要大 \(n\) 和小 \(p\),使用 \(\lambda = np\)。

你已經出色地完成了這一章的學習!透過了解二項分佈和泊松分佈的條件與參數,你現在已具備處理 Statistics 2 中複雜概率問題的能力。繼續練習查表——那通常是最容易出錯的地方!加油!