歡迎來到離散概率分佈的世界!

在這一章中,我們將跨越基礎概率的範疇,探討如何利用離散概率分佈 (Discrete Probability Distributions) 來模擬真實世界的事件。這是高等統計學 1 (Further Statistics 1) 的核心部分。無論你是在計算每小時收到多少封電子郵件,還是玩遊戲時需要嘗試多少次才能通過某一關,這些分佈都能幫助我們預測「長期」的結果。

別擔心,這些公式初看之下可能有點嚇人!我們會把它們拆解成簡單的步驟,並運用類比來幫你輕鬆記憶。讓我們開始吧!

1. 基礎概念:平均值與變異數

在研究特定的分佈之前,我們需要知道如何找出任何離散隨機變數 \(X\) 的「中心」和「離散程度」。

平均值(期望值)

期望值 (Expected Value),寫作 \(E(X)\) 或 \(\mu\),本質上就是長期平均值。如果你進行了數千次實驗,平均結果會是多少呢?

公式: \(E(X) = \sum x P(X=x)\)

可以這樣想: 將每一個可能的結果乘以它發生的機率,然後將它們全部加總起來。

變異數

變異數 (Variance),寫作 \(Var(X)\) 或 \(\sigma^2\),用來衡量結果圍繞著平均值有多大的「擺動」或分散程度。

公式: \(Var(X) = E(X^2) - [E(X)]^2\)
其中 \(E(X^2) = \sum x^2 P(X=x)\)。

推廣至函數:\(E(g(X))\)

有時候,我們需要的不是 \(X\) 的平均值,而是 \(X\) 的函數(如 \(X^2\) 或 \(3X+2\))的平均值。這寫作 \(E(g(X))\)。
技巧: 只要將求和中的 \(x\) 替換為函數 \(g(x)\) 即可。
公式: \(E(g(X)) = \sum g(x) P(X=x)\)

快速複習箱:
1. \(E(X)\) 是「平均結果」。
2. \(Var(X)\) 是「分散程度」。永遠記住:「平方的平均值減去平均值的平方。」

2. 卜瓦松分佈 (Poisson Distribution)

卜瓦松分佈非常適合用來模擬在特定時間或空間區間內,以恆定平均速率發生的隨機事件

現實生活例子: 10 分鐘內經過某一點的汽車數量,或一頁書中的錯字數量。

卜瓦松分佈的條件

若情況要以 \(X \sim Po(\lambda)\) 進行模擬,事件必須滿足:
1. 獨立性 (Independently)(一個事件的發生不會影響下一個)。
2. 單一性 (Singly)(兩個事件不會在同一瞬間發生)。
3. 恆定平均速率 (\(\lambda\))

關鍵特性

若 \(X \sim Po(\lambda)\):
- 平均值: \(E(X) = \lambda\)
- 變異數: \(Var(X) = \lambda\)

你知道嗎? 在卜瓦松分佈中,平均值與變異數是完全一樣的!這是檢查一組數據是否適合使用卜瓦松模型的好方法。

可加性 (Additive Property)

如果你有兩個獨立的卜瓦松變數,\(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\),你可以直接將它們相加!
\(X + Y \sim Po(\lambda + \mu)\)

例子: 如果你每小時收到 2 封電郵 (\(X\)) 和 3 則訊息 (\(Y\)),則每小時收到的總通知數為 \(Po(2+3) = Po(5)\)。

重點總結: 當你在固定區間內「計數」發生次數時,請使用卜瓦松分佈。

3. 以卜瓦松作為二項分佈的近似

在數字非常大時計算二項分佈的機率簡直是場噩夢。幸運的是,如果你的 \(n\) 很大\(p\) 很小,卜瓦松分佈就能派上用場。

規則: 若 \(X \sim B(n, p)\),你可以使用 \(Po(\lambda)\) 來近似,其中 \(\lambda = np\)

何時使用? 通常在 \(n > 50\) 且 \(np < 5\) 時。這會讓你的計算快得多!

4. 幾何分佈 (Geometric Distribution)

幾何分佈 (Geometric Distribution),\(X \sim Geo(p)\),其核心在於等待第一次成功

類比: 想像你在投擲硬幣試圖得到「正面」。你不斷投擲,直到終於得到一次為止。\(X\) 就是你所需的投擲次數。

機率公式

\(P(X=x) = p(1-p)^{x-1}\)
為什麼? 因為若要在第 \(x\) 次嘗試才獲得第一次成功,代表你必須先失敗了 \(x-1\) 次,然後在最後一次獲得成功。

平均值與變異數

- \(E(X) = \frac{1}{p}\)
- \(Var(X) = \frac{1-p}{p^2}\)

記憶小技巧: 如果贏得遊戲的機率是 \(1/10\),你會「預期」玩 10 次才能贏一次。這就是 \(E(X) = 1/(1/10) = 10\)。

5. 負二項分佈 (Negative Binomial Distribution)

負二項分佈 (Negative Binomial Distribution) 是幾何分佈的「大哥」。你不只是等待「第一次」成功,而是等待第 \(r\) 次成功。

例子: 一名籃球運動員不斷投籃,直到投進 3 球 (\(r=3\)) 為止。\(X\) 是總投籃次數。

機率公式

\(P(X=x) = \binom{x-1}{r-1} p^r (1-p)^{x-r}\)

別驚慌!理解它的方式如下:
1. 最後一次投籃(第 \(x\) 次)必須是成功(這就是為什麼有 \(p^r\))。
2. 在之前的 \(x-1\) 次投籃中,你必須以任何順序獲得 \(r-1\) 次成功(這就是 \(\binom{x-1}{r-1}\) 的部分)。
3. 其餘的都是失敗(即 \((1-p)^{x-r}\))。

平均值與變異數

- \(E(X) = \frac{r}{p}\)
- \(Var(X) = \frac{r(1-p)}{p^2}\)

常見錯誤: 在負二項分佈中,\(x\) 不能小於 \(r\)。你不可能只試了 3 次就獲得 5 次成功!

總結檢查清單

在繼續前進之前,請確保你能:
- 計算任何給定離散表中的 \(E(X)\)\(Var(X)\)
- 辨識 卜瓦松 情境(恆定速率、獨立事件)。
- 當 \(n\) 大且 \(p\) 小時,使用 卜瓦松近似二項分佈
- 區分 幾何分佈(等待第 1 次成功)與 負二項分佈(等待第 \(r\) 次成功)。
- 使用 計算機 找出卜瓦松和二項分佈的累積機率 (\(P(X \leq x)\))。

鼓勵一下: 離散分佈的關鍵就在於識別模式。一旦你確認了題目在講哪種「故事」(是速率問題?還是等待問題?),公式自然就會浮現出來!