歡迎來到離散概率分佈!

在本章中,我們將從基礎概率進入統計分佈的世界。在這裡,我們不再只關注單次發生的事件,而是開始審視在多次試驗下,各種結果發生的「大局」。這就像是從觀察一滴雨點,進階到了解整場暴雨!對於未來從事科學、金融,甚至是遊戲設計等職業,這是一項至關重要的技能。

1. 什麼是離散隨機變量?

在我們深入數學細節之前,先拆解一下這個聽起來很深奧的名詞:離散隨機變量 (Discrete Random Variable)

變量 (Variable):一個可以改變數值的量(通常稱為 \(X\))。
隨機 (Random):在事件發生前,我們無法預知確切的結果。
離散 (Discrete):數值是分隔且獨立的。你可以數出它們(例如 0、1、2、3)。你不可能在擲硬幣時得到「2.5 個正面」或「3.14 個小孩」。

生活中的例子:
想像一下你正在進行 5 次籃球罰球。你投進籃球的次數就是一個離散隨機變量。你可能投進 0、1、2、3、4 或 5 球。你不可能投進 2.7 球!

重點提示:我們使用大寫 \(X\) 作為變量的名稱(例如「投進籃球的次數」),並使用小寫 \(x\) 代表特定的數值(例如「投進了 3 球」)。因此,\(P(X = x)\) 的意思就是「投進籃球的次數剛好等於特定數值的概率」。

2. 描述分佈

OCR 課程要求你主要透過兩種方式來理解這些分佈:表格公式

概率表格

這是最常見的分佈表示方式。它列出了每一個可能的結果及其發生的機會。

例子:設 \(X\) 為投擲一個公平四面骰子的得分。
\(x\):1, 2, 3, 4
\(P(X = x)\):0.25, 0.25, 0.25, 0.25

黃金法則:分佈中所有概率的總和必須等於 1。
\(\sum P(X = x) = 1\)
如果你將表格底部的數值加總後不等於 1.0,那就代表哪裡出錯了!

概率函數(公式)

有時,概率會以一個小型「機器」的形式給出。你代入 \(x\),它就會吐出概率。
例子:\(P(X = x) = kx\),其中 \(x = 1, 2, 3\)。

要找出 \(k\) 的值,你可以代入數值:
當 \(x=1\) 時,\(P = 1k\)
當 \(x=2\) 時,\(P = 2k\)
當 \(x=3\) 時,\(P = 3k\)
因為總和必須為 1:\(1k + 2k + 3k = 1\),所以 \(6k = 1\),即 \(k = 1/6\)。

關鍵點:無論是表格還是公式,總概率永遠是 1。利用這一事實來找出缺失的值!

3. 二項分佈 (Binomial Distribution)

二項分佈是一種在各處隨處可見的特殊離散分佈。當你有一組固定的「試驗」次數,且每次試驗只有兩種結果:成功 (Success)失敗 (Failure) 時,就會用到它。

我們何時可以使用二項分佈模型?

如果覺得這很複雜,別擔心!只要記住口訣 B.I.N.S.!要使用二項分佈,情境必須滿足以下四個條件:

B - Binary (二元):只有兩種可能的結果(成功或失敗)。
I - Independent (獨立):一次試驗不會影響下一次的結果(例如拋硬幣)。
N - Number of trials (試驗次數):有固定數量的試驗 (\(n\))。
S - Success probability (成功概率):每次成功的概率 (\(p\)) 保持不變。

符號標記:我們將其寫為 \(X \sim B(n, p)\)。
這是數學上的簡寫,意為:「變量 \(X\) 服從參數為 \(n\) 次試驗和成功概率 \(p\) 的二項分佈。」

你知道嗎?「不放回」抽樣(例如從帽子裡拿名字且不放回去)嚴格來說違反了獨立性規則。但如果群體非常大,我們通常仍會假設它是二項分佈,因為概率的變化微乎其微!

4. 計算二項概率

你需要學會使用兩種方法來求得剛好出現 \(x\) 次成功的概率:公式法和計算機法。

公式法

\(P(X = x) = \binom{n}{x} \times p^x \times (1 - p)^{n-x}\)

讓我們用「人話」拆解一下:
\(\binom{n}{x}\):這是成功可能出現的不同方式的數量(使用計算機上的 \(nCr\) 按鍵)。
\(p^x\):成功概率的 \(x\) 次方。
\((1 - p)^{n-x}\):失敗概率的餘下次數次方。

例子:如果你拋一枚有偏差的硬幣 5 次 (\(n=5\)),出現正面的概率為 0.6 (\(p=0.6\)),那麼剛好出現 3 次正面的機會是多少?
\(P(X = 3) = \binom{5}{3} \times 0.6^3 \times 0.4^2\)
\(P(X = 3) = 10 \times 0.216 \times 0.16 = 0.3456\)

使用計算機(專業做法)

在考試中,速度是關鍵!大多數現代科學計算機都有 Binomial PD (概率密度) 模式用於「剛好」類型的問題,以及 Binomial CD (累積概率分佈) 用於「小於或等於」類型的問題。

常見錯誤:計算機通常計算的是 \(P(X \le x)\)。如果題目問的是 \(P(X > 3)\),你必須計算 \(1 - P(X \le 3)\)。務必檢查不等號的方向!

快速複習盒:
\(P(X = x)\) 使用 Binomial PD
\(P(X \le x)\) 使用 Binomial CD
\(P(X < x)\) 轉換為 \(P(X \le x-1\),然後使用 Binomial CD

5. 總結與關鍵點

1. 離散隨機變量代表可數的結果,其總概率永遠為 1。
2. B.I.N.S. 是你判斷情境是否為二項分佈的檢查清單(二元、獨立、固定次數、相同成功概率)。
3. \(X \sim B(n, p)\) 是你在解題過程中必須使用的符號標記。
4. 平均數與變異數:對於 H230 AS Level,你不需要計算這些分佈的平均數或變異數。請專注於尋求概率!

最後小貼士:在解釋情境中的「假設」時,不要只說「它是獨立的」。應該說「我們假設一個人患流感的事件與下一個人患流感是獨立的」。語境才是最重要的!