歡迎來到離散隨機變數的世界!
在以往的數學學習中,你可能處理過只有單一固定值的變數。在統計學中,我們進入了一個數值不確定、取決於機遇的世界。離散隨機變數 (Discrete Random Variable, DRV) 本質上是一種將隨機過程的結果(例如擲骰子或計算網站的點擊次數)映射為數字的方法。
別擔心,起初這聽起來可能有點抽象!你可以把離散隨機變數想像成一份「數學菜單」,它告訴你可能會發生什麼事,以及每道「菜」(結果)出現的可能性。讀完這些筆記後,你將能夠計算平均值、衡量數據的「離散程度」,並利用特殊的模型來預測從體育賽事結果到餅乾中巧克力豆數量等各種事物。
1. 基本概念:什麼是離散隨機變數?
隨機變數 (Random Variable)(通常用大寫字母如 \( X \) 表示)是一個其值由隨機事件結果決定的量。如果它只能取某些特定的離散值(例如 0, 1, 2...),而不是某個區間內的任何值,那麼它就是離散的。
機率分佈
機率分佈 (Probability distribution) 僅僅是一份清單,列出了離散隨機變數所有可能的取值及其對應的機率。你通常會在表格中或以函數形式 \( P(X = x) = f(x) \) 看到這些表示。
例子:設 \( X \) 為投擲一枚公平硬幣兩次時出現正面的次數。可能的取值為 \( x = 0, 1, 2 \)。表格看起來會像這樣:
- \( P(X=0) = 0.25 \)
- \( P(X=1) = 0.50 \)
- \( P(X=2) = 0.25 \)
快速複習:黃金法則
分佈中所有機率的總和必須等於 1。
\( \sum P(X = x) = 1 \)
常見錯誤:別忘了 \( x \) 代表的是數值(例如「3 個入球」),而 \( P(X=x) \) 代表的是機會(例如「0.1」)。在計算時千萬不要混淆它們!
2. 期望值與變異數
有了機率分佈後,我們通常想知道兩件事:什麼是「平均」結果,以及結果的波動有多大?
期望值 (平均值)
期望值 (Expectation),記作 \( E(X) \),是如果你進行該實驗非常多次後,長遠下來的平均值。它也稱為平均值,記作 \( \mu \)。
公式: \( E(X) = \mu = \sum x_i p_i \)
類比: 想像一個蹺蹺板。期望值就是該分佈的「平衡點」,所有機率在兩側會完美平衡。
變異數
變異數 (Variance),記作 \( Var(X) \),衡量的是數據的離散程度。高變異數代表結果非常分散;低變異數則代表結果集中在平均值附近。
公式: \( Var(X) = \sigma^2 = \sum x_i^2 p_i - \mu^2 \)
記憶技巧:「平方的平均值減去平均值的平方」。
1. 先計算 \( E(X^2) \),即將每個 \( x \) 平方後乘以其對應機率。
2. 減去你剛才算出的平均值的平方。
線性變換 (改變尺度)
如果將所有數值加倍並加上 5,會發生什麼事呢?我們可以使用以下這些實用的規則:
1. \( E(aX + b) = aE(X) + b \)(平均值會隨你的操作而變化)。
2. \( Var(aX + b) = a^2 Var(X) \)(加上常數不會改變離散程度,但乘以 \( a \) 會使變異數增加 \( a^2 \) 倍)。
核心要點: 期望值告訴你「在哪裡?」(位置),而變異數告訴你「有多寬?」(離散程度)。
3. 離散均勻分佈 (Discrete Uniform Distribution)
這是最簡單的分佈,當每個結果都同樣可能發生時就會出現。
符號: \( X \sim U(n) \),其中 \( X \) 取值為 \( 1, 2, ..., n \)。
現實生活例子: 投擲一枚公平的六面骰子。從 1 到 6 的每個數字機率都是 \( \frac{1}{6} \)。
你知道嗎? 因為每個結果出現的機會均等,所以平均值永遠剛好在區間的正中間!
4. 二項分佈 (Binomial Distribution)
你在 A-Level 數學中已經見過它了,但在進階數學 (Further Maths) 中,我們更專注於它的總結性質。
條件: 固定試驗次數 (\( n \)),兩種結果(成功/失敗),以及固定的成功機率 (\( p \))。
\( X \sim B(n, p) \) 的公式:
1. 平均值: \( E(X) = np \)
2. 變異數: \( Var(X) = np(1 - p) \)
逐步計算: 如果你投籃 10 次 (\( n=10 \)),成功率為 70% (\( p=0.7 \)),你預期會投進的次數為 \( 10 \times 0.7 = 7 \)。你的變異數則為 \( 10 \times 0.7 \times 0.3 = 2.1 \)。
5. 幾何分佈 (Geometric Distribution)
當我們計算直到第一次成功出現所需的試驗次數時,就會使用這種分佈。
符號: \( X \sim Geo(p) \)
核心公式:
- 在第 \( x \) 次試驗才第一次成功的機率: \( P(X=x) = (1-p)^{x-1}p \)
- 需要超過 \( x \) 次試驗的機率: \( P(X > x) = (1-p)^x \)
- 平均值: \( E(X) = \frac{1}{p} \)
- 變異數: \( Var(X) = \frac{1-p}{p^2} \)
類比: 想像嘗試擲骰子得到「6」。機率是 \( \frac{1}{6} \)。預期得到第一次「6」所需的擲骰次數是 \( \frac{1}{1/6} = 6 \) 次。
常見錯誤: 學生經常混淆 \( P(X=x) \) 和 \( P(X > x) \)。記住,\( P(X > x) \) 其實就是連續失敗 \( x \) 次的機率!
6. 卜瓦松分佈 (Poisson Distribution)
卜瓦松分佈模擬了事件在固定時間或空間區間內發生的次數。
符號: \( X \sim Po(\lambda) \),其中 \( \lambda \) (lambda) 是平均發生率。
條件 (「SIM」規則):
- Singly (單次性):事件一次只發生一個。
- Independently (獨立性):一個事件的發生不會影響下一個。
- Maintain a constant rate (恆定速率):平均速率 (\( \lambda \)) 保持不變。
數學運算:
- 機率公式: \( P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!} \)
- 神奇特性: 對於卜瓦松分佈,平均值 = 變異數。
\( E(X) = \lambda \) 且 \( Var(X) = \lambda \)。
卜瓦松變數的加總:
如果你有兩個獨立的卜瓦松變數 \( X \sim Po(\lambda_1) \) 和 \( Y \sim Po(\lambda_2) \),它們的和也是卜瓦松分佈:
\( X + Y \sim Po(\lambda_1 + \lambda_2) \)
例子: 如果一間商店早上每小時有 3 位顧客,下午每小時有 5 位,那麼每日總顧客數(假設各計 1 小時)遵循 \( Po(3 + 5) = Po(8) \)。
成功的小撇步
- 計算機技能: 確保你知道如何使用計算機的分佈選單(二項分佈、卜瓦松分佈)來快速計算機率。
- 檢查語境: 你是在計算固定試驗次數中的成功次數(二項分佈)?直到成功的試驗次數(幾何分佈)?還是特定時間段內的事件次數(卜瓦松分佈)?正確識別模型就已經成功了 80%!
- 捨入問題: 在計算變異數時,請保持平均值 (\( \mu \)) 的精確數值,以避免「累進式捨入誤差」。
總結: 你現在已經掌握了描述任何離散隨機事件的工具。你可以找出它的平均值(期望值)、一致性(變異數),並應用專業模型(均勻、二項、幾何、卜瓦松)來解決複雜的現實問題。持續練習,這些規律將成為你的本能!