離散隨機變數簡介

歡迎來到 Statistics 1 中最重要的章節之一!在此之前,你可能接觸的都是已經發生的數據(例如班上同學的身高)。但在這一章,我們的焦點會轉向模型(Models)——即用數學方式預測未來「可能」發生的事情。

理解離散隨機變數(Discrete Random Variables)就像在玩遊戲前先弄懂規則一樣。它讓我們能夠針對尚未發生的事件計算平均值與風險,這正是保險公司、遊戲設計師和科學家做決策的核心方法!

1. 什麼是離散隨機變數?

讓我們把這個術語拆解成兩個簡單的部分:

1. 離散(Discrete): 指的是結果是明確且分開的。你可以計算它們(例如 1, 2, 3...)。在這些情況下,你不可能得到「一半」的結果。例如,擲 3 次硬幣出現的人頭數就是離散的(你不可能得到 1.5 次人頭)。
2. 隨機變數(Random Variable): 這是一個數值取決於隨機事件結果的量。我們通常使用大寫字母(例如 \(X\))來代表變數的「名稱」,並使用小寫字母(例如 \(x\))來代表它實際取到的數值。

比喻: 想像一台自動販賣機。這台機器本身就是隨機變數 \(X\)。掉出來的特定零食(巧克力棒、薯片或餅乾)就是數值 \(x\)。因為你無法確切知道會掉出哪一個,所以它是「隨機」的。

重要術語小提醒:

樣本空間(Sample Space): 所有可能結果的列表(例如,對於一顆骰子,樣本空間為 {1, 2, 3, 4, 5, 6})。
機率分佈(Probability Distribution): 一份完整的說明(通常是表格),顯示了每一個可能結果及其對應的機率。

快速複習: 對於任何有效的機率分佈,所有機率的總和必須等於 1。 \( \sum P(X = x) = 1 \)。

2. 機率函數與累積分配函數 (CDF)

機率函數 \(p(x)\)

機率函數寫作 \(P(X = x)\),告訴我們特定結果發生的機會。有時候它會以公式呈現,例如 \(P(X = x) = kx\)。要找出 \(k\) 的值,只需記住「總和為 1」的規則!

累積分配函數 (CDF)

CDF 寫作 \(F(x)\)。你可以把「累積(Cumulative)」想像成累計總數。它告訴我們變數小於或等於某個特定數值的機率。

公式: \(F(x_0) = P(X \le x_0) = \sum_{x \le x_0} p(x)\)

例子: 如果你投擲一顆骰子,\(F(2)\) 就是擲出 1 或 2 的機率。
\(F(2) = P(X=1) + P(X=2) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6}\)。

關鍵重點: \(P(X = x)\) 是單一個點的機率;\(F(x)\) 則是累積到該點為止的總和機率

3. 期望值 (Expected Value):\(X\) 的「平均值」

期望值寫作 \(E(X)\) 或用希臘字母 \(\mu\) (mu) 表示,這是指如果你重複實驗很多很多次後,長期下來所期望得到的平均數值。

如何計算 \(E(X)\):
1. 將每個數值 \(x\) 乘以它對應的機率 \(P(X=x)\)。
2. 將所有乘積加起來。

公式: \(E(X) = \sum x \cdot P(X = x)\)

如果一開始覺得有點難,別擔心! 把它想像成「加權平均數」就好。如果贏 1 元的機率是 90%,贏 100 元的機率是 10%,那麼「期望值」會高於 1 元,因為 100 元會把平均值「拉高」,即使它很少發生。

你知道嗎? 期望值不一定要是該變數實際可以取到的數值。對於一顆公平的骰子,\(E(X)\) 是 3.5,儘管你永遠無法擲出 3.5 這個數字!

4. 變異數 (Variance) 與標準差 (Standard Deviation)

雖然平均值告訴我們中心位置,但變異數(寫作 \(Var(X)\)\(\sigma^2\))則告訴我們數值的離散程度(分佈有多廣)。

我們使用這個非常通用的公式來計算變異數:
\(Var(X) = E(X^2) - [E(X)]^2\)

變異數計算步驟:

1. 找出 \(E(X)\)(平均值),然後將它平方。
2. 找出 \(E(X^2)\):先將每個 \(x\) 值平方,然後乘以其機率,再將它們全部加總。
3. 相減: 用 \(E(X^2)\) 減去平均值的平方。

記憶小撇步: 記住「平方的平均值減去平均值的平方」。

常見錯誤: 很多同學最後會忘記將平均值平方。計算相減步驟時一定要再三檢查!

標準差: 這就是變異數的平方根。 \(\sigma = \sqrt{Var(X)}\)。

5. 數據編碼:線性轉換 (Linear Transformations)

有時候我們會透過加上常數或乘上係數來改變數據(例如將分數轉換成百分比),這稱為編碼(Coding)

如果我們有一個新變數 \(Y = aX + b\),會發生以下情況:

1. 平均值受所有運算影響:
\(E(aX + b) = aE(X) + b\)
(如果你把每個人的分數乘以 2 再加 5 分,平均值也會乘以 2 再加 5。)

2. 變異數只受乘數影響(且必須平方!):
\(Var(aX + b) = a^2 Var(X)\)
(每個分數加 5 分並不會改變分數的「離散程度」,所以 '+ b' 會消失。乘數 'a' 必須平方,因為變異數是一種平方度量。)

快速總結:
• 平均值:完全遵循運算規則。
• 變異數:忽略加減項,將乘數平方。

6. 離散均勻分佈 (Discrete Uniform Distribution)

這是一種特殊的「公平」分佈。當每個可能結果的機率完全相同時,就是離散均勻分佈

例子: 投擲一顆公平的 6 面骰子。從 1 到 6 的每個數字機率都是 \(\frac{1}{6}\)。
如果隨機變數 \(X\) 可以取值 \(1, 2, ..., n\),那麼:
• 對於所有 \(x\),\(P(X = x) = \frac{1}{n}\)。
• 平均值 \(E(X)\) 會正好在中間: \(\frac{n+1}{2}\)。

關鍵重點: 當你看到「Uniform(均勻)」這個詞,就想到「相等」或「公平」。這會簡化你的計算,因為你不需要複雜的表格——你已經知道每個機率都是一樣的!

總結檢查清單:
• 我的所有機率加起來等於 1 嗎?
• 計算變異數時,我有記得將平均值平方嗎?
• 在處理 \(Var(aX+b)\) 的編碼時,我有記得把 \(a\) 平方並忽略 \(b\) 嗎?
• 我的 \(E(X)\) 是否落在最小值與最大值 \(x\) 之間?(如果不是,檢查一下算式!)