歡迎來到離散隨機變數的世界!
哈囉!如果你曾經試著預測擲骰子的結果、體育比賽的勝負,甚至是通勤路上會遇到幾次紅燈,那你其實一直在運用機率的概念。本章「離散隨機變數 (Discrete Random Variables)」將帶你更進一步:我們不再只是計算簡單的機率,而是要以結構化的方式,計算隨機事件的期望結果與其分散程度。
如果一開始覺得有點棘手,別擔心!我們只是把你在敘述統計學中已經學過的「平均值」與「分散程度」概念,延伸應用到機率模型中而已。讓我們開始吧!
1. 定義離散隨機變數 (DRVs)
什麼是隨機變數?
隨機變數 (Random Variable) 通常記作 $X$ 或 $Y$,本質上是一個函數,它將隨機實驗的每一個可能結果賦予一個數值。
離散隨機變數 (Discrete Random Variable, 簡稱 DRV) 是指只能取「可數」個數值的隨機變數。這些數值通常(但不一定)是整數。
- 離散的例子: 拋硬幣 3 次時,正面出現的次數(結果為:0, 1, 2, 3)。
- 非離散(連續)的例子: 學生的身高(在一定範圍內可以是任何數值)。
機率分佈
DRV 的機率分佈 (Probability Distribution)(或稱機率質量函數,PMF)精確地告訴我們 $X$ 可以取哪些值,以及每個值對應的機率。
分佈通常以兩種方式呈現:
- 表格: 這是你在題目中最常見的形式。
- 簡易函數: 一個可以為給定值 $x$ 算出機率 $P(X=x)$ 的公式。
關鍵規則:機率總和
所有可能結果的機率總和必須等於 1。
對於所有 $i$,皆有 $P(X=x_i) \ge 0$。
重要公式: \(\sum P(X=x) = 1\)
例子:擲一顆偏倚的骰子。
| $x$ | 1 | 2 | 3 | 4 |
| $P(X=x)$ | 0.1 | 0.2 | $k$ | 0.4 |
因為機率總和必須為 1:$0.1 + 0.2 + k + 0.4 = 1$。因此,$k = 1 - 0.7 = 0.3$。
第 1 節重點總結: DRV 具有可數的結果。其分佈列出了這些結果及其機率,機率總和永遠為 1。
2. 集中趨勢的測量:平均值(期望值)
當我們討論隨機變數的「平均值」時,我們使用期望值 (Expected Value) 這個術語。如果你將某個實驗重複執行非常多次,期望值就是你預期會得到的平均結果。
我們將期望值記作 $E(X)$ 或希臘字母 $\mu$ (mu)。
計算期望值 \(E(X)\)
期望值是一個加權平均數 (Weighted Average)。我們將每個結果 ($x$) 乘以其發生的機率 ($P$) 作為權重。
公式: $$E(X) = \mu = \sum x_i P(X=x_i)$$
類比: 想像你在某個單元的成績取決於四項任務。如果任務 1 佔 10%,而任務 4 佔 40%,那麼任務 4 的得分權重就重得多。同樣地,機率越高的結果,對期望值的貢獻就越大。
逐步範例(使用上述偏倚骰子的例子):
| $x$ | 1 | 2 | 3 | 4 |
| $P(X=x)$ | 0.1 | 0.2 | 0.3 | 0.4 |
1. 將每個 $x$ 值乘以其對應的機率 $P(X=x)$:
\(1 \times 0.1 = 0.1\)
\(2 \times 0.2 = 0.4\)
\(3 \times 0.3 = 0.9\)
\(4 \times 0.4 = 1.6\)
2. 將結果相加:
\(E(X) = 0.1 + 0.4 + 0.9 + 1.6 = 3.0\)
期望值為 $3.0$。請注意,$E(X)$ 不一定必須是實驗中真正可能出現的結果(例如,即使你擲不出 2.5 次正面,但期望值計算結果為 2.5 是完全正常的)。
第 2 節重點總結: 期望值 $E(X)$ 是長期平均結果,計算方式是將所有結果的 $x \times P(X=x)$ 相加。
3. 分散程度的測量:變異數與標準差
平均值告訴我們中心位置,但我們也需要知道分散程度——即平均而言,數值偏離平均值的程度。這通常透過變異數 (Variance) $Var(X)$ 和標準差 (Standard Deviation) $\sigma$ 來測量。
3.1. 計算變異數 \(Var(X)\)
變異數是結果與平均值之間「差值平方」的期望值。
定義公式(計算較少用):
$$Var(X) = E((X - \mu)^2) = \sum (x_i - \mu)^2 P(X=x_i)$$這個公式用起來較複雜,因為你需要先算出 $\mu$,然後從每個 $x$ 中減去它,平方後再乘以 $P$,最後全部相加。
計算公式(你必須熟練這個版本):
這個等效公式在計算上容易得多:
$$Var(X) = E(X^2) - [E(X)]^2$$要使用此公式,需分為兩步:
- 計算 $E(X^2)$:即 $X$ 平方的期望值。
- 平方 $E(X)$:將你在第 2 節算出的平均值進行平方。
計算 \(E(X^2)\): $$E(X^2) = \sum x_i^2 P(X=x_i)$$
千萬別搞混 \(E(X^2)\) 和 \([E(X)]^2\)!
逐步範例(延續剛才的偏倚骰子,其中 $E(X)=3.0$):
| $x$ | 1 | 2 | 3 | 4 |
| $x^2$ | 1 | 4 | 9 | 16 |
| $P(X=x)$ | 0.1 | 0.2 | 0.3 | 0.4 |
1. 計算 $E(X^2)$:將每個 $x^2$ 值乘以其機率 $P(X=x)$:
\(E(X^2) = (1 \times 0.1) + (4 \times 0.2) + (9 \times 0.3) + (16 \times 0.4)\)
\(E(X^2) = 0.1 + 0.8 + 2.7 + 6.4 = 10.0\)
2. 計算 $Var(X)$:使用 $Var(X) = E(X^2) - [E(X)]^2$。
已知 $E(X)=3.0$,所以 $[E(X)]^2 = 3.0^2 = 9.0$。
\(Var(X) = 10.0 - 9.0 = 1.0\)
3.2. 標準差 \(\sigma\)
標準差 (Standard Deviation, \(\sigma\)) 就是變異數的平方根。它很有用,因為它的單位與原始隨機變數 $X$ 的單位相同。
$$ \sigma = \sqrt{Var(X)} $$在我們的例子中,$\sigma = \sqrt{1.0} = 1.0$。
常見錯誤請避免!
- 不要使用處理原始數據時用的變異數頻率公式(即除以 $n$)。在這裡,我們已經隱含地除以了 1(機率總和)。請堅持使用 $E(X^2) - [E(X)]^2$。
- 記得 $E(X^2)$ 不等於 $E(X)$ 的平方!
第 3 節重點總結: 變異數衡量分散程度。請使用更簡單的公式:$Var(X) = E(X^2) - [E(X)]^2$。標準差即為變異數的平方根。
4. 離散隨機變數的函數
有時我們感興趣的不是 $X$ 本身,而是 $X$ 的函數,例如 $Y = X^2$ 或 $Z = 3X + 5$。
4.1. 一般函數的期望值 \(E(g(X))\)
如果 $Y = g(X)$ 是 $X$ 的某個函數,則 $Y$ 的期望值是先將函數應用於結果,再以機率作為權重來計算。
公式: $$E(g(X)) = \sum g(x_i) P(X=x_i)$$
註:你在計算 $E(X^2)$ 時已經用過這個概念了!這裡的 $g(X)=X^2$。
4.2. 線性函數:$Y = aX + b$(縮放與平移)
這是最常見的函數類型。$a$ 是縮放因子,$b$ 是平移常數。
類比:將溫度從攝氏 ($X$) 轉換為華氏 ($Y$)。$Y = 1.8X + 32$。
期望值(平均值)的法則:
期望值會完全遵循該線性轉換。
$$E(aX + b) = aE(X) + b$$變異數與標準差(分散程度)的法則:
分散程度受縮放 ($a$) 影響,但不受平移 ($b$) 影響。如果你將每個結果都加上 10,平均值會增加 10,但數據的分散程度(範圍大小)保持不變。
關鍵在於,由於變異數測量的是平方距離,因此縮放因子 $a$ 會變成 $a^2$:
$$Var(aX + b) = a^2Var(X)$$ $$SD(aX + b) = |a|SD(X)$$例子:若 $E(X)=10$ 且 $Var(X)=4$。求 $E(2X - 5)$ 與 $Var(2X - 5)$。
\(E(2X - 5) = 2E(X) - 5 = 2(10) - 5 = 15\)
\(Var(2X - 5) = 2^2 Var(X) = 4(4) = 16\)
第 4 節重點總結: 對於線性變換,平均值遵循法則 ($E(aX+b) = aE(X)+b$),但變異數僅受縮放因子影響,且需平方 ($Var(aX+b) = a^2Var(X)$)。常數 $b$ 對分散程度完全沒有影響。
5. 結合獨立隨機變數
我們經常會處理兩個獨立、無關實驗的綜合結果。
若兩個隨機變數 $X$ 與 $Y$ 的結果互不影響(例如擲兩顆不同的骰子),則它們是獨立的 (independent)。
5.1. 期望值的法則(加法或減法)
總和或差值的期望值,等於各別期望值的總和或差值。這條規則無論 $X$ 與 $Y$ 是否獨立均成立。
$$E(aX + bY) = aE(X) + bE(Y)$$ $$E(X - Y) = E(X) - E(Y)$$5.2. 變異數的法則(加法或減法)—— 獨立性需求
變異數的運算規則成立的前提是:$X$ 與 $Y$ 必須是獨立的。
當結合獨立變數時,無論你是相加還是相減,分散程度總是會增加。這是因為結合結果引入了更多的整體隨機性。
重要公式: $$Var(aX + bY) = a^2Var(X) + b^2Var(Y)$$ $$Var(aX - bY) = a^2Var(X) + b^2Var(Y)$$
記憶小技巧:變異數永遠是相加的
如果 $X$ 與 $Y$ 是獨立的,變異數永遠為正數且永遠相加。
例子:若 $E(X)=10$,$Var(X)=4$,$E(Y)=20$,$Var(Y)=9$。求 $E(X-Y)$ 與 $Var(3X + 2Y)$。
\(E(X - Y) = E(X) - E(Y) = 10 - 20 = -10\)
\(Var(3X + 2Y) = 3^2 Var(X) + 2^2 Var(Y)\)
\(Var(3X + 2Y) = 9(4) + 4(9) = 36 + 36 = 72\)
5.3. \(n\) 個獨立隨機變數的總和
此規則可自然延伸。若 $X_1, X_2, ..., X_n$ 為獨立的 DRVs(例如擲骰子 $n$ 次),則:
$$E(\sum X_i) = \sum E(X_i)$$ $$Var(\sum X_i) = \sum Var(X_i)$$
你知道嗎? 如果你擲一顆公平骰子 10 次,總得分的期望值就是 $10 \times E(X)$,而總變異數就是 $10 \times Var(X)$。
快速複習區:核心公式
設 $X$ 與 $Y$ 為獨立 DRVs,$a$ 與 $b$ 為常數。
期望值(平均值):
$E(X) = \sum x P(X=x)$
$E(aX + b) = aE(X) + b$
$E(X \pm Y) = E(X) \pm E(Y)$
變異數(分散程度):
$Var(X) = E(X^2) - [E(X)]^2$
$Var(aX + b) = a^2Var(X)$ (常數 $b$ 會消失!)
$Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)$ (對於獨立變數,變異數永遠相加!)