Discrete random variables

歡迎來到離散隨機變數的世界！

哈囉！如果你曾經試著預測擲骰子的結果、體育比賽的勝負，甚至是通勤路上會遇到幾次紅燈，那你其實一直在運用機率的概念。本章「離散隨機變數 (Discrete Random Variables)」將帶你更進一步：我們不再只是計算簡單的機率，而是要以結構化的方式，計算隨機事件的期望結果與其分散程度。

如果一開始覺得有點棘手，別擔心！我們只是把你在敘述統計學中已經學過的「平均值」與「分散程度」概念，延伸應用到機率模型中而已。讓我們開始吧！

1. 定義離散隨機變數 (DRVs)

什麼是隨機變數？

隨機變數 (Random Variable) 通常記作 $X$ 或 $Y$，本質上是一個函數，它將隨機實驗的每一個可能結果賦予一個數值。

離散隨機變數 (Discrete Random Variable, 簡稱 DRV) 是指只能取「可數」個數值的隨機變數。這些數值通常（但不一定）是整數。

離散的例子： 拋硬幣 3 次時，正面出現的次數（結果為：0, 1, 2, 3）。
非離散（連續）的例子： 學生的身高（在一定範圍內可以是任何數值）。

機率分佈

DRV 的機率分佈 (Probability Distribution)（或稱機率質量函數，PMF）精確地告訴我們 $X$ 可以取哪些值，以及每個值對應的機率。

分佈通常以兩種方式呈現：

表格： 這是你在題目中最常見的形式。
簡易函數： 一個可以為給定值 $x$ 算出機率 $P(X=x)$ 的公式。

關鍵規則：機率總和

所有可能結果的機率總和必須等於 1。

對於所有 $i$，皆有 $P(X=x_i) \ge 0$。
重要公式： $\sum P(X=x) = 1$

例子：擲一顆偏倚的骰子。

$x$	1	2	3	4
$P(X=x)$	0.1	0.2	$k$	0.4

因為機率總和必須為 1：$0.1 + 0.2 + k + 0.4 = 1$。因此，$k = 1 - 0.7 = 0.3$。

第 1 節重點總結： DRV 具有可數的結果。其分佈列出了這些結果及其機率，機率總和永遠為 1。

2. 集中趨勢的測量：平均值（期望值）

當我們討論隨機變數的「平均值」時，我們使用期望值 (Expected Value) 這個術語。如果你將某個實驗重複執行非常多次，期望值就是你預期會得到的平均結果。

我們將期望值記作 $E(X)$ 或希臘字母 $\mu$ (mu)。

計算期望值 $E(X)$

期望值是一個加權平均數 (Weighted Average)。我們將每個結果 ($x$) 乘以其發生的機率 ($P$) 作為權重。

公式： $$E(X) = \mu = \sum x_i P(X=x_i)$$

類比： 想像你在某個單元的成績取決於四項任務。如果任務 1 佔 10%，而任務 4 佔 40%，那麼任務 4 的得分權重就重得多。同樣地，機率越高的結果，對期望值的貢獻就越大。

逐步範例（使用上述偏倚骰子的例子）：

$x$	1	2	3	4
$P(X=x)$	0.1	0.2	0.3	0.4

1. 將每個 $x$ 值乘以其對應的機率 $P(X=x)$：
$1 \times 0.1 = 0.1$
$2 \times 0.2 = 0.4$
$3 \times 0.3 = 0.9$
$4 \times 0.4 = 1.6$
2. 將結果相加：
$E(X) = 0.1 + 0.4 + 0.9 + 1.6 = 3.0$

期望值為 $3.0$。請注意，$E(X)$ 不一定必須是實驗中真正可能出現的結果（例如，即使你擲不出 2.5 次正面，但期望值計算結果為 2.5 是完全正常的）。

第 2 節重點總結： 期望值 $E(X)$ 是長期平均結果，計算方式是將所有結果的 $x \times P(X=x)$ 相加。

3. 分散程度的測量：變異數與標準差

平均值告訴我們中心位置，但我們也需要知道分散程度——即平均而言，數值偏離平均值的程度。這通常透過變異數 (Variance) $Var(X)$ 和標準差 (Standard Deviation) $\sigma$ 來測量。

3.1. 計算變異數 $Var(X)$

變異數是結果與平均值之間「差值平方」的期望值。

定義公式（計算較少用）：

$$Var(X) = E((X - \mu)^2) = \sum (x_i - \mu)^2 P(X=x_i)$$

這個公式用起來較複雜，因為你需要先算出 $\mu$，然後從每個 $x$ 中減去它，平方後再乘以 $P$，最後全部相加。

計算公式（你必須熟練這個版本）：

這個等效公式在計算上容易得多：

$$Var(X) = E(X^2) - [E(X)]^2$$

要使用此公式，需分為兩步：

計算 $E(X^2)$：即 $X$ 平方的期望值。
平方 $E(X)$：將你在第 2 節算出的平均值進行平方。

計算 $E(X^2)$： $$E(X^2) = \sum x_i^2 P(X=x_i)$$

千萬別搞混 $E(X^2)$ 和 $[E(X)]^2$！

逐步範例（延續剛才的偏倚骰子，其中 $E(X)=3.0$）：

$x$	1	2	3	4
$x^2$	1	4	9	16
$P(X=x)$	0.1	0.2	0.3	0.4

1. 計算 $E(X^2)$：將每個 $x^2$ 值乘以其機率 $P(X=x)$：
$E(X^2) = (1 \times 0.1) + (4 \times 0.2) + (9 \times 0.3) + (16 \times 0.4)$
$E(X^2) = 0.1 + 0.8 + 2.7 + 6.4 = 10.0$

2. 計算 $Var(X)$：使用 $Var(X) = E(X^2) - [E(X)]^2$。
已知 $E(X)=3.0$，所以 $[E(X)]^2 = 3.0^2 = 9.0$。
$Var(X) = 10.0 - 9.0 = 1.0$

3.2. 標準差 $\sigma$

標準差 (Standard Deviation, $\sigma$) 就是變異數的平方根。它很有用，因為它的單位與原始隨機變數 $X$ 的單位相同。

$$ \sigma = \sqrt{Var(X)} $$

在我們的例子中，$\sigma = \sqrt{1.0} = 1.0$。

常見錯誤請避免！

不要使用處理原始數據時用的變異數頻率公式（即除以 $n$）。在這裡，我們已經隱含地除以了 1（機率總和）。請堅持使用 $E(X^2) - [E(X)]^2$。
記得 $E(X^2)$ 不等於 $E(X)$ 的平方！

第 3 節重點總結： 變異數衡量分散程度。請使用更簡單的公式：$Var(X) = E(X^2) - [E(X)]^2$。標準差即為變異數的平方根。

4. 離散隨機變數的函數

有時我們感興趣的不是 $X$ 本身，而是 $X$ 的函數，例如 $Y = X^2$ 或 $Z = 3X + 5$。

4.1. 一般函數的期望值 $E(g(X))$

如果 $Y = g(X)$ 是 $X$ 的某個函數，則 $Y$ 的期望值是先將函數應用於結果，再以機率作為權重來計算。

公式： $$E(g(X)) = \sum g(x_i) P(X=x_i)$$

註：你在計算 $E(X^2)$ 時已經用過這個概念了！這裡的 $g(X)=X^2$。

4.2. 線性函數：$Y = aX + b$（縮放與平移）

這是最常見的函數類型。$a$ 是縮放因子，$b$ 是平移常數。

類比：將溫度從攝氏 ($X$) 轉換為華氏 ($Y$)。$Y = 1.8X + 32$。

期望值（平均值）的法則：

期望值會完全遵循該線性轉換。

$$E(aX + b) = aE(X) + b$$

變異數與標準差（分散程度）的法則：

分散程度受縮放 ($a$) 影響，但不受平移 ($b$) 影響。如果你將每個結果都加上 10，平均值會增加 10，但數據的分散程度（範圍大小）保持不變。

關鍵在於，由於變異數測量的是平方距離，因此縮放因子 $a$ 會變成 $a^2$：

$$Var(aX + b) = a^2Var(X)$$ $$SD(aX + b) = |a|SD(X)$$

例子：若 $E(X)=10$ 且 $Var(X)=4$。求 $E(2X - 5)$ 與 $Var(2X - 5)$。

$E(2X - 5) = 2E(X) - 5 = 2(10) - 5 = 15$
$Var(2X - 5) = 2^2 Var(X) = 4(4) = 16$

第 4 節重點總結： 對於線性變換，平均值遵循法則 ($E(aX+b) = aE(X)+b$)，但變異數僅受縮放因子影響，且需平方 ($Var(aX+b) = a^2Var(X)$)。常數 $b$ 對分散程度完全沒有影響。

5. 結合獨立隨機變數

我們經常會處理兩個獨立、無關實驗的綜合結果。

若兩個隨機變數 $X$ 與 $Y$ 的結果互不影響（例如擲兩顆不同的骰子），則它們是獨立的 (independent)。

5.1. 期望值的法則（加法或減法）

總和或差值的期望值，等於各別期望值的總和或差值。這條規則無論 $X$ 與 $Y$ 是否獨立均成立。

$$E(aX + bY) = aE(X) + bE(Y)$$ $$E(X - Y) = E(X) - E(Y)$$

5.2. 變異數的法則（加法或減法）—— 獨立性需求

變異數的運算規則成立的前提是：$X$ 與 $Y$ 必須是獨立的。

當結合獨立變數時，無論你是相加還是相減，分散程度總是會增加。這是因為結合結果引入了更多的整體隨機性。

重要公式： $$Var(aX + bY) = a^2Var(X) + b^2Var(Y)$$ $$Var(aX - bY) = a^2Var(X) + b^2Var(Y)$$

記憶小技巧：變異數永遠是相加的

如果 $X$ 與 $Y$ 是獨立的，變異數永遠為正數且永遠相加。

例子：若 $E(X)=10$，$Var(X)=4$，$E(Y)=20$，$Var(Y)=9$。求 $E(X-Y)$ 與 $Var(3X + 2Y)$。

$E(X - Y) = E(X) - E(Y) = 10 - 20 = -10$
$Var(3X + 2Y) = 3^2 Var(X) + 2^2 Var(Y)$
$Var(3X + 2Y) = 9(4) + 4(9) = 36 + 36 = 72$

5.3. $n$ 個獨立隨機變數的總和

此規則可自然延伸。若 $X_1, X_2, ..., X_n$ 為獨立的 DRVs（例如擲骰子 $n$ 次），則：

$$E(\sum X_i) = \sum E(X_i)$$ $$Var(\sum X_i) = \sum Var(X_i)$$

你知道嗎？ 如果你擲一顆公平骰子 10 次，總得分的期望值就是 $10 \times E(X)$，而總變異數就是 $10 \times Var(X)$。

快速複習區：核心公式

設 $X$ 與 $Y$ 為獨立 DRVs，$a$ 與 $b$ 為常數。

期望值（平均值）：

$E(X) = \sum x P(X=x)$
$E(aX + b) = aE(X) + b$
$E(X \pm Y) = E(X) \pm E(Y)$

變異數（分散程度）：

$Var(X) = E(X^2) - [E(X)]^2$
$Var(aX + b) = a^2Var(X)$ （常數 $b$ 會消失！）
$Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)$ （對於獨立變數，變異數永遠相加！）

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。