歡迎來到離散隨機變量!

你好!這一章將帶你跨越簡單概率計算,進入統計建模的領域。別擔心,「隨機變量」這個術語聽起來可能很生硬——它其實只是一種用數學方式來描述隨機事件中可能出現的數值結果的方法。

理解離散隨機變量 (Discrete Random Variables, DRVs) 是統計學 1 (Statistics 1) 的基礎。它能幫助我們分析機率遊戲、解讀實驗數據,並對預期結果進行預測。我們將學習如何計算平均結果,以及衡量這些結果的分散程度。


第 1 節:什麼是離散隨機變量?

1.1 定義隨機變量 (X)

隨機變量 (Random Variable, X) 是一個函數,它將樣本空間中的每一個結果都賦予一個數值。它之所以是「隨機」的,是因為在事件發生之前,我們無法確切知道它會取什麼數值。

  • 我們通常使用大寫字母(例如 \(X\) 或 \(Y\))來表示隨機變量本身。
  • 我們使用小寫字母(例如 \(x\) 或 \(y\))來表示變量可以取到的具體數值。

例子: 如果你投擲一顆標準骰子一次,設 \(X\) 為擲出的點數。所有可能的數值 \(x\) 為 \(\{1, 2, 3, 4, 5, 6\}\)。

1.2 離散與連續

這裡的關鍵詞是離散 (Discrete)

  • 離散隨機變量 (DRV): 指那些可能結果是可數的 (countable) 變量。它們通常取整數值。
  • 類比: DRV 就像計算班上的學生人數,或是投擲五次硬幣中出現正面的次數。你不可能有 2.5 個學生或 3.1 次正面。
  • (非考試範圍小提示): 連續隨機變量 (Continuous Random Variable, CRV) 可以在一個區間內取任何數值(例如身高、體重、時間)。我們稍後會在統計學中討論這些內容。
快速複習:DRV 檢查清單

若要使變量 \(X\) 成為離散隨機變量,其結果必須滿足:

  1. 數值性。
  2. 由機率決定。
  3. 可數的(通常為整數)。

第 2 節:概率分佈

一旦我們知道了 DRV 可能取到的數值 \(x\),我們就需要知道每個數值對應的概率。概率分佈 (Probability Distribution)(有時稱為概率質量函數,PMF)列出了所有可能的結果及其對應的概率。

2.1 展示分佈

概率分佈通常以表格形式呈現:

\(x\) (可能的數值) \(x_1\) \(x_2\) \(x_3\) ...
\(P(X=x)\) (概率) \(p_1\) \(p_2\) \(p_3\) ...

我們常用記號 \(P(X=x)\) 來表示「隨機變量 \(X\) 取特定值 \(x\) 的概率」。

例子:如果 \(X\) 是擲骰子的結果:

\(x\) 1 2 3 4 5 6
\(P(X=x)\) \(1/6\) \(1/6\) \(1/6\) \(1/6\) \(1/6\) \(1/6\)

2.2 兩個基本規則

任何函數或表格若要成為有效的概率分佈,必須滿足兩個至關重要的條件:

  1. 所有概率必須介於 0 和 1 之間:
    $$0 \le P(X=x) \le 1$$
  2. 所有概率之和必須恰好等於 1:
    $$\sum P(X=x) = 1$$

!!! 常見考試場景 !!!
你經常會遇到概率中包含未知常數(如 \(k\))的題目。你必須運用第二個規則(\(\sum P(X=x) = 1\))來列出方程並解出 \(k\)。

第 2 節重點總結

概率分佈展示了每個可能結果發生的可能性。如果概率總和不等於 1,那麼你要麼算錯了,要麼這個分佈是無效的!


第 3 節:期望值 (平均值)

離散隨機變量 \(X\) 的期望值 (Expectation / Expected Value),記為 \(E(X)\) 或 \(\mu\)(希臘字母 mu),是該變量的長期平均值。

類比:如果 \(X\) 代表一場遊戲的獎金,\(E(X)\) 就是如果你玩這場遊戲幾千次後,平均每次預期贏得的金額。它告訴你分佈的中心位置。

3.1 期望值的公式,\(E(X)\)

計算期望值時,將每個可能的結果 \(x\) 乘以其對應的概率 \(P(X=x)\),然後將所有結果相加。

$$E(X) = \mu = \sum x P(X=x)$$

3.2 計算 \(E(X)\) 的步驟

讓我們用一個簡單的例子:一個遊戲,你贏得 $1、$2 或 $5 的概率如下:

\(x\) 1 2 5
\(P(X=x)\) 0.5 0.3 0.2
  1. 建立第三行/列: 計算每個數值的 \(x P(X=x)\)。
    • \(1 \times 0.5 = 0.5\)
    • \(2 \times 0.3 = 0.6\)
    • \(5 \times 0.2 = 1.0\)
  2. 將結果求和:
    $$E(X) = 0.5 + 0.6 + 1.0 = 2.1$$

期望值是 2.1。注意,2.1 並不是表格中的實際結果(你不可能贏得 $2.10),但它代表了多次試驗後的平均結果。

3.3 X 的函數之期望值,\(E(g(X))\)

有時你需要求 \(X\) 的函數的期望值,例如 \(E(X^2)\) 或 \(E(2X-1)\)。規則依然相同:

$$E(g(X)) = \sum g(x) P(X=x)$$

要計算 \(E(X^2)\),只需將 \(x\) 的數值平方,然後再乘以對應的概率。這個特定的計算對於求變異數(見第 4 節)至關重要。

第 3 節重點總結

期望值 \(E(X)\) 告訴你結果的加權平均數。它是分佈的「中心」。記住公式:「x 乘以 P(x),然後求和」。


第 4 節:衡量分散程度 (變異數與標準差)

雖然 \(E(X)\) 告訴我們平均值,但它沒有告訴我們結果有多分散。一個總是贏 $2 的遊戲,比一個要麼輸 $100 要麼贏 $104 的遊戲風險小得多,儘管兩者的期望值都是 $2。

變異數 (Variance)標準差 (Standard Deviation) 就是用來衡量這種分散程度或風險的。

4.1 變異數,\(Var(X)\) 或 \(\sigma^2\)

變異數是結果與平均值之間差值的平方的期望值。雖然定義公式為:

$$Var(X) = \sum (x - \mu)^2 P(X=x)$$

這個定義計算起來很麻煩!相反,我們使用一個更簡單的恆等式(你必須熟記並運用):

$$Var(X) = E(X^2) - [E(X)]^2$$

記憶口訣: 「平方的期望值 減去 期望值的平方」。

4.2 計算變異數的步驟

要找到 \(Var(X)\),你需要兩樣東西:

  1. \(E(X)\): 平均值(在第 3 節計算過)。
  2. \(E(X^2)\): \(X\) 平方的期望值。

延續 3.2 的例子(其中 \(E(X) = 2.1\)):

  1. 計算每個結果的 \(x^2\):
    • \(1^2 = 1\)
    • \(2^2 = 4\)
    • \(5^2 = 25\)
  2. 計算 \(E(X^2) = \sum x^2 P(X=x)\):
    • \(1 \times 0.5 = 0.5\)
    • \(4 \times 0.3 = 1.2\)
    • \(25 \times 0.2 = 5.0\)
    $$E(X^2) = 0.5 + 1.2 + 5.0 = 6.7$$
  3. 代入變異數公式: $$Var(X) = E(X^2) - [E(X)]^2$$ $$Var(X) = 6.7 - (2.1)^2$$ $$Var(X) = 6.7 - 4.41 = 2.29$$

!!! 常見錯誤警示 !!!
千萬別忘了方括號!學生經常正確算出 \(E(X^2)\),卻忘記在最後把 \(E(X)\) 的值平方。

4.3 標準差,\(\sigma\)

標準差 (Standard Deviation, SD) 僅是變異數的平方根,即 \(\sigma = \sqrt{Var(X)}\)。

  • 它更受歡迎,因為它的單位與 \(X\) 和 \(E(X)\) 的單位相同。

在我們的例子中: $$SD(X) = \sqrt{2.29} \approx 1.513$$

第 4 節重點總結

變異數 (\(Var(X)\)) 衡量數據的分散程度。務必使用簡便公式:\(E(X^2) - [E(X)]^2\)。標準差就是該結果的平方根。


第 5 節:線性變換 (編碼)

如果你縮放或平移隨機變量會發生什麼?例如,如果 \(X\) 是分數,但你想求 \(Y\) 的統計量,其中 \(Y = 2X + 5\)(分數加倍並加上 5 分獎勵分)。

如果 \(Y = aX + b\),其中 \(a\) 和 \(b\) 是常數,新的平均值和變異數遵循以下規則:

5.1 對期望值 (平均值) 的影響

期望值同時受縮放 (\(a\)) 和平移 (\(b\)) 的影響。

$$E(aX + b) = a E(X) + b$$

這很符合邏輯:如果你將分數加倍並加上 5 分,平均分數也會加倍並增加 5 分。

5.2 對變異數 (分散程度) 的影響

變異數衡量分散程度。平移整個分佈(加上 \(b\))不會改變數值的分散情況,只會改變中心位置。因此,\(b\) 對變異數沒有影響。

然而,將分佈縮放 \(a\) 倍會使分散程度增加 \(a^2\) 倍。

$$Var(aX + b) = a^2 Var(X)$$

5.3 對標準差的影響

由於標準差是變異數的平方根,變化更簡單:

$$SD(aX + b) = |a| SD(X)$$

我們使用 \(|a|\) 是因為標準差必須為正數。

你知道嗎?(為什麼是 \(a^2\)?)

變異數的單位是原變量單位的平方。如果 \(X\) 的單位是米 (m),\(Var(X)\) 的單位就是 \(m^2\)。如果你將 \(X\) 縮放 3 倍,等於將單位縮放 3 倍,意味著變異數(平方單位)必須縮放 \(3^2 = 9\) 倍。

線性編碼規則總結
\(Y = aX + b\) 的統計量 變換規則
\(E(Y)\) \(a E(X) + b\)
\(Var(Y)\) \(a^2 Var(X)\)
\(SD(Y)\) \(|a| SD(X)\)
第 5 節重點總結

線性變換對平均值的影響與預期一致(縮放和平移)。然而,對於變異數,只有縮放因子 (\(a^2\)) 有影響;平移 (\(b\)) 對分散程度沒有任何影響。


章節複習:離散隨機變量

你已經掌握了統計建模的核心基礎!這裡是最後的快速檢查清單:

  • DRV 取可數的數值。
  • 有效的概率分佈其概率總和必須為 1。
  • 期望值 (平均值): \(E(X) = \sum x P(X=x)\)。(數據的中心。)
  • 變異數 (分散程度): \(Var(X) = E(X^2) - [E(X)]^2\)。(數據的風險/分散程度。)
  • 線性編碼 \(Y=aX+b\): \(E(Y)=aE(X)+b\) 且 \(Var(Y)=a^2 Var(X)\)。

做得好!掌握這些核心概念和計算方法,你就能為後續學習更具體的命名分佈(如二項分佈)打下堅實的基礎。請繼續練習計算步驟!