Discrete random variables - Mathematics (XMA01) - Pearson Edexcel International AS Level

離散隨機變數簡介

歡迎來到 Statistics 1 中最重要的章節之一！在此之前，你可能接觸的都是已經發生的數據（例如班上同學的身高）。但在這一章，我們的焦點會轉向模型（Models）——即用數學方式預測未來「可能」發生的事情。

理解離散隨機變數（Discrete Random Variables）就像在玩遊戲前先弄懂規則一樣。它讓我們能夠針對尚未發生的事件計算平均值與風險，這正是保險公司、遊戲設計師和科學家做決策的核心方法！

1. 什麼是離散隨機變數？

讓我們把這個術語拆解成兩個簡單的部分：

1. 離散（Discrete）： 指的是結果是明確且分開的。你可以計算它們（例如 1, 2, 3...）。在這些情況下，你不可能得到「一半」的結果。例如，擲 3 次硬幣出現的人頭數就是離散的（你不可能得到 1.5 次人頭）。
2. 隨機變數（Random Variable）： 這是一個數值取決於隨機事件結果的量。我們通常使用大寫字母（例如 \(X\)）來代表變數的「名稱」，並使用小寫字母（例如 \(x\)）來代表它實際取到的數值。

比喻： 想像一台自動販賣機。這台機器本身就是隨機變數 \(X\)。掉出來的特定零食（巧克力棒、薯片或餅乾）就是數值 \(x\)。因為你無法確切知道會掉出哪一個，所以它是「隨機」的。

重要術語小提醒：

• 樣本空間（Sample Space）： 所有可能結果的列表（例如，對於一顆骰子，樣本空間為 {1, 2, 3, 4, 5, 6}）。
• 機率分佈（Probability Distribution）： 一份完整的說明（通常是表格），顯示了每一個可能結果及其對應的機率。

快速複習： 對於任何有效的機率分佈，所有機率的總和必須等於 1。 \( \sum P(X = x) = 1 \)。

2. 機率函數與累積分配函數 (CDF)

機率函數 \(p(x)\)

機率函數寫作 \(P(X = x)\)，告訴我們特定結果發生的機會。有時候它會以公式呈現，例如 \(P(X = x) = kx\)。要找出 \(k\) 的值，只需記住「總和為 1」的規則！

累積分配函數 (CDF)

CDF 寫作 \(F(x)\)。你可以把「累積（Cumulative）」想像成累計總數。它告訴我們變數小於或等於某個特定數值的機率。

公式： \(F(x_0) = P(X \le x_0) = \sum_{x \le x_0} p(x)\)

例子： 如果你投擲一顆骰子，\(F(2)\) 就是擲出 1 或 2 的機率。
\(F(2) = P(X=1) + P(X=2) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6}\)。

關鍵重點： \(P(X = x)\) 是單一個點的機率；\(F(x)\) 則是累積到該點為止的總和機率。

3. 期望值 (Expected Value)：\(X\) 的「平均值」

期望值寫作 \(E(X)\) 或用希臘字母 \(\mu\) (mu) 表示，這是指如果你重複實驗很多很多次後，長期下來所期望得到的平均數值。

如何計算 \(E(X)\)：
1. 將每個數值 \(x\) 乘以它對應的機率 \(P(X=x)\)。
2. 將所有乘積加起來。

公式： \(E(X) = \sum x \cdot P(X = x)\)

如果一開始覺得有點難，別擔心！ 把它想像成「加權平均數」就好。如果贏 1 元的機率是 90%，贏 100 元的機率是 10%，那麼「期望值」會高於 1 元，因為 100 元會把平均值「拉高」，即使它很少發生。

你知道嗎？ 期望值不一定要是該變數實際可以取到的數值。對於一顆公平的骰子，\(E(X)\) 是 3.5，儘管你永遠無法擲出 3.5 這個數字！

4. 變異數 (Variance) 與標準差 (Standard Deviation)

雖然平均值告訴我們中心位置，但變異數（寫作 \(Var(X)\) 或 \(\sigma^2\)）則告訴我們數值的離散程度（分佈有多廣）。

我們使用這個非常通用的公式來計算變異數：
\(Var(X) = E(X^2) - [E(X)]^2\)

變異數計算步驟：

1. 找出 \(E(X)\)（平均值），然後將它平方。
2. 找出 \(E(X^2)\)：先將每個 \(x\) 值平方，然後乘以其機率，再將它們全部加總。
3. 相減： 用 \(E(X^2)\) 減去平均值的平方。

記憶小撇步： 記住「平方的平均值減去平均值的平方」。

常見錯誤： 很多同學最後會忘記將平均值平方。計算相減步驟時一定要再三檢查！

標準差： 這就是變異數的平方根。 \(\sigma = \sqrt{Var(X)}\)。

5. 數據編碼：線性轉換 (Linear Transformations)

有時候我們會透過加上常數或乘上係數來改變數據（例如將分數轉換成百分比），這稱為編碼（Coding）。

如果我們有一個新變數 \(Y = aX + b\)，會發生以下情況：

1. 平均值受所有運算影響：
\(E(aX + b) = aE(X) + b\)
（如果你把每個人的分數乘以 2 再加 5 分，平均值也會乘以 2 再加 5。）

2. 變異數只受乘數影響（且必須平方！）：
\(Var(aX + b) = a^2 Var(X)\)
（每個分數加 5 分並不會改變分數的「離散程度」，所以 '+ b' 會消失。乘數 'a' 必須平方，因為變異數是一種平方度量。）

快速總結：
• 平均值：完全遵循運算規則。
• 變異數：忽略加減項，將乘數平方。

6. 離散均勻分佈 (Discrete Uniform Distribution)

這是一種特殊的「公平」分佈。當每個可能結果的機率完全相同時，就是離散均勻分佈。

例子： 投擲一顆公平的 6 面骰子。從 1 到 6 的每個數字機率都是 \(\frac{1}{6}\)。
如果隨機變數 \(X\) 可以取值 \(1, 2, ..., n\)，那麼：
• 對於所有 \(x\)，\(P(X = x) = \frac{1}{n}\)。
• 平均值 \(E(X)\) 會正好在中間： \(\frac{n+1}{2}\)。

關鍵重點： 當你看到「Uniform（均勻）」這個詞，就想到「相等」或「公平」。這會簡化你的計算，因為你不需要複雜的表格——你已經知道每個機率都是一樣的！

總結檢查清單：
• 我的所有機率加起來等於 1 嗎？
• 計算變異數時，我有記得將平均值平方嗎？
• 在處理 \(Var(aX+b)\) 的編碼時，我有記得把 \(a\) 平方並忽略 \(b\) 嗎？
• 我的 \(E(X)\) 是否落在最小值與最大值 \(x\) 之間？（如果不是，檢查一下算式！）

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。