歡迎來到離散隨機變量世界!
在本章中,我們將探討如何將「機會」轉化為「數學」。想像你在玩桌上遊戲,你知道擲出 6 點純屬運氣,但如果你擲了 1,000 次骰子,你其實是可以預測平均點數的。離散隨機變量 (Discrete Random Variables) 讓我們能利用精確的數學公式來建立這些現實世界不確定性的模型。無論是預測進入店鋪的顧客人數,還是你需要擲多少次硬幣才能得到「正面」,這些工具都能將不可預測的情況變得可以預測。
如果公式起初看起來有點嚇人,別擔心;我們會一步步為你拆解!
1. 什麼是離散隨機變量?
隨機變量 (Random Variable)(通常以大寫字母如 \(X\) 表示)是一個數值,其取決於隨機事件的結果。
離散 (Discrete) 一詞意味著它只能取特定的、分離的數值(如 1, 2, 3...),而不是連續尺度上的任何數值(如 1.234...)。
概率函數 (Probability Function):
我們使用 \(P(X = x)\) 來表示變量 \(X\) 取特定數值 \(x\) 的概率。這些通常以表格或公式形式呈現。
兩大金科玉律:
1. 每個個別概率必須介於 0 和 1 之間:\(0 \leq P(X=x) \leq 1\)。
2. 分佈中所有概率的總和必須為 1:\(\sum P(X=x) = 1\)。
小貼士:如果你解題時概率總和不等於 1,檢查一下你的加法吧!這是最常見的錯誤。
總結要點:離散隨機變量就是一種列出事件所有可能結果及其發生概率的方法。
2. 期望值 (平均值) 與變異數
如果你進行了數百萬次實驗,平均結果會是多少?這就是期望值 (Expectation),記作 \(E(X)\) 或 \(\mu\)。
公式: \(E(X) = \sum x P(X = x)\)
類比:把它想像成一個「加權平均數」,概率越高的數值會將平均值拉向它們。
變異數 (Variance) 用來衡量結果偏離平均值的「散佈程度」。高變異數代表結果非常分散;低變異數則代表結果大多集中在平均值附近。
公式: \(Var(X) = E(X^2) - [E(X)]^2\)
要計算 \(E(X^2)\),你只需將每個 \(x\) 值平方,再乘以其相應的概率即可。
標準差 (Standard Deviation): 這僅僅是變異數的平方根:\(\sigma = \sqrt{Var(X)}\)。
重點速覽:
- 期望值 = 平均結果。
- 變異數 = 結果的一致性。
- 務必先計算 \(E(X)\),因為變異數公式會用到它!
3. 編碼:變量的轉換
有時我們會更改數據。例如,如果 \(X\) 是遊戲得分,也許新得分是 \(2X + 5\)。這會如何改變我們的平均值和變異數?
線性轉換規則:
- 期望值: \(E(a + bX) = a + bE(X)\)。(它完全遵循運算規則!)
- 變異數: \(Var(a + bX) = b^2 Var(X)\)。
記憶法:變異數討厭加法! 加上常數 (\(a\)) 不會改變數據的散佈程度,因此它會被忽略。乘以 \(b\) 會使散佈變大,但由於變異數是「平方」單位,我們必須使用 \(b^2\)。
關鍵要點:加上一個數只會平移整個圖表,但不改變散佈;乘以一個數會拉伸圖表,並顯著增加散佈。
4. 獨立變量的線性組合
如果我們有兩個獨立的變量 \(X\) 和 \(Y\),且想將它們加起來怎麼辦?(例如,兩名隨機挑選的人的身高總和)。
期望值: \(E(X \pm Y) = E(X) \pm E(Y)\)
變異數: \(Var(X \pm Y) = Var(X) + Var(Y)\)
關鍵點:即使你是在進行減法運算 (\(X - Y\)),你仍然要相加變異數!這是因為將兩個不確定的事物結合起來,總是不確定性(散佈)增加。
5. 離散均勻分佈 (Discrete Uniform Distribution)
這是最簡單的模型。當每個結果發生的可能性相等時使用。
例子:公平的 6 面骰子。每個數字的概率均為 \(1/6\)。
如果 \(X\) 在集合 \(\{1, 2, ..., n\}\) 上均勻分佈:
- 平均值: \(E(X) = \frac{n + 1}{2}\)
- 變異數: \(Var(X) = \frac{1}{12}(n^2 - 1)\)
你知道嗎?這些公式僅適用於你的數值從 1 開始,且以 1 為步長遞增的情況。如果你的數值是 \(\{4, 5, 6, 7\}\),它仍然是均勻分佈,但你會通過尋找中間值來計算平均值!
6. 二項分佈 (Binomial Distribution)
你可能在 AS Level 就記得這個。它模擬在固定次數的試驗中「成功」的次數。
符號: \(X \sim B(n, p)\)
進階數學新知: 你需要掌握二項分佈的平均值和變異數公式:
- 平均值: \(E(X) = np\)
- 變異數: \(Var(X) = np(1 - p)\)
7. 泊松分佈 (Poisson Distribution)
這用於「隨機發生在時間或空間中」的事件。
例子:你在一個小時內收到的郵件數量,或一平方米草地上的雜草數量。
條件(CRIS 準則):
- C (Constant): 恆定的平均率 (\(\lambda\))。
- R (Randomly/Independently): 隨機且獨立發生。
- I (In isolation): 互斥(事件不能在完全同一時間發生)。
- S (Singly): 單次(一次發生一個)。
主要特徵:
- 符號: \(X \sim Po(\lambda)\)。
- 平均值與變異數: 在泊松分佈中,平均值和變異數是相等的! \(E(X) = Var(X) = \lambda\)。
快速檢查:如果題目給出的數據中平均值是 5 而變異數是 20,那麼泊松模型很可能不適用!
泊松相加: 如果你有兩個獨立的泊松變量 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\),那麼 \(X + Y \sim Po(\lambda + \mu)\)。你只需將比率相加即可!
8. 幾何分佈 (Geometric Distribution)
幾何分佈模擬的是直到第一次成功前所需的試驗次數。
例子:擲硬幣直到你得到第一個「正面」。
符號: \(X \sim Geo(p)\),其中 \(p\) 是成功的概率。
概率:
- 在第 \(r\) 次試驗才得到第一次成功:\(P(X = r) = (1 - p)^{r-1} p\)。
- 等待超過 \(r\) 次試驗才成功:\(P(X > r) = (1 - p)^r\)。
類比:若要失敗 5 次,直到第 6 次才成功,你必須經歷 (失敗 \(\times\) 失敗 \(\times\) 失敗 \(\times\) 失敗 \(\times\) 失敗 \(\times\) 成功)。
性質:
- 平均值: \(E(X) = \frac{1}{p}\)
- 變異數: \(Var(X) = \frac{1 - p}{p^2}\)
避免常見錯誤: 確保你清楚題目定義的 \(X\) 是「試驗次數」(本課程大綱)還是「第一次成功前的失敗次數」。務必仔細閱讀題目!
關鍵模型總結
1. 二項分佈: 固定次數的試驗,計算成功的次數。
2. 泊松分佈: 固定區間(時間/空間),計算發生的次數。
3. 幾何分佈: 不斷嘗試,直到第一次成功。
4. 均勻分佈: 每個結果的可能性均等。
如果起初覺得棘手,請別擔心!掌握這些模型最好的方法是多練習,學會辨認哪種模型適合題目中的情境。你一定能做到的!