歡迎來到連續隨機變數的世界!
在之前的學習中,你可能已經接觸過離散隨機變數 (Discrete Random Variables)——即那些可以數得出來的數值,比如拋硬幣出現的正反面次數,或是擲骰子的結果。在這一章,我們將進入連續隨機變數 (Continuous Random Variables, 簡稱 CRV) 的領域。這些變數處理的是在一定範圍內可以取任何數值的數據,例如燒開一壺水所需的時間、樹木的高度,或是蘋果的精確重量。
如果起初覺得這些概念有些抽象,別擔心!你可以把它想像成從「樓梯」(你只能站在特定的階梯上)過渡到「平滑的斜坡」(你可以在任何高度站立)。我們會運用一些微積分來求取機率,但我們會一步步帶你拆解。
1. 機率密度函數 (Probability Density Function, pdf)
對於連續隨機變數,我們使用一個稱為機率密度函數 (pdf) 的函數,記作 \(f(x)\)。這個函數描述了分佈的形狀。
黃金法則:要讓 \(f(x)\) 成為一個有效的 pdf,必須同時滿足兩點:
1. 函數值永不為負:對於所有的 \(x\),\(f(x) \geq 0\)。
2. 曲線下的總面積必須等於 1。數學上即:\(\int_{-\infty}^{\infty} f(x) dx = 1\)。
比喻:雨量計
想像一個形狀特殊的雨量計,它總共能容納的總水量正好是 1 公升。雨量計在任何一點的高度就像是 \(f(x)\)。若要找出特定區域有多少「機率水」,你只需計算該區域的面積即可。
重點複習:
- 離散:機率是特定點上的數值。
- 連續:機率是曲線下的面積。
- 關鍵事實:連續隨機變數等於精確某一點的機率為零!\(P(X = 5) = 0\)。我們只測量區間,例如 \(P(4.9 < X < 5.1)\)。
2. 在區間內求機率
若要找出觀測值介於 \(a\) 和 \(b\) 之間的機率,我們使用積分 (integration) 來計算該區間內曲線下的面積。
\(P(a < X < b) = \int_{a}^{b} f(x) dx\)
逐步操作:
1. 確認你感興趣的範圍 \([a, b]\)。
2. 建立函數 \(f(x)\) 在這些上下限之間的積分。
3. 進行積分並求解!
常見錯誤:遺漏了積分限。務必檢查函數定義的範圍。如果函數定義在 \(0 < x < 4\),而題目問的是 \(P(x > 3)\),你的積分範圍應該是從 3 到 4,而不是 3 到無限大!
3. 平均數的度量:期望值與中位數
就像處理離散數據一樣,我們需要找到連續隨機變數的「中心」。
期望值 (Mean / Expected Value)
期望值 (Mean),即 \(E(X)\),代表機率分佈的「平衡點」。其公式為:
\(E(X) = \int x f(x) dx\)
(提示:在積分之前,只需將你的函數乘以 \(x\) 即可!)
中位數與四分位數
中位數 (Median, \(m\)) 是指左側佔總面積 50%、右側也佔 50% 的數值。要找到它,請解以下方程式中的 \(m\):
\(\int_{-\infty}^{m} f(x) dx = 0.5\)
同理:
- 對於下四分位數 (Lower Quartile, \(Q_1\)),面積為 0.25。
- 對於上四分位數 (Upper Quartile, \(Q_3\)),面積為 0.75。
你知道嗎?中位數是「公平切割」點。如果 pdf 是一個蛋糕,中位數就是你切割的位置,讓兩個人剛好分到同樣多的蛋糕!
4. 離散度的度量:變異數與標準差
為了觀察數據的分散程度,我們計算變異數 (Variance) 和標準差 (Standard Deviation)。
變異數公式
\(Var(X) = E(X^2) - [E(X)]^2\)
為了求出 \(E(X^2)\),我們使用與期望值類似的積分,但將 \(x\) 替換為 \(x^2\):
\(E(X^2) = \int x^2 f(x) dx\)
記憶口訣:「平方的期望值減去期望值的平方」。
標準差
標準差 (Standard Deviation) 就是變異數的平方根:\(\sigma = \sqrt{Var(X)}\)。
關鍵步驟:
1. 利用 \(\int x f(x) dx\) 求出 \(E(X)\)。
2. 利用 \(\int x^2 f(x) dx\) 求出 \(E(X^2)\)。
3. 將結果代入變異數公式。
5. 函數的期望值:\(E(g(X))\)
有時候,我們感興趣的不僅是 \(X\),而是 \(X\) 的某個函數,例如 \(X^3\) 或 \(1/X\)。課程要求你處理諸如 \(5X^3\)、\(18X^{-3}\) 或 \(6X^{-1}\) 這類函數。
規則很簡單:將期望值公式中的 \(x\) 替換為你的新函數 \(g(x)\):
\(E(g(X)) = \int g(x) f(x) dx\)
範例:若要計算 \(E(18X^{-3})\),你需要計算 \(\int (18x^{-3}) f(x) dx\)。
6. 線性變換
如果我們改變數據的刻度該怎麼辦?例如,將攝氏溫度 \(X\) 轉換為新的刻度 \(aX + b\)。我們可以使用這些好用的「捷徑」規則:
對於期望值: \(E(aX + b) = aE(X) + b\)
(平均數的平移與伸縮正如你所預期。)
對於變異數: \(Var(aX + b) = a^2 Var(X)\)
(加上 \(b\) 不會改變分散程度;而縮放因子 \(a\) 會使變異數增加 \(a^2\) 倍,因為變異數是「平方」單位。)
快速複習框:
若 \(E(X) = 10\) 且 \(Var(X) = 4\):
- \(E(2X + 5) = 2(10) + 5 = 25\)
- \(Var(2X + 5) = 2^2 \times 4 = 16\)
7. 獨立隨機變數
如果你有兩個隨機變數 \(X\) 和 \(Y\),且它們是獨立的(意味著一個變數的結果不會影響另一個),你可以輕鬆地結合它們的期望值與變異數。
期望值的和: \(E(X + Y) = E(X) + E(Y)\)
變異數的和: \(Var(X + Y) = Var(X) + Var(Y)\)
重要提示:這個變異數規則僅在變數獨立時成立!此外,即使你是進行減法計算(即求 \(Var(X - Y)\)),你依然要將變異數相加,因為當你結合兩個變數時,不確定性(分散程度)總是會增加!
總結表:關鍵公式
總機率: \(\int f(x) dx = 1\)
期望值 \(E(X)\): \(\int x f(x) dx\)
\(E(X^2)\): \(\int x^2 f(x) dx\)
變異數 \(Var(X)\): \(E(X^2) - [E(X)]^2\)
中位數 \(m\): 解 \(\int_{-\infty}^{m} f(x) dx = 0.5\)
最後小撇步:如果可以的話,試著畫出函數圖形!這有助於你視覺化面積,並檢查你計算出的平均數或中位數在圖表上看起來是否「合理」。