歡迎來到連續隨機變數的世界!
在之前的課程(單元 S1)中,你已經學過離散隨機變數 (discrete random variables)——也就是可以數得出來的數值,比如擲硬幣時出現的人頭數。在這個章節,我們將進入「無限」的世界,探討連續隨機變數 (continuous random variables)。這些變數通常是透過「測量」得出的,例如燈泡壞掉前的時長,或是樹木的精確高度。由於測量永遠可以更精確(例如:1.5米、1.52米、1.5234米……),這些變數可以在某個範圍內取任何數值。如果一開始覺得很抽象,不用擔心!我們將運用你已有的微積分知識(積分與微分)來把它拆解得清清楚楚!
1. 什麼是連續隨機變數?
連續隨機變數 (CRV) 是一個可以取給定區間內任何值的變數 \( X \)。
例子:一顆蘋果的重量。它可以是 150克、150.1克,甚至是 150.115克。
重要概念:單一點的機率
你知道嗎? 對於連續隨機變數來說,變數等於「特定單一點」的機率永遠是零,即 \( P(X = 2) = 0 \)。
你可以這樣想像:如果你試著往數線上投擲飛鏢,想要剛好擊中 2.000000...(有無窮多個零)那個點是不可能的。因此,我們總是關注落在某個範圍 (range) 內的機率,例如 \( P(1.9 < X < 2.1) \)。
快速重溫:離散 vs 連續
- 離散: 可數的數值。使用機率分佈表。
- 連續: 可測量的數值。使用機率密度函數 (pdf)。
2. 機率密度函數 (pdf)
機率密度函數記作 \( f(x) \),用來描述分佈的形狀。它本身並不是機率,但其曲線下的面積 (area) 代表了機率。
\( f(x) \) 的兩大金科玉律:
1. 函數值永遠不能為負:對於所有的 \( x \),都有 \( f(x) \ge 0 \)。
2. 曲線下的總面積必須等於 1: \( \int_{-\infty}^{\infty} f(x) dx = 1 \)。
若要找出 \( X \) 落在兩個數值 \( a \) 和 \( b \) 之間的機率,我們只需計算該曲線在這些點之間的面積:
\( P(a < X \le b) = \int_{a}^{b} f(x) dx \)
記憶小撇步: 把 pdf 想成是一張「密度圖」。圖形越高的地方,該數值出現的可能性就越高。而這張地圖的總「質量」永遠是 1。
3. 累積分配函數 (cdf)
累積分配函數記作 \( F(x) \),它告訴我們變數小於或等於某個值 \( x_0 \) 的機率。
\( F(x_0) = P(X \le x_0) = \int_{-\infty}^{x_0} f(x) dx \)
連結 \( f(x) \) 與 \( F(x) \) 的「橋樑」
你可以運用微積分技巧在兩個函數之間轉換:
- 從 pdf 到 cdf:對 \( f(x) \) 進行積分 (integrate)。
- 從 cdf 到 pdf:對 \( F(x) \) 進行微分 (differentiate)。
\( f(x) = \frac{dF(x)}{dx} \)
常見錯誤: 當你積分 \( f(x) \) 來求 \( F(x) \) 時,千萬別忘了加上積分常數 \( +C \)。你通常可以透過 \( F(\text{下限}) = 0 \) 或 \( F(\text{上限}) = 1 \) 的條件來求出 \( C \)。
核心觀念: \( f(x) \) 是機率的「斜率」或變化率,而 \( F(x) \) 是機率的「累積總數」。
4. 位置測度:眾數、中位數與四分位數
就像在 S1 一樣,我們想找出數據的「中心」。
眾數 (Mode)
眾數是使 pdf \( f(x) \) 達到最大值的 \( x \) 值。
如何尋找:觀察圖形。如果是簡單的曲線,就使用微分:令 \( f'(x) = 0 \) 並解出 \( x \)。別忘了檢查範圍的邊界,因為最大值可能出現在端點上!
中位數與四分位數
中位數 (Median) \( m \) 是使左側面積佔一半、右側面積佔一半的數值。
令 \( F(m) = 0.5 \) 並解出 \( m \)。
對於四分位數 (Quartiles) 也是如此:
- 下四分位數 (\( Q_1 \)): 令 \( F(Q_1) = 0.25 \)。
- 上四分位數 (\( Q_3 \)): 令 \( F(Q_3) = 0.75 \)。
中位數計算步驟:
1. 找出 cdf \( F(x) \) 的表達式。
2. 將該表達式令為 0.5。
3. 解出 \( x \)。這個值就是你的中位數!
5. 平均值與變異數
平均值(或稱期望值 expectation)與變異數 (variance) 告訴我們數據的平均水平以及數據的離散程度。
平均值 (期望值)
在離散數學中,你用的是 \( \sum x P(X=x) \)。而在連續數學中,我們使用積分:
\( E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx \)
變異數
變異數的公式與 S1 相同,但我們使用積分來計算各個部分:
\( Var(X) = \sigma^2 = E(X^2) - [E(X)]^2 \)
其中 \( E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx \)。
如果覺得這部分很複雜,別擔心! 只要記住,如果要找「任何東西」的期望值,只要把那個「東西」放進積分式裡,並乘以 \( f(x) \) 即可。
例子:要求 \( E(X^2) \),就對 \( x^2 \times f(x) \) 進行積分。
6. 運算總結表
如果你想找出…… 使用此方法:
- 機率 \( P(a < X < b) \): 對 \( f(x) \) 從 \( a \) 到 \( b \) 積分,或計算 \( F(b) - F(a) \)。
- 期望值 \( E(X) \): 對 \( x \times f(x) \) 積分。
- 眾數: 找出使 \( f(x) \) 最大的 \( x \) 值。
- 中位數: 解方程式 \( F(x) = 0.5 \)。
- 關係: \( f(x) \) 是 \( F(x) \) 的導數。
核心總結: 積分是你在這個章節最好的朋友!做完題目後,務必檢查總機率是否等於 1,以確保沒有計算錯誤。