連續隨機變數 (CRVs) 簡介

你好!在之前的數學學習中,你已經接觸過離散 (discrete) 隨機變數——也就是你可以數出來的數值,例如擲硬幣出現正面的次數,或是班級中的學生人數。在本章中,我們將進入連續 (continuous) 的世界。

你可以把連續隨機變數 (CRV) 想像成可以在某個範圍內取任何數值的變數。數碼時鐘顯示的是離散的分鐘,而傳統指針時鐘的秒針則是連續地掃過每一分每一秒。我們使用 CRV 來模擬諸如時間、身高或體重等事物。理解 CRV 非常重要,因為現實世界中的情況很少會剛好是整數!

1. 機率密度函數 (pdf)

對於離散變數,我們使用表格來顯示機率。對於 CRV,我們則使用一個稱為機率密度函數 (Probability Density Function) 的函數,寫作 \( f(x) \)

核心概念:面積 = 機率
在 CRV 中,變數落在兩個數值之間的機率,就是該區間內曲線 \( f(x) \) 下方的面積。因此,兩個非常重要的規則適用於此:
1. 整個曲線下方的總面積必須始終等於 1
\( \int_{-\infty}^{\infty} f(x) \, dx = 1 \)
2. 函數 \( f(x) \) 永遠不能為負(因為機率不可能是負的!)。

你知道嗎?
對於 CRV,變數取剛好某個特定數值的機率總是 。即 \( P(X = 2) = 0 \)。這是因為單點沒有寬度,所以也就沒有面積。我們只討論關於一個區間 (interval) 的機率,例如 \( P(1 < X < 3) \)。

快速回顧:
- 離散: 機率總和 \( \sum P(X=x) = 1 \)
- 連續: 密度函數的積分 \( \int f(x) \, dx = 1 \)

2. 求機率

要找出 \( X \) 落在 \( a \) 和 \( b \) 之間的機率,你只需要對該區間內的 pdf 進行積分即可:

\( P(a \le X \le b) = \int_{a}^{b} f(x) \, dx \)

如果一開始覺得很難,別擔心! 只要記住「求機率」其實就是「求圖形下方的面積」的一種高階說法。如果函數形狀簡單(如長方形或三角形),你甚至可以直接用基本幾何公式,而不必使用積分!

3. 累積分配函數 (cdf)

累積分配函數 (Cumulative Distribution Function),寫作 \( F(x) \),代表機率的「累加總和」。它告訴你變數小於或等於某個數值 \( x \) 的機率。

兩者關係:
- 由 \( f(x) \) 求 \( F(x) \):積分 (Integrate)
\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) \, dt \)
- 由 \( F(x) \) 求 \( f(x) \):微分 (Differentiate)
\( f(x) = \frac{d}{dx} F(x) \)

常見錯誤:
在進行積分以求 \( F(x) \) 時,別忘了積分常數 (\( + C \)),或者使用一個虛擬變數(如 \( t \))並從下限積分到 \( x \)。\( F(x) \) 在範圍的最開始必須永遠等於 0,而在最末端則必須等於 1。

4. 平均數、變異數與標準差

就像處理離散變數一樣,我們想知道 CRV 的平均數(期望值)和分散程度(變異數)。

期望值 (平均數):
\( E(X) = \mu = \int x f(x) \, dx \)
類比:這可以被視為曲線下方面積的「平衡點」。

變異數:
要計算變異數,先求出 \( E(X^2) \):
\( E(X^2) = \int x^2 f(x) \, dx \)
然後使用熟悉的公式:
\( Var(X) = E(X^2) - [E(X)]^2 \)

標準差:
這只是變異數的平方根:\( \sigma = \sqrt{Var(X)} \)。

重點提示: 永遠先求 \( E(X) \),再求 \( E(X^2) \),最後才求變異數。這是一個三步走的過程!

5. 中位數與四分位數

中位數 (median) (\( m \)) 是該數值左側面積剛好佔一半、右側也佔一半的點。若要找出它,請解以下方程式中的 \( m \):
\( F(m) = 0.5 \) 或 \( \int_{-\infty}^{m} f(x) \, dx = 0.5 \)

同理,對於四分位數:
- 下四分位數 (\( Q_1 \)): 解 \( F(Q_1) = 0.25 \)
- 上四分位數 (\( Q_3 \)): 解 \( F(Q_3) = 0.75 \)

中位數計算步驟:
1. 找出 cdf 的表達式 \( F(x) \)。
2. 將該表達式設為 0.5。
3. 解出 \( x \)。這就是你的中位數!

6. 線性函數與 \( g(X) \) 的期望值

有時候,我們不只想知道 \( X \) 的平均值,還想知道 \( X \) 的函數的平均值,例如 \( 5X^3 \) 或 \( 6X^{-1} \)。

函數 \( g(X) \) 的期望值:
\( E(g(X)) = \int g(x) f(x) \, dx \)

線性變換:
如果你有一個線性變換 \( aX + b \):
- 平均值: \( E(aX + b) = aE(X) + b \)
- 變異數: \( Var(aX + b) = a^2 Var(X) \)
記憶小撇步:加上常數 (\( b \)) 會平移整個圖形,但不會改變它的分散程度,所以 \( b \) 在變異數公式中會消失!

7. 長方形(均勻)分配

最簡單的 CRV 是長方形分配 (Rectangular Distribution)。當區間 \( [a, b] \) 內每個數值發生的可能性都相等時,就會用到它。

公式:
- pdf: \( f(x) = \frac{1}{b-a} \),範圍為 \( a \le x \le b \)(其餘範圍為 0)。
- 平均值: \( E(X) = \frac{a+b}{2} \)(剛好在中間)。
- 變異數: \( Var(X) = \frac{(b-a)^2}{12} \)

快速回顧:
如果巴士在 0 到 10 分鐘內的任何時間到達,則 \( a=0 \),\( b=10 \)。pdf 的高度為 \( \frac{1}{10-0} = 0.1 \)。平均等待時間為 5 分鐘。

8. 合併獨立變數

如果你有兩個獨立 (independent) 的隨機變數 \( X \) 和 \( Y \)(代表兩者互不影響),無論它們是離散還是連續,以下規則皆適用:

期望值之和:
\( E(X + Y) = E(X) + E(Y) \)

變異數之和:
\( Var(X + Y) = Var(X) + Var(Y) \)

重要提醒: 此變異數規則在變數獨立時有效。如果它們之間有關聯,公式會變得複雜得多(但本節不需要擔心這個!)。

重點總結:
- pdf \( f(x) \): 曲線。下方面積即為機率,總面積 = 1。
- cdf \( F(x) \): 累加總和。\( F(x) = P(X \le x) \)。
- 平均值 \( E(X) \): 對 \( x f(x) \) 積分。
- 中位數: \( F(x) = 0.5 \) 之處。
- 長方形: pdf 為水平線的「公平」分配。