歡迎來到連續隨機變量的世界!

在之前的學習中,你可能已經接觸過離散隨機變量 (Discrete Random Variables)——即可以數出來的數據,例如拋十次硬幣出現的正反面次數,或是擲骰子的結果。在這章中,我們將進入數學的「平滑」領域:連續隨機變量 (Continuous Random Variables, CRVs)

想像一下,測量水壺燒開所需的精確時間,或是學校每位學生的精確身高。這些數字不只是整數,它們可以是範圍內的任何值(例如 165.234 cm)。由於這些數值有無限多種可能,我們需要藉助微積分來幫助我們計算概率。如果剛開始覺得有點複雜也不用擔心——只要看出當中的規律,它其實就跟一般的積分和微分沒什麼兩樣!

1. 什麼是概率密度函數 (PDF)?

由於連續變量可以取無限多的數值,它落在「某個特定點」(例如正好是 1.500000... cm)的概率其實是。因此,我們改為探討數值落在某個範圍內的概率。

我們使用概率密度函數 (Probability Density Function) 來表示,記作 \( f(x) \)。

PDF 的兩大金科玉律

任何函數要成為有效的 PDF,必須遵循以下兩條規則:

1. 不能為負:對於所有 \( x \),皆有 \( f(x) \geq 0 \)。 (概率「密度」是不可能為負的!)
2. 總面積必須為 1:所有概率的總和必須等於 100%。用微積分的術語來說:\( \int_{-\infty}^{\infty} f(x) \, dx = 1 \)。

快速複習:如果考試題目要求你「找出常數 \( k \)」,只需將函數在給定的範圍內進行積分,設其等於 1,然後解出 \( k \) 即可。

2. 累積分佈函數 (CDF)

如果 PDF 告訴我們某個特定點的「密度」,那麼累積分佈函數 (Cumulative Distribution Function)(記作 \( F(x) \))則告訴我們截至該點為止的「累積」概率。

比喻:如果 PDF 就像水滴入桶中的速度,那麼 CDF 就是在時間 \( x \) 時桶內水的總量。

在 PDF 與 CDF 之間轉換

這就是展現你微積分功力的時候了:

從 PDF 得到 CDF:積分! \( F(x) = \int_{-\infty}^{x} f(t) \, dt \)
從 CDF 得到 PDF:微分! \( f(x) = \frac{d}{dx} F(x) \)

重點提示:對於任何 CDF,\( F(x) \) 在範圍起點處總為 0,在範圍終點處總為 1。

3. 計算概率

要找出 \( X \) 落在兩個數值 \( a \) 和 \( b \) 之間的概率,你需要求出這兩點之間曲線下的面積

\( P(a < X < b) = \int_{a}^{b} f(x) \, dx \)

或者,如果你已經有了 CDF:
\( P(a < X < b) = F(b) - F(a) \)

你知道嗎?在連續分佈中,\( P(X \leq a) \) 和 \( P(X < a) \) 是完全一樣的。因為落在特定一點的概率為零,所以是否有「等於」符號並不影響面積!

4. 期望值與方差

就像離散變量一樣,我們同樣希望找出數據的「平均值」(期望值 Mean)和「離散程度」(方差 Variance)。

期望值 (Expectation)

平均值,即 \( E(X) \),是該分佈的重心。
\( E(X) = \int_{-\infty}^{\infty} x f(x) \, dx \)

方差 (Variance)

方差衡量數值偏離平均值的程度。
1. 首先,找出 \( E(X^2) \):\( E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) \, dx \)
2. 然後使用公式:\( Var(X) = E(X^2) - [E(X)]^2 \)

常見錯誤:別忘了在方差公式的最後要減去平均值的平方!在考試壓力下,這是一個非常容易犯的錯誤。

5. 中位數與百分位數

中位數 (Median, \( m \)) 是指左側佔總概率 50%、右側也佔 50% 的數值。

要找出中位數,請解以下方程的 \( m \):
\( F(m) = 0.5 \) 或 \( \int_{-\infty}^{m} f(x) \, dx = 0.5 \)

對於任何其他百分位數(例如第 75 百分位數或上四分位數),只需將 CDF 設為該小數值(例如 0.75)並解出 \( x \) 即可。

6. 隨機變量的函數

有時課程大綱會要求你找出一個依賴於 \( X \) 的「新」變量的分佈。例如,如果 \( X \) 是正方形的邊長,那麼面積 \( Y = X^2 \) 的分佈是什麼?

步驟拆解(CDF 方法):

1. 從 Y 的 CDF 開始:寫下 \( G(y) = P(Y \leq y) \)。
2. 代入:將 \( Y \) 替換為 \( X \) 的函數。(例如 \( P(X^2 \leq y) \))。
3. 重組:將 \( X \) 單獨留在不等式一側。(例如 \( P(X \leq \sqrt{y}) \))。
4. 聯繫到 X:這現在就是 \( X \) 的 CDF 了,即 \( F_X(\sqrt{y}) \)。
5. 微分:一旦有了新的 CDF,對其進行微分即可得到新的 PDF,即 \( g(y) \)。

核心觀念:當進行變量變換時,務必先處理累積分佈(積分)。直接跳到 PDF 通常會導致錯誤!

總結清單

• 我的 \( f(x) \) 下的總面積等於 1 嗎?
• 要從 PDF 轉換到 CDF,我的積分正確且加上積分限了嗎?
• 在找中位數時,我有沒有設 \( F(x) = 0.5 \)?
• 計算方差時,我有沒有記得減去平均值的平方?

你一定做得到!連續隨機變量只是用微積分來描述現實中「平滑」世界的一種方式。繼續練習積分,其餘的自然會迎刃而解。