連續隨機變數簡介

歡迎來到這個章節!在之前的學習中,你已經接觸過離散隨機變數——也就是那些可以數得出來的東西,例如擲硬幣出現的正反面次數,或是班上學生的人數。現在,我們將進入連續隨機變數 (Continuous Random Variables, CRVs) 的世界。這類變數可以在某個範圍內取任何數值,例如時間、身高或體重。與其用一連串的機率列表,我們改用一條「平滑曲線」來描述它們。如果一開始覺得有點抽象,別擔心;我們將會運用微積分來解開這些數據背後的規律!

1. 機率密度函數 (pdf)

機率密度函數 (Probability Density Function),寫作 \(f(x)\),是用來描述連續分佈形狀的函數。你可以把它想像成一座「機率小山」。某一點的「山」越高,該處的機率就越「密集」。

pdf 的兩大黃金法則

要成為有效的 pdf,函數必須遵循以下兩項規則:

  1. 非負值: 圖形絕不能低於 x 軸。數學表達式為:對於所有 \(x\),\(f(x) \ge 0\)
  2. 總面積為 1: 曲線下方的總面積必須精確等於 1。這是「所有機率總和為 1」在連續情況下的版本。
    \(\int_{-\infty}^{\infty} f(x) dx = 1\)

小撇步: 大多數考試題目給你的函數只會在兩個數值之間(例如 0 到 5)是非零的。你只需要在那兩個特定的極限範圍內進行積分即可!

你知道嗎? 對於一個連續變數,變數值恰好等於某個特定數值(例如 \(P(X = 2.5)\))的機率其實是 !我們只能測量變數落入某個範圍內的機率。

重點摘要: CRV 的機率由曲線下的面積來表示。沒有面積 = 沒有機率!

2. 計算機率

既然機率就是面積,我們可以使用積分來找出 \(X\) 落入 \(a\) 和 \(b\) 之間數值的機率。

公式: \(P(a < X < b) = \int_{a}^{b} f(x) dx\)

計算機率的步驟:

  1. 找出函數 \(f(x)\) 以及你感興趣的範圍。
  2. 設定積分,將下限放在積分符號下方,上限放在上方。
  3. 對函數進行積分。
  4. 代入數值並計算出最終面積。

範例:如果一個變數的 pdf 為 \(f(x) = \frac{1}{8}x\),範圍在 \(0 \le x \le 4\),要計算 \(P(1 < X < 3)\),你只需計算 \(\int_{1}^{3} \frac{1}{8}x dx\)。

3. 期望值 (平均值) 與變異數

就像離散數據一樣,我們會想知道數據的「平均」值以及數據有多「分散」。

期望值 \(E(X)\)

期望值(或稱平均值,\(\mu\))是分佈的平衡點。
公式: \(E(X) = \int_{-\infty}^{\infty} x f(x) dx\)

變異數 \(Var(X)\)

變異數是用來衡量分散程度的。計算時通常先算出 \(E(X^2)\) 會比較容易。
步驟 1: 找出 \(E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx\)
步驟 2: 使用變異數公式:\(Var(X) = E(X^2) - [E(X)]^2\)

記憶小幫手: 對於變異數,請記住:「平方的平均值減去平均值的平方」。

4. 眾數、中位數與百分位數

有時候,我們想找出數據小山中的特定「臨界點」。

眾數

眾數就是使 pdf \(f(x)\) 達到最大值的 \(x\) 值。你可以透過觀察圖形,或是使用微分找出駐點(如果是曲線的話)來求得。

中位數與百分位數

中位數 (\(m\)) 是左側面積恰好為 0.5 的那個數值。
解出 \(m\): \(\int_{-\infty}^{m} f(x) dx = 0.5\)

若要求第 90 百分位數,只需將積分結果設為 0.9 而非 0.5 即可。

重點摘要: 中位數將總面積平分為兩個各佔 0.5 的區域。

5. 累積分布函數 (cdf)

累積分布函數 (Cumulative Distribution Function),寫作 \(F(x)\),告訴你變數小於或等於某個數值 \(x\) 的機率。

公式: \(F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt\)

兩者的關聯橋樑

這是你考試中至關重要的概念:

  • pdf 到 cdf積分 (Integrate)
  • cdf 到 pdf微分 (Differentiate) (\(f(x) = F'(x)\))。

常見錯誤提醒: 在進行積分求 cdf 時,千萬別忘了積分常數 (+C)!你可以利用累積機率在範圍起點必須為 0、終點必須為 1 的特性來求出 \(C\)。

6. 特殊連續模型

課程大綱中強調了兩個你需要熟悉的特殊模型。

連續均勻(矩形)分佈

這指的是範圍 \([a, b]\) 內的每個數值發生的機率皆相等。圖形是一個平坦的矩形。
關鍵公式(通常會提供在公式手冊中):
\(E(X) = \frac{a+b}{2}\)
\(Var(X) = \frac{1}{12}(b-a)^2\)

常態分佈

在本單元中,我們將 A Level 的知識擴展到常態變數的線性組合。如果 \(X\) 和 \(Y\) 是獨立的常態變數,那麼它們的任何組合(例如 \(X + Y\) 或 \(2X - 3Y\))也同樣是常態分佈

  • 平均值: \(E(aX + bY) = aE(X) + bE(Y)\)
  • 變異數: \(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\) (注意:變異數永遠是相加的,即使變數本身是相減的!)

複習速查表:
- pdf \(f(x)\):代表「高度」(積分可得面積/機率)。
- cdf \(F(x)\):代表「累計總額」的面積。
- \(E(X)\):中心位置。
- \(Var(X)\):分散程度。

總結:融會貫通

當處理連續隨機變數問題時,請務必問自己:「我現在看的是 pdf (形狀) 還是 cdf (目前的累計值)?」使用積分來求取機率、平均值和中位數;使用微分來找出眾數,或是從 cdf 反推回 pdf。保持積分極限清晰,並記住總面積必須永遠等於 1。你可以做到的!