歡迎來到連續隨機變量的世界!

在你的 H2 數學旅程中,你可能已經熟悉了離散隨機變量——也就是那些可以「數」出來的數值,例如擲硬幣出現正面的次數。在 進階數學 (Further Mathematics, 9649) 中,我們將進入一個「平滑」的領域:連續隨機變量 (Continuous Random Variables, CRVs)。現在,我們不再是「數數」,而是進行「測量」。試想一下你等巴士的精確時間,或者一棵樹的精確高度;這些數值可以在一個範圍內取任何值,而不僅僅是整數!

在這些筆記結束時,你將學會如何利用微積分來找出這個連續世界中的概率、平均值和離散程度。讓我們馬上開始吧!


1. 概率密度函數 (PDF)

對於離散變量,我們使用概率質量函數;而對於 CRV,我們則使用 概率密度函數 (Probability Density Function, PDF),通常寫作 \( f(x) \)。

關鍵點: 在連續的世界裡,變量等於 某一個特定值 的概率為零,即 \( P(X = c) = 0 \)。相反,我們是計算 \( X \) 落入某個 區間 的概率。這可以透過 曲線下的面積 來表示。

PDF 的兩大黃金法則:

1. 函數值永不為負:對於所有 \( x \),都有 \( f(x) \ge 0 \)。
2. 曲線下的總面積必須為 1:\( \int_{-\infty}^{\infty} f(x) \, dx = 1 \)。

分段函數

有時候,PDF 會被「分割」成不同的部分,這稱為 分段函數 (piecewise function)。例如:
\( f(x) = \begin{cases} kx & 0 \le x \le 2 \\ 0 & \text{其他} \end{cases} \)
要找出 \( k \),你只需將 \( kx \) 從 0 到 2 進行積分,並將結果設為 1 即可!

快速回顧: 若要找出概率 \( P(a \le X \le b) \),只需計算定積分:\( \int_{a}^{b} f(x) \, dx \)。


2. 平均值、方差與期望值

正如在離散統計中一樣,我們想知道數據的「平均值」和「離散程度」。由於我們處理的是連續函數,我們使用 積分 來代替求和。

平均值 (期望值)

平均值 \( E(X) \) 或 \( \mu \) 是分佈的「平衡點」。
\( E(X) = \int_{-\infty}^{\infty} x f(x) \, dx \)

方差與標準差

方差衡量數值偏離平均值的程度。
公式: \( Var(X) = E(X^2) - [E(X)]^2 \)
要找出 \( E(X^2) \),請使用:\( \int_{-\infty}^{\infty} x^2 f(x) \, dx \)。

函數的期望值: \( E(g(X)) \)

如果你需要找出 \( X \) 的函數的期望值(例如 \( X^3 \) 或 \( \sin(X) \)),請使用此規則:
\( E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) \, dx \)

常見錯誤提示: 一個很常見的錯誤是認為 \( E(X^2) \) 等於 \( (E(X))^2 \)。這兩者截然不同!記得務必將 \( x^2 f(x) \) 的積分分開計算。


3. 眾數與中位數

除了平均值,我們還可以找出數據的其他「中心」指標。

眾數 (Mode)

眾數 是 PDF \( f(x) \) 達到 最大值 時的 \( x \) 值。
如何找出它: 在圖像上尋找最高點。如果函數是可微分的,你可以透過令 \( f'(x) = 0 \) 並檢查該點是否為最大值來找出它。

中位數 (Median)

中位數 (我們稱之為 \( m \)) 是將面積精確地平分為兩半的值(左側為 0.5,右側為 0.5)。
如何找出它: 解方程:\( \int_{-\infty}^{m} f(x) \, dx = 0.5 \),從而求出 \( m \)。

核心總結: 平均值是「算術平均」,眾數是「最頻繁出現的值」,而中位數則是「中間值」。在偏態分佈中,這三個值通常各不相同!


4. 累積分佈函數 (CDF)

累積分佈函數 (Cumulative Distribution Function),寫作 \( F(x) \),告訴我們 \( X \) 小於或等於 某個特定值 \( x \) 的概率。

\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) \, dt \)

PDF 與 CDF 之間的聯繫

將 PDF 想像成 斜率 (梯度),將 CDF 想像成 面積。這給我們提供了一個優美的微積分關係:
1. 從 PDF 得到 CDF: 對 PDF 進行積分。
2. 從 CDF 得到 PDF: 對 CDF 進行微分:\( f(x) = \frac{d}{dx} F(x) \)。

你知道嗎? CDF 總是以 0 開始(在最左端),並以 1 結束(在最右端),因為總概率必須累積到 1。


5. 特殊概率模型

課程大綱中規定了兩個你必須掌握的特定連續模型。

A. 均勻分佈 (Uniform / Rectangular Distribution)

這是最簡單的模型。在特定的區間 \( [a, b] \) 內,概率是恆定的。圖形看起來像一個矩形!
PDF: \( f(x) = \frac{1}{b-a} \),其中 \( a \le x \le b \)。
平均值: \( E(X) = \frac{a+b}{2} \) (正中間)。
方差: \( Var(X) = \frac{(b-a)^2}{12} \)。

B. 指數分佈 (Exponential Distribution)

此模型經常用於表示 事件之間的時間間隔(例如顧客進入商店的時間間隔)。它取決於速率參數 \( \lambda \)。
PDF: \( f(x) = \lambda e^{-\lambda x} \),其中 \( x \ge 0 \)。
平均值: \( E(X) = \frac{1}{\lambda} \)。
方差: \( Var(X) = \frac{1}{\lambda^2} \)。
CDF: \( F(x) = 1 - e^{-\lambda x} \)。

類比: 想像你在等待流星出現。如果它們以恆定的平均速率隨機發生,那麼你等待的時間就遵循 指數分佈


6. 泊松分佈與指數分佈的聯繫

這是考試中最受歡迎的主題之一!離散的「泊松分佈」與連續的「指數分佈」之間存在著直接的「婚姻關係」。

如果事件發生的 次數 在固定時間區間內遵循參數為 \( \lambda \) 的 泊松分佈...
...那麼相同事件之間的 時間間隔 就遵循參數為 \( \lambda \) 的 指數分佈

記憶小幫手:
Poisson = People (數有多少人/次數)。
Exponential = Elapsed time (測量經過的時間)。


學生檢查清單

在開始做練習題之前,確保你能:
• 證明一個函數是有效的 PDF (積分結果 = 1)。
• 使用積分計算 \( P(a < X < b) \)。
• 使用微積分在 PDF \( f(x) \) 和 CDF \( F(x) \) 之間進行轉換。
• 為任何給定的 PDF 找出平均值、方差、眾數和中位數。
• 識別並使用 均勻分佈指數分佈 的公式。
• 解釋泊松分佈和指數分佈之間是如何關聯的。

如果一開始覺得積分很困難,不要擔心!專注於為積分設定正確的上下限,剩下的部分只是應用你已經熟悉的微積分規則而已。加油!