Continuous Random Variables - Further Mathematics A - H245 - Cambridge OCR A Level

歡迎來到連續隨機變數的世界！

在你的 A Level 數學旅程中，你已經認識了離散隨機變數 (Discrete Random Variables)——即那些可以數得出來的數值，例如擲硬幣時正面出現的次數。現在，我們要踏入統計學中「平滑」的一面：連續隨機變數 (Continuous Random Variables, 簡稱 CRVs)。

試想一下走樓梯（離散的階梯）與從坡道滑下（連續的路徑）之間的差別。CRVs 適用於我們透過「測量」而非「計算」所得的數據，例如你等巴士的精確時間、樹木的高度，或是蘋果的重量。如果最初接觸到相關的微積分覺得有點吃力，別擔心；我們會一步一步把它拆解開來！

1. 機率密度函數 (Probability Density Function, PDF)

機率密度函數記作 \(f(x)\)，是一個描述連續分配形狀的公式。與離散變數不同，CRV 取得「某個精確數值」（例如剛好 1.50000... 公分）的機率在技術上為零。相反，我們會觀察數值落在某個區間 (range) 內的機率。

PDF 的關鍵性質：

函數值永遠非負：對於所有 \(x\)，\(f(x) \ge 0\)。
黃金法則：曲線下的總面積必須等於 1。數學表示為：\(\int_{-\infty}^{\infty} f(x) dx = 1\)。
機率即面積：\(X\) 落在 \(a\) 與 \(b\) 之間的機率，就是曲線在這兩點之間的下方面積：\(P(a \le X \le b) = \int_{a}^{b} f(x) dx\)。

比喻：想像 PDF 就像一堆鋪在線上的沙子。沙子的總量是「1 個單位」。要找出某個區間的機率，你只需要測量該區間對應的線上鋪了多少沙子即可。

常見錯誤：別以為 \(f(x)\) 本身就是機率。它不是！面積才是機率。如果你計算出的面積大於 1 或出現負數，請務必重新檢查你的積分過程！

快速回顧：
1. \(f(x) \ge 0\)
2. 總面積 = 1
3. \(P(a < X < b) = P(a \le X \le b\)（在 CRVs 中，邊界點不會增加額外的機率！）

2. 累積分布函數 (Cumulative Distribution Function, CDF)

累積分布函數記作 \(F(x)\)，告訴我們變數小於或等於某個特定數值的機率。

\(F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt\)

PDF 與 CDF 的關係：

這是一條「雙向道」：

從 PDF 到 CDF：進行積分。
從 CDF 到 PDF：進行微分。\(f(x) = \frac{d}{dx}F(x)\)。

你知道嗎？ CDF 的起點總是 0（在最左側），終點總是 1（在最右側），因為它在過程中不斷累積所有的機率。

關鍵重點： CDF 是你的好幫手，能讓你快速找到機率，而不需要每次都重新進行積分。

3. 期望值與變異數 (Expectation and Variance)

就像離散變數一樣，我們想知道數據的「平均值」(Mean) 與「散佈程度」(Variance)。因為我們處理的是連續曲線，所以我們用積分取代加總。

公式：

平均值（期望值）： \(E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx\)
變異數： \(Var(X) = \sigma^2 = E(X^2) - [E(X)]^2\)，其中 \(E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx\)
函數 \(g(X)\) 的期望值： \(E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) dx\)

記憶小撇步：計算平均值時，「乘以 \(x\) 再積分」。計算 \(E(X^2)\) 時，「乘以 \(x^2\) 再積分」。切記在計算變異數的最後一步，一定要減去平均值的平方！

4. 中位數、四分位數與百分位數

有時我們想找出「中間」的數值或「前 10%」的門檻。

中位數 (Median, \(m\)) 是左側面積佔一半、右側面積也佔一半的數值。解方程：\(F(m) = 0.5\)。
下四分位數 (Lower Quartile, \(Q_1\)) 是數據累積至 25% 的數值。解方程：\(F(Q_1) = 0.25\)。
上四分位數 (Upper Quartile, \(Q_3\)) 是數據累積至 75% 的數值。解方程：\(F(Q_3) = 0.75\)。

步驟流程：
1. 對 PDF 進行積分，求出 CDF，即 \(F(x)\)。
2. 令 \(F(x) = \text{目標機率}\)（例如中位數為 0.5）。
3. 解出 \(x\)。確保你的答案落在該函數的有效定義域內！

5. 特殊分布

除了常態分布，OCR 大綱還強調了另外兩種你需要掌握的分布。

A. 連續均勻分布 (Continuous Uniform Distribution)

這是一種「公平」的分布，區間 \([a, b]\) 內每個數值出現的機率都相同。其 PDF 看起來像一個矩形。

PDF： \(f(x) = \frac{1}{b-a}\) (當 \(a \le x \le b\) 時)。
平均值： \(E(X) = \frac{a+b}{2}\)（剛好在中間！）。
變異數： \(Var(X) = \frac{(b-a)^2}{12}\)。

B. 指數分布 (Exponential Distribution)

這常用於模擬事件之間的時間間隔（例如放射性衰變的時間間隔，或是顧客抵達商店的時間間隔）。

PDF： \(f(x) = \lambda e^{-\lambda x}\) (當 \(x \ge 0\) 時)。
平均值： \(E(X) = \frac{1}{\lambda}\)。
變異數： \(Var(X) = \frac{1}{\lambda^2}\)。

有趣的連結：指數分布與卜瓦松分布 (Poisson distribution) 密切相關。如果事件依照速率 \(\lambda\) 的卜瓦松過程發生，那麼事件之間的時間間隔就會遵循同樣 \(\lambda\) 的指數分布。

6. 隨機變數的函數

有時候你知道 \(X\) 的分布，但想求出相關變數（例如 \(Y = X^3\) 或 \(Y = 2X + 5\)）的分布。

解題方法：

從 \(Y\) 的 CDF 開始：\(F_Y(y) = P(Y \le y)\)。
代入關係式：\(P(g(X) \le y)\)。
整理算式使 \(X\) 獨立：\(P(X \le g^{-1}(y))\)。
這現在變成了 \(X\) 在某一點的 CDF 值！
得到新的 CDF (\(F_Y(y)\)) 後，對其進行微分即可求出新的 PDF (\(f_Y(y)\))。

範例：若 \(Y = X^3\)，則 \(P(Y \le y) = P(X^3 \le y) = P(X \le y^{1/3}) = F_X(y^{1/3})\)。

關鍵重點：在變數轉換時，務必從 CDF 開始。這比直接跳到 PDF 的邏輯更穩妥、更不容易出錯。

最後快速複習箱

CRV 核心要點：
- 積分 PDF 可得機率或 CDF。
- 微分 CDF 可得 PDF。
- 總面積必須為 1。
- 平均值就是「平均數」(\(\int x f(x) dx\))。
- 中位數是 CDF 上 0.5 的那個點。

你一定沒問題的！連續變數聽起來可能很抽象，但它們其實只是用數學方式來描述現實世界中無窮變化的工具。勤加練習積分，統計學的概念自然就會融會貫通！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。