歡迎來到連續隨機變數的世界!
在你的 A Level 數學旅程中,你已經認識了離散隨機變數 (Discrete Random Variables)——即那些可以數得出來的數值,例如擲硬幣時正面出現的次數。現在,我們要踏入統計學中「平滑」的一面:連續隨機變數 (Continuous Random Variables, 簡稱 CRVs)。
試想一下走樓梯(離散的階梯)與從坡道滑下(連續的路徑)之間的差別。CRVs 適用於我們透過「測量」而非「計算」所得的數據,例如你等巴士的精確時間、樹木的高度,或是蘋果的重量。如果最初接觸到相關的微積分覺得有點吃力,別擔心;我們會一步一步把它拆解開來!
1. 機率密度函數 (Probability Density Function, PDF)
機率密度函數記作 \(f(x)\),是一個描述連續分配形狀的公式。與離散變數不同,CRV 取得「某個精確數值」(例如剛好 1.50000... 公分)的機率在技術上為零。相反,我們會觀察數值落在某個區間 (range) 內的機率。
PDF 的關鍵性質:
- 函數值永遠非負:對於所有 \(x\),\(f(x) \ge 0\)。
- 黃金法則:曲線下的總面積必須等於 1。數學表示為:\(\int_{-\infty}^{\infty} f(x) dx = 1\)。
- 機率即面積:\(X\) 落在 \(a\) 與 \(b\) 之間的機率,就是曲線在這兩點之間的下方面積:\(P(a \le X \le b) = \int_{a}^{b} f(x) dx\)。
比喻:想像 PDF 就像一堆鋪在線上的沙子。沙子的總量是「1 個單位」。要找出某個區間的機率,你只需要測量該區間對應的線上鋪了多少沙子即可。
常見錯誤:別以為 \(f(x)\) 本身就是機率。它不是!面積才是機率。如果你計算出的面積大於 1 或出現負數,請務必重新檢查你的積分過程!
快速回顧:
1. \(f(x) \ge 0\)
2. 總面積 = 1
3. \(P(a < X < b) = P(a \le X \le b\)(在 CRVs 中,邊界點不會增加額外的機率!)
2. 累積分布函數 (Cumulative Distribution Function, CDF)
累積分布函數記作 \(F(x)\),告訴我們變數小於或等於某個特定數值的機率。
\(F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt\)
PDF 與 CDF 的關係:
這是一條「雙向道」:
- 從 PDF 到 CDF:進行積分。
- 從 CDF 到 PDF:進行微分。\(f(x) = \frac{d}{dx}F(x)\)。
你知道嗎? CDF 的起點總是 0(在最左側),終點總是 1(在最右側),因為它在過程中不斷累積所有的機率。
關鍵重點: CDF 是你的好幫手,能讓你快速找到機率,而不需要每次都重新進行積分。
3. 期望值與變異數 (Expectation and Variance)
就像離散變數一樣,我們想知道數據的「平均值」(Mean) 與「散佈程度」(Variance)。因為我們處理的是連續曲線,所以我們用積分取代加總。
公式:
- 平均值(期望值): \(E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx\)
- 變異數: \(Var(X) = \sigma^2 = E(X^2) - [E(X)]^2\),其中 \(E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx\)
- 函數 \(g(X)\) 的期望值: \(E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) dx\)
記憶小撇步:計算平均值時,「乘以 \(x\) 再積分」。計算 \(E(X^2)\) 時,「乘以 \(x^2\) 再積分」。切記在計算變異數的最後一步,一定要減去平均值的平方!
4. 中位數、四分位數與百分位數
有時我們想找出「中間」的數值或「前 10%」的門檻。
- 中位數 (Median, \(m\)) 是左側面積佔一半、右側面積也佔一半的數值。解方程:\(F(m) = 0.5\)。
- 下四分位數 (Lower Quartile, \(Q_1\)) 是數據累積至 25% 的數值。解方程:\(F(Q_1) = 0.25\)。
- 上四分位數 (Upper Quartile, \(Q_3\)) 是數據累積至 75% 的數值。解方程:\(F(Q_3) = 0.75\)。
步驟流程:
1. 對 PDF 進行積分,求出 CDF,即 \(F(x)\)。
2. 令 \(F(x) = \text{目標機率}\)(例如中位數為 0.5)。
3. 解出 \(x\)。確保你的答案落在該函數的有效定義域內!
5. 特殊分布
除了常態分布,OCR 大綱還強調了另外兩種你需要掌握的分布。
A. 連續均勻分布 (Continuous Uniform Distribution)
這是一種「公平」的分布,區間 \([a, b]\) 內每個數值出現的機率都相同。其 PDF 看起來像一個矩形。
- PDF: \(f(x) = \frac{1}{b-a}\) (當 \(a \le x \le b\) 時)。
- 平均值: \(E(X) = \frac{a+b}{2}\)(剛好在中間!)。
- 變異數: \(Var(X) = \frac{(b-a)^2}{12}\)。
B. 指數分布 (Exponential Distribution)
這常用於模擬事件之間的時間間隔(例如放射性衰變的時間間隔,或是顧客抵達商店的時間間隔)。
- PDF: \(f(x) = \lambda e^{-\lambda x}\) (當 \(x \ge 0\) 時)。
- 平均值: \(E(X) = \frac{1}{\lambda}\)。
- 變異數: \(Var(X) = \frac{1}{\lambda^2}\)。
有趣的連結:指數分布與卜瓦松分布 (Poisson distribution) 密切相關。如果事件依照速率 \(\lambda\) 的卜瓦松過程發生,那麼事件之間的時間間隔就會遵循同樣 \(\lambda\) 的指數分布。
6. 隨機變數的函數
有時候你知道 \(X\) 的分布,但想求出相關變數(例如 \(Y = X^3\) 或 \(Y = 2X + 5\))的分布。
解題方法:
- 從 \(Y\) 的 CDF 開始:\(F_Y(y) = P(Y \le y)\)。
- 代入關係式:\(P(g(X) \le y)\)。
- 整理算式使 \(X\) 獨立:\(P(X \le g^{-1}(y))\)。
- 這現在變成了 \(X\) 在某一點的 CDF 值!
- 得到新的 CDF (\(F_Y(y)\)) 後,對其進行微分即可求出新的 PDF (\(f_Y(y)\))。
範例:若 \(Y = X^3\),則 \(P(Y \le y) = P(X^3 \le y) = P(X \le y^{1/3}) = F_X(y^{1/3})\)。
關鍵重點:在變數轉換時,務必從 CDF 開始。這比直接跳到 PDF 的邏輯更穩妥、更不容易出錯。
最後快速複習箱
CRV 核心要點:
- 積分 PDF 可得機率或 CDF。
- 微分 CDF 可得 PDF。
- 總面積必須為 1。
- 平均值就是「平均數」(\(\int x f(x) dx\))。
- 中位數是 CDF 上 0.5 的那個點。
你一定沒問題的!連續變數聽起來可能很抽象,但它們其實只是用數學方式來描述現實世界中無窮變化的工具。勤加練習積分,統計學的概念自然就會融會貫通!