Continuous random variables (CRVs) - Further Mathematics 7367 - AQA A Level

連續隨機變數 (CRVs) 簡介

你好！在之前的數學學習中，你已經接觸過離散 (discrete) 隨機變數——也就是你可以數出來的數值，例如擲硬幣出現正面的次數，或是班級中的學生人數。在本章中，我們將進入連續 (continuous) 的世界。

你可以把連續隨機變數 (CRV) 想像成可以在某個範圍內取任何數值的變數。數碼時鐘顯示的是離散的分鐘，而傳統指針時鐘的秒針則是連續地掃過每一分每一秒。我們使用 CRV 來模擬諸如時間、身高或體重等事物。理解 CRV 非常重要，因為現實世界中的情況很少會剛好是整數！

1. 機率密度函數 (pdf)

對於離散變數，我們使用表格來顯示機率。對於 CRV，我們則使用一個稱為機率密度函數 (Probability Density Function) 的函數，寫作 \( f(x) \)。

核心概念：面積 = 機率
在 CRV 中，變數落在兩個數值之間的機率，就是該區間內曲線 \( f(x) \) 下方的面積。因此，兩個非常重要的規則適用於此：
1. 整個曲線下方的總面積必須始終等於 1。
\( \int_{-\infty}^{\infty} f(x) \, dx = 1 \)
2. 函數 \( f(x) \) 永遠不能為負（因為機率不可能是負的！）。

你知道嗎？
對於 CRV，變數取剛好某個特定數值的機率總是零。即 \( P(X = 2) = 0 \)。這是因為單點沒有寬度，所以也就沒有面積。我們只討論關於一個區間 (interval) 的機率，例如 \( P(1 < X < 3) \)。

快速回顧：
- 離散： 機率總和 \( \sum P(X=x) = 1 \)
- 連續： 密度函數的積分 \( \int f(x) \, dx = 1 \)

2. 求機率

要找出 \( X \) 落在 \( a \) 和 \( b \) 之間的機率，你只需要對該區間內的 pdf 進行積分即可：

\( P(a \le X \le b) = \int_{a}^{b} f(x) \, dx \)

如果一開始覺得很難，別擔心！ 只要記住「求機率」其實就是「求圖形下方的面積」的一種高階說法。如果函數形狀簡單（如長方形或三角形），你甚至可以直接用基本幾何公式，而不必使用積分！

3. 累積分配函數 (cdf)

累積分配函數 (Cumulative Distribution Function)，寫作 \( F(x) \)，代表機率的「累加總和」。它告訴你變數小於或等於某個數值 \( x \) 的機率。

兩者關係：
- 由 \( f(x) \) 求 \( F(x) \)：積分 (Integrate)。
\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) \, dt \)
- 由 \( F(x) \) 求 \( f(x) \)：微分 (Differentiate)。
\( f(x) = \frac{d}{dx} F(x) \)

常見錯誤：
在進行積分以求 \( F(x) \) 時，別忘了積分常數 (\( + C \))，或者使用一個虛擬變數（如 \( t \)）並從下限積分到 \( x \)。\( F(x) \) 在範圍的最開始必須永遠等於 0，而在最末端則必須等於 1。

4. 平均數、變異數與標準差

就像處理離散變數一樣，我們想知道 CRV 的平均數（期望值）和分散程度（變異數）。

期望值 (平均數)：
\( E(X) = \mu = \int x f(x) \, dx \)
類比：這可以被視為曲線下方面積的「平衡點」。

變異數：
要計算變異數，先求出 \( E(X^2) \)：
\( E(X^2) = \int x^2 f(x) \, dx \)
然後使用熟悉的公式：
\( Var(X) = E(X^2) - [E(X)]^2 \)

標準差：
這只是變異數的平方根：\( \sigma = \sqrt{Var(X)} \)。

重點提示： 永遠先求 \( E(X) \)，再求 \( E(X^2) \)，最後才求變異數。這是一個三步走的過程！

5. 中位數與四分位數

中位數 (median) (\( m \)) 是該數值左側面積剛好佔一半、右側也佔一半的點。若要找出它，請解以下方程式中的 \( m \)：
\( F(m) = 0.5 \) 或 \( \int_{-\infty}^{m} f(x) \, dx = 0.5 \)

同理，對於四分位數：
- 下四分位數 (\( Q_1 \))： 解 \( F(Q_1) = 0.25 \)
- 上四分位數 (\( Q_3 \))： 解 \( F(Q_3) = 0.75 \)

中位數計算步驟：
1. 找出 cdf 的表達式 \( F(x) \)。
2. 將該表達式設為 0.5。
3. 解出 \( x \)。這就是你的中位數！

6. 線性函數與 \( g(X) \) 的期望值

有時候，我們不只想知道 \( X \) 的平均值，還想知道 \( X \) 的函數的平均值，例如 \( 5X^3 \) 或 \( 6X^{-1} \)。

函數 \( g(X) \) 的期望值：
\( E(g(X)) = \int g(x) f(x) \, dx \)

線性變換：
如果你有一個線性變換 \( aX + b \)：
- 平均值： \( E(aX + b) = aE(X) + b \)
- 變異數： \( Var(aX + b) = a^2 Var(X) \)
記憶小撇步：加上常數 (\( b \)) 會平移整個圖形，但不會改變它的分散程度，所以 \( b \) 在變異數公式中會消失！

7. 長方形（均勻）分配

最簡單的 CRV 是長方形分配 (Rectangular Distribution)。當區間 \( [a, b] \) 內每個數值發生的可能性都相等時，就會用到它。

公式：
- pdf： \( f(x) = \frac{1}{b-a} \)，範圍為 \( a \le x \le b \)（其餘範圍為 0）。
- 平均值： \( E(X) = \frac{a+b}{2} \)（剛好在中間）。
- 變異數： \( Var(X) = \frac{(b-a)^2}{12} \)

快速回顧：
如果巴士在 0 到 10 分鐘內的任何時間到達，則 \( a=0 \)，\( b=10 \)。pdf 的高度為 \( \frac{1}{10-0} = 0.1 \)。平均等待時間為 5 分鐘。

8. 合併獨立變數

如果你有兩個獨立 (independent) 的隨機變數 \( X \) 和 \( Y \)（代表兩者互不影響），無論它們是離散還是連續，以下規則皆適用：

期望值之和：
\( E(X + Y) = E(X) + E(Y) \)

變異數之和：
\( Var(X + Y) = Var(X) + Var(Y) \)

重要提醒： 此變異數規則僅在變數獨立時有效。如果它們之間有關聯，公式會變得複雜得多（但本節不需要擔心這個！）。

重點總結：
- pdf \( f(x) \)： 曲線。下方面積即為機率，總面積 = 1。
- cdf \( F(x) \)： 累加總和。\( F(x) = P(X \le x) \)。
- 平均值 \( E(X) \)： 對 \( x f(x) \) 積分。
- 中位數： \( F(x) = 0.5 \) 之處。
- 長方形： pdf 為水平線的「公平」分配。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。