歡迎來到連續分佈:掌握機率的流動!

哈囉,未來的統計學家!在這一章「連續分佈 (Continuous Distributions)」中,我們將從計算結果的個數(離散變數,例如擲硬幣的正反面次數),轉向測量結果的數值(連續變數,例如身高、體重或時間)。

如果積分公式讓你感到有點頭痛,別擔心!我們會把它拆解成簡單的步驟。請記住,積分不過是找出曲線下的面積,而在統計學中,曲線下的面積就代表了機率。你一定做得到的!

什麼是連續隨機變數 (CRV)?

連續隨機變數 (Continuous Random Variable, CRV),即 \(X\),是一個可以在給定範圍內取任何值的變數。

  • 例子: 學生完成考試所需的時間(例如 50.1 分鐘、50.1003 分鐘等),或者房間的溫度。
  • 與離散變數對比: 離散變數會從一個整數跳到下一個整數(例如 1, 2, 3)。連續變數則是平滑地流動。
關鍵概念提醒! 單點機率

在連續分佈中,變數取特定單一數值的機率永遠為零。

$$P(X = x) = 0$$

為什麼? 試想你要精確測量一棵樹的高度,精確到無限位小數。要剛好擊中那「那個精確的」無限位數字,機率是零。正因如此,在處理連續變數時:

$$P(a \le X \le b) = P(a < X < b) = P(a \le X < b)$$

端點(是否有等號)並不重要!這通常能簡化計算過程。

第 1 節:機率密度函數 (PDF)

任何連續分佈的核心就是它的機率密度函數 (Probability Density Function, PDF),通常記作 \(f(x)\)。

你可以把 PDF 想像成該分佈的「形狀」或「食譜」。它描述了機率是如何在所有可能的數值範圍內「分佈」的。

PDF \(f(x)\) 的關鍵性質

1. 函數必須是非負的

由於 \(f(x)\) 描述的是結果的可能性,函數本身絕不能為負。

$$f(x) \ge 0 \quad \text{對於所有 } x$$

2. 曲線下的總面積必須等於 1

所有可能結果的總機率必須是 1(或 100%)。用微積分的術語來說,這意味著將 PDF 在其整個定義範圍 \(R\) 內進行積分,結果必須為 1。

$$\int_R f(x) \, dx = 1$$

這個性質經常用於找出 PDF 定義中的未知常數(例如 'k')!

使用 PDF 計算機率

\(X\) 落在兩個數值 \(a\) 和 \(b\) 之間的機率,就是 \(f(x)\) 在這兩點之間的曲線下面積

$$P(a < X < b) = \int_a^b f(x) \, dx$$

步驟說明:如何計算機率
  1. 確認範圍: 確定你需要計算機率的下限 \(a\) 和上限 \(b\)。
  2. 積分: 計算 PDF \(f(x)\) 在這些限值之間的定積分。
  3. 求解: 將限值代入積分後的函數,求出最終的數值。

快速回顧: PDF 提供了分佈的「形狀」。機率永遠是透過計算「面積」(利用積分)來求得的。

第 2 節:累積分配函數 (CDF)

雖然 PDF 告訴你某一點的密度,但累積分配函數 (Cumulative Distribution Function, CDF),即 \(F(x)\),告訴你直到該點 \(x\) 為止所累積的機率。

CDF \(F(x)\) 的定義

CDF 是指隨機變數 \(X\) 取值小於或等於特定數值 \(x\) 的機率。

$$F(x) = P(X \le x)$$

PDF 與 CDF 的關係(積分與微分)

\(f(x)\) 與 \(F(x)\) 之間的關係來自微積分基本定理:

  1. 從 PDF 到 CDF:積分 $$F(x) = \int_{-\infty}^{x} f(t) \, dt$$ (註:實際上,我們通常從 \(f(x)\) 定義的最低邊界,例如 \(a\),積分到 \(x\)。)
  2. 從 CDF 到 PDF:微分 $$f(x) = F'(x) = \frac{d}{dx} F(x)$$ 這是檢查計算結果的好方法!

CDF 的性質

  1. 起點: CDF 從 0 開始。如果最小值是 \(a\),則 \(F(a) = 0\)。
  2. 終點: CDF 以 1 結束。如果最大值是 \(b\),則 \(F(b) = 1\)。
  3. 非遞減性: 隨著 \(x\) 增大,\(F(x)\) 絕不會減少(累積機率只會增加或維持不變)。

使用 CDF 計算機率

如果你已經有了 CDF,計算機率會比積分簡單得多!

$$P(a < X < b) = F(b) - F(a)$$

類比: 如果 \(F(b)\) 是袋子中直到點 \(b\) 為止的麵粉總重量,而 \(F(a)\) 是直到點 \(a\) 的重量,那麼 \(F(b) - F(a)\) 就是 \(a\) 與 \(b\) 之間麵粉的重量。

避免常見錯誤

在計算 CDF \(F(x)\) 時,記得加上積分常數 \(C\)。不過,由於我們將積分的下限定義為 \(X\) 的最小值,我們通常會算出 \(C=0\)。

務必檢查: 如果 \(X\) 的定義域是 \(x \ge a\),那麼設定 \(F(a) = 0\) 可以幫助你求出 \(C\)。

快速複習箱

PDF (\(f(x)\)): 描述密度。使用積分來求機率。

CDF (\(F(x)\)): 描述累積機率。使用相減 (\(F(b) - F(a)\)) 來求機率。

第 3 節:期望值、變異數與中位數

期望值(平均值)

期望值 (Expectation)平均值 (Mean),即 \(E(X)\) 或 \(\mu\),是隨機變數的長期平均值。它是分佈的「平衡點」。

就像在離散變數中我們計算 \(\sum x P(X=x)\) 一樣,這裡我們將總和換成積分,將機率 \(P(X=x)\) 換成密度函數 \(f(x)\)。

$$E(X) = \mu = \int x f(x) \, dx$$

X 的函數之期望值

如果你需要找出 \(X\) 的函數(例如 \(g(X)\))的期望值:

$$E(g(X)) = \int g(x) f(x) \, dx$$

最重要的情況是透過設定 \(g(x) = x^2\) 來求 \(E(X^2)\):

$$E(X^2) = \int x^2 f(x) \, dx$$

變異數

變異數 (Variance),即 \(\text{Var}(X)\),衡量的是分佈圍繞平均值的散佈或離散程度。

公式與離散變數完全相同:

$$\text{Var}(X) = E(X^2) - [E(X)]^2$$

標準差 (Standard Deviation) 則是 \(\sigma = \sqrt{\text{Var}(X)}\)。

中位數 (m)

中位數 (Median),即 \(m\),是將分佈平分為兩半的數值。一半的機率質量在其下方,另一半在其上方。

因此,中位數 \(m\) 是滿足以下條件的數值:

$$P(X \le m) = 0.5$$

你可以透過解以下任一方程式來找到中位數:

$$\int_{-\infty}^{m} f(x) \, dx = 0.5 \quad \text{或} \quad F(m) = 0.5$$

小撇步:如果你已經算出了 \(F(x)\),使用 CDF 方法 \(F(m) = 0.5\) 幾乎總是比較簡單。

第 4 節:連續均勻分佈(矩形)

連續均勻分佈 (Continuous Uniform Distribution) 是最簡單的連續分佈。它假設隨機變數在定義的區間內取任何值的機率相等,且在區間外不存在。

我們記作:$$X \sim U(a, b)$$ 其中 \(a\) 是最小值,\(b\) 是最大值。

U(a, b) 的 PDF

由於機率是「均勻」(平均)分佈的,PDF 看起來就像一個矩形。

矩形的高度 \(f(x)\) 必須確保總面積為 1。寬度為 \((b-a)\)。

$$f(x) = \frac{1}{\text{寬度}} = \frac{1}{b-a} \quad \text{對於 } a \le x \le b$$ $$f(x) = 0 \quad \text{其他情況}$$

在均勻分佈中計算機率

對於均勻分佈,計算機率不需要積分!因為形狀是矩形,機率就是:

$$P(x_1 < X < x_2) = \text{高度} \times \text{寬度}$$ $$P(x_1 < X < x_2) = \left(\frac{1}{b-a}\right) \times (x_2 - x_1)$$

U(a, b) 的 CDF

CDF 在 \(a\) 和 \(b\) 之間是一條遞增的直線。

  • 當 \(x < a\),\(F(x) = 0\)
  • 當 \(a \le x \le b\),$$F(x) = \frac{x-a}{b-a}$$
  • 當 \(x > b\),\(F(x) = 1\)

平均值與變異數的快速公式

辨識出均勻分佈的好處之一,就是你可以直接使用這些快速公式,而不必執行複雜的 \(xf(x)\) 和 \(x^2f(x)\) 積分。

平均值(期望值)

平均值單純就是區間的中點。

$$E(X) = \mu = \frac{a+b}{2}$$

變異數

$$\text{Var}(X) = \frac{(b-a)^2}{12}$$

記憶輔助: 變異數公式裡出現 12,是因為 12 是同時能被 3 和 4 整除的最小整數,而這兩個數字會在均勻分佈計算 \(E(X)\) 和 \(E(X^2)\) 的積分過程中出現。只要記住這個美妙的數字 12 就行了!

最終複習與重點總結

連續分佈問題檢查清單

  1. 辨識函數: 這是一般的 PDF(需要積分)還是均勻分佈(可以使用面積/公式快捷鍵)?
  2. 總面積檢查: 務必確認 \(\int f(x) \, dx = 1\)。如果裡面有常數 (k),先把它找出來!
  3. 機率: 若使用 PDF,對 \(f(x)\) 積分。若使用 CDF,計算 \(F(b) - F(a)\)。
  4. 平均值/變異數: 記得使用公式 \(E(X) = \int x f(x) \, dx\),然後使用 \(\text{Var}(X) = E(X^2) - [E(X)]^2\)。

你知道嗎? 你之後可能會學到的「常態分佈」也是一種連續分佈。它大概是統計學中最著名的曲線了!它的 PDF 極其複雜,這就是為什麼我們依賴查表或計算機來找機率,而不是親自進行積分。

持續練習你的積分技巧! 在統計學 (Statistics 2) 中,數學應用往往就是微積分。這些概念很合邏輯;需要練習的是執行過程。你正在掌握代數、微積分與現實世界統計學之間那複雜而迷人的連結。做得好!


*** 學習筆記結束 ***