Continuous distributions

歡迎來到連續分佈：掌握機率的流動！

哈囉，未來的統計學家！在這一章「連續分佈 (Continuous Distributions)」中，我們將從計算結果的個數（離散變數，例如擲硬幣的正反面次數），轉向測量結果的數值（連續變數，例如身高、體重或時間）。

如果積分公式讓你感到有點頭痛，別擔心！我們會把它拆解成簡單的步驟。請記住，積分不過是找出曲線下的面積，而在統計學中，曲線下的面積就代表了機率。你一定做得到的！

什麼是連續隨機變數 (CRV)？

連續隨機變數 (Continuous Random Variable, CRV)，即 $X$，是一個可以在給定範圍內取任何值的變數。

例子： 學生完成考試所需的時間（例如 50.1 分鐘、50.1003 分鐘等），或者房間的溫度。
與離散變數對比： 離散變數會從一個整數跳到下一個整數（例如 1, 2, 3）。連續變數則是平滑地流動。

關鍵概念提醒！單點機率

在連續分佈中，變數取特定單一數值的機率永遠為零。

$$P(X = x) = 0$$

為什麼？ 試想你要精確測量一棵樹的高度，精確到無限位小數。要剛好擊中那「那個精確的」無限位數字，機率是零。正因如此，在處理連續變數時：

$$P(a \le X \le b) = P(a < X < b) = P(a \le X < b)$$

端點（是否有等號）並不重要！這通常能簡化計算過程。

第 1 節：機率密度函數 (PDF)

任何連續分佈的核心就是它的機率密度函數 (Probability Density Function, PDF)，通常記作 $f(x)$。

你可以把 PDF 想像成該分佈的「形狀」或「食譜」。它描述了機率是如何在所有可能的數值範圍內「分佈」的。

PDF $f(x)$ 的關鍵性質

1. 函數必須是非負的

由於 $f(x)$ 描述的是結果的可能性，函數本身絕不能為負。

$$f(x) \ge 0 \quad \text{對於所有 } x$$

2. 曲線下的總面積必須等於 1

所有可能結果的總機率必須是 1（或 100%）。用微積分的術語來說，這意味著將 PDF 在其整個定義範圍 $R$ 內進行積分，結果必須為 1。

$$\int_R f(x) \, dx = 1$$

這個性質經常用於找出 PDF 定義中的未知常數（例如 'k'）！

使用 PDF 計算機率

$X$ 落在兩個數值 $a$ 和 $b$ 之間的機率，就是 $f(x)$ 在這兩點之間的曲線下面積。

$$P(a < X < b) = \int_a^b f(x) \, dx$$

步驟說明：如何計算機率

確認範圍： 確定你需要計算機率的下限 $a$ 和上限 $b$。
積分： 計算 PDF $f(x)$ 在這些限值之間的定積分。
求解： 將限值代入積分後的函數，求出最終的數值。

快速回顧： PDF 提供了分佈的「形狀」。機率永遠是透過計算「面積」（利用積分）來求得的。

第 2 節：累積分配函數 (CDF)

雖然 PDF 告訴你某一點的密度，但累積分配函數 (Cumulative Distribution Function, CDF)，即 $F(x)$，告訴你直到該點 $x$ 為止所累積的機率。

CDF $F(x)$ 的定義

CDF 是指隨機變數 $X$ 取值小於或等於特定數值 $x$ 的機率。

$$F(x) = P(X \le x)$$

PDF 與 CDF 的關係（積分與微分）

$f(x)$ 與 $F(x)$ 之間的關係來自微積分基本定理：

從 PDF 到 CDF：積分 $$F(x) = \int_{-\infty}^{x} f(t) \, dt$$ （註：實際上，我們通常從 $f(x)$ 定義的最低邊界，例如 $a$，積分到 $x$。）
從 CDF 到 PDF：微分 $$f(x) = F'(x) = \frac{d}{dx} F(x)$$ 這是檢查計算結果的好方法！

CDF 的性質

起點： CDF 從 0 開始。如果最小值是 $a$，則 $F(a) = 0$。
終點： CDF 以 1 結束。如果最大值是 $b$，則 $F(b) = 1$。
非遞減性： 隨著 $x$ 增大，$F(x)$ 絕不會減少（累積機率只會增加或維持不變）。

使用 CDF 計算機率

如果你已經有了 CDF，計算機率會比積分簡單得多！

$$P(a < X < b) = F(b) - F(a)$$

類比： 如果 $F(b)$ 是袋子中直到點 $b$ 為止的麵粉總重量，而 $F(a)$ 是直到點 $a$ 的重量，那麼 $F(b) - F(a)$ 就是 $a$ 與 $b$ 之間麵粉的重量。

避免常見錯誤

在計算 CDF $F(x)$ 時，記得加上積分常數 $C$。不過，由於我們將積分的下限定義為 $X$ 的最小值，我們通常會算出 $C=0$。

務必檢查： 如果 $X$ 的定義域是 $x \ge a$，那麼設定 $F(a) = 0$ 可以幫助你求出 $C$。

快速複習箱

PDF ($f(x)$)： 描述密度。使用積分來求機率。

CDF ($F(x)$)： 描述累積機率。使用相減 ($F(b) - F(a)$) 來求機率。

第 3 節：期望值、變異數與中位數

期望值（平均值）

期望值 (Expectation) 或平均值 (Mean)，即 $E(X)$ 或 $\mu$，是隨機變數的長期平均值。它是分佈的「平衡點」。

就像在離散變數中我們計算 $\sum x P(X=x)$ 一樣，這裡我們將總和換成積分，將機率 $P(X=x)$ 換成密度函數 $f(x)$。

$$E(X) = \mu = \int x f(x) \, dx$$

X 的函數之期望值

如果你需要找出 $X$ 的函數（例如 $g(X)$）的期望值：

$$E(g(X)) = \int g(x) f(x) \, dx$$

最重要的情況是透過設定 $g(x) = x^2$ 來求 $E(X^2)$：

$$E(X^2) = \int x^2 f(x) \, dx$$

變異數

變異數 (Variance)，即 $\text{Var}(X)$，衡量的是分佈圍繞平均值的散佈或離散程度。

公式與離散變數完全相同：

$$\text{Var}(X) = E(X^2) - [E(X)]^2$$

標準差 (Standard Deviation) 則是 $\sigma = \sqrt{\text{Var}(X)}$。

中位數 (m)

中位數 (Median)，即 $m$，是將分佈平分為兩半的數值。一半的機率質量在其下方，另一半在其上方。

因此，中位數 $m$ 是滿足以下條件的數值：

$$P(X \le m) = 0.5$$

你可以透過解以下任一方程式來找到中位數：

$$\int_{-\infty}^{m} f(x) \, dx = 0.5 \quad \text{或} \quad F(m) = 0.5$$

小撇步：如果你已經算出了 $F(x)$，使用 CDF 方法 $F(m) = 0.5$ 幾乎總是比較簡單。

第 4 節：連續均勻分佈（矩形）

連續均勻分佈 (Continuous Uniform Distribution) 是最簡單的連續分佈。它假設隨機變數在定義的區間內取任何值的機率相等，且在區間外不存在。

我們記作：$$X \sim U(a, b)$$ 其中 $a$ 是最小值，$b$ 是最大值。

U(a, b) 的 PDF

由於機率是「均勻」（平均）分佈的，PDF 看起來就像一個矩形。

矩形的高度 $f(x)$ 必須確保總面積為 1。寬度為 $(b-a)$。

$$f(x) = \frac{1}{\text{寬度}} = \frac{1}{b-a} \quad \text{對於 } a \le x \le b$$ $$f(x) = 0 \quad \text{其他情況}$$

在均勻分佈中計算機率

對於均勻分佈，計算機率不需要積分！因為形狀是矩形，機率就是：

$$P(x_1 < X < x_2) = \text{高度} \times \text{寬度}$$ $$P(x_1 < X < x_2) = \left(\frac{1}{b-a}\right) \times (x_2 - x_1)$$

U(a, b) 的 CDF

CDF 在 $a$ 和 $b$ 之間是一條遞增的直線。

當 $x < a$，$F(x) = 0$
當 $a \le x \le b$，$$F(x) = \frac{x-a}{b-a}$$
當 $x > b$，$F(x) = 1$

平均值與變異數的快速公式

辨識出均勻分佈的好處之一，就是你可以直接使用這些快速公式，而不必執行複雜的 $xf(x)$ 和 $x^2f(x)$ 積分。

平均值（期望值）

平均值單純就是區間的中點。

$$E(X) = \mu = \frac{a+b}{2}$$

變異數

$$\text{Var}(X) = \frac{(b-a)^2}{12}$$

記憶輔助： 變異數公式裡出現 12，是因為 12 是同時能被 3 和 4 整除的最小整數，而這兩個數字會在均勻分佈計算 $E(X)$ 和 $E(X^2)$ 的積分過程中出現。只要記住這個美妙的數字 12 就行了！

最終複習與重點總結

連續分佈問題檢查清單

辨識函數： 這是一般的 PDF（需要積分）還是均勻分佈（可以使用面積/公式快捷鍵）？
總面積檢查： 務必確認 $\int f(x) \, dx = 1$。如果裡面有常數 (k)，先把它找出來！
機率： 若使用 PDF，對 $f(x)$ 積分。若使用 CDF，計算 $F(b) - F(a)$。
平均值/變異數： 記得使用公式 $E(X) = \int x f(x) \, dx$，然後使用 $\text{Var}(X) = E(X^2) - [E(X)]^2$。

你知道嗎？ 你之後可能會學到的「常態分佈」也是一種連續分佈。它大概是統計學中最著名的曲線了！它的 PDF 極其複雜，這就是為什麼我們依賴查表或計算機來找機率，而不是親自進行積分。

持續練習你的積分技巧！ 在統計學 (Statistics 2) 中，數學應用往往就是微積分。這些概念很合邏輯；需要練習的是執行過程。你正在掌握代數、微積分與現實世界統計學之間那複雜而迷人的連結。做得好！

*** 學習筆記結束 ***

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

歡迎來到連續分佈：掌握機率的流動！

什麼是連續隨機變數 (CRV)？

關鍵概念提醒！單點機率

第 1 節：機率密度函數 (PDF)

PDF \(f(x)\) 的關鍵性質

1. 函數必須是非負的

2. 曲線下的總面積必須等於 1

使用 PDF 計算機率

步驟說明：如何計算機率

第 2 節：累積分配函數 (CDF)

CDF \(F(x)\) 的定義

PDF 與 CDF 的關係（積分與微分）

CDF 的性質

使用 CDF 計算機率

避免常見錯誤

第 3 節：期望值、變異數與中位數

期望值（平均值）

X 的函數之期望值

變異數

中位數 (m)

第 4 節：連續均勻分佈（矩形）

U(a, b) 的 PDF

在均勻分佈中計算機率

U(a, b) 的 CDF

平均值與變異數的快速公式

平均值（期望值）

變異數

最終複習與重點總結

連續分佈問題檢查清單

立即實踐所學

歡迎來到連續分佈：掌握機率的流動！

什麼是連續隨機變數 (CRV)？

關鍵概念提醒！ 單點機率

第 1 節：機率密度函數 (PDF)

PDF \(f(x)\) 的關鍵性質

1. 函數必須是非負的

2. 曲線下的總面積必須等於 1

使用 PDF 計算機率

步驟說明：如何計算機率

第 2 節：累積分配函數 (CDF)

CDF \(F(x)\) 的定義

PDF 與 CDF 的關係（積分與微分）

CDF 的性質

使用 CDF 計算機率

避免常見錯誤

第 3 節：期望值、變異數與中位數

期望值（平均值）

X 的函數之期望值

變異數

中位數 (m)

第 4 節：連續均勻分佈（矩形）

U(a, b) 的 PDF

在均勻分佈中計算機率

U(a, b) 的 CDF

平均值與變異數的快速公式

平均值（期望值）

變異數

最終複習與重點總結

連續分佈問題檢查清單

立即實踐所學

關鍵概念提醒！單點機率