Continuous random variables

單元 S2：統計學 2 – 連續隨機變量

你好，統計學家！連續分佈入門

歡迎來到 S2 最核心的章節之一：連續隨機變量 (Continuous Random Variables, CRV)。如果看到涉及積分的公式讓你感到畏懼，別擔心——這一章其實就是讓你運用微積分技巧（積分與微分）來解決概率問題！我們現在將超越簡單的計數（離散變量），轉而測量如時間、高度和溫度等數值。

為什麼這很重要？ 現實世界中的現象通常不會整齊地落在可數的區間內。如果你測量一顆電池的壽命，它可以是 100.5 小時、100.51 小時或 100.5103 小時。CRV 能幫助我們準確地為這些情況建立模型。

1. 理解連續隨機變量 (CRVs)

什麼是連續變量？

一個隨機變量（我們稱為 $X$）如果是連續的，代表它可以在指定的範圍（區間）內取任何值。與離散變量不同（離散變量中 $X$ 只能取 0, 1, 2, 3...），CRV 在任意兩點之間可以取無限多個值。

例子： 顧客在隊伍中的等待時間 $T$。$T$ 可以是 2 分鐘、2.3 分鐘、2.3001 分鐘等。

關鍵區別：單點概率

這是一個學生經常混淆的關鍵概念：

由於存在無限多個可能的值，連續變量取任何精確特定值的概率始終為零。

$$P(X = x) = 0$$

類比： 試想你要射中一條長線上的一個點。射中那個極其微小、沒有寬度的點的機會是零。

這對計算意味著什麼：

$$P(a < X < b) = P(a \leq X \leq b) = P(a < X \leq b)$$

端點是否包含在內並不重要，因為 $P(X=a)=0$ 且 $P(X=b)=0$。

重點總結： CRV 處理的是區間，而概率是透過測量曲線下的面積來求得的，而不是將個別點相加。

2. 概率密度函數 (PDF), $f(x)$

由於我們無法為單個點指定概率，我們使用一個函數 $f(x)$ 來描述概率如何在可能值的範圍內分佈。這就是概率密度函數 (Probability Density Function, PDF)。

有效 PDF 的屬性

對於任何函數 $f(x)$，要成為隨機變量 $X$ 的有效 PDF，必須符合：

非負性： 在其範圍內，函數對於任何 $x$ 的值都不得為負。（概率不可能是負的！）
$$f(x) \geq 0 \text{ 對所有 } x$$
總面積為一： 整個曲線下的總面積必須等於 1（代表所有可能結果的 100%）。
$$\int_{-\infty}^{\infty} f(x) dx = 1$$ 注意：由於大多數 PDF 只定義在特定區間，例如 $[a, b]$，這通常簡化為： $$\int_{a}^{b} f(x) dx = 1$$

使用 PDF 計算概率

變量 $X$ 落在 $a$ 和 $b$ 之間的概率，就是 PDF 曲線在這些限制之間的面積。

$$P(a < X < b) = \int_{a}^{b} f(x) dx$$

逐步範例：求常數 'k'

假設 PDF 定義為 $f(x) = kx$，其中 $0 \leq x \leq 2$，其餘為 0。

應用總面積規則： 定義範圍內的積分必須等於 1。
$$\int_{0}^{2} kx \ dx = 1$$
積分： $$ \left[ \frac{kx^2}{2} \right]_{0}^{2} = 1 $$
代入上下限： $$ \left( \frac{k(2)^2}{2} \right) - \left( \frac{k(0)^2}{2} \right) = 1 $$ $$ 2k - 0 = 1 $$
解出 k： $$ k = \frac{1}{2} $$

你知道嗎？ 概率密度的概念正是我們使用積分的原因。積分就是專為測量曲線下方的面積而設計的數學工具！

常見錯誤： 忘記檢查積分限。務必使用該 PDF 定義的特定範圍來進行計算。

重點總結： PDF $f(x)$ 告訴我們分佈的形狀。概率即面積，透過積分計算得出。

3. 累積分布函數 (CDF), $F(x)$

累積分布函數 (Cumulative Distribution Function, CDF), $F(x)$，給出隨機變量 $X$ 小於或等於特定值 $x$ 的概率。

$$F(x) = P(X \leq x)$$

從 PDF 計算 CDF

要找到 $F(x)$，你需要從最小值積分到點 $x$。我們使用 $t$ 作為積分變量，以避免與上限 $x$ 混淆。

$$F(x) = \int_{\text{最小值}}^{x} f(t) dt$$

重要要求：分段定義 $F(x)$

CDF 必須對所有實數定義，因此它通常需要三個部分：

$$F(x) = 0 \text{ 當 } x < \text{下界}$$
$$F(x) = \int f(t) dt \text{ 當 } \text{下界} \leq x \leq \text{上界}$$
$$F(x) = 1 \text{ 當 } x > \text{上界}$$

使用 CDF 尋找概率

如果你已有 CDF，計算區間概率會快得多，通常可以避免進一步的積分：

$$P(a < X < b) = F(b) - F(a)$$

反向過程：從 CDF 求 PDF

由於 CDF 是 PDF 的積分，PDF 必然是 CDF 的導數！

$$f(x) = \frac{d}{dx} F(x) = F'(x)$$

技巧： 記住積分（求 CDF）和微分（求 PDF）是互逆運算，就像在純數中一樣。

重點總結： CDF 是概率的滾動總和。它總是從 0 開始，並以 1 結束。

4. 位置測量（眾數、中位數、平均數）

這些指標告訴我們分佈集中在哪裡或在哪裡達到峰值。

4.1 眾數 (Mode)

眾數是概率密度函數 $f(x)$ 達到最大值時的 $x$ 值（曲線的峰值）。

如果 $f(x)$ 是一個簡單函數（如二次或三次函數），你可以通過令一階導數為零來找到眾數：$f'(x) = 0$，並確認它是範圍內的最大值。
如果 $f(x)$ 是分段函數，你必須檢查邊界處以及函數範圍內 $f(x)$ 的最大值。

4.2 中位數 (Median, $m$)

中位數 $m$ 是將分佈精確平分為二的值。50% 的概率位於 $m$ 以下，50% 位於 $m$ 以上。

我們通過求解以下其中一個方程來找到中位數 $m$：

使用 CDF：$$F(m) = 0.5$$
使用 PDF：$$\int_{\text{下界}}^{m} f(x) dx = 0.5$$

別擔心！ 如果你已經計算出 CDF，使用它通常會更快。

4.3 平均數（期望值, $E[X]$）

平均數或期望值 ($E[X]$ 或 $\mu$) 是分佈的「質量中心」。它是所有可能值的加權平均值，權重即為密度 $f(x)$。

平均數的公式為：

$$E[X] = \mu = \int_{-\infty}^{\infty} x f(x) dx$$

函數的期望值

如果你需要求某函數 $g(X)$（如 $X^2$ 或 $3X+5$）的期望值，通用公式是：

$$E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) dx$$

記憶小撇步 (對於 E[X])： 記住，對於離散變量，$E[X] = \sum x P(X=x)$。對於連續變量，求和符號 ($\sum$) 變成了積分符號 ($\int$)，而 $P(X=x)$ 變成了 $f(x) dx$。你只需將 $x$ 放入積分中，與 $f(x)$ 並列即可。

重點總結： 位置指標可通過導數（眾數）、令 CDF 等於 0.5（中位數）或積分 $x f(x)$（平均數）求得。

5. 離散程度測量（方差與標準差）

這些指標告訴我們分佈圍繞平均數的分散程度。

5.1 方差 ($\text{Var}[X]$)

方差是觀察值與平均數之差的平方的平均值。計算方差通常分為兩步：

求 $E[X]$（平均數，$\mu$）。
求 $E[X^2]$。

第一步：計算 $E[X^2]$

使用 $g(x) = x^2$ 的通用期望值公式：

$$E[X^2] = \int_{-\infty}^{\infty} x^2 f(x) dx$$

第二步：應用公式

我們使用方差的計算公式（這比積分 $(x-\mu)^2 f(x)$ 要簡單得多）：

$$\text{Var}[X] = E[X^2] - (E[X])^2$$

或

$$\text{Var}[X] = \left( \int x^2 f(x) dx \right) - \mu^2$$

5.2 標準差 ($\sigma$)

標準差僅僅是方差的平方根。它更受偏愛，因為它的單位與 $X$ 及平均數 $\mu$ 相同。

$$\sigma = \sqrt{\text{Var}[X]}$$

快速回顧：求方差的步驟

通過積分 $x f(x)$ 計算 $\mu = E[X]$。
通過積分 $x^2 f(x)$ 計算 $E[X^2]$。
計算 $\text{Var}[X] = E[X^2] - (E[X])^2$。

重要提示： 中間數值請勿四捨五入！將 $E[X]$ 和 $E[X^2]$ 的分數或精確小數值保留到最後一步，以確保方差最終答案的準確性。

重點總結： 離散程度由方差衡量，這需要使用密度函數求出 $E[X]$ 和 $E[X^2]$。

6. 關鍵技能總結（微積分工具箱）

連續隨機變量完全依賴於在統計框架內應用微積分技巧。請確保你熟悉以下運算：

目標	數學運算	微積分聯繫
求概率 $P(a < X < b)$	PDF 下的面積	積分 $\int_{a}^{b} f(x) dx$
求 CDF $F(x)$	累積面積	積分 $\int_{\text{下界}}^{x} f(t) dt$
求 PDF $f(x)$	CDF 的變化率	微分 $F'(x)$
求平均數 $E[X]$	加權積分	積分 $\int x f(x) dx$
求眾數	密度峰值	微分 $f'(x) = 0$

繼續練習你的積分技巧，尤其是涉及多項式的（這在本單元的 PDF 中非常常見！）。你一定做得到的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

單元 S2：統計學 2 – 連續隨機變量

你好，統計學家！連續分佈入門

1. 理解連續隨機變量 (CRVs)

什麼是連續變量？

關鍵區別：單點概率

2. 概率密度函數 (PDF), \(f(x)\)

有效 PDF 的屬性

使用 PDF 計算概率

逐步範例：求常數 'k'

3. 累積分布函數 (CDF), \(F(x)\)

從 PDF 計算 CDF

重要要求：分段定義 \(F(x)\)

使用 CDF 尋找概率

反向過程：從 CDF 求 PDF

4. 位置測量（眾數、中位數、平均數）

4.1 眾數 (Mode)

4.2 中位數 (Median, \(m\))

4.3 平均數（期望值, \(E[X]\)）

函數的期望值

5. 離散程度測量（方差與標準差）

5.1 方差 (\(\text{Var}[X]\))

第一步：計算 \(E[X^2]\)

第二步：應用公式

5.2 標準差 (\(\sigma\))

快速回顧：求方差的步驟

6. 關鍵技能總結（微積分工具箱）

立即實踐所學

目標	數學運算	微積分聯繫
求概率 \(P(a < X < b)\)	PDF 下的面積	積分 \(\int_{a}^{b} f(x) dx\)
求 CDF \(F(x)\)	累積面積	積分 \(\int_{\text{下界}}^{x} f(t) dt\)
求 PDF \(f(x)\)	CDF 的變化率	微分 \(F'(x)\)
求平均數 \(E[X]\)	加權積分	積分 \(\int x f(x) dx\)
求眾數	密度峰值	微分 \(f'(x) = 0\)