單元 S2:統計學 2 – 連續隨機變量

你好,統計學家!連續分佈入門

歡迎來到 S2 最核心的章節之一:連續隨機變量 (Continuous Random Variables, CRV)。如果看到涉及積分的公式讓你感到畏懼,別擔心——這一章其實就是讓你運用微積分技巧(積分與微分)來解決概率問題!我們現在將超越簡單的計數(離散變量),轉而測量如時間、高度和溫度等數值。

為什麼這很重要? 現實世界中的現象通常不會整齊地落在可數的區間內。如果你測量一顆電池的壽命,它可以是 100.5 小時、100.51 小時或 100.5103 小時。CRV 能幫助我們準確地為這些情況建立模型。


1. 理解連續隨機變量 (CRVs)

什麼是連續變量?

一個隨機變量(我們稱為 \(X\))如果是連續的,代表它可以在指定的範圍(區間)內取任何值。與離散變量不同(離散變量中 \(X\) 只能取 0, 1, 2, 3...),CRV 在任意兩點之間可以取無限多個值。

例子: 顧客在隊伍中的等待時間 \(T\)。\(T\) 可以是 2 分鐘、2.3 分鐘、2.3001 分鐘等。

關鍵區別:單點概率

這是一個學生經常混淆的關鍵概念:

由於存在無限多個可能的值,連續變量取任何精確特定值的概率始終為零。

$$P(X = x) = 0$$

類比: 試想你要射中一條長線上的一個點。射中那個極其微小、沒有寬度的點的機會是零。

這對計算意味著什麼:

$$P(a < X < b) = P(a \leq X \leq b) = P(a < X \leq b)$$

端點是否包含在內並不重要,因為 \(P(X=a)=0\) 且 \(P(X=b)=0\)。

重點總結: CRV 處理的是區間,而概率是透過測量曲線下的面積來求得的,而不是將個別點相加。


2. 概率密度函數 (PDF), \(f(x)\)

由於我們無法為單個點指定概率,我們使用一個函數 \(f(x)\) 來描述概率如何在可能值的範圍內分佈。這就是概率密度函數 (Probability Density Function, PDF)。

有效 PDF 的屬性

對於任何函數 \(f(x)\),要成為隨機變量 \(X\) 的有效 PDF,必須符合:

  1. 非負性: 在其範圍內,函數對於任何 \(x\) 的值都不得為負。(概率不可能是負的!)
    $$f(x) \geq 0 \text{ 對所有 } x$$
  2. 總面積為一: 整個曲線下的總面積必須等於 1(代表所有可能結果的 100%)。
    $$\int_{-\infty}^{\infty} f(x) dx = 1$$ 注意:由於大多數 PDF 只定義在特定區間,例如 \([a, b]\),這通常簡化為: $$\int_{a}^{b} f(x) dx = 1$$

使用 PDF 計算概率

變量 \(X\) 落在 \(a\) 和 \(b\) 之間的概率,就是 PDF 曲線在這些限制之間的面積。

$$P(a < X < b) = \int_{a}^{b} f(x) dx$$

逐步範例:求常數 'k'

假設 PDF 定義為 \(f(x) = kx\),其中 \(0 \leq x \leq 2\),其餘為 0。

  1. 應用總面積規則: 定義範圍內的積分必須等於 1。
  2. $$\int_{0}^{2} kx \ dx = 1$$
  3. 積分: $$ \left[ \frac{kx^2}{2} \right]_{0}^{2} = 1 $$
  4. 代入上下限: $$ \left( \frac{k(2)^2}{2} \right) - \left( \frac{k(0)^2}{2} \right) = 1 $$ $$ 2k - 0 = 1 $$
  5. 解出 k: $$ k = \frac{1}{2} $$

你知道嗎? 概率密度的概念正是我們使用積分的原因。積分就是專為測量曲線下方的面積而設計的數學工具!

常見錯誤: 忘記檢查積分限。務必使用該 PDF 定義的特定範圍來進行計算。

重點總結: PDF \(f(x)\) 告訴我們分佈的形狀。概率即面積,透過積分計算得出。


3. 累積分布函數 (CDF), \(F(x)\)

累積分布函數 (Cumulative Distribution Function, CDF), \(F(x)\),給出隨機變量 \(X\) 小於或等於特定值 \(x\) 的概率。

$$F(x) = P(X \leq x)$$

從 PDF 計算 CDF

要找到 \(F(x)\),你需要從最小值積分到點 \(x\)。我們使用 \(t\) 作為積分變量,以避免與上限 \(x\) 混淆。

$$F(x) = \int_{\text{最小值}}^{x} f(t) dt$$

重要要求:分段定義 \(F(x)\)

CDF 必須對所有實數定義,因此它通常需要三個部分:

  1. $$F(x) = 0 \text{ 當 } x < \text{下界}$$
  2. $$F(x) = \int f(t) dt \text{ 當 } \text{下界} \leq x \leq \text{上界}$$
  3. $$F(x) = 1 \text{ 當 } x > \text{上界}$$

使用 CDF 尋找概率

如果你已有 CDF,計算區間概率會快得多,通常可以避免進一步的積分:

$$P(a < X < b) = F(b) - F(a)$$

反向過程:從 CDF 求 PDF

由於 CDF 是 PDF 的積分,PDF 必然是 CDF 的導數!

$$f(x) = \frac{d}{dx} F(x) = F'(x)$$

技巧: 記住積分(求 CDF)和微分(求 PDF)是互逆運算,就像在純數中一樣。

重點總結: CDF 是概率的滾動總和。它總是從 0 開始,並以 1 結束。


4. 位置測量(眾數、中位數、平均數)

這些指標告訴我們分佈集中在哪裡或在哪裡達到峰值。

4.1 眾數 (Mode)

眾數是概率密度函數 \(f(x)\) 達到最大值時的 \(x\) 值(曲線的峰值)。

  • 如果 \(f(x)\) 是一個簡單函數(如二次或三次函數),你可以通過令一階導數為零來找到眾數:\(f'(x) = 0\),並確認它是範圍內的最大值。
  • 如果 \(f(x)\) 是分段函數,你必須檢查邊界處以及函數範圍內 \(f(x)\) 的最大值。

4.2 中位數 (Median, \(m\))

中位數 \(m\) 是將分佈精確平分為二的值。50% 的概率位於 \(m\) 以下,50% 位於 \(m\) 以上。

我們通過求解以下其中一個方程來找到中位數 \(m\):

  1. 使用 CDF:$$F(m) = 0.5$$
  2. 使用 PDF:$$\int_{\text{下界}}^{m} f(x) dx = 0.5$$

別擔心! 如果你已經計算出 CDF,使用它通常會更快。

4.3 平均數(期望值, \(E[X]\))

平均數期望值 (\(E[X]\) 或 \(\mu\)) 是分佈的「質量中心」。它是所有可能值的加權平均值,權重即為密度 \(f(x)\)。

平均數的公式為:

$$E[X] = \mu = \int_{-\infty}^{\infty} x f(x) dx$$

函數的期望值

如果你需要求某函數 \(g(X)\)(如 \(X^2\) 或 \(3X+5\))的期望值,通用公式是:

$$E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) dx$$

記憶小撇步 (對於 E[X]): 記住,對於離散變量,\(E[X] = \sum x P(X=x)\)。對於連續變量,求和符號 (\(\sum\)) 變成了積分符號 (\(\int\)),而 \(P(X=x)\) 變成了 \(f(x) dx\)。你只需將 \(x\) 放入積分中,與 \(f(x)\) 並列即可。

重點總結: 位置指標可通過導數(眾數)、令 CDF 等於 0.5(中位數)或積分 \(x f(x)\)(平均數)求得。


5. 離散程度測量(方差與標準差)

這些指標告訴我們分佈圍繞平均數的分散程度。

5.1 方差 (\(\text{Var}[X]\))

方差是觀察值與平均數之差的平方的平均值。計算方差通常分為兩步:

  1. 求 \(E[X]\)(平均數,\(\mu\))。
  2. 求 \(E[X^2]\)。
第一步:計算 \(E[X^2]\)

使用 \(g(x) = x^2\) 的通用期望值公式:

$$E[X^2] = \int_{-\infty}^{\infty} x^2 f(x) dx$$

第二步:應用公式

我們使用方差的計算公式(這比積分 \((x-\mu)^2 f(x)\) 要簡單得多):

$$\text{Var}[X] = E[X^2] - (E[X])^2$$

$$\text{Var}[X] = \left( \int x^2 f(x) dx \right) - \mu^2$$

5.2 標準差 (\(\sigma\))

標準差僅僅是方差的平方根。它更受偏愛,因為它的單位與 \(X\) 及平均數 \(\mu\) 相同。

$$\sigma = \sqrt{\text{Var}[X]}$$

快速回顧:求方差的步驟

  1. 通過積分 \(x f(x)\) 計算 \(\mu = E[X]\)。
  2. 通過積分 \(x^2 f(x)\) 計算 \(E[X^2]\)。
  3. 計算 \(\text{Var}[X] = E[X^2] - (E[X])^2\)。

重要提示: 中間數值請勿四捨五入!將 \(E[X]\) 和 \(E[X^2]\) 的分數或精確小數值保留到最後一步,以確保方差最終答案的準確性。

重點總結: 離散程度由方差衡量,這需要使用密度函數求出 \(E[X]\) 和 \(E[X^2]\)。


6. 關鍵技能總結(微積分工具箱)

連續隨機變量完全依賴於在統計框架內應用微積分技巧。請確保你熟悉以下運算:

目標 數學運算 微積分聯繫
求概率 \(P(a < X < b)\) PDF 下的面積 積分 \(\int_{a}^{b} f(x) dx\)
求 CDF \(F(x)\) 累積面積 積分 \(\int_{\text{下界}}^{x} f(t) dt\)
求 PDF \(f(x)\) CDF 的變化率 微分 \(F'(x)\)
求平均數 \(E[X]\) 加權積分 積分 \(\int x f(x) dx\)
求眾數 密度峰值 微分 \(f'(x) = 0\)

繼續練習你的積分技巧,尤其是涉及多項式的(這在本單元的 PDF 中非常常見!)。你一定做得到的!