歡迎來到均勻分佈的世界!

你好,未來的進階數學家!「均勻分佈 (Uniform Distribution)」這一章是你正式踏入 FS1 統計模組中連續隨機變量 (continuous random variables) 的第一個深入課題。不用擔心,這是所有分佈中最友善的一個!

我們稱之為「均勻」,是因為它非常公平——在特定範圍內的每一個數值都擁有完全相同的機率密度。掌握這個概念至關重要,它不僅是考試得分的基礎,更是你日後理解正態分佈 (Normal Distribution) 或指數分佈 (Exponential Distribution) 等更複雜分佈的基石。

準備好掌握公式、理解條件並征服推導了嗎?我們出發吧!

引言重點總結

均勻分佈用於模擬在一個定義區間內,所有結果出現的機會均完全相等的情況。


1. 理解連續均勻分佈 (FS1.2: 應用條件)

由於均勻分佈的機率圖形呈現矩形,它通常也被稱為矩形分佈 (Rectangular Distribution)

使用它的條件是什麼?

若一個隨機變量 \(X\) 在特定區間(例如從 \(a\) 到 \(b\))內服從均勻分佈,需滿足以下條件:

  1. \(X\) 必須是一個連續隨機變量。這意味著 \(X\) 可以取該範圍內的任何數值(例如時間、距離、溫度),而不僅限於離散的整數。
  2. 在區間 \(a \le x \le b\) 內,機率密度必須是恆定不變的。
  3. 在該範圍之外,機率密度必須為

記法: 我們記作 \(X \sim U(a, b)\),其中 \(a\) 和 \(b\) 分別是可能出現的最小值與最大值,且 \(a < b\)。

類比:巴士到達時間

想像一輛巴士在上午 8:00 (\(a=0\)) 到 8:10 (\(b=10\)) 之間隨機到達車站。如果到達時間是真正的隨機,且不受交通或時刻表影響,那麼到達時間(以 8:00 後的分鐘數計算)就是均勻分佈,即 \(X \sim U(0, 10)\)。無論你是在 8:01:05 還是 8:07:32 到達,該特定時間點的密度都是一樣的。

你知道嗎?
在現實世界中,「絕對均勻」的分佈其實很少見,但我們常利用它來模擬隨機誤差、捨入誤差,或是那些在物理上沒有理由偏好某個特定結果的過程(例如電腦產生的隨機數)。

第一節重點總結

若一個變量 \(X\) 的密度在兩個界限 \(a\) 和 \(b\) 之間是平坦的(恆定的),則它服從均勻分佈。


2. 機率密度函數 (PDF)

對於任何連續分佈,其曲線(或圖形)下的總面積必須永遠等於 1(代表 100% 的機率)。

因為均勻分佈繪圖後會形成一個矩形,所以面積的計算非常簡單:

$$\text{面積} = \text{高} \times \text{寬}$$

我們知道面積必須等於 1。矩形的寬度即是區間的長度,即 \((b - a)\)。

$$\text{高} \times (b - a) = 1$$

因此,高度(也就是機率密度函數 \(f(x)\))必須是:

$$f(x) = \frac{1}{b-a}$$

PDF 的定義公式

對於 \(X \sim U(a, b)\),其機率密度函數 (PDF) 的完整定義為:

$$f(x) = \begin{cases} \frac{1}{b-a} & \text{for } a \le x \le b \\ 0 & \text{其他情況} \end{cases}$$

記憶小撇步: 把這想像成一塊蛋糕!如果你切出一塊長度為 \((b-a)\) 的蛋糕,為了讓總面積(體積)為 1,切片的高度必須是長度的倒數:\(1/(b-a)\)。

第二節重點總結

機率密度函數 \(f(x)\) 就是機率矩形的高度,等於 \(1\) 除以區間的長度 \((b-a)\)。


3. 計算機率 (FS1.2: 機率的計算)

要找出 \(X\) 落在子區間 \([c, d]\) 內的機率(其中 \(a \le c \le d \le b\)),我們只需計算該子區間所構成的矩形面積即可。

$$P(c \le X \le d) = \text{子矩形的面積}$$

$$\text{面積} = \text{高} \times \text{子區間的寬度}$$

$$P(c \le X \le d) = f(x) \times (d - c)$$

代入 PDF 公式:

$$P(c \le X \le d) = \left(\frac{1}{b-a}\right) \times (d-c) = \frac{d-c}{b-a}$$

關於連續變量的小提醒

不必糾結不等式是嚴格的 (\(<\)) 還是非嚴格的 (\(\le\))。因為 \(X\) 是連續的,任何單一點的機率均為零。

$$P(X=c) = 0$$

因此:

$$P(c < X < d) = P(c \le X < d) = P(c \le X \le d)$$

步驟範例

機器產生一個 2 到 8 之間的隨機數 \(X\)。求該數值介於 3 和 5 之間的機率。 (\(X \sim U(2, 8)\)。故 \(a=2\),\(b=8\))。

  1. 求區間長度: \(b - a = 8 - 2 = 6\)。
  2. 求 PDF(高度): \(f(x) = 1/6\)。
  3. 求目標子區間寬度: \(d - c = 5 - 3 = 2\)。
  4. 計算機率(面積):
  5. $$P(3 < X < 5) = \text{高} \times \text{寬} = \frac{1}{6} \times 2 = \frac{2}{6} = \frac{1}{3}$$

避免常見錯誤!

學生有時會混淆離散與連續均勻分佈。在連續均勻分佈中,你不需要進行累加 (sum);你需要計算的是面積。請務必使用幾何學公式(面積 = 寬度 * 高度)。

第三節重點總結

計算機率的方法,就是求出目標子區間長度佔總區間長度的比例:\(\frac{\text{目標區間長度}}{\text{總區間長度}}\)。


4. 平均值與變異數 (FS1.2: 平均值與變異數 - 要求掌握及推導)

對於均勻分佈,平均值和變異數的公式雖然已收錄在你的公式手冊中,但課程大綱明確指出必須懂得推導過程。這意味著你必須學會如何利用積分來證明這些結果。

記住,對於任何連續分佈:

  • 平均值 \(E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx\)
  • 變異數 \(Var(X) = \sigma^2 = E(X^2) - [E(X)]^2\)

由於 \(f(x) = \frac{1}{b-a}\) 僅存在於 \(a\) 到 \(b\) 之間,我們的積分上下限可作相應簡化。

4.1 平均值 \(E(X)\)

直觀地說,由於該分佈是完全對稱的,平均值必然是區間 \([a, b]\) 的中點。

要求結果: $$\mu = E(X) = \frac{a+b}{2}$$

推導過程(證明):

$$E(X) = \int_a^b x f(x) dx = \int_a^b x \left(\frac{1}{b-a}\right) dx$$

由於 \(\frac{1}{b-a}\) 是常數,我們可以將其提出:

$$E(X) = \frac{1}{b-a} \int_a^b x dx$$

積分 \(x\):

$$E(X) = \frac{1}{b-a} \left[ \frac{x^2}{2} \right]_a^b$$

代入上下限:

$$E(X) = \frac{1}{b-a} \left( \frac{b^2}{2} - \frac{a^2}{2} \right)$$

提出 \(\frac{1}{2}\):

$$E(X) = \frac{1}{2(b-a)} (b^2 - a^2)$$

使用平方差公式:\(b^2 - a^2 = (b-a)(b+a)\):

$$E(X) = \frac{1}{2(b-a)} (b-a)(b+a)$$

約去 \((b-a)\) 項:

$$E(X) = \frac{a+b}{2}$$

第一個推導完成了!做得好!

4.2 變異數 \(Var(X)\)

要計算變異數,我們首先需要計算 \(E(X^2)\)。

$$E(X^2) = \int_a^b x^2 f(x) dx = \int_a^b x^2 \left(\frac{1}{b-a}\right) dx$$

$$E(X^2) = \frac{1}{b-a} \int_a^b x^2 dx$$

積分 \(x^2\):

$$E(X^2) = \frac{1}{b-a} \left[ \frac{x^3}{3} \right]_a^b$$

代入上下限:

$$E(X^2) = \frac{1}{b-a} \left( \frac{b^3}{3} - \frac{a^3}{3} \right) = \frac{1}{3(b-a)} (b^3 - a^3)$$

現在使用立方差公式:\(b^3 - a^3 = (b-a)(a^2 + ab + b^2)\):

$$E(X^2) = \frac{1}{3(b-a)} (b-a)(a^2 + ab + b^2)$$

約去 \((b-a)\) 項:

$$E(X^2) = \frac{a^2 + ab + b^2}{3}$$

現在代入變異數公式:\(Var(X) = E(X^2) - [E(X)]^2\):

$$Var(X) = \frac{a^2 + ab + b^2}{3} - \left(\frac{a+b}{2}\right)^2$$

展開平均值項的平方:

$$Var(X) = \frac{a^2 + ab + b^2}{3} - \frac{a^2 + 2ab + b^2}{4}$$

通分(公分母為 12):

$$Var(X) = \frac{4(a^2 + ab + b^2) - 3(a^2 + 2ab + b^2)}{12}$$

展開括號:

$$Var(X) = \frac{(4a^2 + 4ab + 4b^2) - (3a^2 + 6ab + 3b^2)}{12}$$

合併同類項:

$$Var(X) = \frac{(4a^2 - 3a^2) + (4ab - 6ab) + (4b^2 - 3b^2)}{12}$$

$$Var(X) = \frac{a^2 - 2ab + b^2}{12}$$

識別分子為完全平方公式:\(a^2 - 2ab + b^2 = (b-a)^2\):

要求結果: $$Var(X) = \frac{(b-a)^2}{12}$$

變異數的代數推導確實比較繁瑣,但重點在於三個步驟:計算 \(E(X^2)\)、使用立方差公式,以及最後通分代入變異數公式。多練習幾次,將推導變成你的反射動作!

速查:均勻分佈公式

分佈: \(X \sim U(a, b)\)
PDF: \(f(x) = \frac{1}{b-a}\)
平均值 (\(\mu\)): \(E(X) = \frac{a+b}{2}\)
變異數 (\(\sigma^2\)): \(Var(X) = \frac{(b-a)^2}{12}\)
標準差 (\(\sigma\)): \(\sigma = \sqrt{\frac{(b-a)^2}{12}} = \frac{b-a}{\sqrt{12}}\)

5. 標準差的運用與實際應用

一旦你得到了平均值和變異數,計算標準差 (SD) 就非常直接:它就是變異數的平方根。

應用範例

一台機器被程式編定切削金屬桿至長度 \(L\) (單位為 cm)。由於輕微誤差,實際長度 \(X\) 在 19.8 cm 到 20.2 cm 之間均勻分佈。(\(X \sim U(19.8, 20.2)\))。

  1. 求金屬桿的平均長度。
  2. 使用平均值公式:\(a=19.8\),\(b=20.2\)。

    $$E(X) = \frac{19.8 + 20.2}{2} = \frac{40}{2} = 20 \text{ cm}$$

    這非常合理——平均值正好是預定的長度。

  3. 求長度的變異數與標準差。
  4. 先計算 \((b-a)\):\(20.2 - 19.8 = 0.4\)

    變異數:

    $$Var(X) = \frac{(b-a)^2}{12} = \frac{(0.4)^2}{12} = \frac{0.16}{12} = \frac{1}{75}$$

    標準差:

    $$\sigma = \sqrt{\frac{1}{75}} \approx 0.115 \text{ cm (取 3 位有效數字)}$$
先備知識檢查:連續 vs. 離散

如果你覺得這章很有挑戰性,簡要回顧一下連續與離散隨機變量的基本區別:

  • 離散(例如:二項分佈、泊松分佈): 使用累加符號 (\(\sum\))、機率質量函數,以及計算 \(P(X=x)\)。
  • 連續(例如:均勻分佈): 使用積分符號 (\(\int\)) 或幾何方法(面積)、機率密度函數 \(f(x)\),且 \(P(X=x)=0\)。

均勻分佈本質上是連續機率規則最簡潔的應用,這讓它成為鞏固你「透過積分 PDF 來求取期望值」觀念的最佳起點!

現在你已經掌握了均勻分佈的核心內容——從基礎的常數 PDF 到平均值與變異數的積分推導。繼續練習這些推導吧!