歡迎來到均勻分佈的世界!
你好,未來的進階數學家!「均勻分佈 (Uniform Distribution)」這一章是你正式踏入 FS1 統計模組中連續隨機變量 (continuous random variables) 的第一個深入課題。不用擔心,這是所有分佈中最友善的一個!
我們稱之為「均勻」,是因為它非常公平——在特定範圍內的每一個數值都擁有完全相同的機率密度。掌握這個概念至關重要,它不僅是考試得分的基礎,更是你日後理解正態分佈 (Normal Distribution) 或指數分佈 (Exponential Distribution) 等更複雜分佈的基石。
準備好掌握公式、理解條件並征服推導了嗎?我們出發吧!
引言重點總結
均勻分佈用於模擬在一個定義區間內,所有結果出現的機會均完全相等的情況。
1. 理解連續均勻分佈 (FS1.2: 應用條件)
由於均勻分佈的機率圖形呈現矩形,它通常也被稱為矩形分佈 (Rectangular Distribution)。
使用它的條件是什麼?
若一個隨機變量 \(X\) 在特定區間(例如從 \(a\) 到 \(b\))內服從均勻分佈,需滿足以下條件:
- \(X\) 必須是一個連續隨機變量。這意味著 \(X\) 可以取該範圍內的任何數值(例如時間、距離、溫度),而不僅限於離散的整數。
- 在區間 \(a \le x \le b\) 內,機率密度必須是恆定不變的。
- 在該範圍之外,機率密度必須為零。
記法: 我們記作 \(X \sim U(a, b)\),其中 \(a\) 和 \(b\) 分別是可能出現的最小值與最大值,且 \(a < b\)。
類比:巴士到達時間
想像一輛巴士在上午 8:00 (\(a=0\)) 到 8:10 (\(b=10\)) 之間隨機到達車站。如果到達時間是真正的隨機,且不受交通或時刻表影響,那麼到達時間(以 8:00 後的分鐘數計算)就是均勻分佈,即 \(X \sim U(0, 10)\)。無論你是在 8:01:05 還是 8:07:32 到達,該特定時間點的密度都是一樣的。
在現實世界中,「絕對均勻」的分佈其實很少見,但我們常利用它來模擬隨機誤差、捨入誤差,或是那些在物理上沒有理由偏好某個特定結果的過程(例如電腦產生的隨機數)。
第一節重點總結
若一個變量 \(X\) 的密度在兩個界限 \(a\) 和 \(b\) 之間是平坦的(恆定的),則它服從均勻分佈。
2. 機率密度函數 (PDF)
對於任何連續分佈,其曲線(或圖形)下的總面積必須永遠等於 1(代表 100% 的機率)。
因為均勻分佈繪圖後會形成一個矩形,所以面積的計算非常簡單:
$$\text{面積} = \text{高} \times \text{寬}$$
我們知道面積必須等於 1。矩形的寬度即是區間的長度,即 \((b - a)\)。
$$\text{高} \times (b - a) = 1$$
因此,高度(也就是機率密度函數 \(f(x)\))必須是:
$$f(x) = \frac{1}{b-a}$$
PDF 的定義公式
對於 \(X \sim U(a, b)\),其機率密度函數 (PDF) 的完整定義為:
$$f(x) = \begin{cases} \frac{1}{b-a} & \text{for } a \le x \le b \\ 0 & \text{其他情況} \end{cases}$$
記憶小撇步: 把這想像成一塊蛋糕!如果你切出一塊長度為 \((b-a)\) 的蛋糕,為了讓總面積(體積)為 1,切片的高度必須是長度的倒數:\(1/(b-a)\)。
第二節重點總結
機率密度函數 \(f(x)\) 就是機率矩形的高度,等於 \(1\) 除以區間的長度 \((b-a)\)。
3. 計算機率 (FS1.2: 機率的計算)
要找出 \(X\) 落在子區間 \([c, d]\) 內的機率(其中 \(a \le c \le d \le b\)),我們只需計算該子區間所構成的矩形面積即可。
$$P(c \le X \le d) = \text{子矩形的面積}$$
$$\text{面積} = \text{高} \times \text{子區間的寬度}$$
$$P(c \le X \le d) = f(x) \times (d - c)$$
代入 PDF 公式:
$$P(c \le X \le d) = \left(\frac{1}{b-a}\right) \times (d-c) = \frac{d-c}{b-a}$$
關於連續變量的小提醒
不必糾結不等式是嚴格的 (\(<\)) 還是非嚴格的 (\(\le\))。因為 \(X\) 是連續的,任何單一點的機率均為零。
$$P(X=c) = 0$$
因此:
$$P(c < X < d) = P(c \le X < d) = P(c \le X \le d)$$
步驟範例
機器產生一個 2 到 8 之間的隨機數 \(X\)。求該數值介於 3 和 5 之間的機率。 (\(X \sim U(2, 8)\)。故 \(a=2\),\(b=8\))。
- 求區間長度: \(b - a = 8 - 2 = 6\)。
- 求 PDF(高度): \(f(x) = 1/6\)。
- 求目標子區間寬度: \(d - c = 5 - 3 = 2\)。
- 計算機率(面積):
$$P(3 < X < 5) = \text{高} \times \text{寬} = \frac{1}{6} \times 2 = \frac{2}{6} = \frac{1}{3}$$
避免常見錯誤!
學生有時會混淆離散與連續均勻分佈。在連續均勻分佈中,你不需要進行累加 (sum);你需要計算的是面積。請務必使用幾何學公式(面積 = 寬度 * 高度)。
第三節重點總結
計算機率的方法,就是求出目標子區間長度佔總區間長度的比例:\(\frac{\text{目標區間長度}}{\text{總區間長度}}\)。
4. 平均值與變異數 (FS1.2: 平均值與變異數 - 要求掌握及推導)
對於均勻分佈,平均值和變異數的公式雖然已收錄在你的公式手冊中,但課程大綱明確指出必須懂得推導過程。這意味著你必須學會如何利用積分來證明這些結果。
記住,對於任何連續分佈:
- 平均值 \(E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx\)
- 變異數 \(Var(X) = \sigma^2 = E(X^2) - [E(X)]^2\)
由於 \(f(x) = \frac{1}{b-a}\) 僅存在於 \(a\) 到 \(b\) 之間,我們的積分上下限可作相應簡化。
4.1 平均值 \(E(X)\)
直觀地說,由於該分佈是完全對稱的,平均值必然是區間 \([a, b]\) 的中點。
要求結果: $$\mu = E(X) = \frac{a+b}{2}$$
推導過程(證明):
$$E(X) = \int_a^b x f(x) dx = \int_a^b x \left(\frac{1}{b-a}\right) dx$$
由於 \(\frac{1}{b-a}\) 是常數,我們可以將其提出:
$$E(X) = \frac{1}{b-a} \int_a^b x dx$$
積分 \(x\):
$$E(X) = \frac{1}{b-a} \left[ \frac{x^2}{2} \right]_a^b$$
代入上下限:
$$E(X) = \frac{1}{b-a} \left( \frac{b^2}{2} - \frac{a^2}{2} \right)$$
提出 \(\frac{1}{2}\):
$$E(X) = \frac{1}{2(b-a)} (b^2 - a^2)$$
使用平方差公式:\(b^2 - a^2 = (b-a)(b+a)\):
$$E(X) = \frac{1}{2(b-a)} (b-a)(b+a)$$
約去 \((b-a)\) 項:
$$E(X) = \frac{a+b}{2}$$
第一個推導完成了!做得好!
4.2 變異數 \(Var(X)\)
要計算變異數,我們首先需要計算 \(E(X^2)\)。
$$E(X^2) = \int_a^b x^2 f(x) dx = \int_a^b x^2 \left(\frac{1}{b-a}\right) dx$$
$$E(X^2) = \frac{1}{b-a} \int_a^b x^2 dx$$
積分 \(x^2\):
$$E(X^2) = \frac{1}{b-a} \left[ \frac{x^3}{3} \right]_a^b$$
代入上下限:
$$E(X^2) = \frac{1}{b-a} \left( \frac{b^3}{3} - \frac{a^3}{3} \right) = \frac{1}{3(b-a)} (b^3 - a^3)$$
現在使用立方差公式:\(b^3 - a^3 = (b-a)(a^2 + ab + b^2)\):
$$E(X^2) = \frac{1}{3(b-a)} (b-a)(a^2 + ab + b^2)$$
約去 \((b-a)\) 項:
$$E(X^2) = \frac{a^2 + ab + b^2}{3}$$
現在代入變異數公式:\(Var(X) = E(X^2) - [E(X)]^2\):
$$Var(X) = \frac{a^2 + ab + b^2}{3} - \left(\frac{a+b}{2}\right)^2$$
展開平均值項的平方:
$$Var(X) = \frac{a^2 + ab + b^2}{3} - \frac{a^2 + 2ab + b^2}{4}$$
通分(公分母為 12):
$$Var(X) = \frac{4(a^2 + ab + b^2) - 3(a^2 + 2ab + b^2)}{12}$$
展開括號:
$$Var(X) = \frac{(4a^2 + 4ab + 4b^2) - (3a^2 + 6ab + 3b^2)}{12}$$
合併同類項:
$$Var(X) = \frac{(4a^2 - 3a^2) + (4ab - 6ab) + (4b^2 - 3b^2)}{12}$$
$$Var(X) = \frac{a^2 - 2ab + b^2}{12}$$
識別分子為完全平方公式:\(a^2 - 2ab + b^2 = (b-a)^2\):
要求結果: $$Var(X) = \frac{(b-a)^2}{12}$$
變異數的代數推導確實比較繁瑣,但重點在於三個步驟:計算 \(E(X^2)\)、使用立方差公式,以及最後通分代入變異數公式。多練習幾次,將推導變成你的反射動作!
速查:均勻分佈公式
PDF: \(f(x) = \frac{1}{b-a}\)
平均值 (\(\mu\)): \(E(X) = \frac{a+b}{2}\)
變異數 (\(\sigma^2\)): \(Var(X) = \frac{(b-a)^2}{12}\)
標準差 (\(\sigma\)): \(\sigma = \sqrt{\frac{(b-a)^2}{12}} = \frac{b-a}{\sqrt{12}}\)
5. 標準差的運用與實際應用
一旦你得到了平均值和變異數,計算標準差 (SD) 就非常直接:它就是變異數的平方根。
應用範例
一台機器被程式編定切削金屬桿至長度 \(L\) (單位為 cm)。由於輕微誤差,實際長度 \(X\) 在 19.8 cm 到 20.2 cm 之間均勻分佈。(\(X \sim U(19.8, 20.2)\))。
- 求金屬桿的平均長度。
- 求長度的變異數與標準差。
使用平均值公式:\(a=19.8\),\(b=20.2\)。
$$E(X) = \frac{19.8 + 20.2}{2} = \frac{40}{2} = 20 \text{ cm}$$這非常合理——平均值正好是預定的長度。
先計算 \((b-a)\):\(20.2 - 19.8 = 0.4\)
變異數:
$$Var(X) = \frac{(b-a)^2}{12} = \frac{(0.4)^2}{12} = \frac{0.16}{12} = \frac{1}{75}$$標準差:
$$\sigma = \sqrt{\frac{1}{75}} \approx 0.115 \text{ cm (取 3 位有效數字)}$$先備知識檢查:連續 vs. 離散
如果你覺得這章很有挑戰性,簡要回顧一下連續與離散隨機變量的基本區別:
- 離散(例如:二項分佈、泊松分佈): 使用累加符號 (\(\sum\))、機率質量函數,以及計算 \(P(X=x)\)。
- 連續(例如:均勻分佈): 使用積分符號 (\(\int\)) 或幾何方法(面積)、機率密度函數 \(f(x)\),且 \(P(X=x)=0\)。
均勻分佈本質上是連續機率規則最簡潔的應用,這讓它成為鞏固你「透過積分 PDF 來求取期望值」觀念的最佳起點!
現在你已經掌握了均勻分佈的核心內容——從基礎的常數 PDF 到平均值與變異數的積分推導。繼續練習這些推導吧!