歡迎來到連續分佈的世界!
在之前的學習中,你可能接觸過離散 (discrete) 數據——即那些可以數出來的項目,例如班上的學生人數或擲骰子的點數。但如果是一些需要測量 (measure) 的東西呢?想想看全校學生的身高、袋中蘋果的重量,或是燈泡燒掉所需的時間。這些都是連續變量 (continuous variables),因為它們可以在某個範圍內取任何數值。
在本章中,我們將專注於所有連續分佈中最著名的一個:常態分佈 (Normal Distribution)。由於它的形狀,它通常被稱為「鐘形曲線 (Bell Curve)」,而且在大自然和科學領域中幾乎無處不在!
1. 什麼是連續分佈?
與離散分佈不同(我們會在離散分佈中找出某個確切數值的機率,例如 \(P(X = 3)\)),在連續分佈中,任何確切數值的機率其實都是零。相反,我們會找出數值落在某個範圍 (range) 內的機率(例如:「一名學生的身高在 160cm 到 170cm 之間的機率是多少?」)。
類比:想像你在數線上投擲飛鏢。要精確命中 1.500000... 這一點是不可能的。然而,命中 1 到 2 之間這個「區域」的機會卻非常高!重點總結:對於連續分佈,我們始終是在尋找曲線下的面積 (area under a curve) 來表示機率。
2. 常態分佈:「鐘形曲線」
常態分佈是完全對稱 (symmetrical) 的。如果你把圖形從正中間對摺,左右兩邊會完全吻合。
要記住的關鍵特徵:
- 曲線呈鐘形。
- 它圍繞著平均值 (\(\mu\)) 對稱。
- 平均值 (mean)、中位數 (median) 和眾數 (mode) 都是同一個數值,且位於正中央。
- 曲線永遠不會真正接觸到 x 軸(它向兩個方向無限延伸)。
- 曲線下的總面積永遠為 1(因為總機率必須是 100%)。
你知道嗎?許多事物都遵循常態分佈,例如智商分數、鞋碼,甚至是科學家在進行測量時產生的誤差!
3. 理解符號標示
當我們說一個變量 \(X\) 服從常態分佈時,我們會這樣寫: \(X \sim N(\mu, \sigma^2)\)
- \(\mu\) (mu):平均值。它告訴你鐘形曲線的中心在哪裡。
- \(\sigma^2\) (sigma squared):方差 (variance)。它告訴你鐘形曲線有多「分散」。
- \(\sigma\) (sigma):標準差 (standard deviation)。這是方差的平方根。
常見錯誤提醒!在符號 \(N(\mu, \sigma^2)\) 中,第二個數字是方差。當你進行計算時,通常需要用到標準差 (\(\sigma\))。請務必檢查是否需要對第二個數字開平方根!
4. 標準常態分佈 (\(Z\))
常態分佈有無窮多種(有的高而窄,有的矮而寬)。為了讓生活變得簡單,數學家們創造了標準常態分佈 (Standard Normal Distribution),它的平均值永遠為 0,且標準差永遠為 1。
我們使用字母 \(Z\) 來表示:\(Z \sim N(0, 1)\)。
標準化 (Standardizing):神奇的公式
如果你有來自常態分佈的任何數值 \(x\),你可以使用此公式將其轉換為 \(Z\)-分數: \(Z = \frac{X - \mu}{\sigma}\)
如果覺得有點難,別擔心!這個公式其實只是告訴你,你的數值距離平均值 「有幾個標準差」。
- \(Z\)-分數為 1,代表你在平均值之上 1 個標準差。
- \(Z\)-分數為 -2,代表你在平均值之下 2 個標準差。
5. 使用統計表查找機率
要找出機率 \(P(X < x)\),我們遵循以下步驟:
- 標準化:使用公式 \(Z = \frac{x - \mu}{\sigma}\) 得到一個 \(Z\)-值。
- 查找:使用考試手冊中提供的常態分佈表,找出該 \(Z\)-值左側的面積。這個面積通常記作 \(\Phi(z)\)。
統計表規則快速複習:
- 要找出 \(P(Z < z)\):只需直接在表中查找 \(z\)。
- 要找出 \(P(Z > z)\):由於總面積為 1,請使用 \(1 - P(Z < z)\)。
- 要找出 \(P(a < Z < b)\):找出較大區域的面積,減去較小區域的面積:\(P(Z < b) - P(Z < a)\)。
6. 反向操作:查找 \(\mu\) 和 \(\sigma\)
有時候,考試題目會給你機率,並要求你找出平均值或標準差。這就像是給你「答案」,問你「問題」是什麼。
「反向」問題的逐步解法:
- 識別機率:查看給定的百分比或面積。
- 找出 \(Z\)-值:使用百分位點表 (percentage points table)(小表),或者在主表內的中間位置查找符合該面積的 \(Z\)-分數。
- 建立方程:使用 \(Z = \frac{x - \mu}{\sigma}\),並代入你的 \(Z\)、\(x\) 以及你所知道的其他數值。
- 求解:整理方程式以找出缺失的字母。
聯立方程
如果 \(\mu\) 和 \(\sigma\) 都是未知的,題目會提供給你兩個不同的資訊。你將使用 \(Z\)-公式建立兩個方程式,並聯立求解。
專業建議:通常解決這些問題最簡單的方法是將兩個方程式相減,以消除 \(\mu\)。
7. 總結檢查清單
在開始練習題目之前,請確保你能做到:
- 從符號中識別平均值 (\(\mu\)) 和方差 (\(\sigma^2\))。
- 使用 \(Z = \frac{X - \mu}{\sigma}\) 公式將數值標準化。
- 正確使用統計表來查找「小於」和「大於」的機率。
- 利用對稱性處理負的 \(Z\)-值(請記住:\(P(Z < -1)\) 等同於 \(P(Z > 1)\))。
- 當給定機率時,能反向求解 \(\mu\) 和 \(\sigma\)。