歡迎來到常態分佈的世界!
各位未來的統計學家大家好!你們即將踏入統計學中最著名且最基礎的概念之一:常態分佈(The Normal Distribution)。
如果這章節一開始看起來有點複雜,別擔心!重點在於標準化(Standardisation)和運用對稱性(Symmetry)。我們會將每一個概念拆解成清晰、簡單的步驟。學完之後,你們一定會成為駕馭經典「鐘形曲線」的高手!
為什麼常態分佈如此重要?
現實世界中有許多事物都自然地遵循這種分佈:成年人的身高、大型考試的得分、完成任務所需的時間,甚至測量誤差。如果一個變量呈常態分佈,我們就能準確地預測特定結果發生的機率。
1. 常態分佈的屬性
\(X \sim N(\mu, \sigma^2)\) 的特徵
當我們說一個隨機變量 \(X\) 呈常態分佈時,我們使用以下標記:
\(X \sim N(\mu, \sigma^2)\)
符號的含義如下:
- \(X\):隨機變量(例如:身高、溫度、得分)。
- \(N\):代表「常態分佈」(Normal Distribution)。
- \(\mu\)(讀作 'mu'):這是分佈的平均值(mean)。它決定了曲線中心的位置。
- \(\sigma^2\)(讀作 'sigma squared'):這是變異數(variance)。
- \(\sigma\):變異數的平方根,稱為標準差(standard deviation)。它衡量曲線的離散程度或寬度。
!!! 常見錯誤警示 !!!
務必檢查標記!有時題目會給你變異數(\(\sigma^2\)),有時會給你標準差(\(\sigma\))。如果你拿到的是 \(\sigma^2\),記得先開平方根求出 \(\sigma\),再代入標準化公式(見第 3 節)。
常態曲線的關鍵特徵
- 對稱性(Symmetry): 曲線圍繞平均值 \(\mu\) 完全對稱。
- 集中趨勢(Central Tendency): 平均值、中位數和眾數相等,且位於曲線的中心峰值處。
- 鐘形(Bell Shape): 它具有典型的「鐘形」外觀。
- 漸近線(Asymptotic): 曲線的尾部永遠不會真正接觸橫軸,而是無限延伸(儘管機率很快就會變得極小)。
- 面積(Area): 曲線下方的總面積永遠為 1(或 100%),代表總機率。
快速複習:形狀與散佈
如果兩個常態分佈具有相同的平均值 \(\mu\),那麼標準差(\(\sigma\))較大的那個分佈會更平、更寬,表示數據分佈較廣。而標準差 \(\sigma\) 較小的那個則會更高、更窄。
2. 經驗法則(68-95-99.7 法則)
由於常態分佈是標準化的,我們總能根據標準差(\(\sigma\))知道某些特定的機率。這有時被稱為經驗法則(Empirical Rule)。
- 大約 68% 的數據落在平均值上下 1 個標準差範圍內(即 \(\mu - \sigma\) 到 \(\mu + \sigma\) 之間)。
- 大約 95% 的數據落在平均值上下 2 個標準差範圍內(即 \(\mu - 2\sigma\) 到 \(\mu + 2\sigma\) 之間)。
- 大約 99.7% 的數據落在平均值上下 3 個標準差範圍內(即 \(\mu - 3\sigma\) 到 \(\mu + 3\sigma\) 之間)。
這條法則非常適合用來快速檢查你的答案是否合理。如果你計算出一個數值落在平均值上方 4 個標準差處,你就知道該數值的機率應該是非常、非常小的!
3. 標準化:Z 分數 (Z-Score)
想像你有兩場不同的考試:數學(平均值 70,標準差 5)和物理(平均值 60,標準差 10)。如果你在兩科都考了 75 分,哪一個成績比較好呢?
我們不能直接比較原始分數,因為兩場考試的分散程度不同。我們需要一個標準化的衡量指標,這就是 Z 分數 (Z-score) 的作用!
什麼是 Z 分數?
Z 分數(或標準分數)精確地告訴我們,一個特定的數值(\(X\))在平均值(\(\mu\))之上或之下幾個標準差。
標準化公式為:
\(Z = \frac{X - \mu}{\sigma}\)
- 如果 \(X\) 高於平均值,\(Z\) 為正數。
- 如果 \(X\) 低於平均值,\(Z\) 為負數。
- 如果 \(X\) 等於平均值,\(Z\) 為 0。
類比:把 Z 分數想像成萬能貨幣兌換器。無論原始分佈是什麼(美元、歐元、分數),標準化都會將其轉換為通用的 Z 貨幣,這樣我們就可以使用一張共同的表格來計算機率。
重點總結: 在使用常態分佈表之前,你必須將隨機變量 \(X\) 轉換為 \(Z\) 分數。
4. 標準常態分佈 \(Z \sim N(0, 1)\)
當我們將任何常態變量 \(X\) 標準化後,它就變成了變量 \(Z\),且始終遵循標準常態分佈。
\(Z \sim N(0, 1)\)
這意味著標準常態分佈始終具備:
- 平均值 \(\mu = 0\)
- 變異數 \(\sigma^2 = 1\)(且標準差 \(\sigma = 1\))
標準常態分佈的機率可以透過統計表(或計算機)查得。
理解常態分佈表
你的考試材料中提供的表格給出了 \(\Phi(z)\) 的值(讀作 'Phi of z')。
\(\Phi(z) = P(Z \le z)\)
這是標準化變量 \(Z\) 小於或等於特定數值 \(z\) 的機率。關鍵在於,表格僅顯示 Z 分數左側的面積。
由於常態分佈是連續的,請記住:
\(P(X < x) = P(X \le x)\)
5. 運用對稱性與表格
由於表格只給出了正 \(Z\) 分數左側的面積,我們必須利用對稱性以及總面積為 1 的特性來求得其他機率。
情況 1:求 \(P(Z > z)\)(右側面積)
如果你想要 \(z\) 右側的面積,你需要從總面積(1)中減去左側面積(表格中給出的值)。
\(P(Z > z) = 1 - P(Z < z) = 1 - \Phi(z)\)
例子:如果表格給出 \(P(Z < 1.5) = 0.9332\),那麼 \(P(Z > 1.5) = 1 - 0.9332 = 0.0668\)。
情況 2:求 \(P(Z < -z)\)(左尾面積)
表格通常不列出負的 Z 分數,但我們不需要它們!因為曲線圍繞 0 對稱:
負數值極左側的面積(\(P(Z < -z)\))與相應正數值極右側的面積(\(P(Z > z)\))完全相同。
\(P(Z < -z) = P(Z > z) = 1 - \Phi(z)\)
情況 3:求 \(P(Z > -z)\)(負 Z 分數右側的面積)
這是情況 2 的鏡像。如果你想要負數右側的面積(這是一個大面積,包含了 0 以上的整個曲線):
\(P(Z > -z) = P(Z < z) = \Phi(z)\)
情況 4:求 \(P(z_1 < Z < z_2)\)(兩個數值之間的面積)
要求出兩個數值之間的面積,計算較大數值左側的面積,減去較小數值左側的面積即可。
\(P(z_1 < Z < z_2) = P(Z < z_2) - P(Z < z_1)\)
給學生的解題小撇步:畫個草圖!
務必畫出常態曲線,標出平均值(0),並塗黑你想求出的面積部分。這個視覺輔助會立即告訴你機率應該很大(接近 1)還是很小(接近 0),並指導你選擇正確的公式(1 減去表值,或直接取表值)。
6. 綜合問題:求機率
步驟說明
假設 \(X \sim N(50, 4^2)\)。求 \(P(X < 58)\)。
步驟 1:識別參數。
\(\mu = 50\)。\(\sigma^2 = 4^2 = 16\)。因此,\(\sigma = 4\)。
步驟 2:將變量 \(X\) 標準化為 \(Z\) 分數。
使用 \(Z = \frac{X - \mu}{\sigma}\)。
\(Z = \frac{58 - 50}{4} = \frac{8}{4} = 2.00\)
所以,\(P(X < 58)\) 與 \(P(Z < 2.00)\) 是相同的。
步驟 3:在常態分佈表中查出機率。
找出 \(\Phi(2.00)\)。
\(P(Z < 2.00) = 0.9772\)
步驟 4:結合情境檢查(建議進行)。
由於 58 比平均值高出兩個標準差,經驗法則告訴我們其下方的面積應該很大(超過 95%),所以 0.9772 是一個合理的答案。
7. 反向問題:已知機率求 X
通常,你會得到一個機率(百分比或面積),並被要求找出對應該面積的原始數值 \(X\)。這通常被稱為反向問題(Inverse Problems)。
反向問題的步驟說明
假設 \(X \sim N(50, 4^2)\)。求滿足 \(P(X > x) = 0.10\) 的數值 \(x\)。
步驟 1:將所需機率轉換為「左側面積」。
表格給出的是 \(P(Z < z)\)。如果 \(P(X > x) = 0.10\),那麼左側面積為 \(P(X < x) = 1 - 0.10 = 0.90\)。
步驟 2:使用反向查表(或將主表倒著看)找出 Z 分數 (\(z\))。
我們在尋找使 \(\Phi(z) = 0.90\) 的 \(z\)。
在表格主體中查找 0.9000,大約得到 \(z = 1.282\)。
(由於機率 0.90 大於 0.5,我們知道 Z 分數必須為正)。
步驟 3:將 Z 分數轉換回原始分數 \(X\)。
重新排列標準化公式:
\(X = \mu + Z\sigma\)
代入數值:\(\mu = 50\),\(\sigma = 4\),\(Z = 1.282\)。
\(X = 50 + (1.282)(4)\)
\(X = 50 + 5.128 = 55.128\)
步驟 4:結論。
所求數值 \(x\) 為 55.13(取 3 位有效數字)。
處理負 Z 分數的反向問題
如果題目要求的是滿足 \(P(X < x) = 0.10\) 的分數 \(x\) 呢?
左側面積為 0.10。由於 0.10 小於 0.5,該數值 \(x\) 必須低於平均值(\(Z\) 必須為負)。
1. 我們查右側面積,即 \(1 - 0.10 = 0.90\),以找出 Z 分數的絕對值,\(z_0 = 1.282\)。 2. 因為我們需要的機率(0.10)在左尾,實際需要的 Z 分數為負數:\(Z = -1.282\)。 3. 計算 \(X\):\(X = 50 + (-1.282)(4) = 50 - 5.128 = 44.872\)。
記憶小撇步: 如果 \(P < 0.5\),\(Z\) 為負;如果 \(P > 0.5\),\(Z\) 為正。
最終總結與關鍵要點
你已經成功攻克常態分佈了!請記住這些基本事實:
- 符號是 \(X \sim N(\mu, \sigma^2\)。小心變異數 (\(\sigma^2\)) 與標準差 (\(\sigma\)) 的區別。
- 要解決任何問題,必須使用 \(Z = \frac{X - \mu}{\sigma}\) 進行標準化。
- 表格測量的是標準常態分佈 \(Z \sim N(0, 1)\)。
- 表格給出的是左側面積,即 \(\Phi(z) = P(Z < z)\)。
- 利用對稱性及 \(1 - \Phi(z)\) 來求出表格範圍外的面積。
- 對於反向問題,先求出 Z 分數,然後使用 \(X = \mu + Z\sigma\) 轉換回 \(X\)。
繼續練習你的標準化規則與對稱性技巧。你一定沒問題的!