歡迎來到常態分佈的世界!

各位未來的統計學家大家好!你們即將踏入統計學中最著名且最基礎的概念之一:常態分佈(The Normal Distribution)

如果這章節一開始看起來有點複雜,別擔心!重點在於標準化(Standardisation)和運用對稱性(Symmetry)。我們會將每一個概念拆解成清晰、簡單的步驟。學完之後,你們一定會成為駕馭經典「鐘形曲線」的高手!

為什麼常態分佈如此重要?

現實世界中有許多事物都自然地遵循這種分佈:成年人的身高、大型考試的得分、完成任務所需的時間,甚至測量誤差。如果一個變量呈常態分佈,我們就能準確地預測特定結果發生的機率。


1. 常態分佈的屬性

\(X \sim N(\mu, \sigma^2)\) 的特徵

當我們說一個隨機變量 \(X\) 呈常態分佈時,我們使用以下標記:

\(X \sim N(\mu, \sigma^2)\)

符號的含義如下:

  • \(X\):隨機變量(例如:身高、溫度、得分)。
  • \(N\):代表「常態分佈」(Normal Distribution)。
  • \(\mu\)(讀作 'mu'):這是分佈的平均值(mean)。它決定了曲線中心的位置。
  • \(\sigma^2\)(讀作 'sigma squared'):這是變異數(variance)。
  • \(\sigma\):變異數的平方根,稱為標準差(standard deviation)。它衡量曲線的離散程度或寬度。

!!! 常見錯誤警示 !!!
務必檢查標記!有時題目會給你變異數(\(\sigma^2\)),有時會給你標準差(\(\sigma\))。如果你拿到的是 \(\sigma^2\),記得先開平方根求出 \(\sigma\),再代入標準化公式(見第 3 節)。

常態曲線的關鍵特徵

  1. 對稱性(Symmetry): 曲線圍繞平均值 \(\mu\) 完全對稱。
  2. 集中趨勢(Central Tendency): 平均值、中位數和眾數相等,且位於曲線的中心峰值處。
  3. 鐘形(Bell Shape): 它具有典型的「鐘形」外觀。
  4. 漸近線(Asymptotic): 曲線的尾部永遠不會真正接觸橫軸,而是無限延伸(儘管機率很快就會變得極小)。
  5. 面積(Area): 曲線下方的總面積永遠為 1(或 100%),代表總機率。
快速複習:形狀與散佈

如果兩個常態分佈具有相同的平均值 \(\mu\),那麼標準差(\(\sigma\))較大的那個分佈會更平、更寬,表示數據分佈較廣。而標準差 \(\sigma\) 較小的那個則會更高、更窄


2. 經驗法則(68-95-99.7 法則)

由於常態分佈是標準化的,我們總能根據標準差(\(\sigma\))知道某些特定的機率。這有時被稱為經驗法則(Empirical Rule)

  • 大約 68% 的數據落在平均值上下 1 個標準差範圍內(即 \(\mu - \sigma\) 到 \(\mu + \sigma\) 之間)。
  • 大約 95% 的數據落在平均值上下 2 個標準差範圍內(即 \(\mu - 2\sigma\) 到 \(\mu + 2\sigma\) 之間)。
  • 大約 99.7% 的數據落在平均值上下 3 個標準差範圍內(即 \(\mu - 3\sigma\) 到 \(\mu + 3\sigma\) 之間)。

這條法則非常適合用來快速檢查你的答案是否合理。如果你計算出一個數值落在平均值上方 4 個標準差處,你就知道該數值的機率應該是非常、非常小的!


3. 標準化:Z 分數 (Z-Score)

想像你有兩場不同的考試:數學(平均值 70,標準差 5)和物理(平均值 60,標準差 10)。如果你在兩科都考了 75 分,哪一個成績比較好呢?

我們不能直接比較原始分數,因為兩場考試的分散程度不同。我們需要一個標準化的衡量指標,這就是 Z 分數 (Z-score) 的作用!

什麼是 Z 分數?

Z 分數(或標準分數)精確地告訴我們,一個特定的數值(\(X\))在平均值(\(\mu\))之上或之下幾個標準差

標準化公式為:

\(Z = \frac{X - \mu}{\sigma}\)

  • 如果 \(X\) 高於平均值,\(Z\) 為正數。
  • 如果 \(X\) 低於平均值,\(Z\) 為負數。
  • 如果 \(X\) 等於平均值,\(Z\) 為 0。

類比:把 Z 分數想像成萬能貨幣兌換器。無論原始分佈是什麼(美元、歐元、分數),標準化都會將其轉換為通用的 Z 貨幣,這樣我們就可以使用一張共同的表格來計算機率。

重點總結: 在使用常態分佈表之前,你必須將隨機變量 \(X\) 轉換為 \(Z\) 分數。


4. 標準常態分佈 \(Z \sim N(0, 1)\)

當我們將任何常態變量 \(X\) 標準化後,它就變成了變量 \(Z\),且始終遵循標準常態分佈

\(Z \sim N(0, 1)\)

這意味著標準常態分佈始終具備:

  • 平均值 \(\mu = 0\)
  • 變異數 \(\sigma^2 = 1\)(且標準差 \(\sigma = 1\))

標準常態分佈的機率可以透過統計表(或計算機)查得。

理解常態分佈表

你的考試材料中提供的表格給出了 \(\Phi(z)\) 的值(讀作 'Phi of z')。

\(\Phi(z) = P(Z \le z)\)

這是標準化變量 \(Z\) 小於或等於特定數值 \(z\) 的機率。關鍵在於,表格僅顯示 Z 分數左側的面積。

由於常態分佈是連續的,請記住:

\(P(X < x) = P(X \le x)\)


5. 運用對稱性與表格

由於表格只給出了正 \(Z\) 分數左側的面積,我們必須利用對稱性以及總面積為 1 的特性來求得其他機率。

情況 1:求 \(P(Z > z)\)(右側面積)

如果你想要 \(z\) 右側的面積,你需要從總面積(1)中減去左側面積(表格中給出的值)。

\(P(Z > z) = 1 - P(Z < z) = 1 - \Phi(z)\)

例子:如果表格給出 \(P(Z < 1.5) = 0.9332\),那麼 \(P(Z > 1.5) = 1 - 0.9332 = 0.0668\)。

情況 2:求 \(P(Z < -z)\)(左尾面積)

表格通常不列出負的 Z 分數,但我們不需要它們!因為曲線圍繞 0 對稱:

負數值極左側的面積(\(P(Z < -z)\))與相應正數值極右側的面積(\(P(Z > z)\))完全相同。

\(P(Z < -z) = P(Z > z) = 1 - \Phi(z)\)

情況 3:求 \(P(Z > -z)\)(負 Z 分數右側的面積)

這是情況 2 的鏡像。如果你想要負數右側的面積(這是一個大面積,包含了 0 以上的整個曲線):

\(P(Z > -z) = P(Z < z) = \Phi(z)\)

情況 4:求 \(P(z_1 < Z < z_2)\)(兩個數值之間的面積)

要求出兩個數值之間的面積,計算較大數值左側的面積,減去較小數值左側的面積即可。

\(P(z_1 < Z < z_2) = P(Z < z_2) - P(Z < z_1)\)

給學生的解題小撇步:畫個草圖!

務必畫出常態曲線,標出平均值(0),並塗黑你想求出的面積部分。這個視覺輔助會立即告訴你機率應該很大(接近 1)還是很小(接近 0),並指導你選擇正確的公式(1 減去表值,或直接取表值)。


6. 綜合問題:求機率

步驟說明

假設 \(X \sim N(50, 4^2)\)。求 \(P(X < 58)\)。

步驟 1:識別參數。
\(\mu = 50\)。\(\sigma^2 = 4^2 = 16\)。因此,\(\sigma = 4\)。

步驟 2:將變量 \(X\) 標準化為 \(Z\) 分數。
使用 \(Z = \frac{X - \mu}{\sigma}\)。

\(Z = \frac{58 - 50}{4} = \frac{8}{4} = 2.00\)

所以,\(P(X < 58)\) 與 \(P(Z < 2.00)\) 是相同的。

步驟 3:在常態分佈表中查出機率。
找出 \(\Phi(2.00)\)。

\(P(Z < 2.00) = 0.9772\)

步驟 4:結合情境檢查(建議進行)。
由於 58 比平均值高出兩個標準差,經驗法則告訴我們其下方的面積應該很大(超過 95%),所以 0.9772 是一個合理的答案。


7. 反向問題:已知機率求 X

通常,你會得到一個機率(百分比或面積),並被要求找出對應該面積的原始數值 \(X\)。這通常被稱為反向問題(Inverse Problems)

反向問題的步驟說明

假設 \(X \sim N(50, 4^2)\)。求滿足 \(P(X > x) = 0.10\) 的數值 \(x\)。

步驟 1:將所需機率轉換為「左側面積」。
表格給出的是 \(P(Z < z)\)。如果 \(P(X > x) = 0.10\),那麼左側面積為 \(P(X < x) = 1 - 0.10 = 0.90\)。

步驟 2:使用反向查表(或將主表倒著看)找出 Z 分數 (\(z\))。
我們在尋找使 \(\Phi(z) = 0.90\) 的 \(z\)。 在表格主體中查找 0.9000,大約得到 \(z = 1.282\)。 (由於機率 0.90 大於 0.5,我們知道 Z 分數必須為正)。

步驟 3:將 Z 分數轉換回原始分數 \(X\)。
重新排列標準化公式:

\(X = \mu + Z\sigma\)

代入數值:\(\mu = 50\),\(\sigma = 4\),\(Z = 1.282\)。

\(X = 50 + (1.282)(4)\)
\(X = 50 + 5.128 = 55.128\)

步驟 4:結論。
所求數值 \(x\) 為 55.13(取 3 位有效數字)。

處理負 Z 分數的反向問題

如果題目要求的是滿足 \(P(X < x) = 0.10\) 的分數 \(x\) 呢?

左側面積為 0.10。由於 0.10 小於 0.5,該數值 \(x\) 必須低於平均值(\(Z\) 必須為負)。

1. 我們查右側面積,即 \(1 - 0.10 = 0.90\),以找出 Z 分數的絕對值,\(z_0 = 1.282\)。 2. 因為我們需要的機率(0.10)在左尾,實際需要的 Z 分數為負數:\(Z = -1.282\)。 3. 計算 \(X\):\(X = 50 + (-1.282)(4) = 50 - 5.128 = 44.872\)。

記憶小撇步: 如果 \(P < 0.5\),\(Z\) 為負;如果 \(P > 0.5\),\(Z\) 為正。


最終總結與關鍵要點

你已經成功攻克常態分佈了!請記住這些基本事實:

  • 符號是 \(X \sim N(\mu, \sigma^2\)。小心變異數 (\(\sigma^2\)) 與標準差 (\(\sigma\)) 的區別。
  • 要解決任何問題,必須使用 \(Z = \frac{X - \mu}{\sigma}\) 進行標準化。
  • 表格測量的是標準常態分佈 \(Z \sim N(0, 1)\)。
  • 表格給出的是左側面積,即 \(\Phi(z) = P(Z < z)\)。
  • 利用對稱性及 \(1 - \Phi(z)\) 來求出表格範圍外的面積。
  • 對於反向問題,先求出 Z 分數,然後使用 \(X = \mu + Z\sigma\) 轉換回 \(X\)。

繼續練習你的標準化規則與對稱性技巧。你一定沒問題的!