簡介:世界的形狀

歡迎來到統計學中最著名的課題之一!你有沒有留意到,大多數人的身高都在「平均值」附近,而極高或極矮的人寥寥無幾?又或者,一袋蘋果中大多數的大小重量相若,只有極少數特別細小或巨大?這種「自然」出現的規律,就是我們所說的常態分佈 (Normal Distribution)

在本章中,我們將學習如何利用數學來為這些規律建模。對於你的 OCR MEI H640 考試來說,這是一個至關重要的工具,因為它能讓我們計算現實生活中各種事件發生的機率。如果初學者覺得有點深奧,請不用擔心——一旦你看過那條著名的「鐘形曲線」,一切就會豁然開朗!

1. 什麼是常態分佈?

常態分佈是一種連續型機率分佈 (continuous probability distribution)。這意味著它處理的是可以取任何數值(例如時間、重量或身高)的數據,而不是像「計數」型數據(例如入球數量)。

主要特徵

  • 鐘形:曲線完全對稱,且以中間為中心。
  • 平均值 (\(\mu\)):曲線的峰值正好位於平均值處。這同時也是中位數和眾數!
  • 反曲點 (Points of Inflection):曲線從「向下凹」轉變為「向上凹」的位置,剛好距離平均值一個標準差 (\(\sigma\))。
  • 總面積:曲線下的總面積剛好是 1(代表總機率為 100%)。

符號表示法

我們這樣記錄它:\(X \sim N(\mu, \sigma^2)\)
其中:
- \(X\) 是隨機變數。
- \(\mu\) 是平均值 (mean)
- \(\sigma^2\) 是變異數 (variance)(請記住:\(\sigma\) 才是標準差)。

溫習小貼士:
如果你看到 \(X \sim N(50, 16)\),平均值是 50,而標準差是 \(\sqrt{16} = 4\)。常見錯誤:學生經常忘記將第二個數字開根號來求標準差!

2. 「鐘形曲線」的形狀與對稱性

由於曲線是對稱的,我們知道 50% 的數據低於平均值,50% 高於平均值。這讓計算過程簡單得多!

你知道嗎?

在常態分佈中:
- 約 68% 的數據位於平均值 1 個標準差範圍內 (\(\mu \pm \sigma\))。
- 約 95% 的數據位於 2 個標準差範圍內 (\(\mu \pm 2\sigma\))。
- 約 99.7% 的數據位於 3 個標準差範圍內 (\(\mu \pm 3\sigma\))。

3. 計算機率

在考試中,你不需要進行曲線背後複雜的微積分運算。相反,你會使用你的統計計算機

如何使用計算機:

1. 進入 Distribution(分佈) 選單。
2. 選擇 Normal CD (Normal Cumulative Distribution,常態累積分佈)
3. 輸入你的 Lower(下限)Upper(上限)、\(\sigma\)(標準差)以及 \(\mu\)(平均值)。
4. 例子: 若要計算 \(X \sim N(50, 16)\) 時的 \(P(X < 60)\),下限應輸入一個極小的數(例如 -9999),上限則輸入 60。

類比:將機率想像成覆蓋曲線下方兩點之間區域所需的油漆量。你覆蓋的面積越大,機率就越高!

4. 標準化:Z分數 (Z-score)

有時我們想比較兩種不同的常態分佈(例如比較一場困難的數學測驗和一場簡單的英文測驗成績)。為此,我們將其「標準化」為標準常態分佈 (Standard Normal Distribution),我們稱之為 \(Z\)

\(Z \sim N(0, 1)\)(平均值為 0,變異數為 1)。

公式:

\(Z = \frac{X - \mu}{\sigma}\)

這告訴你一個數值距離平均值有多少個標準差

5. 連續性校正 (Continuity Correction)

課程大綱提到,我們有時會使用常態分佈來模擬離散數據(例如通過考試的人數)。由於常態分佈是連續的,我們需要進行一點微小的調整。

如果你想找出離散數據中「至少 10」的機率,在常態模型中,你應該計算從 9.5 開始向上的區域。試想像每一個整數都佔據了一個向左右各延伸 0.5 單位的「盒子」。

重點總結:僅在當你使用連續曲線(常態分佈)來估算離散計數(如二項分佈數據)時,才需要使用連續性校正。

6. 平均值的假設檢定 (Hypothesis Testing)

這是 MEI 課程大綱中的重頭戲。我們想檢定一個樣本的平均值是否暗示整體母體的平均值已經發生改變。

樣本平均值的分佈

如果我們取一個樣本大小為 \(n\) 的樣本,該樣本的平均值 (\(\bar{X}\)) 會遵循其自身的常態分佈:
\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)

關鍵點:樣本平均值的變異數遠小於原始變異數!它是原始變異數除以樣本大小 (\(n\))。

假設檢定步驟:

1. 列出假設: \(H_0: \mu = \text{數值}\) 以及 \(H_1: \mu \neq, <, \text{ 或 } > \text{數值}\)。
2. 確定分佈: 寫下 \(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。
3. 計算 p-value: 使用計算機找出得到該樣本平均值(或更極端情況)的機率。
4. 比較: 如果 p-value 小於顯著水準(例如 0.05),則拒絕 \(H_0\)
5. 情境: 務必以與題目相關的文字寫出結論(例如:「有足夠證據顯示蘋果的平均重量已經下降。」)。

常見錯誤:進行假設檢定時忘記將變異數除以 \(n\)。記得時刻檢查你的樣本大小!

總結:你必須記住的重點

  • 模型: \(X \sim N(\mu, \sigma^2)\)。曲線以 \(\mu\) 為中心對稱。
  • 標準化: \(Z = \frac{X - \mu}{\sigma}\) 可以將任何常態分佈轉換為 \(Z\) 分佈。
  • 機率: 即曲線下的面積。請使用計算機的 Normal CD 功能。
  • 樣本平均值: 當檢定樣本大小為 \(n\) 的樣本時,請使用標準差 \(\frac{\sigma}{\sqrt{n}}\)。
  • 對稱性: 利用曲線對稱的特性來處理那些已知機率要求計算數值的問題(反向常態分佈,Inverse Normal)。

繼續練習使用計算機的步驟!一旦你熟悉了按鍵操作,常態分佈就會成為你統計學試卷中最穩定且最容易拿高分的章節之一。