歡迎來到常態分佈的世界!

在本章中,我們將探討統計學中最核心的概念之一。常態分佈 (Normal Distribution) 因為其形狀像個鐘,所以常被稱為「鐘形曲線」。如果一開始覺得有點難也不用擔心;實際上,這是一種理解現實世界中數據分佈方式非常有邏輯的方法!

我們使用常態分佈來描述自然發生的現象,例如人的身高、商店裡蘋果的重量,甚至是你的考試成績。大多數事物都集中在「平均值」附近,而極端偏小或極端偏大的事物則較少。這正是這條曲線要告訴我們的。

1. 什麼是常態分佈?

想像一下,你測量了全校每一位同學的身高。你會發現大多數同學的身高都差不多,處於平均值附近。極高的人和極矮的人都是少數,大多數人都會集中在中間。這種「集中」現象形成了一種對稱的圖形,稱為常態曲線 (Normal Curve)

必須記住的關鍵性質:

• 它是對稱的:左半邊與右半邊是鏡像關係。
平均值 (\(\mu\))、中位數和眾數都位於正中央。
• 曲線下的總面積永遠為 1(代表總機率為 100%)。
• 曲線兩端無限延伸,但永遠不會真正觸碰到水平軸!

重點重溫:

常態分佈由兩個數值定義:
1. 平均值 (\(\mu\)):這告訴你曲線的中心在哪裡。
2. 標準差 (\(\sigma\)):這告訴你曲線有多「分散」。大的 \(\sigma\) 代表曲線寬而平坦;小的 \(\sigma\) 代表曲線高而狹窄。

2. 標準常態分佈 (\(Z\))

由於平均值和標準差的組合有無數多種,數學家們創造了一個「萬用翻譯機」,稱為標準常態分佈 (Standard Normal Distribution)。我們用字母 \(Z\) 來表示它。

在 \(Z\) 分佈中:
• 平均值 \(\mu = 0\)
• 標準差 \(\sigma = 1\)

如何進行標準化(\(Z\)-score 公式)

若要將任何數值 \(X\) 轉換為 \(Z\)-score,我們使用以下公式:
\( Z = \frac{X - \mu}{\sigma} \)

類比:將 \(Z\) 想像成「通用貨幣」。如果你有 100 日圓,而你的朋友有 5 美元,你們需要將它們轉換成同一種貨幣才能比較誰更有錢。標準化就是將數據轉換為「標準單位」,以便你能使用機率表進行計算。

3. 尋找機率

當題目要求計算機率時,它其實是在問曲線下的面積。你的計數機或公式小冊子中的機率表,通常會提供該數值左側的面積 (\(P(X < a)\))。

解題步驟:

例子:某種電池的平均壽命為 50 小時 (\(\mu = 50\)),標準差為 5 小時 (\(\sigma = 5\))。電池壽命少於 42 小時的機率是多少?

第一步:寫下已知條件。
\(X \sim N(50, 5^2)\)。我們要計算 \(P(X < 42)\)。

第二步:標準化以求出 \(Z\)。
\(Z = \frac{42 - 50}{5} = \frac{-8}{5} = -1.6\)

第三步:畫一個簡單的草圖!
畫一條鐘形曲線,標記中間為 0,並將 -1.6 左側的區域塗上陰影。這能幫助你直觀地判斷答案應該偏大還是偏小。

第四步:使用機率表或計數機。
查表得出 \(Z = -1.6\) 對應的機率約為 0.0548

要避免的常見錯誤:

機率表通常只提供左側的面積。如果題目要求的是「大於」 (\(P(X > a)\)),你必須計算:\(1 - \text{表中的數值}\)

4. 反向常態分佈 (Inverse Normal)

有時候,題目會給你機率(面積),並要求你找出原始數值 (\(x\))。這稱為反向常態分佈

記憶口訣:「由內而外」
常態機率計算 = \(X \rightarrow Z \rightarrow \text{面積}\)
反向常態計算 = \(\text{面積} \rightarrow Z \rightarrow X\)

若要從 \(Z\) 反推 \(X\),我們調整公式如下:
\( X = \mu + (Z \times \sigma) \)

快速檢查箱:

• 如果面積 小於 0.5,你的 \(Z\)-score 將會是 負數
• 如果面積 大於 0.5,你的 \(Z\)-score 將會是 正數

5. 二項分佈的常態近似

(請核對你的考試大綱要求,因為這通常是 S1 課程的重點!)

如果你有一個二項分佈 (Binomial Distribution),且試驗次數 (\(n\)) 很大,機率 (\(p\)) 接近 0.5 時,它的形狀看起來會非常像常態分佈。我們可以使用常態分佈來簡化計算!

什麼時候可以使用?

當符合以下條件時,你可以使用近似法:
1. \(np > 5\)
2. \(n(1-p) > 5\)

如何操作:

• 使用平均值 \(\mu = np\)
• 使用變異數 \(\sigma^2 = np(1-p)\)

重要技巧:連續性修正 (Continuity Correction)
由於二項數據是離散的(整數),而常態數據是連續的(任何小數),我們必須進行調整。如果你想在二項分佈中計算 \(P(X \ge 10)\),在常態近似中你應該使用 \(P(X > 9.5)\)。記住,要在數值基礎上加減 0.5!

6. 總結關鍵點

參數: \(\mu\) 是中心位置,\(\sigma\) 是分佈的寬度。
標準化: 使用 \( Z = \frac{X - \mu}{\sigma} \) 將現實數據轉換為 \(Z\)-table 可用的標準單位。
對稱性: 利用曲線的對稱性來處理負值區域(如果你的機率表只提供正數)。
畫圖: 養成畫出小草圖並塗上陰影的習慣,這是避免粗心錯誤的最佳方法!
機率: 總面積為 1。如果你需要右側區域,用 1 減去左側區域即可。

你知道嗎?
常態分佈是由 Carl Friedrich Gauss 發現的。這也是為什麼它有時被稱為高斯分佈 (Gaussian Distribution)。他當年曾利用此分佈成功預測了行星和恆星的位置!