Normal distribution - Mathematics (9758) - GCE A-Level - Higher 2 (H2)

歡迎來到鐘形曲線的世界！

在本章中，我們將探討統計學中最重要的概念之一：常態分佈 (Normal Distribution)。你可能聽過它被稱為「鐘形曲線」，這是因為它具有獨特的形狀。無論是身高、考試分數，還是甚至一包薯片的重量，現實世界中許多事物都遵循這種規律。看完這些筆記後，你將能夠掌握這些曲線背後的數學原理，並像專家一樣利用它們來預測機率！

如果起初覺得這些內容有點抽象，不用擔心。我們會一步一步來，很快你就會發現常態分佈無處不在！

1. 理解連續隨機變數

在深入探討常態分佈之前，我們需要先了解什麼是連續隨機變數 (Continuous Random Variable)。與離散 (Discrete) 變數（你可以數出具體數值，如 0, 1, 2, 3）不同，連續變數是指你可以測量的事物。

可以這樣理解：
如果你計算班上的學生人數，那是離散的（你不可能有 20.5 個學生）。
如果你測量這些學生的身高，那就是連續的（學生身高可能是 170 公分、170.1 公分，甚至是 170.154 公分）。

關鍵區別： 對於連續變數，變數等於特定數值的機率為零 \( (P(X = x) = 0) \)。相反，我們通常尋求的是變數落在某個範圍內的機率，例如 \( P(160 < X < 170) \)。

快速複習：

離散：可數的（例如：藍色筆的數量）。
連續：可測量的（例如：跑完一場比賽所需的時間）。
我們透過計算曲線下的面積來求出連續變數的機率。

2. 什麼是常態分佈？

常態分佈是一種特定類型的連續機率分佈。我們記作：\( X \sim N(\mu, \sigma^2) \)。

有兩個「大佬」控制著這條曲線的外觀：

平均值 (\(\mu\))： 這是曲線的中心，它告訴你峰值位於何處。
變異數 (\(\sigma^2\))： 這告訴你曲線有多「分散」。(注意：\(\sigma\) 是標準差)。

常態曲線的特性：

對稱性： 左側是右側的鏡像。
鐘形： 中間有一個峰值。
「三者相等」： 在完美的常態分佈中，平均值 = 中位數 = 眾數。
總面積 = 1： 因為任何事件的總機率必須等於 100%。

你知道嗎？ 因為曲線是對稱的，所以平均值以下剛好佔 0.5 (或 50%) 的數據，平均值以上也佔 0.5！

重點總結： 常態分佈完全由其平均值和變異數定義。只要知道這兩個參數，你就掌握了整條曲線。

3. 標準常態分佈 (\(Z\))

由於 \(\mu\) 和 \(\sigma^2\) 有無限種組合，數學家創造了一種「萬用翻譯機」，稱為標準常態分佈，用字母 \(Z\) 表示。

標準常態分佈總是滿足：
平均值 \((\mu) = 0\)
變異數 \((\sigma^2) = 1\)
因此，我們記作：\( Z \sim N(0, 1) \)。

標準化公式：

要將任何值 \(X\) 轉換為 \(Z\)-分數，我們使用以下公式：
\( Z = \frac{X - \mu}{\sigma} \)

類比： 把 \(X\) 想像成本地貨幣（如日圓），把 \(Z\) 想像成全球通用貨幣（如美元）。這個公式就是「匯率」，讓你可以把不同的曲線放在同一個尺度下進行比較。

記憶小撇步：

「X 是定位點，減去平均值，再除以離散程度（標準差）。」

4. 使用你的圖形計算機 (GC)

在 H2 課程大綱中，你不需要手動計算這些機率。你的 GC 是你最好的朋友！

A. 求機率：normCDF

當你擁有數值並想求機率（面積）時使用。
語法：normCDF(下限, 上限, \(\mu\), \(\sigma\))

B. 求數值：invNorm

當題目給予機率（左側面積）並需要求數值 \(x\) 時使用。
語法：invNorm(左側面積, \(\mu\), \(\sigma\))

常見錯誤： 務必檢查題目給的是變異數 (\(\sigma^2\)) 還是標準差 (\(\sigma\))。GC 需要的是標準差 \(\sigma\)。如果題目給出 \(\sigma^2 = 16\)，你輸入時必須換算成 \(\sigma = 4\)！

5. 常態變數的線性變換

有時我們會想改變變數。例如，如果 \(X\) 是員工的日薪，如果每個人都獲得 10 元獎金且薪水加倍，會發生什麼事？

若 \( X \sim N(\mu, \sigma^2) \)，且我們建立一個新變數 \( Y = aX + b \)：

新平均值： \( E(aX + b) = aE(X) + b \)
新變異數： \( Var(aX + b) = a^2Var(X) \)

等等，為什麼是 \(a^2\)？ 變異數衡量的是面積或離散程度。如果你將長度加倍 (\(a=2\))，面積會增加 \(2^2 = 4\) 倍。此外，請注意加上常數 (\(b\)) 不會改變變異數。如果每個人都向右移動 10 步，群體的離散程度依然與原來相同！

重點總結： 縮放 (\(a\)) 會同時影響平均值和變異數。平移 (\(b\)) 只會影響平均值。

6. 獨立變數的線性組合

如果我們將兩個不同的獨立常態變數加在一起會怎樣？（例如：箱子的重量 \(X\) 和裡面水果的重量 \(Y\)）。

若 \( X \sim N(\mu_X, \sigma_X^2) \) 和 \( Y \sim N(\mu_Y, \sigma_Y^2) \) 是獨立的：

平均值法則：

\( E(aX + bY) = aE(X) + bE(Y) \)

變異數法則：

\( Var(aX + bY) = a^2Var(X) + b^2Var(Y) \)

關鍵點： 即使你是將兩個變數相減 \( (X - Y) \)，你也必須相加變異數！
\( Var(X - Y) = Var(X) + Var(Y) \)

為什麼？ 把變異數想像成「不確定性」。如果你結合兩個不確定的事物，總體的不確定性總是會增加，無論你是相加還是相減實際數值。

7. 總結清單與專業建議

在練習習題之前，請記住以下建議：

檢查獨立性： 只有在變數相互獨立時，才能將變異數相加。
畫出曲線： 在解決機率問題時，務必畫出一個簡單的鐘形曲線並標示出你要求的區域。這能防止粗心錯誤！
符號標記： 小心 \( N(\mu, \sigma^2) \)。許多題目寫成 \( N(50, 4) \)，請務必問自己：「這 4 是變異數還是標準差？」（通常是變異數）。
對稱性： 記住 \( P(X > \mu + k) = P(X < \mu - k) \)。利用這一點，在沒有 GC 的情況下也能解決棘手問題。

做得好！你已經掌握了常態分佈的精髓。這看起來像是一堆公式，但透過練習，使用 GC 和標準化公式將會變成你的本能。繼續努力！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。