The Normal distribution - Mathematics (YMA01) - Pearson Edexcel International A Level

歡迎來到常態分佈的世界！

各位未來的統計學家大家好！你們即將踏入統計學中最著名且最基礎的概念之一：常態分佈（The Normal Distribution）。

如果這章節一開始看起來有點複雜，別擔心！重點在於標準化（Standardisation）和運用對稱性（Symmetry）。我們會將每一個概念拆解成清晰、簡單的步驟。學完之後，你們一定會成為駕馭經典「鐘形曲線」的高手！

為什麼常態分佈如此重要？

現實世界中有許多事物都自然地遵循這種分佈：成年人的身高、大型考試的得分、完成任務所需的時間，甚至測量誤差。如果一個變量呈常態分佈，我們就能準確地預測特定結果發生的機率。

1. 常態分佈的屬性

\(X \sim N(\mu, \sigma^2)\) 的特徵

當我們說一個隨機變量 \(X\) 呈常態分佈時，我們使用以下標記：

\(X \sim N(\mu, \sigma^2)\)

符號的含義如下：

\(X\)：隨機變量（例如：身高、溫度、得分）。
\(N\)：代表「常態分佈」（Normal Distribution）。
\(\mu\)（讀作 'mu'）：這是分佈的平均值（mean）。它決定了曲線中心的位置。
\(\sigma^2\)（讀作 'sigma squared'）：這是變異數（variance）。
\(\sigma\)：變異數的平方根，稱為標準差（standard deviation）。它衡量曲線的離散程度或寬度。

!!! 常見錯誤警示 !!!
務必檢查標記！有時題目會給你變異數（\(\sigma^2\)），有時會給你標準差（\(\sigma\)）。如果你拿到的是 \(\sigma^2\)，記得先開平方根求出 \(\sigma\)，再代入標準化公式（見第 3 節）。

常態曲線的關鍵特徵

對稱性（Symmetry）： 曲線圍繞平均值 \(\mu\) 完全對稱。
集中趨勢（Central Tendency）： 平均值、中位數和眾數相等，且位於曲線的中心峰值處。
鐘形（Bell Shape）： 它具有典型的「鐘形」外觀。
漸近線（Asymptotic）： 曲線的尾部永遠不會真正接觸橫軸，而是無限延伸（儘管機率很快就會變得極小）。
面積（Area）： 曲線下方的總面積永遠為 1（或 100%），代表總機率。

快速複習：形狀與散佈

如果兩個常態分佈具有相同的平均值 \(\mu\)，那麼標準差（\(\sigma\)）較大的那個分佈會更平、更寬，表示數據分佈較廣。而標準差 \(\sigma\) 較小的那個則會更高、更窄。

2. 經驗法則（68-95-99.7 法則）

由於常態分佈是標準化的，我們總能根據標準差（\(\sigma\)）知道某些特定的機率。這有時被稱為經驗法則（Empirical Rule）。

大約 68% 的數據落在平均值上下 1 個標準差範圍內（即 \(\mu - \sigma\) 到 \(\mu + \sigma\) 之間）。
大約 95% 的數據落在平均值上下 2 個標準差範圍內（即 \(\mu - 2\sigma\) 到 \(\mu + 2\sigma\) 之間）。
大約 99.7% 的數據落在平均值上下 3 個標準差範圍內（即 \(\mu - 3\sigma\) 到 \(\mu + 3\sigma\) 之間）。

這條法則非常適合用來快速檢查你的答案是否合理。如果你計算出一個數值落在平均值上方 4 個標準差處，你就知道該數值的機率應該是非常、非常小的！

3. 標準化：Z 分數 (Z-Score)

想像你有兩場不同的考試：數學（平均值 70，標準差 5）和物理（平均值 60，標準差 10）。如果你在兩科都考了 75 分，哪一個成績比較好呢？

我們不能直接比較原始分數，因為兩場考試的分散程度不同。我們需要一個標準化的衡量指標，這就是 Z 分數 (Z-score) 的作用！

什麼是 Z 分數？

Z 分數（或標準分數）精確地告訴我們，一個特定的數值（\(X\)）在平均值（\(\mu\)）之上或之下幾個標準差。

標準化公式為：

\(Z = \frac{X - \mu}{\sigma}\)

如果 \(X\) 高於平均值，\(Z\) 為正數。
如果 \(X\) 低於平均值，\(Z\) 為負數。
如果 \(X\) 等於平均值，\(Z\) 為 0。

類比：把 Z 分數想像成萬能貨幣兌換器。無論原始分佈是什麼（美元、歐元、分數），標準化都會將其轉換為通用的 Z 貨幣，這樣我們就可以使用一張共同的表格來計算機率。

重點總結： 在使用常態分佈表之前，你必須將隨機變量 \(X\) 轉換為 \(Z\) 分數。

4. 標準常態分佈 \(Z \sim N(0, 1)\)

當我們將任何常態變量 \(X\) 標準化後，它就變成了變量 \(Z\)，且始終遵循標準常態分佈。

\(Z \sim N(0, 1)\)

這意味著標準常態分佈始終具備：

平均值 \(\mu = 0\)
變異數 \(\sigma^2 = 1\)（且標準差 \(\sigma = 1\)）

標準常態分佈的機率可以透過統計表（或計算機）查得。

理解常態分佈表

你的考試材料中提供的表格給出了 \(\Phi(z)\) 的值（讀作 'Phi of z'）。

\(\Phi(z) = P(Z \le z)\)

這是標準化變量 \(Z\) 小於或等於特定數值 \(z\) 的機率。關鍵在於，表格僅顯示 Z 分數左側的面積。

由於常態分佈是連續的，請記住：

\(P(X < x) = P(X \le x)\)

5. 運用對稱性與表格

由於表格只給出了正 \(Z\) 分數左側的面積，我們必須利用對稱性以及總面積為 1 的特性來求得其他機率。

情況 1：求 \(P(Z > z)\)（右側面積）

如果你想要 \(z\) 右側的面積，你需要從總面積（1）中減去左側面積（表格中給出的值）。

\(P(Z > z) = 1 - P(Z < z) = 1 - \Phi(z)\)

例子：如果表格給出 \(P(Z < 1.5) = 0.9332\)，那麼 \(P(Z > 1.5) = 1 - 0.9332 = 0.0668\)。

情況 2：求 \(P(Z < -z)\)（左尾面積）

表格通常不列出負的 Z 分數，但我們不需要它們！因為曲線圍繞 0 對稱：

負數值極左側的面積（\(P(Z < -z)\)）與相應正數值極右側的面積（\(P(Z > z)\)）完全相同。

\(P(Z < -z) = P(Z > z) = 1 - \Phi(z)\)

情況 3：求 \(P(Z > -z)\)（負 Z 分數右側的面積）

這是情況 2 的鏡像。如果你想要負數右側的面積（這是一個大面積，包含了 0 以上的整個曲線）：

\(P(Z > -z) = P(Z < z) = \Phi(z)\)

情況 4：求 \(P(z_1 < Z < z_2)\)（兩個數值之間的面積）

要求出兩個數值之間的面積，計算較大數值左側的面積，減去較小數值左側的面積即可。

\(P(z_1 < Z < z_2) = P(Z < z_2) - P(Z < z_1)\)

給學生的解題小撇步：畫個草圖！

務必畫出常態曲線，標出平均值（0），並塗黑你想求出的面積部分。這個視覺輔助會立即告訴你機率應該很大（接近 1）還是很小（接近 0），並指導你選擇正確的公式（1 減去表值，或直接取表值）。

6. 綜合問題：求機率

步驟說明

假設 \(X \sim N(50, 4^2)\)。求 \(P(X < 58)\)。

步驟 1：識別參數。
\(\mu = 50\)。\(\sigma^2 = 4^2 = 16\)。因此，\(\sigma = 4\)。

步驟 2：將變量 \(X\) 標準化為 \(Z\) 分數。
使用 \(Z = \frac{X - \mu}{\sigma}\)。

\(Z = \frac{58 - 50}{4} = \frac{8}{4} = 2.00\)

所以，\(P(X < 58)\) 與 \(P(Z < 2.00)\) 是相同的。

步驟 3：在常態分佈表中查出機率。
找出 \(\Phi(2.00)\)。

\(P(Z < 2.00) = 0.9772\)

步驟 4：結合情境檢查（建議進行）。
由於 58 比平均值高出兩個標準差，經驗法則告訴我們其下方的面積應該很大（超過 95%），所以 0.9772 是一個合理的答案。

7. 反向問題：已知機率求 X

通常，你會得到一個機率（百分比或面積），並被要求找出對應該面積的原始數值 \(X\)。這通常被稱為反向問題（Inverse Problems）。

反向問題的步驟說明

假設 \(X \sim N(50, 4^2)\)。求滿足 \(P(X > x) = 0.10\) 的數值 \(x\)。

步驟 1：將所需機率轉換為「左側面積」。
表格給出的是 \(P(Z < z)\)。如果 \(P(X > x) = 0.10\)，那麼左側面積為 \(P(X < x) = 1 - 0.10 = 0.90\)。

步驟 2：使用反向查表（或將主表倒著看）找出 Z 分數 (\(z\))。
我們在尋找使 \(\Phi(z) = 0.90\) 的 \(z\)。在表格主體中查找 0.9000，大約得到 \(z = 1.282\)。 （由於機率 0.90 大於 0.5，我們知道 Z 分數必須為正）。

步驟 3：將 Z 分數轉換回原始分數 \(X\)。
重新排列標準化公式：

\(X = \mu + Z\sigma\)

代入數值：\(\mu = 50\)，\(\sigma = 4\)，\(Z = 1.282\)。

\(X = 50 + (1.282)(4)\)
\(X = 50 + 5.128 = 55.128\)

步驟 4：結論。
所求數值 \(x\) 為 55.13（取 3 位有效數字）。

處理負 Z 分數的反向問題

如果題目要求的是滿足 \(P(X < x) = 0.10\) 的分數 \(x\) 呢？

左側面積為 0.10。由於 0.10 小於 0.5，該數值 \(x\) 必須低於平均值（\(Z\) 必須為負）。

1. 我們查右側面積，即 \(1 - 0.10 = 0.90\)，以找出 Z 分數的絕對值，\(z_0 = 1.282\)。 2. 因為我們需要的機率（0.10）在左尾，實際需要的 Z 分數為負數：\(Z = -1.282\)。 3. 計算 \(X\)：\(X = 50 + (-1.282)(4) = 50 - 5.128 = 44.872\)。

記憶小撇步： 如果 \(P < 0.5\)，\(Z\) 為負；如果 \(P > 0.5\)，\(Z\) 為正。

最終總結與關鍵要點

你已經成功攻克常態分佈了！請記住這些基本事實：

符號是 \(X \sim N(\mu, \sigma^2\)。小心變異數 (\(\sigma^2\)) 與標準差 (\(\sigma\)) 的區別。
要解決任何問題，必須使用 \(Z = \frac{X - \mu}{\sigma}\) 進行標準化。
表格測量的是標準常態分佈 \(Z \sim N(0, 1)\)。
表格給出的是左側面積，即 \(\Phi(z) = P(Z < z)\)。
利用對稱性及 \(1 - \Phi(z)\) 來求出表格範圍外的面積。
對於反向問題，先求出 Z 分數，然後使用 \(X = \mu + Z\sigma\) 轉換回 \(X\)。

繼續練習你的標準化規則與對稱性技巧。你一定沒問題的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。