歡迎來到常態分佈的世界!
嘿,統計學家!準備好探索統計學中最重要的一個分佈:常態分佈 (The Normal Distribution)。它有時也被稱為高斯分佈 (Gaussian distribution),在現實生活中描述了無數的現象,從人類的身高、智商分數,到製造過程中的誤差和測量公差,無處不在。
理解這一章至關重要,因為它為你提供了處理連續數據並計算機率的工具,讓你幾乎可以分析所有符合著名的「鐘形曲線」形態的數據。如果某些概念看起來很理論化,也不用擔心——我們會一步一步地拆解,確保你能夠精準掌握查表技巧!
1. 定義常態分佈
1.1 鐘形曲線的特徵
常態分佈是一種由兩個關鍵參數定義的連續機率分佈 (continuous probability distribution)。
想像一下測量一所大學裡每一位學生的身高。大多數學生都集中在平均身高附近,而極矮或極高的人非常少。當你將這些數據繪製出來時,就會得到典型的鐘形曲線 (bell shape)。
- 對稱性:曲線以其中心為軸,呈現完美對稱。
- 平均值 = 中位數 = 眾數:曲線的最高點(眾數)同時也是平均值(mean)和中間值(中位數)。
- 漸近線:曲線會無限接近水平軸,但永遠不會真正觸碰到它(它在兩個方向上都延伸至無限大)。
- 總面積:曲線下的總面積恰好為 1(因為總機率必須等於 1)。
1.2 常態分佈的符號表示
我們使用特定的符號來描述一個服從常態分佈的變數 \(X\):
$$X \sim N(\mu, \sigma^2)$$
讓我們拆解一下這些參數:
- \(\mu\) (Mu):這是分佈的平均值 (mean)。它決定了鐘形曲線的中心位置。
- \(\sigma^2\) (Sigma Squared):這是變異數 (variance)。它衡量數據的離散程度。
- \(\sigma\) (Sigma):變異數的平方根,即標準差 (standard deviation)。這決定了曲線的形狀。較大的 \(\sigma\) 表示曲線更寬、更扁平(分佈更分散)。
小貼士:務必記住,符號中使用的是變異數 (\(\sigma^2\)),但幾乎所有的計算都使用標準差 (\(\sigma\))。如果題目給你 \(\sigma^2 = 25\),你必須在公式中使用 \(\sigma = 5\)!
重點摘要:常態分佈是對稱的,並且完全由其平均值 (\(\mu\)) 和變異數 (\(\sigma^2\)) 定義。
2. 標準常態分佈 (Z-分數)
2.1 為何需要標準化?
想像一下,要比較一個身高 180 cm 的數據(來自平均值為 170 cm 的母體)與一個 IQ 115 的分數(來自平均值為 100 的母體)。這些是不同的變數,具有不同的平均值和標準差。我們如何客觀地比較它們?
我們需要一個通用的標度!這個標度就是標準常態分佈 (Standard Normal Distribution)。
標準常態分佈(通常以變數 \(Z\) 表示)是一個特殊的常態分佈,其中:
- 平均值為 0:\(\mu = 0\)
- 標準差為 1:\(\sigma = 1\)(且變異數 \(\sigma^2 = 1\))
我們寫作:$$Z \sim N(0, 1)$$
2.2 Z-分數公式(標準化)
標準化 (Standardisation) 是將任何常態分佈變數 \(X\) 轉換為標準變數 \(Z\) 的過程。
Z-分數 (Z-score)(也稱為標準化分數)的計算公式為:
$$Z = \frac{X - \mu}{\sigma}$$
Z-分數代表什麼?
Z-分數告訴你數值 \(X\) 距離平均值 (\(\mu\)) 具體有多少個標準差 (\(\sigma\))。
例子: 如果學生在測試中取得 \(X=80\),而該次測試 \(\mu=60\),\(\sigma=10\)。
$$Z = \frac{80 - 60}{10} = 2$$
這意味著該學生的得分高出平均值 2 個標準差。
類比:將 Z-分數視為一把通用的捲尺。如果你將兩個分數標準化,你就可以直接比較它們相對於各自母體平均值和離散程度的極端程度。
重點摘要:標準化將任何 X 值轉換為 Z-分數,讓我們可以使用通用的 Z-表來找出機率。公式為 \(Z = \frac{X - \mu}{\sigma}\)。
3. 使用標準常態分佈表
一旦你將數值 \(X\) 標準化為 Z-分數,你就可以在考試提供的公式手冊中的常態分佈表中查出機率。
3.1 理解分佈表
表格給出的是標準化變數 \(Z\) 小於或等於 (less than or equal to) 一個正值 \(z\) 的機率。這通常表示為 \(\Phi(z)\) (Phi of z)。
表中圖示的陰影區域始終代表: $$P(Z \le z)$$
重要規則:表格僅適用於正的 Z-分數 (\(z \ge 0\))。對於負的 Z-分數,我們需要利用曲線的對稱性。
3.2 對稱性規則(基本功!)
在計算機率時,你會遇到三種主要情況:
情況 1:求正 Z-分數以下的面積。
$$P(Z \le z)$$
操作: 直接在表中查出 \(z\) 對應的值。
情況 2:求正 Z-分數以上的面積。
$$P(Z > z)$$
因為曲線下的總面積為 1,所以這是剩餘的區域:
操作: 計算 \(1 - P(Z \le z)\)。
記憶法:「大於等於,用 1 減去」。
情況 3:求負 Z-分數以下的面積。
$$P(Z \le -z)$$
由於曲線是對稱的,左側尾部的面積與右側尾部的面積相同:
$$P(Z \le -z) = P(Z > z)$$
操作: 使用情況 2 的規則:\(1 - P(Z \le z)\)。
情況 4:求兩個 Z-分數之間的面積。
$$P(a < Z < b)$$
操作: 找出到達 \(b\) 的面積,減去到達 \(a\) 的面積: $$P(Z \le b) - P(Z \le a)$$
避免常見錯誤:一定要畫草圖!務必畫一個簡單的鐘形曲線,塗上你需要求的區域,並判斷使用哪種規則(1、2 或 3)。這能有效防止符號錯誤。
對稱性範例
假設你計算出 \(z = 1.50\)。求 \(P(Z > 1.50)\)。
1. 在表中查出 \(P(Z \le 1.50) = 0.9332\)。
2. 應用情況 2:\(P(Z > 1.50) = 1 - 0.9332 = 0.0668\)。
求 \(P(Z < -1.50)\)。
1. 應用情況 3:\(P(Z < -1.50) = P(Z > 1.50)\)。
2. 結果相同:\(0.0668\)。
重點摘要:表格只給出 \(P(Z \le z)\)。利用總機率為 1 的特性和曲線的對稱性,來求 \(z\) 以上或 \(-z\) 以下的區域機率。
4. 反向常態分佈計算(逆向推算)
有時題目會給你機率(面積),要求你找出原始數值 \(X\) 或標準化分數 \(Z\)。這稱為反向常態分佈 (Inverse Normal Distribution) 問題。
4.1 反向處理步驟
1. 畫圖並調整:畫出曲線並標示出給定的機率區域。確定對應於左側區域(即表格給出的格式)的正 Z-分數 (\(z\))。如果給定的機率在尾部,你必須進行調整(通常是使用「1 減去」),使其符合 \(P(Z \le z)\) 的格式。
2. 尋找 \(z\):使用反向常態分佈表(或將主表倒過來看),找出對應該累積機率的 Z-分數 \(z\)。
3. 確定符號:如果要求的數值 \(X\) 在平均值以下,則 Z-分數必須為負(即 \(Z = -z\))。如果 \(X\) 在平均值以上,則為正(即 \(Z = +z\))。
4. 取消標準化:重排標準化公式來求出 \(X\): $$\mathbf{X = \mu + Z\sigma}$$
範例:求 X
蘋果重量服從常態分佈,\(\mu=150\)g,\(\sigma=10\)g。求蘋果重量 \(k\),使得 90% 的蘋果重量小於 \(k\)。
1. 畫圖並調整:我們求的是 \(P(X < k) = 0.90\)。由於 0.90 大於 0.5,\(k\) 必須在平均值以上,因此 \(Z\) 為正。
2. 尋找 \(z\):在表中尋找最接近 0.9000 的機率。
(使用標準常態分佈表,0.9000 對應的 \(z \approx 1.28\))。
3. 確定符號:因為 \(k\) 在平均值以上,所以 \(Z = +1.28\)。
4. 取消標準化: $$k = \mu + Z\sigma$$ $$k = 150 + (1.28)(10)$$ $$k = 150 + 12.8 = 162.8 \text{ 克}$$
你知道嗎?Z-分數 \(Z=1.645\)(對應 95% 累積面積)和 \(Z=2.326\)(對應 99% 累積面積)非常常見,通常會出現在你的公式表中的臨界值表格部分。
重點摘要:反向問題涉及先使用機率在表中找到 Z-分數,然後利用 \(X = \mu + Z\sigma\) 轉換回原始單位。
5. 求解未知參數 (\(\mu\) 或 \(\sigma\))
最挑戰性的常態分佈問題通常是要求出未知的平均值 \(\mu\) 或標準差 \(\sigma\),甚至兩者皆未知。這類問題幾乎都需要利用 Z-分數公式列方程組來解決。
5.1 兩點問題
如果你被要求同時求出 \(\mu\) 和 \(\sigma\),題目一定會給予兩個機率資訊(兩個不同的 X 分數及其對應的機率)。
步驟:
- 標準化第一個點:對於第一個資訊 (\(X_1\)),使用反向常態分佈法(對稱性規則和查表)將給定的機率轉換為 Z-分數 (\(Z_1\))。
- 建立方程 1:將 \(X_1\)、\(Z_1\)、\(\mu\) 和 \(\sigma\) 代入標準化公式的變形: $$X_1 = \mu + Z_1\sigma$$
- 標準化第二個點:對第二個資訊 (\(X_2\)) 重複上述過程,求出 \(Z_2\)。
- 建立方程 2: $$X_2 = \mu + Z_2\sigma$$
- 聯立求解:解這兩個關於 \(\mu\) 和 \(\sigma\) 的線性方程組。
鼓勵:如果 Z-分數的符號看起來很複雜,請不要擔心——只需格外小心。記住,任何低於平均值的 \(X\) 分數一定會產生負的 Z-分數,任何高於平均值的 \(X\) 分數一定會產生正的 Z-分數。
5.2 常見錯誤:Z-分數符號
如果你被告知 5% 的分數小於 12 (即 \(P(X < 12) = 0.05\)):
- 由於 0.05 是一個小機率 (< 0.5),所以分數 \(X=12\) 位於左側尾部,意味著它低於平均值。
- 對應累積面積為 0.05 的 Z-分數必須是負的。
- (如果 \(P(Z < -z) = 0.05\),則 \(P(Z > z) = 0.05\)。正的 z-分數是 1.645,因此所需的 Z-分數為 \(Z = -1.645\)。)
- 你的方程式必須是:\(12 = \mu - 1.645\sigma\)
快速複習:常態分佈檢查清單
- 確認 \(\mu\) 和 \(\sigma\)(注意變異數與標準差的區別)。
- 畫草圖!(對於視覺化區域和判斷 Z-分數符號至關重要)。
- 標準化:使用 \(Z = \frac{X - \mu}{\sigma}\) 將 \(X\) 轉換為 \(Z\)。
- 使用分佈表:必要時利用對稱性(1 減去規則)調整機率。
- 反向問題:機率 \(\to\) Z-分數 \(\to\) X。
- 參數問題:建立聯立方程式 \(X = \mu + Z\sigma\)。