歡迎來到鐘形曲線的世界!
在本章中,我們將探討統計學中最重要的概念之一:常態分佈 (Normal Distribution)。你可能聽過它被稱為「鐘形曲線」,這是因為它具有獨特的形狀。無論是身高、考試分數,還是甚至一包薯片的重量,現實世界中許多事物都遵循這種規律。看完這些筆記後,你將能夠掌握這些曲線背後的數學原理,並像專家一樣利用它們來預測機率!
如果起初覺得這些內容有點抽象,不用擔心。我們會一步一步來,很快你就會發現常態分佈無處不在!
1. 理解連續隨機變數
在深入探討常態分佈之前,我們需要先了解什麼是連續隨機變數 (Continuous Random Variable)。與離散 (Discrete) 變數(你可以數出具體數值,如 0, 1, 2, 3)不同,連續 變數是指你可以測量的事物。
可以這樣理解:
如果你計算班上的學生人數,那是離散的(你不可能有 20.5 個學生)。
如果你測量這些學生的身高,那就是連續的(學生身高可能是 170 公分、170.1 公分,甚至是 170.154 公分)。
關鍵區別: 對於連續變數,變數等於特定數值的機率為零 \( (P(X = x) = 0) \)。相反,我們通常尋求的是變數落在某個範圍內的機率,例如 \( P(160 < X < 170) \)。
快速複習:
- 離散:可數的(例如:藍色筆的數量)。
- 連續:可測量的(例如:跑完一場比賽所需的時間)。
- 我們透過計算曲線下的面積來求出連續變數的機率。
2. 什麼是常態分佈?
常態分佈是一種特定類型的連續機率分佈。我們記作:\( X \sim N(\mu, \sigma^2) \)。
有兩個「大佬」控制著這條曲線的外觀:
- 平均值 (\(\mu\)): 這是曲線的中心,它告訴你峰值位於何處。
- 變異數 (\(\sigma^2\)): 這告訴你曲線有多「分散」。(注意:\(\sigma\) 是標準差)。
常態曲線的特性:
- 對稱性: 左側是右側的鏡像。
- 鐘形: 中間有一個峰值。
- 「三者相等」: 在完美的常態分佈中,平均值 = 中位數 = 眾數。
- 總面積 = 1: 因為任何事件的總機率必須等於 100%。
你知道嗎? 因為曲線是對稱的,所以平均值以下剛好佔 0.5 (或 50%) 的數據,平均值以上也佔 0.5!
重點總結: 常態分佈完全由其平均值和變異數定義。只要知道這兩個參數,你就掌握了整條曲線。
3. 標準常態分佈 (\(Z\))
由於 \(\mu\) 和 \(\sigma^2\) 有無限種組合,數學家創造了一種「萬用翻譯機」,稱為標準常態分佈,用字母 \(Z\) 表示。
標準常態分佈總是滿足:
平均值 \((\mu) = 0\)
變異數 \((\sigma^2) = 1\)
因此,我們記作:\( Z \sim N(0, 1) \)。
標準化公式:
要將任何值 \(X\) 轉換為 \(Z\)-分數,我們使用以下公式:
\( Z = \frac{X - \mu}{\sigma} \)
類比: 把 \(X\) 想像成本地貨幣(如日圓),把 \(Z\) 想像成全球通用貨幣(如美元)。這個公式就是「匯率」,讓你可以把不同的曲線放在同一個尺度下進行比較。
記憶小撇步:
「X 是定位點,減去平均值,再除以離散程度(標準差)。」
4. 使用你的圖形計算機 (GC)
在 H2 課程大綱中,你不需要手動計算這些機率。你的 GC 是你最好的朋友!
A. 求機率:normCDF
當你擁有數值並想求機率(面積)時使用。
語法:normCDF(下限, 上限, \(\mu\), \(\sigma\))
B. 求數值:invNorm
當題目給予機率(左側面積)並需要求數值 \(x\) 時使用。
語法:invNorm(左側面積, \(\mu\), \(\sigma\))
常見錯誤: 務必檢查題目給的是變異數 (\(\sigma^2\)) 還是標準差 (\(\sigma\))。GC 需要的是標準差 \(\sigma\)。如果題目給出 \(\sigma^2 = 16\),你輸入時必須換算成 \(\sigma = 4\)!
5. 常態變數的線性變換
有時我們會想改變變數。例如,如果 \(X\) 是員工的日薪,如果每個人都獲得 10 元獎金且薪水加倍,會發生什麼事?
若 \( X \sim N(\mu, \sigma^2) \),且我們建立一個新變數 \( Y = aX + b \):
- 新平均值: \( E(aX + b) = aE(X) + b \)
- 新變異數: \( Var(aX + b) = a^2Var(X) \)
等等,為什麼是 \(a^2\)? 變異數衡量的是面積或離散程度。如果你將長度加倍 (\(a=2\)),面積會增加 \(2^2 = 4\) 倍。此外,請注意加上常數 (\(b\)) 不會改變變異數。如果每個人都向右移動 10 步,群體的離散程度依然與原來相同!
重點總結: 縮放 (\(a\)) 會同時影響平均值和變異數。平移 (\(b\)) 只會影響平均值。
6. 獨立變數的線性組合
如果我們將兩個不同的獨立常態變數加在一起會怎樣?(例如:箱子的重量 \(X\) 和裡面水果的重量 \(Y\))。
若 \( X \sim N(\mu_X, \sigma_X^2) \) 和 \( Y \sim N(\mu_Y, \sigma_Y^2) \) 是獨立的:
平均值法則:
\( E(aX + bY) = aE(X) + bE(Y) \)
變異數法則:
\( Var(aX + bY) = a^2Var(X) + b^2Var(Y) \)
關鍵點: 即使你是將兩個變數相減 \( (X - Y) \),你也必須相加變異數!
\( Var(X - Y) = Var(X) + Var(Y) \)
為什麼? 把變異數想像成「不確定性」。如果你結合兩個不確定的事物,總體的不確定性總是會增加,無論你是相加還是相減實際數值。
7. 總結清單與專業建議
在練習習題之前,請記住以下建議:
- 檢查獨立性: 只有在變數相互獨立時,才能將變異數相加。
- 畫出曲線: 在解決機率問題時,務必畫出一個簡單的鐘形曲線並標示出你要求的區域。這能防止粗心錯誤!
- 符號標記: 小心 \( N(\mu, \sigma^2) \)。許多題目寫成 \( N(50, 4) \),請務必問自己:「這 4 是變異數還是標準差?」(通常是變異數)。
- 對稱性: 記住 \( P(X > \mu + k) = P(X < \mu - k) \)。利用這一點,在沒有 GC 的情況下也能解決棘手問題。
做得好!你已經掌握了常態分佈的精髓。這看起來像是一堆公式,但透過練習,使用 GC 和標準化公式將會變成你的本能。繼續努力!