歡迎來到數據摘要!
在本章中,我們將學習如何將一大堆數據濃縮成兩個非常重要的數值:平均數 (mean) 和 標準差 (standard deviation)。平均數告訴我們數據的「中心」在哪裡,而標準差則告訴我們數據有多「分散」或多「穩定」。想像一下天氣預報——平均數是該月的平均溫度,但標準差會告訴你每天的氣溫是否都維持在這個水平,還是說氣溫會在冰點與沸點之間劇烈波動!
如果公式起初看起來有點嚇人,不用擔心。 我們會一步一步拆解它們,你會發現它們就像製作蛋糕的食譜一樣簡單。
1. 算術平均數 \(\bar{x}\)
平均數(符號為 \(\bar{x}\),讀作 "x-bar")就是大多數人所說的「平均值」。如果你把所有東西平均分配,每人分得的數值就是平均數。
從數列計算
要計算一組簡單數列的平均數,只需將它們全部加起來,然後除以數據的個數即可。
\(\bar{x} = \frac{\sum x}{n}\)
其中:
\(\sum x\) 代表「所有數值的總和」。
\(n\) 是數列中數值的個數。
從頻數分佈表計算
如果你有一個數值出現多次的表格,你需要先將每個數值 (\(x\)) 乘以它的頻數 (\(f\))。
\(\bar{x} = \frac{\sum fx}{\sum f}\)
例子:如果有 3 個人各有 2 隻寵物,而 5 個人各有 1 隻寵物,你不能只做 2 + 1。你需要計算 \((3 \times 2) + (5 \times 1)\),然後除以總人數 (8)。
快速檢視: 平均數是一個「公平分配」的數值。請務必檢查你的答案是否合理——它必須介於數據中的最大值和最小值之間!
2. 理解變異:方差與標準差
平均數固然很好,但它無法說明全貌。想像兩名射箭選手。兩人的命中點「平均」都在靶心。選手 A 的所有箭都集中在靶心的緊密區域內;選手 B 的箭則散落在整個靶盤上,但它們的「平均」位置也在中心。我們需要一種方法來衡量這種「散佈」程度。
關鍵術語
1. 方差 (\(\sigma^2\)): 與平均數差值的平方的平均值。
2. 標準差 (\(\sigma\)): 方差的平方根。這能將測量單位還原為原始數據的單位。
你知道嗎? 我們將與平均數的差值平方,是因為有些差值是正的,有些是負的。如果我們只是將它們相加,它們會互相抵消變成零!平方能確保所有數值都變為正數。
3. 標準差的公式
在 OCR H240 考試中,你需要熟悉兩種形式的公式。它們看起來不同,但計算出的答案完全相同。
形式 A:「定義」公式
\(\sigma = \sqrt{\frac{\sum (x - \bar{x})^2}{n}}\)
這清楚地告訴你什麼是標準差:即與平均數的差值平方的平均數的平方根。
形式 B:「計算」公式(又稱「運算」公式)
這個版本在計算機上使用時通常快得多:
\(\sigma = \sqrt{\frac{\sum x^2}{n} - \bar{x}^2}\)
記憶小撇步: 一個簡單的記憶方法是「平方的平均值減去平均值的平方(然後全部開根號!)」。
常見錯誤: 學生經常忘記在最後一步開平方根。如果你的「離散度」數值看起來比原始數據值大得多,請檢查一下是否不小心留下了方差,而不是標準差。
4. 分組頻數分佈
有時數據會被分成組別(例如:身高:\(150 \le h < 160\))。因為我們不知道該組內每個人的確切身高,我們會使用該組的組中點 (midpoint) 作為 \(x\) 值。
分組數據的標準差公式為:
\(\sigma = \sqrt{\frac{\sum fx^2}{\sum f} - \bar{x}^2}\)
重點: 因為我們使用的是組中點,所以從分組數據計算出的平均數和標準差永遠是估算值,而不是確切值。
要點: 如果題目問為什麼你的答案是估算值,答案是:「因為各組內的確切數值未知,所以使用了組中點。」
5. 使用你的計算機
對於 OCR H240 課程,你應該學會使用計算機上的統計功能來快速得出這些數值。
操作步驟:
1. 進入 "Stat" 或 "Data" 模式。
2. 輸入你的數據列(或頻數表)。
3. 查找 "Variable" 或 "Results" 按鈕。
4. 找到 \(\bar{x}\) 作為平均數,\(\sigma x\) 作為標準差。
注意:你的計算機可能會顯示 \(s_x\)(樣本標準差)和 \(\sigma x\)(總體標準差)。對於此課程,你應該專注於 \(\sigma x\) 版本(即除以 \(n\) 的那個)。
6. 比較數據集
一個非常常見的考題是給你兩組不同的數據(例如:A 班和 B 班的考試成績),並要求你進行比較。你必須針對平均數和離散程度兩方面進行評論。
如何寫出答案:
1. 比較平均數: 「平均而言,A 班的成績優於 B 班,因為他們的平均數較高 (\(65 > 58\))。」
2. 比較標準差: 「A 班比 B 班更穩定,因為他們的標準差較低 (\(5 < 12\))。」
關鍵法則: 標準差越小,代表數據越穩定或越集中。標準差越大,代表數據越分散或差異越大。
最終總結清單
快速檢視表:
• 平均數 (\(\bar{x}\)): 數據的平均值 /「中心」。
• 標準差 (\(\sigma\)): 衡量離散度 /「穩定性」的指標。
• 方差 (\(\sigma^2\)): 標準差的平方。
• 分組數據: 使用組中點;結果為估算值。
• 比較: 平均數高 = 平均水平較高;標準差低 = 更穩定。