歡迎來到統計測度!
你好!本章將帶領你認識並總結數據。無論你是在分析考試分數、溫度記錄還是銷售數字,掌握統計測度的計算方法,都能幫你揭示隱藏在數字背後的訊息。
如果統計學對你來說有點抽象,不用擔心!我們將會把每一個概念——例如計算「平均值」或測量「離散程度」——拆解成簡單且實用的步驟。讓我們開始吧!
我們將涵蓋的內容:
- 三個主要的平均數:平均數 (Mean)、中位數 (Median) 和眾數 (Mode)(集中趨勢的測度)。
- 數據的分散程度:全距 (Range)(離散程度的測度)。
- 從原始數據列表、頻數分佈表以及分組數據中計算這些測度。
1. 集中趨勢的測度(平均數)
集中趨勢的測度是描述一組數據中心位置或典型數值的數值。我們通常稱這些為「平均數」。
1.1. 眾數 (Mode):出現次數最多
眾數 是最容易找到的平均數!它就是數據集中出現 最頻繁 的數值。
- 關鍵規則: 找出頻數(次數)最高的項目。
- 一組數據可能有一個眾數(單峰)、多於一個眾數(雙峰、多峰),如果每個數值都只出現一次,則該組數據沒有眾數。
例子: 一組學生提供的幸運數字:3, 5, 2, 5, 1, 9, 5, 3。
數字 5 出現了三次,比其他任何數字出現的次數都多。
眾數是 5。
記憶小撇步: MOde (眾數) 就是出現 MOst Often (最頻繁) 的數。
1.2. 中位數 (Median):中間數值
中位數 是將所有數據點按順序排列(由小到大,或由大到小)後,位於中間的數值。
步驟 1:排列數據。 這是最關鍵的一步!
步驟 2:找出位置。 使用以下位置公式:
\[\text{位置} = \frac{n + 1}{2}\]
其中 \(n\) 是數據點的總數。
情況 1:數據點個數為奇數
如果 \(n\) 是奇數,位置公式會得到一個整數,該整數就是中位數的位置。
例子: 4, 1, 7, 2, 8。(\(n=5\))
1. 排列:1, 2, 4, 7, 8
2. 位置:\(\frac{5 + 1}{2} = 3\)。第 3 個數值就是中位數。
中位數是 4。
情況 2:數據點個數為偶數
如果 \(n\) 是偶數,位置公式會得到一個以 .5 結尾的數。這意味著中位數正好位於中間兩個數值的正中央。你必須計算這兩個中間數值的平均值。
例子: 1, 2, 4, 7, 8, 10。(\(n=6\))
1. 排列:(已排列)
2. 位置:\(\frac{6 + 1}{2} = 3.5\)。這意味著中位數位於第 3 個數值 (4) 和第 4 個數值 (7) 的正中間。
3. 計算 4 和 7 的平均值:\(\frac{4 + 7}{2} = \frac{11}{2} = 5.5\)。
中位數是 5.5。
常見錯誤: 忘記先排列數據!如果你不先排序就直接找中間數,答案會是錯的。
1.3. 平均數 (Mean):計算出來的平均值
平均數(通常直接稱為「平均值」)是所有數值的總和除以數據的個數。當準確性很重要時,這是最常用的統計測度。
平均數 (\(\bar{x}\)) 的公式為:
\[\text{平均數 } (\bar{x}) = \frac{\text{所有數值的總和}}{\text{數據的個數}}\]
數學符號表示:
\[\bar{x} = \frac{\sum x}{n}\]
(符號 \(\sum\) 意指「總和」。)
例子: 求 2, 4, 5, 9 的平均數。(\(n=4\))
1. 總和:\(2 + 4 + 5 + 9 = 20\)
2. 相除:\(\frac{20}{4} = 5\)
平均數是 5。
你知道嗎? 平均數容易受 極端值 (outliers)(遠大於或遠小於其餘數據的數值)影響,而中位數則不受影響。
2. 離散程度的測度(數據的分散程度)
平均數告訴你數據的中心位置,而離散程度的測度則告訴你數據有多 分散。
2.1. 全距 (Range)
全距 是最簡單的離散程度測度,它代表數據集中最大值與最小值之間的差。
\[\text{全距} = \text{最大值} - \text{最小值}\]
例子: 一次考試的分數分別是 15, 22, 18, 30, 7。
最大值 = 30
最小值 = 7
全距 = \(30 - 7 = 23\)。
全距越大,代表數據越分散;全距越小,代表數據越集中。
快速複習:平均數與分散程度
- 平均數: 計算出的平均值(適用於精確數據)。
- 中位數: 中間數值(當有極端值時最適用)。
- 眾數: 出現最多次的數值(適用於類別數據)。
- 全距: 最大值減最小值(衡量整體分散程度)。
3. 從頻數分佈表計算測度
通常數據會以 頻數分佈表 (frequency table) 呈現,顯示每個數值出現的次數。這會使計算方法略有不同,特別是平均數。
設 \(x\) 為數值(例如:兄弟姊妹數量、鞋碼),\(f\) 為頻數(出現的次數)。
3.1. 從離散頻數分佈表計算平均數
在使用頻數表時,你不能直接把 \(x\) 欄的所有數值相加除以個數,因為頻數代表某些數值重複出現了多次。
計算平均數的步驟:
- 計算 \(f \times x\): 每一行將數值 (\(x\)) 乘以其頻數 (\(f\)),這會得出該行數據的總貢獻值。
- 找出總頻數 (\(\sum f\)): 將頻數欄的所有數字相加,這就是數據的總個數 (\(n\))。
- 找出總數值 (\(\sum fx\)): 將 \(f \times x\) 欄的所有數值相加。
- 相除: 使用公式:
\[\text{平均數} = \frac{\sum (f \times x)}{\sum f}\]
例子: 下表顯示了學生的考試分數 (x) 以及取得該分數的人數 (f)。
| 分數 (x) | 頻數 (f) | f x x |
|---|---|---|
| 2 | 3 | 6 |
| 5 | 7 | 35 |
| 10 | 2 | 20 |
總頻數 (\(\sum f\)) = \(3 + 7 + 2 = 12\)
總分 (\(\sum fx\)) = \(6 + 35 + 20 = 61\)
平均數 = \(\frac{61}{12} \approx 5.08\)
3.2. 從離散頻數分佈表找眾數和中位數
眾數:
直接找出 最高頻數 (f) 的那一列,該列對應的數值 (\(x\)) 就是眾數。
(在上例中,最高頻數是 7,對應的分數是 5。眾數 = 5。)
中位數:
1. 計算位置:\(\text{位置} = \frac{\sum f + 1}{2}\)。
2. 使用頻數的累計總和,找出中位數位置落在哪個數值 (\(x\)) 上。
如果 \(\sum f = 12\),位置 = \(\frac{12 + 1}{2} = 6.5\)。你需要找出第 6 個數據與第 7 個數據之間的值。
第 1, 2, 3 個數據是 2。
第 4, 5, 6, 7, 8, 9, 10 個數據是 5。
第 6 和第 7 個數據都是 5。因此,中位數是 5。
4. 處理分組頻數數據(估算)
有時數據會被分組為不同的區間(例如:0-10, 11-20)。當數據分組後,我們失去了個別的原始數值。因此,我們只能 估算 平均數。
4.1. 估算平均數
要從分組頻數表估算平均數,我們假設區間內的所有數值都位於該區間的 組中點 (midpoint)。
估算平均數的步驟:
- 找出組中點 (\(m\)): 計算每個區間的中間值。
\[\text{組中點 } (m) = \frac{\text{下限} + \text{上限}}{2}\] - 計算 \(f \times m\): 將頻數 (\(f\)) 乘以組中點 (\(m\))。這是該組總數值的估算值。
- 找出總頻數 (\(\sum f\)) 和總估算數值 (\(\sum fm\))。
- 相除: 使用估算公式:
\[\text{估算平均數} = \frac{\sum (f \times m)}{\sum f}\]
例子: 若一個區間是 10 到 20:
組中點 \(m = \frac{10 + 20}{2} = 15\)。你將使用 15 作為該組的代表數值 (\(x\))。
類比: 想像一下,如果你只知道十個箱子每個重 5 公斤到 15 公斤之間,要估算總重量,最好的假設就是它們每個都重 10 公斤(組中點)。
4.2. 眾數組與中位數組
處理分組數據時,我們找出的是 眾數組 (Modal Class) 而不是確切的眾數。
- 眾數組: 擁有 最高頻數 (f) 的區間。
- 中位數組: 包含中位數位置 (\(\frac{\sum f}{2}\)) 的區間。你可以通過檢查頻數累計總和何時跨過中位數位置來確定。
注意: 你 無需 從分組頻數表中求出確切的中位數值(這需要插值法),只需找出它所在的區間即可。
務必記住,在計算分組數據的平均數時,要使用 估算 (estimate) 這個詞。由於你是使用組中點計算的,結果只是近似值,而非確切的平均數。
5. 關鍵技巧總結
複習計算流程
為了確保你能攻克所有關於統計測度的題目,請使用以下清單:
- 原始數據 (列表):
- 平均數:總和 / 個數。
- 中位數:排列數據,找出中間位置 \(\frac{n+1}{2}\)。
- 眾數:計算頻數。
- 全距:最大值 - 最小值。
- 頻數分佈表 (離散):
- 平均數:計算 \(\sum fx\),除以 \(\sum f\)。
- 中位數:找出位置 \(\frac{\sum f + 1}{2}\) 並查看對應的 \(x\)。
- 眾數:最高頻數 \(f\) 對應的 \(x\)。
- 分組頻數表:
- 平均數:估算!使用組中點 \(m\),計算 \(\sum fm\),除以 \(\sum f\)。
- 眾數組:頻數 \(f\) 最高的區間。
恭喜!你現在已經掌握了總結、分析和傳達數據集中最重要特徵的工具。繼續練習這些步驟,特別是使用 \(f \times x\) 計算平均數,很快你就能精通這一章了!