歡迎來到統計測度!

你好!本章將帶領你認識並總結數據。無論你是在分析考試分數、溫度記錄還是銷售數字,掌握統計測度的計算方法,都能幫你揭示隱藏在數字背後的訊息。

如果統計學對你來說有點抽象,不用擔心!我們將會把每一個概念——例如計算「平均值」或測量「離散程度」——拆解成簡單且實用的步驟。讓我們開始吧!

我們將涵蓋的內容:

  • 三個主要的平均數:平均數 (Mean)、中位數 (Median) 和眾數 (Mode)(集中趨勢的測度)。
  • 數據的分散程度:全距 (Range)(離散程度的測度)。
  • 從原始數據列表、頻數分佈表以及分組數據中計算這些測度。

1. 集中趨勢的測度(平均數)

集中趨勢的測度是描述一組數據中心位置或典型數值的數值。我們通常稱這些為「平均數」。

1.1. 眾數 (Mode):出現次數最多

眾數 是最容易找到的平均數!它就是數據集中出現 最頻繁 的數值。

  • 關鍵規則: 找出頻數(次數)最高的項目。
  • 一組數據可能有一個眾數(單峰)、多於一個眾數(雙峰、多峰),如果每個數值都只出現一次,則該組數據沒有眾數。

例子: 一組學生提供的幸運數字:3, 5, 2, 5, 1, 9, 5, 3。
數字 5 出現了三次,比其他任何數字出現的次數都多。
眾數是 5。

記憶小撇步: MOde (眾數) 就是出現 MOst Often (最頻繁) 的數。

快速檢測: 如果數據以頻數分佈表呈現,眾數就是對應最高頻數 (f) 的那個數值 (x)。

1.2. 中位數 (Median):中間數值

中位數 是將所有數據點按順序排列(由小到大,或由大到小)後,位於中間的數值。

步驟 1:排列數據。 這是最關鍵的一步!
步驟 2:找出位置。 使用以下位置公式:
\[\text{位置} = \frac{n + 1}{2}\]
其中 \(n\) 是數據點的總數。

情況 1:數據點個數為奇數
如果 \(n\) 是奇數,位置公式會得到一個整數,該整數就是中位數的位置。
例子: 4, 1, 7, 2, 8。(\(n=5\))
1. 排列:1, 2, 4, 7, 8
2. 位置:\(\frac{5 + 1}{2} = 3\)。第 3 個數值就是中位數。
中位數是 4。

情況 2:數據點個數為偶數
如果 \(n\) 是偶數,位置公式會得到一個以 .5 結尾的數。這意味著中位數正好位於中間兩個數值的正中央。你必須計算這兩個中間數值的平均值。
例子: 1, 2, 4, 7, 8, 10。(\(n=6\))
1. 排列:(已排列)
2. 位置:\(\frac{6 + 1}{2} = 3.5\)。這意味著中位數位於第 3 個數值 (4) 和第 4 個數值 (7) 的正中間。
3. 計算 4 和 7 的平均值:\(\frac{4 + 7}{2} = \frac{11}{2} = 5.5\)。
中位數是 5.5。

常見錯誤: 忘記先排列數據!如果你不先排序就直接找中間數,答案會是錯的。

1.3. 平均數 (Mean):計算出來的平均值

平均數(通常直接稱為「平均值」)是所有數值的總和除以數據的個數。當準確性很重要時,這是最常用的統計測度。

平均數 (\(\bar{x}\)) 的公式為:
\[\text{平均數 } (\bar{x}) = \frac{\text{所有數值的總和}}{\text{數據的個數}}\]
數學符號表示:
\[\bar{x} = \frac{\sum x}{n}\]
(符號 \(\sum\) 意指「總和」。)

例子: 求 2, 4, 5, 9 的平均數。(\(n=4\))
1. 總和:\(2 + 4 + 5 + 9 = 20\)
2. 相除:\(\frac{20}{4} = 5\)
平均數是 5。

你知道嗎? 平均數容易受 極端值 (outliers)(遠大於或遠小於其餘數據的數值)影響,而中位數則不受影響。


2. 離散程度的測度(數據的分散程度)

平均數告訴你數據的中心位置,而離散程度的測度則告訴你數據有多 分散

2.1. 全距 (Range)

全距 是最簡單的離散程度測度,它代表數據集中最大值與最小值之間的差。

\[\text{全距} = \text{最大值} - \text{最小值}\]

例子: 一次考試的分數分別是 15, 22, 18, 30, 7。
最大值 = 30
最小值 = 7
全距 = \(30 - 7 = 23\)。

全距越大,代表數據越分散;全距越小,代表數據越集中。

快速複習:平均數與分散程度
  • 平均數: 計算出的平均值(適用於精確數據)。
  • 中位數: 中間數值(當有極端值時最適用)。
  • 眾數: 出現最多次的數值(適用於類別數據)。
  • 全距: 最大值減最小值(衡量整體分散程度)。

3. 從頻數分佈表計算測度

通常數據會以 頻數分佈表 (frequency table) 呈現,顯示每個數值出現的次數。這會使計算方法略有不同,特別是平均數。

設 \(x\) 為數值(例如:兄弟姊妹數量、鞋碼),\(f\) 為頻數(出現的次數)。

3.1. 從離散頻數分佈表計算平均數

在使用頻數表時,你不能直接把 \(x\) 欄的所有數值相加除以個數,因為頻數代表某些數值重複出現了多次。

計算平均數的步驟:

  1. 計算 \(f \times x\): 每一行將數值 (\(x\)) 乘以其頻數 (\(f\)),這會得出該行數據的總貢獻值。
  2. 找出總頻數 (\(\sum f\)): 將頻數欄的所有數字相加,這就是數據的總個數 (\(n\))。
  3. 找出總數值 (\(\sum fx\)): 將 \(f \times x\) 欄的所有數值相加。
  4. 相除: 使用公式:
    \[\text{平均數} = \frac{\sum (f \times x)}{\sum f}\]

例子: 下表顯示了學生的考試分數 (x) 以及取得該分數的人數 (f)。

分數 (x)頻數 (f)f x x
236
5735
10220

總頻數 (\(\sum f\)) = \(3 + 7 + 2 = 12\)
總分 (\(\sum fx\)) = \(6 + 35 + 20 = 61\)
平均數 = \(\frac{61}{12} \approx 5.08\)

3.2. 從離散頻數分佈表找眾數和中位數

眾數:
直接找出 最高頻數 (f) 的那一列,該列對應的數值 (\(x\)) 就是眾數。
(在上例中,最高頻數是 7,對應的分數是 5。眾數 = 5。)

中位數:
1. 計算位置:\(\text{位置} = \frac{\sum f + 1}{2}\)。
2. 使用頻數的累計總和,找出中位數位置落在哪個數值 (\(x\)) 上。
如果 \(\sum f = 12\),位置 = \(\frac{12 + 1}{2} = 6.5\)。你需要找出第 6 個數據與第 7 個數據之間的值。
第 1, 2, 3 個數據是 2。
第 4, 5, 6, 7, 8, 9, 10 個數據是 5。
第 6 和第 7 個數據都是 5。因此,中位數是 5。


4. 處理分組頻數數據(估算)

有時數據會被分組為不同的區間(例如:0-10, 11-20)。當數據分組後,我們失去了個別的原始數值。因此,我們只能 估算 平均數。

4.1. 估算平均數

要從分組頻數表估算平均數,我們假設區間內的所有數值都位於該區間的 組中點 (midpoint)

估算平均數的步驟:

  1. 找出組中點 (\(m\)): 計算每個區間的中間值。
    \[\text{組中點 } (m) = \frac{\text{下限} + \text{上限}}{2}\]
  2. 計算 \(f \times m\): 將頻數 (\(f\)) 乘以組中點 (\(m\))。這是該組總數值的估算值。
  3. 找出總頻數 (\(\sum f\)) 和總估算數值 (\(\sum fm\))。
  4. 相除: 使用估算公式:
    \[\text{估算平均數} = \frac{\sum (f \times m)}{\sum f}\]

例子: 若一個區間是 10 到 20:
組中點 \(m = \frac{10 + 20}{2} = 15\)。你將使用 15 作為該組的代表數值 (\(x\))。

類比: 想像一下,如果你只知道十個箱子每個重 5 公斤到 15 公斤之間,要估算總重量,最好的假設就是它們每個都重 10 公斤(組中點)。

4.2. 眾數組與中位數組

處理分組數據時,我們找出的是 眾數組 (Modal Class) 而不是確切的眾數。

  • 眾數組: 擁有 最高頻數 (f) 的區間。
  • 中位數組: 包含中位數位置 (\(\frac{\sum f}{2}\)) 的區間。你可以通過檢查頻數累計總和何時跨過中位數位置來確定。

注意:無需 從分組頻數表中求出確切的中位數值(這需要插值法),只需找出它所在的區間即可。

小提醒!估算注意事項

務必記住,在計算分組數據的平均數時,要使用 估算 (estimate) 這個詞。由於你是使用組中點計算的,結果只是近似值,而非確切的平均數。


5. 關鍵技巧總結

複習計算流程

為了確保你能攻克所有關於統計測度的題目,請使用以下清單:

  • 原始數據 (列表):
    • 平均數:總和 / 個數。
    • 中位數:排列數據,找出中間位置 \(\frac{n+1}{2}\)。
    • 眾數:計算頻數。
    • 全距:最大值 - 最小值。
  • 頻數分佈表 (離散):
    • 平均數:計算 \(\sum fx\),除以 \(\sum f\)。
    • 中位數:找出位置 \(\frac{\sum f + 1}{2}\) 並查看對應的 \(x\)。
    • 眾數:最高頻數 \(f\) 對應的 \(x\)。
  • 分組頻數表:
    • 平均數:估算!使用組中點 \(m\),計算 \(\sum fm\),除以 \(\sum f\)。
    • 眾數組:頻數 \(f\) 最高的區間。

恭喜!你現在已經掌握了總結、分析和傳達數據集中最重要特徵的工具。繼續練習這些步驟,特別是使用 \(f \times x\) 計算平均數,很快你就能精通這一章了!