歡迎來到統計學的核心!

你有沒有想過電子遊戲中的「典型」分數是多少?或者普通人的「平均」收入是多少?在統計學中,我們不只是猜測;我們會使用集中趨勢測量值(Measures of Central Tendency)。這些是找出數據集「中心」的聰明方法。把它想像成找出能總結整堆數字的「典型」或「具代表性」的數值。

在本章中,我們將探討「三大指標」(眾數、中位數和平均數),學習如何處理分組數據,並探索專家使用的一些特殊平均值。如果一開始看起來有點「數學味」也不用擔心——我們會一步一步來!

1. 「三大」平均值

找出平均值的方法不只一種。根據你所分析的數據類型,某些方法可能比其他方法更適合。

眾數(「最常見」的數值)

眾數(Mode)是數據集中出現頻率最高的數值。
記憶小撇步: MOde(眾數) = MOst common(最常見)。
例子:在集合 {2, 3, 3, 5, 8} 中,眾數是 3,因為它出現了兩次。

重點複習:
• 如果沒有數字重複,則沒有眾數
• 如果兩個數字重複出現的次數相同,則稱為雙眾數(bimodal)
• 對於分組數據,我們稱之為眾數組(Modal Class)(即頻率最高的組別)。

中位數(「中間」的數值)

中位數(Median)是將數據排序後位於中間的數值。
記憶小撇步: 「Median」就像馬路中間的分隔帶!
步驟:
1. 將數字由小到大排列。
2. 使用公式找出位置:\( \frac{n+1}{2} \),其中 \( n \) 是數據的總數量。
3. 如果你的數值總數是偶數,中位數就是中間兩個數值的平均值

平均數(「算術平均值」)

這就是大多數人說「平均」時的意思。你將所有數值相加,然後平均分配。
公式: \( \bar{x} = \frac{\sum x}{n} \)
(簡單來說:平均數 = 所有數值的總和 ÷ 數值的個數)
例子:對於 2, 4, 6,平均數為 \( (2+4+6) \div 3 = 4 \)。

核心觀念: 眾數代表受歡迎程度,中位數代表中間位置,而平均數則運用了每一個數據點。

2. 選擇最佳的平均值

為什麼我們需要三種指標?因為數據有時會很「混亂」!選擇正確的指標是考試的一項關鍵技能。

在以下情況使用眾數:
• 數據是非數值類(定性數據)。 例子:找出最受歡迎的汽車顏色。你無法計算出一種「平均顏色」!
• 你是店主。 例子:你需要知道最常見的鞋碼來補貨。

在以下情況使用中位數:
• 存在離群值(outliers)(極端數值)。 例子:如果有 9 個人的收入是 2 萬英鎊,而 CEO 的收入是 1000 萬英鎊,平均數會顯得非常誇張!中位數能提供更準確的「典型」薪資。
• 數據呈現偏態(skewed)(集中在某一端)。

在以下情況使用平均數:
• 你希望使用所有可用數據
• 數據相對對稱,沒有奇怪的離群值。

常見錯誤: 別忘了在找中位數之前先將數據排序!這是學生最常丟分的地方。

3. 從頻率表計算平均值

有時因為數據太多,會以表格形式呈現。
例子:一張顯示 20 場比賽中入球數的表格。

計算平均數:
1. 建立一個新欄位:頻率 × 數值(通常記作 \( f \times x \))。
2. 找出總頻率(\( \sum f \))。
3. 找出 \( fx \) 欄位的總和(\( \sum fx \))。
4. 平均數 = \( \frac{\sum fx}{\sum f} \)。

計算中位數: 在累積頻率中尋找 \( \frac{n+1}{2} \) 的位置。

4. 分組數據(估算平均數)

當數據被分組時(例如:「體重:10kg 至 20kg」),我們失去了確切數值。因此,我們只能找出平均數的估算值

步驟:
1. 找出每一組的組中值(Midpoint)。(將組別的起點與終點相加,然後除以 2)。
2. 將每個組中值與其頻率相乘
3. 將這些積加總。
4. 除以總頻率

進階考生提示 - 線性插值(Linear Interpolation): 對於分組數據的中位數,你可能會被要求使用插值法。這只是一個花俏的說法,意思是「估算中間值位於該組內的哪個位置」。
\( \text{Median} = L + \left( \frac{\frac{n}{2} - F}{f} \right) \times w \)
其中 \( L \) 是該組的下限,\( F \) 是該組之前的累積頻率,\( f \) 是該組的頻率,而 \( w \) 是組距。別慌!只要把它想成計算你需要往組內推進多少距離即可。

5. 進階內容:特殊平均值

如果你參加進階試卷(Higher Tier),你需要知道這三個額外工具:

加權平均數(Weighted Mean)

用於某些數值比其他數值更重要的情況。
公式: \( \frac{\sum (value \times weight)}{\sum weights} \)
例子:你的最終成績可能 30% 來自平時測驗,70% 來自期末考試。期末考試的「權重」更高!

幾何平均數(Geometric Mean)

用於尋找一段時間內的平均增長率或百分比變化。
公式: \( \text{Geometric Mean} = \sqrt[n]{x_1 \times x_2 \times ... \times x_n} \)
(所有數值乘積的 \( n \) 次方根)。
你知道嗎? 我們用它來計算金錢和人口增長,因為它們是乘法關係,而不是加法!

季節性變動平均值(Mean Seasonal Variation)

用於時間序列(Time Series)。在消除整體趨勢後,它能幫助我們找出在特定季節預期會出現的平均「額外」或「減少」量(例如夏季冰淇淋銷量會增加)。

6. 變更數據(轉換)

如果我們變更每一個數據點,平均值會發生什麼變化?
加法/減法: 如果你給每個分數加 5,平均數、中位數和眾數都會增加 5
乘法(比例縮放): 如果你將每個分數加倍,平均數、中位數和眾數也都會加倍

如果我們增加一個人呢?
• 如果你加入一個高於現有平均數的數值,平均數會上升
• 如果你加入一個等於現有平均數的數值,平均數會保持不變

總結檢查清單

核心觀念:
1. 眾數用於受歡迎程度/類別。
2. 中位數是中間值(適合有離群值的偏態數據)。
3. 平均數是總數平分(使用所有數據)。
4. 對於分組數據,請務必使用組中值來估算平均數。
5. 轉換: 平均值會遵循你對數據所做的數學運算(給數據加 10 = 平均值加 10)。

如果一開始覺得棘手也不要擔心!先練習一些簡單的數字清單,然後再練習表格題目。你一定可以做到的!