欢迎来到统计学的核心!

你有没有想过电子游戏中的“典型”分数是多少?或者普通人的“平均”收入是多少?在统计学中,我们不只是猜测;我们会使用集中趋势测量值(Measures of Central Tendency)。这些是找出数据集“中心”的聪明方法。把它想象成找出能总结整堆数字的“典型”或“具代表性”的数值。

在本章中,我们将探讨“三大指标”(众数、中位数和平均数),学习如何处理分组数据,并探索专家使用的一些特殊平均值。如果一开始看起来有点“数学味”也不用担心——我们会一步一步来!

1. “三大”平均值

找出平均值的方法不只一种。根据你所分析的数据类型,某些方法可能比其他方法更适合。

众数(“最常见”的数值)

众数(Mode)是数据集中出现频率最高的数值。
记忆小撇步: MOde(众数) = MOst common(最常见)。
例子:在集合 {2, 3, 3, 5, 8} 中,众数是 3,因为它出现了两次。

重点复习:
• 如果没有数字重复,则没有众数
• 如果两个数字重复出现的次数相同,则称为双众数(bimodal)
• 对于分组数据,我们称之为众数组(Modal Class)(即频率最高的组别)。

中位数(“中间”的数值)

中位数(Median)是将数据排序后位于中间的数值。
记忆小撇步: “Median”就像马路中间的隔离带!
步骤:
1. 将数字由小到大排列。
2. 使用公式找出位置:\( \frac{n+1}{2} \),其中 \( n \) 是数据的总数量。
3. 如果你的数值总数是偶数,中位数就是中间两个数值的平均值

平均数(“算术平均值”)

这就是大多数人说“平均”时的意思。你将所有数值相加,然后平均分配。
公式: \( \bar{x} = \frac{\sum x}{n} \)
(简单来说:平均数 = 所有数值的总和 ÷ 数值的个数)
例子:对于 2, 4, 6,平均数为 \( (2+4+6) \div 3 = 4 \)。

核心观念: 众数代表受欢迎程度,中位数代表中间位置,而平均数则运用了每一个数据点。

2. 选择最佳的平均值

为什么我们需要三种指标?因为数据有时会很“混乱”!选择正确的指标是考试的一项关键技能。

在以下情况使用众数:
• 数据是非数值类(定性数据)。 例子:找出最受欢迎的汽车颜色。你无法计算出一种“平均颜色”!
• 你是店主。 例子:你需要知道最常见的鞋码来补货。

在以下情况使用中位数:
• 存在离群值(outliers)(极端数值)。 例子:如果有 9 个人的收入是 2 万英镑,而 CEO 的收入是 1000 万英镑,平均数会显得非常夸张!中位数能提供更准确的“典型”薪资。
• 数据呈现偏态(skewed)(集中在某一端)。

在以下情况使用平均数:
• 你希望使用所有可用数据
• 数据相对对称,没有奇怪的离群值。

常见错误: 别忘了在找中位数之前先将数据排序!这是学生最常丢分的地方。

3. 从频率表计算平均值

有时因为数据太多,会以表格形式呈现。
例子:一张显示 20 场比赛中入球数的表格。

计算平均数:
1. 建立一个新栏位:频率 × 数值(通常记作 \( f \times x \))。
2. 找出总频率(\( \sum f \))。
3. 找出 \( fx \) 栏位的总和(\( \sum fx \))。
4. 平均数 = \( \frac{\sum fx}{\sum f} \)。

计算中位数: 在累积频率中寻找 \( \frac{n+1}{2} \) 的位置。

4. 分组数据(估算平均数)

当数据被分组时(例如:“体重:10kg 至 20kg”),我们失去了确切数值。因此,我们只能找出平均数的估算值

步骤:
1. 找出每一组的组中值(Midpoint)。(将组别的起点与终点相加,然后除以 2)。
2. 将每个组中值与其频率相乘
3. 将这些积加总。
4. 除以总频率

进阶考生提示 - 线性插值(Linear Interpolation): 对于分组数据的中位数,你可能会被要求使用插值法。这只是一个花哨的说法,意思是“估算中间值位于该组内的哪个位置”。
\( \text{Median} = L + \left( \frac{\frac{n}{2} - F}{f} \right) \times w \)
其中 \( L \) 是该组的下限,\( F \) 是该组之前的累积频率,\( f \) 是该组的频率,而 \( w \) 是组距。别慌!只要把它想成计算你需要往组内推进多少距离即可。

5. 进阶内容:特殊平均值

如果你参加进阶试卷(Higher Tier),你需要知道这三个额外工具:

加权平均数(Weighted Mean)

用于某些数值比其他数值更重要的情况。
公式: \( \frac{\sum (value \times weight)}{\sum weights} \)
例子:你的最终成绩可能 30% 来自平时测验,70% 来自期末考试。期末考试的“权重”更高!

几何平均数(Geometric Mean)

用于寻找一段时间内的平均增长率或百分比变化。
公式: \( \text{Geometric Mean} = \sqrt[n]{x_1 \times x_2 \times ... \times x_n} \)
(所有数值乘积的 \( n \) 次方根)。
你知道吗? 我们用它来计算金钱和人口增长,因为它们是乘法关系,而不是加法!

季节性变动平均值(Mean Seasonal Variation)

用于时间序列(Time Series)。在消除整体趋势后,它能帮助我们找出在特定季节预期会出现的平均“额外”或“减少”量(例如夏季冰淇淋销量会增加)。

6. 变更数据(转换)

如果我们变更每一个数据点,平均值会发生什么变化?
加法/减法: 如果你给每个分数加 5,平均数、中位数和众数都会增加 5
乘法(比例缩放): 如果你将每个分数加倍,平均数、中位数和众数也都会加倍

如果我们增加一个人呢?
• 如果你加入一个高于现有平均数的数值,平均数会上升
• 如果你加入一个等于现有平均数的数值,平均数会保持不变

总结检查清单

核心观念:
1. 众数用于受欢迎程度/类别。
2. 中位数是中间值(适合有离群值的偏态数据)。
3. 平均数是总数平分(使用所有数据)。
4. 对于分组数据,请务必使用组中值来估算平均数。
5. 转换: 平均值会遵循你对数据所做的数学运算(给数据加 10 = 平均值加 10)。

如果一开始觉得棘手也不要担心!先练习一些简单的数字列表,然后再练习表格题目。你一定可以做到的!