统计图表(IGCSE 0580 数学)
你好,未来的统计学家!欢迎来到数据可视化的世界。数字固然重要,但它们有时看起来只是一串枯燥的列表。本章的任务就是把这些乏味的列表变成美观且信息量丰富的图表!通过这些图表,我们可以快速解读数据并得出睿智的结论。别担心自己不会画画;我们只需要掌握如何准确地绘制和阅读它们即可!
理解数据类型:离散数据与连续数据
在绘图之前,我们必须先弄清楚手头数据的类型。请回顾一下统计学章节(C10.3 / E10.3)中的定义:
- 离散数据(Discrete Data): 只能取特定、固定值(通常是整数)的数据,通常是通过“数”出来的。
例如:一个学生拥有的兄弟姐妹数量(你不可能有2.5个兄弟姐妹)。 - 连续数据(Continuous Data): 在一定范围内可以取任意值的数据,通常是通过“测量”出来的。
例如:身高、体重或温度。(注意:C10.6 中的大多数图表处理的是离散数据或分类数据。)
小贴士: 离散数据通常使用独立的柱状图(如标准条形图)。连续数据通常需要直方图等方法(这在 0580 进阶大纲中会有涉及,但不在本文 C10.6/E10.6 的讨论范围内)。
1. 条形图(Bar Charts)
条形图是展示数据最常见的方式之一。它们使用矩形条,条的长度(或高度)与频数(发生频率)成正比。
绘制简单条形图(C10.6/E10.6(a))
主要特点:
- 条形通常是垂直绘制的(上下延伸)。
- 条形之间必须有等宽的间隔。
- 坐标轴必须清晰标注,并使用合适且统一的刻度。
示例:展示 50 名学生最喜爱的运动。
运动类别(足球、橄榄球、网球)放在横轴(x 轴)上,频数(学生人数)放在纵轴(y 轴)上。
复合(堆叠)条形图
复合条形图将不同的组成部分*堆叠*在同一个长条中。它既能展示总频数,也能展示每个子类别的比例。
把它想象成夹心蛋糕: 整个条形是该类别的总人数,不同的层是该类别内部的小组。
重要提示: 你必须包含一个图例(Key),以说明堆叠中每种颜色或图案代表什么。
双重(并列)条形图
当需要对同一类别的两组不同数据进行比较时,会使用双重条形图。
示例:比较“产品 A”和“产品 B”在四个月内的销售额。
对于每个月,你会看到两个并排的条形(一个代表 A,一个代表 B)。
重要提示: 和复合条形图一样,清晰的图例对于区分两组数据至关重要。
条形图核心要点: 条形之间必须有间隙,刻度必须统一;如果使用了复杂条形(堆叠/双重),一定要配上图例!
2. 饼图(Pie Charts)
饼图(C10.6/E10.6(b))是圆形图表,用于展示总体如何划分为部分。整个圆代表 100% 的数据或 360°。
把它想象成披萨: 整个披萨是你的总数据集,每一片代表一个类别。
计算饼图的角度(关键技能!)
饼图中每个扇区(切片)的大小与其代表的频数成正比。因为圆周角是 360°,我们利用总频数来计算每个类别的角度。
计算步骤:
- 找到总频数(将所有数据加起来)。
- 使用以下公式计算每个类别的角度:
$$ \text{角度} = \frac{\text{该类别的频数}}{\text{总频数}} \times 360^{\circ} $$
示例:如果 50 名学生中有 10 人选择“红色”作为最喜欢的颜色:
\( \text{红色的角度} = \frac{10}{50} \times 360^{\circ} \)
\( \text{红色的角度} = 0.2 \times 360^{\circ} = 72^{\circ} \)
常见的避坑指南: 计算完成后,一定要确保所有角度之和等于 360°。如果不等于,说明计算出错了!
饼图核心要点: 饼图展示的是比例。你必须根据每个类别在 360 度中所占的份额来计算其角度。
3. 象形图(Pictograms)
象形图(C10.6/E10.6(c))使用简单的图像或符号来表示频数。
黄金法则:图例!
每个象形图都必须有一个清晰的图例,解释一个符号代表多少数量。
示例:如果象形图显示售出的苹果数量,图例可能会写:
图例: \( \text{一个苹果符号} = 10 \text{ 个苹果} \)
如果频数是 35,你需要画 3 个完整的苹果符号和 1 个半个苹果的符号。确保你画的符号易于识别,且方便拆分为分数。
你知道吗? 象形图非常适合让广泛受众轻松理解数据,即便是那些平时觉得图表很难懂的人也能看明白!
象形图核心要点: 务必包含清晰的图例来定义符号的数值。如果需要,准备好画半个或四分之一符号。
4. 茎叶图(Stem-and-Leaf Diagrams)
茎叶图(C10.6/E10.6(d))是整理数值数据的绝佳方式,因为它在展示分布形态的同时保留了原始数据。
想象你收集了 20 名学生的考试成绩:
45, 61, 68, 49, 70, 72, 83, 61, 55, 59, 78, 81, 74, 60, 52, 53, 67, 70, 60, 75
绘制茎叶图(步骤)
- 确定“茎”和“叶”:
茎(Stem)通常是数字的前几位(例如十位或百位)。
叶(Leaf)通常是最后一位(例如个位)。
对于上述分数,茎是十位数字(4, 5, 6, 7, 8),叶是个位数字。 - 绘制草图(无序):
4 | 5, 9
5 | 5, 9, 2, 3
6 | 1, 8, 1, 0, 7, 0
7 | 0, 2, 8, 4, 0, 5
8 | 3, 1 - 对“叶”进行排序(关键步骤!): 每一行的叶子必须按升序排列(从小到大)。
4 | 5, 9
5 | 2, 3, 5, 9
6 | 0, 0, 1, 1, 7, 8
7 | 0, 0, 2, 4, 5, 8
8 | 1, 3 - 添加图例(必须包含): 图例告诉读者如何解读这些数字。
图例: 5 | 2 代表 52(分)
重要提示: 叶的排序至关重要!如果忘记排序,你的图表就是错误的。一定要把图例写在图表旁边。
解读茎叶图:
该图清晰展示了数据分布。你可以看到大多数学生的分数集中在 60 到 79 分之间。你还可以从有序列表中轻松找到众数(出现最多的数)和中位数(中间的数)。
茎叶图核心要点: 它们展示了数据的形状并保留了原始值。它们必须是有序的且必须包含图例。
5. 简单频数分布(Simple Frequency Distributions)
简单频数分布(C10.6/E10.6(e))通常是我们画图前整理的表格,经常会用到“划记”(Tally)。这是汇总数据最简单的方法。
划记表与频数表(C10.1):
这涉及到计数每个数值或类别出现了多少次。这个原始的计数值就是频数(Frequency)。
| 类别 | 划记 | 频数 |
| --- | --- | --- |
| 蓝色 | IIIII I | 6 |
| 绿色 | IIII | 4 |
我们使用这些表格来组织数据,进而计算平均指标(平均数、众数、中位数)或绘制上述图表(条形图、饼图等)。
核心要点: 简单频数分布是所有统计图表的基石。它们列出了类别以及每个类别的计数值(频数)。
期末复习:解读与比较数据(C10.2 / E10.2)
图表的全部意义在于解读数据并做出推断。在考试中,你经常会被要求比较两张图表或两组数据。
比较数据集时,主要看两点:
- 平均值(集中趋势): 数据的中心在哪里?
示例:“A 组的平均分更高,说明 A 组学生整体表现更好。” - 离散程度(极差/四分位距): 数据是一致的还是分散的?
示例:“B 组的极差较小,意味着他们的分数更稳定。”
重要提示(C10.2.3): 你必须始终意识到得出结论的局限性。样本量过小或选择过程带有偏见,意味着你的结论可能无法代表整个总体。
继续练习,整洁准确地绘制这些图表——尤其是饼图的角度计算和有序茎叶图。相信你一定没问题!