IGCSE 国际数学 (0607) 学习笔记
第 10.5 章:使用计算器 (GDC) 计算平均值
数学家们,大家好!欢迎来到统计学中最实用的章节之一。在 0607 考纲中,你必须学会使用图形显示计算器 (GDC) 来快速、准确地处理复杂的数据分析。这不仅能为你节省大量考试时间(Paper 3, 4, 5 和 6),还能极大程度地减少计算错误。
本节重点介绍如何让你的 GDC 自动得出集中趋势(平均值)和离散程度(四分位数)。让我们开始吧!
第 1 节:关键统计术语快速回顾
在进入 GDC 的操作步骤之前,我们先快速复习一下我们要计算的内容。(这些概念已在 C10.4 中详细阐述。)
- 平均值 (Mean, \(\bar{x}\)): 标准的算术平均数。所有数值的总和除以数据的个数。它容易受极端值(异常值)的影响。
- 中位数 (Median, Med): 将数据按大小顺序排列后处于最中间的数值。它受异常值的影响较小。
- 四分位数 (\(Q_1\) 和 \(Q_3\)): 将数据集等分为四份的三个数值。
- \(Q_1\)(下四分位数)是处于 25% 位置的数值。
- \(Q_3\)(上四分位数)是处于 75% 位置的数值。
- 四分位距 (Interquartile Range, IQR): 一种衡量离散程度的方法:\(IQR = Q_3 - Q_1\)。
核心结论: GDC 非常强大,因为它可以使用通常被称为“单变量统计 (1-Variable Statistics)”的功能,一次性计算出平均值、中位数和四分位数。
第 2 节:设置你的图形显示计算器 (GDC)
要计算平均值,你必须进入 GDC 的 STATISTICS(统计)模式。具体的按键因机型(如 Casio 或 Texas Instruments)而异,但背后的逻辑是一样的。
第一步:进入统计模式
找到并按下进入统计录入的按钮(通常标记为 STAT 或 DATA)。
你会看到列表,通常标记为 L1, L2, L3(List 1, List 2, List 3)。
第二步:清除旧数据
至关重要的提示: 在开始新题目之前,一定要清除所有旧数据!列表里残留的旧数字可能会破坏你的计算结果。
第三步:数据录入:列表
根据数据类型的不同,你会用到 L1,有时还会用到 L2:
- L1 (List 1): 总是用于存放 数据值 (x)。
- L2 (List 2): 用于存放 频数 (f)。如果你的数据只是一个简单的数字列表(不是频数表),你只需要用到 L1。
第 3 节:离散数据的平均值计算
离散数据 (Discrete Data) 指的是只能取特定、可计数的数值(例如:兄弟姐妹的人数、鞋码)。这类数据可能以简单列表形式给出,或以不分组的频数表形式给出。
例题 A:简单列表数据
数据集:10, 15, 12, 18, 10, 15, 10
- 输入数据: 进入 STAT 模式,将所有数值输入 L1。(10, 15, 12, 18, 10, 15, 10)
- 设置频数: 由于没有频数列,计算器的频数设置必须设为 1 (或 Off/None)。
- 计算: 运行 1-Variable Statistics(单变量统计)。
例题 B:频数表形式的离散数据
一家店在 50 天内卖出外套的数量 (x)。
| 外套数量 (x) | 天数 (f) |
|---|---|
| 0 | 5 |
| 1 | 15 |
| 2 | 20 |
| 3 | 10 |
- 输入数据: 将“外套数量 (x)”输入 L1 (0, 1, 2, 3)。
- 输入频数: 将“天数 (f)”输入 L2 (5, 15, 20, 10)。
- 设置计算: 在运行单变量统计时,告知计算器 L1 是数据列表,L2 是频数列表。
解读 GDC 输出的离散数据结果
GDC 会显示一屏幕的结果,你需要认识以下符号:
- 平均值: 显示为 \(\mathbf{\bar{x}}\)。
- 数据点总数: 显示为 \(\mathbf{n}\) 或 \(\mathbf{\sum f}\)。(在例题 B 中,n 应为 50。)
- 中位数: 显示为 Med 或 Q2。
- 四分位数: 显示为 \(\mathbf{Q_1}\) 和 \(\mathbf{Q_3}\)。
你知道吗? 如果你手动计算了 IQR (\(Q_3 - Q_1\)),计算器显示的“Range”数值(最大值减最小值)是“极差”,这是另一种衡量离散程度的指标。
快速回顾:离散数据
使用 L1 存放数据,L2 存放频数。计算器会给出精确的平均值、中位数和四分位数。
第 4 节:分组数据的平均值计算
考纲要求你使用计算器寻找 分组数据的平均值。当数据已分组(例如区间:10 < t \(\le\) 20)时,我们无法找到精确的平均值,因此我们计算的是 平均值的估计值 (estimate of the mean)。
该计算需要使用每个组距的 组中值 (Midpoint)。
分步流程(估计平均值)
例题:时间频数表。
| 时间 (分钟) | 频数 (f) |
|---|---|
| 0 < t \(\le\) 10 | 4 |
| 10 < t \(\le\) 20 | 6 |
| 20 < t \(\le\) 30 | 10 |
- 计算组中值 (x): 对每个组距,寻找中间值。
- 0 < t \(\le\) 10 的组中值:\((0 + 10) / 2 = \mathbf{5}\)
- 10 < t \(\le\) 20 的组中值:\((10 + 20) / 2 = \mathbf{15}\)
- 20 < t \(\le\) 30 的组中值:\((20 + 30) / 2 = \mathbf{25}\)
- 将组中值输入 L1: 将 (5, 15, 25) 输入 L1。
- 将频数输入 L2: 将 (4, 6, 10) 输入 L2。
- 计算: 运行 1-Variable Statistics,确保 L1 是数据列表,L2 是频数列表。
计算器上显示的 \(\mathbf{\bar{x}}\)(平均值)即为该分组数据的 平均值的估计值。
类比:为什么要用组中值?
想象有 4 名学生做作业的时间在 0 到 10 分钟之间。由于我们不知道每个学生的具体时间(可能是 1 分钟、5 分钟或 10 分钟),我们只能假设他们都用了 组中值(5 分钟)。在计算平均值时,组中值充当了整组数据的最佳代表。
关于分组数据四分位数的注意事项
虽然当输入组中值 (L1) 和频数 (L2) 时,GDC *可以*输出四分数值 (\(Q_1\), Med, \(Q_3\)),但这些数值通常是基于离散组中值进行线性插值计算出来的。在 IGCSE 0607 考纲中,分组数据的四分位数和中位数传统上是通过 累积频数图 (Cumulative Frequency Diagrams) (E10.8) 来寻找的。对于 C10.5 和 E10.5,请重点练习使用 GDC 寻找分组数据的 平均值。
核心结论: 对于分组数据,GDC 使用 L1(组中值)和 L2(频数)来计算 平均值的估计值。
第 5 节:常见错误与辅助小技巧
A. 应避免的常见错误
- 忘记清除数据: 开始新题目之前,务必清除 L1 和 L2。
- 错误的频数设置: 如果将单个数据点列表输入 L1,请确保计算器的频数设置设为 '1'。如果使用频数表,请确保频数设置指向 L2。
- 输入组距端点(分组数据): 处理分组数据(如 0-10, 10-20)时,千万不要直接将端点输入 L1,必须先算出并输入 组中值!
- 混淆 L1 和 L2: 检查你的数据值(或组中值)是否在计算器设定的“Data”列表中,频数是否在“Frequency”列表中。
B. 记忆辅助:统计检查两步走
在按下最终计算按钮之前,问自己:
1. 我的数据 (x) 在哪个列表中?(通常是 L1)
2. 我的频数 (f) 在哪个列表中?(通常是 L2,如果是简单列表则设为 1)
C. 保持精确度
记住计算器试卷的黄金法则:
不要过早取整! 在任何中间步骤中,使用计算器显示的完整、未取整数值。只有在 最终答案 中,才根据要求的精确度进行取整(除非另有说明,否则通常保留 3 位有效数字,或 1 位小数)。
你已经掌握了 IGCSE 统计学的核心工具!反复练习这些计算器操作,会让你在考试中更加快速且自信。