Data recording, analysis and presentation - Psychology - H569 - Cambridge OCR A Level

欢迎来到数据记录、分析与呈现！

哈啰！别被这一章的标题吓到了。虽然它听起来很“数学”，但事实上，这是在讲述心理学家如何将复杂混乱的人类行为，转化为清晰易懂的信息。你可以把它看作是研究中的“说故事”环节——你已经收集了数据，现在要学习如何向大家解释这些数据背后的意义。

无论你热爱数字还是觉得它们有点棘手，这些笔记都旨在引导你一步步掌握这些流程。我们将涵盖如何记录数据、你会遇到的数据类型，以及用来找出规律的“神奇”公式。

1. 原始数据：起点

原始数据 (Raw data) 就是你在实验或观察期间收集到的“未经处理”信息，在对其进行任何加工之前的状态。

记录表的设计与使用： 在开始之前，你需要一个清晰的地方来放置结果。一个好的记录表应该有明确的标题，让任何查看它的人都能清楚知道测量的是什么。

标准形式与小数形式： 有时候数字会非常大或非常小。 标准形式 (Standard form) 是一种使用 10 的幂次来书写这些数字的方法。例如，5,000 会变成 \( 5 \times 10^3 \)。 小数形式 (Decimal form) 是我们书写数字的标准方式，例如 0.05。

有效数字 (Significant figures)： 这是关于将数字四舍五入到最重要的位数。 例子： 如果计算结果是 12.34567，将其取至 3 位有效数字，结果就是 12.3。

估算 (Estimations)： 有时候，心理学家会根据数据做出“最佳猜测”，看看最终结果是否合理。

快速回顾：
• 原始数据 = “混乱”的初步结果。
• 记录表 = 我们用来存放数据的“桶子”。
• 有效数字 = 只保留最重要的位数。

2. 数据类型

并非所有数据都是一样的！心理学家使用四大类别：

量化数据 (Quantitative Data)： 这是以数字形式呈现的数据。 例子： 记忆测验中 8/10 的分数。 + 优点： 容易比较并转换成图表。 - 缺点： 缺乏细节；它无法告诉我们某人为何得到那个分数。

质性数据 (Qualitative Data)： 这是以文字、描述或意义形式呈现的数据。 例子： 某人描述其感受的访谈逐字稿。 + 优点： 非常丰富且详尽。 - 缺点： 很难针对不同的人进行总结或比较。

主要数据 (Primary Data)： 你为了特定研究而亲自收集的数据。 例子： 你对同学进行的问卷调查。

次要数据 (Secondary Data)： 你正在使用的、由其他人收集的数据。 例子： 使用政府的犯罪率统计资料。

重点总结： 量化关于数量（有多少），而质性关于品质（它是什么样的）。

3. 测量层次（数据层次）

这是一种对数据精确度进行“排名”的方式。你可以用助记词 NOI 来记住它。

1. 名目层次数据 (Nominal Level Data)： 最基本的层次。数据被放入类别或命名的群组中。 例子： 计算有多少人是“左撇子”与“右撇子”。

2. 次序层次数据 (Ordinal Level Data)： 可以进行排序或排名的数据，但排名之间的差距并不相等。 例子： 比赛中的第 1、2、3 名。你知道谁跑得比较快，但第 1 名可能领先第 2 名 10 秒，而第 2 名只领先第 3 名 1 秒。

3. 等距层次数据 (Interval Level Data)： 最精确的层次。数据是在具有固定、相等间隔的量表上测量的。 例子： 摄氏温度。10°C 到 11°C 之间的差距与 20°C 到 21°C 之间的差距完全相同。

4. 描述性统计：总结数据

一旦有了数字，就需要总结它们。我们使用集中趋势量数 (Measures of Central Tendency)（中间值）和离散程度量数 (Measures of Dispersion)（数据的分散程度）。

集中趋势量数

• 平均数 (Mean)： 数学上的平均值。将所有分数相加并除以分数的总个数。 公式： \( \bar{x} = \frac{\sum x}{n} \)。
• 中位数 (Median)： 将所有分数排序后位于中间的数值。
• 众数 (Mode)： 出现次数最多的分数。

离散程度量数

• 全距 (Range)： 最高分与最低分之间的差值（通常会再加 1）。
• 变异数 (Variance)： 显示分数偏离平均值程度的计算。
• 标准差 (Standard Deviation)： 最受欢迎的量数。它显示每个分数与平均值的平均距离。 类比： 如果班级的平均身高是 160 公分，小标准差意味着每个人都差不多是 160 公分。大标准差则意味着有些人非常矮，而有些人非常高。

其他数学知识

• 比率 (Ratio)： 比较两个数量（例如 2:1）。
• 百分比 (Percentage)： 以 100 为基数的分数。
• 分数 (Fractions)： 整体的一部分（例如 1/4）。
• 次数分配表 (Frequency Tables)： 通常称为“计数表”，用于计算事物发生的频率。

5. 数据呈现：图表

如果你不是艺术家也不要担心！只要记住哪种图表对应哪种数据即可：

条形图 (Bar Charts)： 用于名目（类别）数据。条形之间不应该相连。
直方图 (Histograms)： 用于等距数据。条形必须相连，因为数据是连续的。
散点图 (Scatter Diagrams)： 用于相关性 (Correlations)。你绘制点来查看两个变量之间是否存在关系。
折线图 (Line Graphs)： 用于显示事物的变化，通常是随时间的变化。
饼图 (Pie Charts)： 用于显示整体的比例（百分比）。

常见错误： 学生常会为连续数据绘制条形图。记住：如果是分开的类别（如“猫与狗”），一定要留空隙！

6. 质性数据的分析

我们该拿那些文字怎么办呢？我们可以将质性数据转换为量化数据。

这通常是透过内容分析法 (Content Analysis) 来完成的。你检视文字（如访谈逐字稿）并计算某些主题或“编码”出现了多少次。 例子： 如果你访问人们关于学校的感受，你可以计算他们说出“压力”这个词的次数。瞬间，你的文字就变成了数字！

7. 推论统计：结果是否“真实”？

这部分能帮助心理学家判断结果是因为自变量 (IV，即他们改变的东西) 造成的，还是仅仅出于“运气”（随机误差）。

概率与显著性

心理学家通常使用 \( p \le 0.05 \) 的显著性水平 (Significance level)。这意味着结果由偶然产生的概率为 5%（或更低）。如果 \( p \le 0.05 \)，我们就会拒绝虚无假设 (null hypothesis) 并接受对立假设 (alternative hypothesis)。

分配

常态分配 (Normal Distribution)： 一种对称的“钟形”曲线，平均数、中位数和众数都在中间。
偏态分配 (Skewed Distributions)： 当结果集中在一端时。 正偏态 (Positive Skew)： 大多数分数较低（“尾巴”指向右侧）。 负偏态 (Negative Skew)： 大多数分数较高（“尾巴”指向左侧）。

选择统计检验

你需要知道选择这五种非参数检验 (non-parametric tests) 的标准：

1. 曼-惠特尼 U 检验 (Mann-Whitney U)： 用于独立样本设计 (Independent Measures) 和次序数据。
2. 威尔卡森符号等级检验 (Wilcoxon Signed Ranks)： 用于重复测量设计 (Repeated Measures) 和次序数据。
3. 卡方检验 (Chi-Square)： 用于独立组别和名目数据。
4. 二项式符号检验 (Binomial Sign)： 用于重复测量和名目数据。
5. 斯皮尔曼等级相关系数 (Spearman’s Rho)： 用于寻找相关性时。

研究中的误差

第一类错误 (Type 1 Error，型一错误/假阳性)： 你声称结果具有显著性，但实际上它们只是随机发生的。（你太宽松了）。
第二类错误 (Type 2 Error，型二错误/假阴性)： 你声称结果不具显著性，但实际上存在效应。（你太严格了）。

本节重点：
• 推论统计检验告诉我们是否能信任我们的结果。
• p ≤ 0.05 是魔法数字。
• 第一类错误 = 看见了不存在的鬼魂。
• 第二类错误 = 错过了站在你身后那个真实的鬼魂！

必知符号

你必须能够在考试中识别并使用这些符号：
= 等于
< 小于
<< 远小于
>> 远大于
> 大于
∝ 成正比
~ 大约
≥ 大于或等于
≤ 小于或等于

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。