Data recording, analysis and presentation - Psychology - H169 - Cambridge OCR AS Level

导言：解读数字

欢迎！你已经规划好研究、招募了参加者并收集了数据。但接下来呢？你手头上可能有一堆数字或厚厚的访谈逐字稿。本章将介绍心理学家如何整理这些“杂乱”的信息，通过分析找出其意义，并将其呈现出来以便他人理解。别担心，如果你不是一个“数学高手”——我们会一步一步为你拆解所有内容！

1. 原始数据：起点

原始数据 (Raw data) 简单来说，就是你在研究过程中收集到的最初、未经过处理的信息。在进行任何复杂的计算之前，你需要先将它们整理好。

设计数据记录表

一个好的记录表应该清晰且具逻辑性。它通常包含代表自变量 (Independent Variable, IV) 条件的列，以及代表每位参加者的行。 例子：如果你正在测试咖啡是否有助于记忆，其中一列应为“咖啡组”，另一列为“清水组”。

处理数字（数学技巧）

心理学涉及一些基础算术，你需要熟悉以下概念：

标准形式 (Standard Form)：一种书写极大或极小数值的方法。例如，\(1.2 \times 10^3\) 只是 \(1,200\) 的另一种写法。
小数形式 (Decimal Form)：确保你能将分数（如 \(1/4\)）转换为小数 (\(0.25\))。
有效数字 (Significant Figures)：这涉及四舍五入至最关键的位数。如果计算器显示 \(12.34567\)，老师可能要求你保留 3 位有效数字，即 \(12.3\)。
估算 (Estimations)：有时候你需要对结果进行“估算”，以检查你的最终计算结果看起来是否合理。

快速复习：请务必清楚标注你的表格，这样即使是陌生人也能看懂这些数字代表什么！

2. 数据类型

在心理学中，我们主要通过两种方式将数据分类：按其性质（它看起来像什么）和来源（它来自哪里）。

数据性质：定量与定性

定量数据 (Quantitative Data)：数字和统计数据。 例子：测验得分 8/10。
优点：易于比较并制作成图表。
缺点：缺乏细节；我们无法得知受试者*为什么*得到那个分数。

定性数据 (Qualitative Data)：文字、描述和意义。 例子：参加者描述其在实验过程中的感受。
优点：细节丰富且具深度。
缺点：难以分析或在不同人之间进行比较。

数据来源：第一手与第二手

第一手数据 (Primary Data)：你自己为特定研究收集的数据。
第二手数据 (Secondary Data)：由他人收集的数据（例如使用政府统计资料或其他研究人员的结果）。

记忆小撇步：Primary（第一手）就是 Personal（个人的，你自己做的！）。Secondary（第二手）就是 Second-hand（二手转来的）。

3. 数据层次（测量尺度）

这是一种为数值数据的精确度进行“分级”的方法，这是非常常见的考点！

名义尺度 (Nominal Level)：数据被分成独立类别，没有先后“顺序”。
例子：按最喜欢的颜色（红、蓝、绿）将人们分类。
次序尺度 (Ordinal Level)：数据可以排列顺序或等级，但等级之间的差距并不相等。
例子：比赛名次（第一名、第二名、第三名）。我们知道谁跑得更快，但不知道快了多少秒。
等距尺度 (Interval Level)：在固定的刻度上测量，点与点之间的间距相等。这是最精确的。
例子：摄氏温度或以秒为单位的时间。

重点总结：从名义尺度进阶到等距尺度，就像从模糊的照片升级到高清视频一样——你能获得更丰富的细节！

4. 定性数据的分析

我们如何将长篇的访谈内容转化为可分析的数据？我们使用将定性数据转化为定量数据的过程。这通常涉及“编码”——在文字中寻找主题并计算它们出现的次数。
例子：如果有五名参加者提到感到“紧张”，你可以为“焦虑”这个主题记录数字“5”。

5. 描述统计

这些统计数据用于总结你的资料，以便观察整体的“趋势”。

集中趋势测量（平均值）

1. 平均数 (Mean)：将所有分数相加后除以分数总数。
适用情况：当你拥有等距数据且没有极端的“离群值”时。
2. 中位数 (Median)：当所有数字按顺序排列时，位于中间的分数。
适用情况：当数据出现“异常”，有一两个极高或极低的分数时。
3. 众数 (Mode)：出现次数最多的分数。
适用情况：当你有名义数据（类别）时。

离散程度测量（分布）

这告诉我们分数是聚集在一起，还是分散得非常广。

全距 (Range)：最高分与最低分之间的差值。（最高分 \(-\) 最低分）。它很简单，但如果有一个异常高的分数，可能会产生误导！
变异数与标准差 (Variance and Standard Deviation)：它们告诉我们平均而言，分数偏离平均值的程度。高标准差表示分数分布极广；低标准差表示参加者的得分非常相似。

你知道吗？次数分配表（计数表）是在计算这些测量值之前整理原始数据最快的方法！

6. 数据可视化：图表

图表能帮助我们瞬间观察到模式。你必须知道哪种图表适合哪种数据：

条形图 (Bar Charts)：用于名义数据（类别）。条形之间没有相连。
直方图 (Histograms)：用于连续数据（如年龄或时间）。条形之间有相连。
折线图 (Line Graphs)：显示某事物如何变化，通常随时间变化。
饼图 (Pie Charts)：显示整体中的比例或百分比。
散点图 (Scatter Diagrams)：用于相关性研究，显示两个变量之间的关系。

常见错误：忘记标记 X 轴（水平）和 Y 轴（垂直）。请务必为你的图表加上清晰的标题！

7. 推论统计：关键的“决定”

描述统计告诉我们数据“看起来”如何。推论统计则帮助我们判断结果是“真实的”，还是纯粹出于偶然。这是我们检验假设的地方。

概率与显著性

心理学家使用显著性水平 (significance level)，通常写作 \(p < 0.05\)。这意味着结果纯属巧合的可能性小于 5%。如果 \(p < 0.05\)，我们就会拒绝零假设 (null hypothesis) 并接受备择假设 (alternative hypothesis)。

第一类错误与第二类错误

第一类错误 (Type 1 Error)：“伪阳性”。你声称结果具有显著性，但实际上它们只是偶然发生。（就像“狼来了”的故事，但其实根本没有狼）。
第二类错误 (Type 2 Error)：“伪阴性”。你声称结果不具显著性，但其实确实存在影响。（就像狼真的来了，你却错过了）。

选择统计检验

你不需要亲自计算所有这些检验，但你必须知道何时使用它们！这些“准则”取决于研究的设计和数据层次。

非参数检验 (Non-Parametric Tests)（五大检验）：

1. 曼-惠特尼 U 检验 (Mann-Whitney U)：独立组设计，次序数据。
2. 威尔科克森符号秩检验 (Wilcoxon Signed Ranks)：重复测量设计，次序数据。
3. 卡方检验 (Chi-Square)：独立组设计，名义数据。（注意：你必须学会如何计算这个！）
4. 二项式符号检验 (Binomial Sign)：重复测量设计，名义数据。
5. 斯皮尔曼等级相关系数 (Spearman’s Rho)：用于相关性研究。

参数检验的准则：

这些是更“强大”的检验，仅在以下情况使用：

数据为等距尺度。
数据遵循常态分布（钟形曲线）。
各组之间的变异数（离散程度）相似。

快速提示：使用助记词来记住这些检验，但请务必检查教科书中的“检验选择”流程图——它绝对能救你一命！

总结：数据之旅

1. 收集原始数据并以表格整理。
2. 识别数据层次（名义、次序或等距）。
3. 计算描述统计（平均数、中位数、众数、全距、标准差）。
4. 制作图表以可视化呈现趋势。
5. 进行推论统计检验以查看结果是否显著 (\(p < 0.05\))。
6. 在得出最终结论前，检查是否有第一类或第二类错误。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。