欢迎来到数据记录、分析与呈现!

哈啰!别被这一章的标题吓到了。虽然它听起来很“数学”,但事实上,这是在讲述心理学家如何将复杂混乱的人类行为,转化为清晰易懂的信息。你可以把它看作是研究中的“说故事”环节——你已经收集了数据,现在要学习如何向大家解释这些数据背后的意义。

无论你热爱数字还是觉得它们有点棘手,这些笔记都旨在引导你一步步掌握这些流程。我们将涵盖如何记录数据、你会遇到的数据类型,以及用来找出规律的“神奇”公式。

1. 原始数据:起点

原始数据 (Raw data) 就是你在实验或观察期间收集到的“未经处理”信息,在对其进行任何加工之前的状态。

记录表的设计与使用: 在开始之前,你需要一个清晰的地方来放置结果。一个好的记录表应该有明确的标题,让任何查看它的人都能清楚知道测量的是什么。

标准形式与小数形式: 有时候数字会非常大或非常小。 标准形式 (Standard form) 是一种使用 10 的幂次来书写这些数字的方法。例如,5,000 会变成 \( 5 \times 10^3 \)。 小数形式 (Decimal form) 是我们书写数字的标准方式,例如 0.05。

有效数字 (Significant figures): 这是关于将数字四舍五入到最重要的位数。 例子: 如果计算结果是 12.34567,将其取至 3 位有效数字,结果就是 12.3。

估算 (Estimations): 有时候,心理学家会根据数据做出“最佳猜测”,看看最终结果是否合理。

快速回顾:
• 原始数据 = “混乱”的初步结果。
• 记录表 = 我们用来存放数据的“桶子”。
• 有效数字 = 只保留最重要的位数。

2. 数据类型

并非所有数据都是一样的!心理学家使用四大类别:

量化数据 (Quantitative Data): 这是以数字形式呈现的数据。 例子: 记忆测验中 8/10 的分数。 + 优点: 容易比较并转换成图表。 - 缺点: 缺乏细节;它无法告诉我们某人为何得到那个分数。

质性数据 (Qualitative Data): 这是以文字、描述或意义形式呈现的数据。 例子: 某人描述其感受的访谈逐字稿。 + 优点: 非常丰富且详尽。 - 缺点: 很难针对不同的人进行总结或比较。

主要数据 (Primary Data): 你为了特定研究而亲自收集的数据。 例子: 你对同学进行的问卷调查。

次要数据 (Secondary Data): 你正在使用的、由其他人收集的数据。 例子: 使用政府的犯罪率统计资料。

重点总结: 量化关于数量(有多少),而质性关于品质(它是什么样的)。

3. 测量层次(数据层次)

这是一种对数据精确度进行“排名”的方式。你可以用助记词 NOI 来记住它。

1. 名目层次数据 (Nominal Level Data): 最基本的层次。数据被放入类别或命名的群组中。 例子: 计算有多少人是“左撇子”与“右撇子”。

2. 次序层次数据 (Ordinal Level Data): 可以进行排序或排名的数据,但排名之间的差距并不相等。 例子: 比赛中的第 1、2、3 名。你知道谁跑得比较快,但第 1 名可能领先第 2 名 10 秒,而第 2 名只领先第 3 名 1 秒。

3. 等距层次数据 (Interval Level Data): 最精确的层次。数据是在具有固定、相等间隔的量表上测量的。 例子: 摄氏温度。10°C 到 11°C 之间的差距与 20°C 到 21°C 之间的差距完全相同。

4. 描述性统计:总结数据

一旦有了数字,就需要总结它们。我们使用集中趋势量数 (Measures of Central Tendency)(中间值)和离散程度量数 (Measures of Dispersion)(数据的分散程度)。

集中趋势量数

• 平均数 (Mean): 数学上的平均值。将所有分数相加并除以分数的总个数。 公式: \( \bar{x} = \frac{\sum x}{n} \)。
• 中位数 (Median): 将所有分数排序后位于中间的数值。
• 众数 (Mode): 出现次数最多的分数。

离散程度量数

• 全距 (Range): 最高分与最低分之间的差值(通常会再加 1)。
• 变异数 (Variance): 显示分数偏离平均值程度的计算。
• 标准差 (Standard Deviation): 最受欢迎的量数。它显示每个分数与平均值的平均距离。 类比: 如果班级的平均身高是 160 公分,标准差意味着每个人都差不多是 160 公分。标准差则意味着有些人非常矮,而有些人非常高。

其他数学知识

• 比率 (Ratio): 比较两个数量(例如 2:1)。
• 百分比 (Percentage): 以 100 为基数的分数。
• 分数 (Fractions): 整体的一部分(例如 1/4)。
• 次数分配表 (Frequency Tables): 通常称为“计数表”,用于计算事物发生的频率。

5. 数据呈现:图表

如果你不是艺术家也不要担心!只要记住哪种图表对应哪种数据即可:

条形图 (Bar Charts): 用于名目(类别)数据。条形之间不应该相连。
直方图 (Histograms): 用于等距数据。条形必须相连,因为数据是连续的。
散点图 (Scatter Diagrams): 用于相关性 (Correlations)。你绘制点来查看两个变量之间是否存在关系。
折线图 (Line Graphs): 用于显示事物的变化,通常是随时间的变化。
饼图 (Pie Charts): 用于显示整体的比例(百分比)。

常见错误: 学生常会为连续数据绘制条形图。记住:如果是分开的类别(如“猫与狗”),一定要留空隙!

6. 质性数据的分析

我们该拿那些文字怎么办呢?我们可以将质性数据转换为量化数据

这通常是透过内容分析法 (Content Analysis) 来完成的。你检视文字(如访谈逐字稿)并计算某些主题或“编码”出现了多少次。 例子: 如果你访问人们关于学校的感受,你可以计算他们说出“压力”这个词的次数。瞬间,你的文字就变成了数字!

7. 推论统计:结果是否“真实”?

这部分能帮助心理学家判断结果是因为自变量 (IV,即他们改变的东西) 造成的,还是仅仅出于“运气”(随机误差)。

概率与显著性

心理学家通常使用 \( p \le 0.05 \) 的显著性水平 (Significance level)。这意味着结果由偶然产生的概率为 5%(或更低)。如果 \( p \le 0.05 \),我们就会拒绝虚无假设 (null hypothesis)接受对立假设 (alternative hypothesis)

分配

常态分配 (Normal Distribution): 一种对称的“钟形”曲线,平均数、中位数和众数都在中间。
偏态分配 (Skewed Distributions): 当结果集中在一端时。 正偏态 (Positive Skew): 大多数分数较低(“尾巴”指向右侧)。 负偏态 (Negative Skew): 大多数分数较高(“尾巴”指向左侧)。

选择统计检验

你需要知道选择这五种非参数检验 (non-parametric tests) 的标准:

1. 曼-惠特尼 U 检验 (Mann-Whitney U): 用于独立样本设计 (Independent Measures)次序数据。
2. 威尔卡森符号等级检验 (Wilcoxon Signed Ranks): 用于重复测量设计 (Repeated Measures)次序数据。
3. 卡方检验 (Chi-Square): 用于独立组别和名目数据。
4. 二项式符号检验 (Binomial Sign): 用于重复测量名目数据。
5. 斯皮尔曼等级相关系数 (Spearman’s Rho): 用于寻找相关性时。

研究中的误差

第一类错误 (Type 1 Error,型一错误/假阳性): 你声称结果具有显著性,但实际上它们只是随机发生的。(你太宽松了)。
第二类错误 (Type 2 Error,型二错误/假阴性): 你声称结果不具显著性,但实际上存在效应。(你太严格了)。

本节重点:
• 推论统计检验告诉我们是否能信任我们的结果。
• p ≤ 0.05 是魔法数字。
• 第一类错误 = 看见了不存在的鬼魂。
• 第二类错误 = 错过了站在你身后那个真实的鬼魂!

必知符号

你必须能够在考试中识别并使用这些符号:
= 等于
< 小于
<< 远小于
>> 远大于
> 大于
成正比
~ 大约
大于或等于
小于或等于