导言:解读数字

欢迎!你已经规划好研究、招募了参加者并收集了数据。但接下来呢?你手头上可能有一堆数字或厚厚的访谈逐字稿。本章将介绍心理学家如何整理这些“杂乱”的信息,通过分析找出其意义,并将其呈现出来以便他人理解。别担心,如果你不是一个“数学高手”——我们会一步一步为你拆解所有内容!

1. 原始数据:起点

原始数据 (Raw data) 简单来说,就是你在研究过程中收集到的最初、未经过处理的信息。在进行任何复杂的计算之前,你需要先将它们整理好。

设计数据记录表

一个好的记录表应该清晰且具逻辑性。它通常包含代表自变量 (Independent Variable, IV) 条件的列,以及代表每位参加者的行。 例子:如果你正在测试咖啡是否有助于记忆,其中一列应为“咖啡组”,另一列为“清水组”。

处理数字(数学技巧)

心理学涉及一些基础算术,你需要熟悉以下概念:

  • 标准形式 (Standard Form):一种书写极大或极小数值的方法。例如,\(1.2 \times 10^3\) 只是 \(1,200\) 的另一种写法。
  • 小数形式 (Decimal Form):确保你能将分数(如 \(1/4\))转换为小数 (\(0.25\))。
  • 有效数字 (Significant Figures):这涉及四舍五入至最关键的位数。如果计算器显示 \(12.34567\),老师可能要求你保留 3 位有效数字,即 \(12.3\)。
  • 估算 (Estimations):有时候你需要对结果进行“估算”,以检查你的最终计算结果看起来是否合理。

快速复习:请务必清楚标注你的表格,这样即使是陌生人也能看懂这些数字代表什么!

2. 数据类型

在心理学中,我们主要通过两种方式将数据分类:按其性质(它看起来像什么)和来源(它来自哪里)。

数据性质:定量与定性

定量数据 (Quantitative Data):数字和统计数据。 例子:测验得分 8/10。
优点:易于比较并制作成图表。
缺点:缺乏细节;我们无法得知受试者*为什么*得到那个分数。

定性数据 (Qualitative Data):文字、描述和意义。 例子:参加者描述其在实验过程中的感受。
优点:细节丰富且具深度。
缺点:难以分析或在不同人之间进行比较。

数据来源:第一手与第二手

第一手数据 (Primary Data):你自己为特定研究收集的数据。
第二手数据 (Secondary Data):由他人收集的数据(例如使用政府统计资料或其他研究人员的结果)。

记忆小撇步:Primary(第一手)就是 Personal(个人的,你自己做的!)。Secondary(第二手)就是 Second-hand(二手转来的)。

3. 数据层次(测量尺度)

这是一种为数值数据的精确度进行“分级”的方法,这是非常常见的考点!

  • 名义尺度 (Nominal Level):数据被分成独立类别,没有先后“顺序”。
    例子:按最喜欢的颜色(红、蓝、绿)将人们分类。
  • 次序尺度 (Ordinal Level):数据可以排列顺序或等级,但等级之间的差距并不相等。
    例子:比赛名次(第一名、第二名、第三名)。我们知道谁跑得更快,但不知道快了多少秒。
  • 等距尺度 (Interval Level):在固定的刻度上测量,点与点之间的间距相等。这是最精确的。
    例子:摄氏温度或以秒为单位的时间。

重点总结:从名义尺度进阶到等距尺度,就像从模糊的照片升级到高清视频一样——你能获得更丰富的细节!

4. 定性数据的分析

我们如何将长篇的访谈内容转化为可分析的数据?我们使用将定性数据转化为定量数据的过程。这通常涉及“编码”——在文字中寻找主题并计算它们出现的次数。
例子:如果有五名参加者提到感到“紧张”,你可以为“焦虑”这个主题记录数字“5”。

5. 描述统计

这些统计数据用于总结你的资料,以便观察整体的“趋势”。

集中趋势测量(平均值)

1. 平均数 (Mean):将所有分数相加后除以分数总数。
适用情况:当你拥有等距数据且没有极端的“离群值”时。
2. 中位数 (Median):当所有数字按顺序排列时,位于中间的分数。
适用情况:当数据出现“异常”,有一两个极高或极低的分数时。
3. 众数 (Mode):出现次数最多的分数。
适用情况:当你有名义数据(类别)时。

离散程度测量(分布)

这告诉我们分数是聚集在一起,还是分散得非常广。

  • 全距 (Range):最高分与最低分之间的差值。(最高分 \(-\) 最低分)。它很简单,但如果有一个异常高的分数,可能会产生误导!
  • 变异数与标准差 (Variance and Standard Deviation):它们告诉我们平均而言,分数偏离平均值的程度。高标准差表示分数分布极广;低标准差表示参加者的得分非常相似。

你知道吗?次数分配表(计数表)是在计算这些测量值之前整理原始数据最快的方法!

6. 数据可视化:图表

图表能帮助我们瞬间观察到模式。你必须知道哪种图表适合哪种数据:

  • 条形图 (Bar Charts):用于名义数据(类别)。条形之间没有相连。
  • 直方图 (Histograms):用于连续数据(如年龄或时间)。条形之间相连。
  • 折线图 (Line Graphs):显示某事物如何变化,通常随时间变化。
  • 饼图 (Pie Charts):显示整体中的比例或百分比。
  • 散点图 (Scatter Diagrams):用于相关性研究,显示两个变量之间的关系。

常见错误:忘记标记 X 轴(水平)和 Y 轴(垂直)。请务必为你的图表加上清晰的标题!

7. 推论统计:关键的“决定”

描述统计告诉我们数据“看起来”如何。推论统计则帮助我们判断结果是“真实的”,还是纯粹出于偶然。这是我们检验假设的地方。

概率与显著性

心理学家使用显著性水平 (significance level),通常写作 \(p < 0.05\)。这意味着结果纯属巧合的可能性小于 5%。如果 \(p < 0.05\),我们就会拒绝零假设 (null hypothesis)接受备择假设 (alternative hypothesis)

第一类错误与第二类错误

  • 第一类错误 (Type 1 Error):“伪阳性”。你声称结果具有显著性,但实际上它们只是偶然发生。(就像“狼来了”的故事,但其实根本没有狼)。
  • 第二类错误 (Type 2 Error):“伪阴性”。你声称结果不具显著性,但其实确实存在影响。(就像狼真的来了,你却错过了)。

选择统计检验

你不需要亲自计算所有这些检验,但你必须知道何时使用它们!这些“准则”取决于研究的设计数据层次

非参数检验 (Non-Parametric Tests)(五大检验):

1. 曼-惠特尼 U 检验 (Mann-Whitney U):独立组设计,次序数据。
2. 威尔科克森符号秩检验 (Wilcoxon Signed Ranks):重复测量设计,次序数据。
3. 卡方检验 (Chi-Square):独立组设计,名义数据。(注意:你必须学会如何计算这个!
4. 二项式符号检验 (Binomial Sign):重复测量设计,名义数据。
5. 斯皮尔曼等级相关系数 (Spearman’s Rho):用于相关性研究。

参数检验的准则:

这些是更“强大”的检验,仅在以下情况使用:

  • 数据为等距尺度。
  • 数据遵循常态分布(钟形曲线)。
  • 各组之间的变异数(离散程度)相似。

快速提示:使用助记词来记住这些检验,但请务必检查教科书中的“检验选择”流程图——它绝对能救你一命!

总结:数据之旅

1. 收集原始数据并以表格整理。
2. 识别数据层次(名义、次序或等距)。
3. 计算描述统计(平均数、中位数、众数、全距、标准差)。
4. 制作图表以可视化呈现趋势。
5. 进行推论统计检验以查看结果是否显著 (\(p < 0.05\))。
6. 在得出最终结论前,检查是否有第一类或第二类错误