欢迎来到数据记录、分析与呈现!
哈啰!别被这一章的标题吓到了。虽然它听起来很“数学”,但事实上,这是在讲述心理学家如何将复杂混乱的人类行为,转化为清晰易懂的信息。你可以把它看作是研究中的“说故事”环节——你已经收集了数据,现在要学习如何向大家解释这些数据背后的意义。
无论你热爱数字还是觉得它们有点棘手,这些笔记都旨在引导你一步步掌握这些流程。我们将涵盖如何记录数据、你会遇到的数据类型,以及用来找出规律的“神奇”公式。
1. 原始数据:起点
原始数据 (Raw data) 就是你在实验或观察期间收集到的“未经处理”信息,在对其进行任何加工之前的状态。
记录表的设计与使用: 在开始之前,你需要一个清晰的地方来放置结果。一个好的记录表应该有明确的标题,让任何查看它的人都能清楚知道测量的是什么。
标准形式与小数形式: 有时候数字会非常大或非常小。
标准形式 (Standard form) 是一种使用 10 的幂次来书写这些数字的方法。例如,5,000 会变成 \( 5 \times 10^3 \)。
小数形式 (Decimal form) 是我们书写数字的标准方式,例如 0.05。
有效数字 (Significant figures): 这是关于将数字四舍五入到最重要的位数。
例子: 如果计算结果是 12.34567,将其取至 3 位有效数字,结果就是 12.3。
估算 (Estimations): 有时候,心理学家会根据数据做出“最佳猜测”,看看最终结果是否合理。
快速回顾:
• 原始数据 = “混乱”的初步结果。
• 记录表 = 我们用来存放数据的“桶子”。
• 有效数字 = 只保留最重要的位数。
2. 数据类型
并非所有数据都是一样的!心理学家使用四大类别:
量化数据 (Quantitative Data): 这是以数字形式呈现的数据。
例子: 记忆测验中 8/10 的分数。
+ 优点: 容易比较并转换成图表。
- 缺点: 缺乏细节;它无法告诉我们某人为何得到那个分数。
质性数据 (Qualitative Data): 这是以文字、描述或意义形式呈现的数据。
例子: 某人描述其感受的访谈逐字稿。
+ 优点: 非常丰富且详尽。
- 缺点: 很难针对不同的人进行总结或比较。
主要数据 (Primary Data): 你为了特定研究而亲自收集的数据。
例子: 你对同学进行的问卷调查。
次要数据 (Secondary Data): 你正在使用的、由其他人收集的数据。
例子: 使用政府的犯罪率统计资料。
重点总结: 量化关于数量(有多少),而质性关于品质(它是什么样的)。
3. 测量层次(数据层次)
这是一种对数据精确度进行“排名”的方式。你可以用助记词 NOI 来记住它。
1. 名目层次数据 (Nominal Level Data): 最基本的层次。数据被放入类别或命名的群组中。
例子: 计算有多少人是“左撇子”与“右撇子”。
2. 次序层次数据 (Ordinal Level Data): 可以进行排序或排名的数据,但排名之间的差距并不相等。
例子: 比赛中的第 1、2、3 名。你知道谁跑得比较快,但第 1 名可能领先第 2 名 10 秒,而第 2 名只领先第 3 名 1 秒。
3. 等距层次数据 (Interval Level Data): 最精确的层次。数据是在具有固定、相等间隔的量表上测量的。
例子: 摄氏温度。10°C 到 11°C 之间的差距与 20°C 到 21°C 之间的差距完全相同。
4. 描述性统计:总结数据
一旦有了数字,就需要总结它们。我们使用集中趋势量数 (Measures of Central Tendency)(中间值)和离散程度量数 (Measures of Dispersion)(数据的分散程度)。
集中趋势量数
• 平均数 (Mean): 数学上的平均值。将所有分数相加并除以分数的总个数。
公式: \( \bar{x} = \frac{\sum x}{n} \)。
• 中位数 (Median): 将所有分数排序后位于中间的数值。
• 众数 (Mode): 出现次数最多的分数。
离散程度量数
• 全距 (Range): 最高分与最低分之间的差值(通常会再加 1)。
• 变异数 (Variance): 显示分数偏离平均值程度的计算。
• 标准差 (Standard Deviation): 最受欢迎的量数。它显示每个分数与平均值的平均距离。
类比: 如果班级的平均身高是 160 公分,小标准差意味着每个人都差不多是 160 公分。大标准差则意味着有些人非常矮,而有些人非常高。
其他数学知识
• 比率 (Ratio): 比较两个数量(例如 2:1)。
• 百分比 (Percentage): 以 100 为基数的分数。
• 分数 (Fractions): 整体的一部分(例如 1/4)。
• 次数分配表 (Frequency Tables): 通常称为“计数表”,用于计算事物发生的频率。
5. 数据呈现:图表
如果你不是艺术家也不要担心!只要记住哪种图表对应哪种数据即可:
条形图 (Bar Charts): 用于名目(类别)数据。条形之间不应该相连。
直方图 (Histograms): 用于等距数据。条形必须相连,因为数据是连续的。
散点图 (Scatter Diagrams): 用于相关性 (Correlations)。你绘制点来查看两个变量之间是否存在关系。
折线图 (Line Graphs): 用于显示事物的变化,通常是随时间的变化。
饼图 (Pie Charts): 用于显示整体的比例(百分比)。
常见错误: 学生常会为连续数据绘制条形图。记住:如果是分开的类别(如“猫与狗”),一定要留空隙!
6. 质性数据的分析
我们该拿那些文字怎么办呢?我们可以将质性数据转换为量化数据。
这通常是透过内容分析法 (Content Analysis) 来完成的。你检视文字(如访谈逐字稿)并计算某些主题或“编码”出现了多少次。
例子: 如果你访问人们关于学校的感受,你可以计算他们说出“压力”这个词的次数。瞬间,你的文字就变成了数字!
7. 推论统计:结果是否“真实”?
这部分能帮助心理学家判断结果是因为自变量 (IV,即他们改变的东西) 造成的,还是仅仅出于“运气”(随机误差)。
概率与显著性
心理学家通常使用 \( p \le 0.05 \) 的显著性水平 (Significance level)。这意味着结果由偶然产生的概率为 5%(或更低)。如果 \( p \le 0.05 \),我们就会拒绝虚无假设 (null hypothesis) 并接受对立假设 (alternative hypothesis)。
分配
常态分配 (Normal Distribution): 一种对称的“钟形”曲线,平均数、中位数和众数都在中间。
偏态分配 (Skewed Distributions): 当结果集中在一端时。
正偏态 (Positive Skew): 大多数分数较低(“尾巴”指向右侧)。
负偏态 (Negative Skew): 大多数分数较高(“尾巴”指向左侧)。
选择统计检验
你需要知道选择这五种非参数检验 (non-parametric tests) 的标准:
1. 曼-惠特尼 U 检验 (Mann-Whitney U): 用于独立样本设计 (Independent Measures) 和次序数据。
2. 威尔卡森符号等级检验 (Wilcoxon Signed Ranks): 用于重复测量设计 (Repeated Measures) 和次序数据。
3. 卡方检验 (Chi-Square): 用于独立组别和名目数据。
4. 二项式符号检验 (Binomial Sign): 用于重复测量和名目数据。
5. 斯皮尔曼等级相关系数 (Spearman’s Rho): 用于寻找相关性时。
研究中的误差
第一类错误 (Type 1 Error,型一错误/假阳性): 你声称结果具有显著性,但实际上它们只是随机发生的。(你太宽松了)。
第二类错误 (Type 2 Error,型二错误/假阴性): 你声称结果不具显著性,但实际上存在效应。(你太严格了)。
本节重点:
• 推论统计检验告诉我们是否能信任我们的结果。
• p ≤ 0.05 是魔法数字。
• 第一类错误 = 看见了不存在的鬼魂。
• 第二类错误 = 错过了站在你身后那个真实的鬼魂!
必知符号
你必须能够在考试中识别并使用这些符号:
= 等于
< 小于
<< 远小于
>> 远大于
> 大于
∝ 成正比
~ 大约
≥ 大于或等于
≤ 小于或等于