欢迎来到方法学议题的世界!

你有没有想过,为什么有些心理学研究举世闻名,而另一些却被抛诸脑后?这通常归结于方法学议题(Methodological Issues)。你可以把这一章看作是你的“心理学胡说检测器”。你将学会如何审视一项研究,并问自己:“这真的是事实吗?这对我由适用性吗?这项研究做得公正吗?”

如果有些术语起初看起来像外星语言,别担心。学完这些笔记后,你就能像专业人士一样进行研究评估了!


1. 我们在谈论谁?代表性与概括性

想象一下,你想知道所有英国青少年的最爱食物是什么。如果你只问了站在披萨店外的五个人,你的结果恐怕不会太准确。这就引出了我们头两个重要的概念。

代表性(Representativeness)

这指的是你的样本(sample)(研究中的参与者)是否能反映你的目标群体(target population)(你所感兴趣的对象)。
例子:如果你研究的是“人类记忆”,但只测试了 19 岁的大学生,你的样本对整个人类种族而言并不具备良好的代表性

概括性(Generalisability)

这是所谓的“那又怎样?”因素。如果一项研究具有概括性,意味着我们可以安全地将研究结果应用到那些并没有参与研究的人身上。
小贴士:如果一个样本具有代表性,通常意味着其结果具有概括性。两者是密不可分的!

重点总结:如果研究存在抽样偏差(sampling bias)(例如:只使用单一性别或单一文化),我们就无法轻易将结果概括(generalise)到其他人身上。

2. 我们能信任它吗?信度(Reliability)

信度讲究的是一致性(consistency)。如果你站上体重秤显示 70kg,下来后再站上去又变成 85kg,那这个体重秤就是不可靠(unreliable)的。它缺乏一致性。

信度的类型:

内部信度(Internal Reliability):测试或问卷中不同的部分是否测量的是同一件事?
例子:如果一份“快乐测验”有 10 个问题,但第 5 题问的是你的身高,那么这一题就破坏了内部信度,因为它与其他题目不相关。

外部信度(External Reliability):如果在不同时间重复进行同一项研究,是否能产生相同的结果?

评分者信度(Inter-rater Reliability):当两位或多位研究人员观察同一种行为并比较他们的记录时。如果他们记录的内容一致,评分者信度就很高。
类比:想象足球比赛中的两位裁判。如果他们都一致判决那是犯规,那他们的“评分者信度”就很好!

重测信度(Test-retest):使用相同的任务对同一批参与者进行两次测试,看看得分是否相似。

折半信度(Split-half):一种检查内部信度的方法,将测验一分为二,看看参与者在两半部分得分是否相似。

快速复习:信度 = 一致性。如果你在考试题目中看到“一致(consistent)”这个词,请联想到信度(Reliability)

3. 这是“真相”吗?效度(Validity)

效度讲究的是准确性(accuracy)。这项测验真的测量到它宣称要测量的东西吗?

内部效度(Internal Validity)

研究人员是否真的在测量自变量(Independent Variable)(他们改变的变量),还是有其他因素(混淆变量/无关变量 extraneous variable)搞乱了结果?
例子:你想看看咖啡是否让人跑得更快。如果喝咖啡的那组恰好都是专业运动员,你的研究就缺乏内部效度,因为你无法确定是因为咖啡还是因为他们的体能技能让他们变快!

检查效度的其他方法:

表面效度(Face Validity):乍看之下,这项测验看起来是否像在测量它应该测量的东西?

建构效度(Construct Validity):测验是否测量了真正的“理论”或概念?(例如:智力测验真的能测量“智力”吗?)

同时效度(Concurrent Validity):这项新测验的结果是否与已建立的旧测验结果一致?

效标效度(Criterion Validity):该测验预测未来行为的能力如何?

外部效度(External Validity)

研究结果是否能应用于特定研究环境之外?
1. 人口效度(Population Validity):我们能将结果应用到其他群体的人吗?
2. 生态效度(Ecological Validity):我们能将结果应用到现实生活环境吗?
例子:在安静、乏味的实验室进行的记忆测试,可能具有较低的生态效度,因为现实生活充满了噪音和干扰。

重点总结:一项研究可以具有信度(一致性)但没有效度(准确性)。一个总是重了 5kg 的体重秤是可靠(reliable)的,因为它总是一致性地偏重 5kg,但它没有效度(valid),因为显示的数值不正确!

4. 那些会“搞砸”研究的因素

心理学很棘手,因为人们知道自己正在被研究,进而会改变行为!

需求特征(Demand Characteristics)

这是指参与者猜测到研究目的,并改变行为来“帮助”研究人员(“顺从效应/Please-U effect”)或是“破坏”研究(“反抗效应/Screw-U effect”)。

社会期许偏差(Social Desirability)

参与者通常会表现出一种让自己看起来很“好”或“正常”的样子。
例子:如果研究人员问“你每次上完厕所都会洗手吗?”,大多数人都会说“会”,即使他们其实没有,因为这在社会上是受到期许的。

研究者/观察者偏差(Researcher/Observer Bias)

研究者也是人!有时他们只会看到他们“想要”看到的结果,以证明他们的理论是正确的。

研究者/观察者效应(Researcher/Observer Effect(s))

研究人员的存在本身就会改变参与者的行为。想象一下,当老师站在你背后时,与他们离开房间时,你的行为举止有何不同!


5. 伦理:做“正确的事”

在英国,英国心理学会(BPS)制定了伦理守则。你可以用助记词:C.R.R.I. 来记住这四大支柱:

1. 尊重(Respect)

知情同意(Informed Consent):参与者应该知道他们参与的是什么。
退出权(Right to Withdraw):参与者可以随时离开,并带走他们的数据。
保密性(Confidentiality):对姓名和个人详细资料保密。

2. 能力(Competence)

心理学家只能进行他们具备相关资格的研究。

3. 责任(Responsibility)

保护参与者(Protection of Participants):参与者不得受到生理或心理上的伤害。
汇报(Debrief):研究结束后,告知参与者真实目的,并确保他们状态良好。

4. 诚信(Integrity)

欺骗(Deception):研究人员应避免对参与者撒谎,除非这对研究绝对必要(即使如此,事后也必须进行汇报!)。

快速复习框:
伦理原则:
  • 尊重(Respect):知情同意、退出权、隐私。
  • 能力(Competence):知道自己在做什么。
  • 责任(Responsibility):保护免受伤害、汇报。
  • 诚信(Integrity):诚实/避免欺骗。

6. 民族中心主义:常见的陷阱

民族中心主义(Ethnocentrism)是指我们仅从自身文化的角度去看待世界。
你知道吗?许多早期的心理学研究都是基于西方的、白人的、中产阶级的人群。如果我们假设他们的行为是全世界的“常态”,那我们就是在进行民族中心主义

常见的错误:不要把民族中心主义抽样偏差(Sampling Bias)混淆。抽样偏差是指谁参与了你的研究;而民族中心主义是一种将你的文化视为其他人标准的心态


方法学议题的最终总结

在考试评估一项研究时,问自己这“四大核心”问题:

  1. 信度(Reliability):测量结果是否一致?
  2. 效度(Validity):测量的是否真的是它宣称要测量的东西?
  3. 伦理(Ethics):参与者是否受到了公平对待?
  4. 概括性(Generalisability):我们可以将此应用于现实世界和其他人吗?

掌握这些,你就离 A 级成绩不远了!