Experimental design

实验设计简介

欢迎！在这一章，我们将探讨统计学的“蓝图”。实验设计（Experimental Design）是指对研究进行规划，以确保收集到的数据尽可能可靠且准确的过程。无论你是在测试一款新的运动饮料还是一种医疗方案，如何设定测试方式与结果本身同样重要。

这就像盖房子一样：如果地基不稳，整座房子可能会倒塌！读完这些笔记后，你将学会如何构建一个“稳固”的实验，从而避免偏差（bias）并减少误差。

1. 实验的核心要素

要进行一场公平的实验，你需要掌握几个关键概念，并能在考试中进行讨论。

对照组与实验组（Control and Experimental Groups）

想象一下，你想测试一种新的“超级生长”肥料对植物是否有效。你不能只是给十棵植物施肥就看它们长得如何。为什么？因为植物本来就会长大！你需要一个基准来进行比较。

实验组（Experimental Group）：接受处理的一组（例如：使用“超级生长”肥料的植物）。
对照组（Control Group）：处理方式完全相同，但不接受处理的一组（例如：只浇清水的植物）。

随机化（Randomisation）

这是统计学家工具箱中最重要的工具之一。随机化是指使用随机机会（例如抛硬币或使用随机数产生器）将对象分配到各组中。这有助于确保在实验开始前，各组之间尽可能相似，从而避免偏差。

例子：如果研究人员亲自挑选看起来最健康的植物放入肥料组，实验就不公平了。随机分配能消除这种人为偏差。

重复（Replication）

单一结果可能只是巧合。重复是指在许多对象身上或多次重复进行实验。我们拥有的对象越多（样本量越大），我们就越能确信结果不是纯属运气。

实验误差（Experimental Error）

别担心，“误差”并不一定意味着你做错了什么！在统计学中，实验误差是指数据中自然出现的差异。即使两棵植物完全相同并浇同样的水，它们的生长速度仍可能略有不同。我们设计的目标是将这种“背景噪音”降到最低。

快速回顾：“三大支柱”
1. 对照（Control）：需要有一个比较的基准。
2. 随机化（Randomisation）：利用随机性确保公平。
3. 重复（Replication）：多次执行以验证结果的真实性。

2. 盲法：保持客观

有时，我们认为会发生的事情会影响结果。这在人类研究中尤其明显。

单盲试验（Blind Trials）

在单盲试验中，受试者不知道自己身处哪一组。例如，在药物试验中，一个人服用真正的药丸，另一个人服用糖丸（即安慰剂，placebo），但两者都不知道自己服用的是哪一种。这能防止“安慰剂效应”，即人们仅仅因为认为自己服用了药物就感觉好转。

双盲试验（Double-Blind Trials）

这是“黄金标准”。在双盲试验中，受试者和接触他们的科研人员都不知道谁接受了哪种处理。这能防止研究人员无意间透露线索，或以有偏差的方式解释结果。

类比：这就像汽水的“盲测”。如果你知道自己在喝昂贵的品牌，你可能会说服自己它更好喝！

3. 改进设计：区组化与配对（Blocking and Pairing）

如果我们知道有什么因素可能会干扰结果（例如人的年龄或土壤类型），我们可以使用特定的设计来“抵销”这些影响。

区组化（Blocking）

区组化是指在随机化之前，将相似的对象分组。这些组别称为区组（blocks）。这有助于减少实验误差，因为我们是在“同类之间”进行比较。

例子：如果你在测试跑鞋，你可以根据体能水平（初级、中级、专业）建立“区组”，因为体能绝对会影响跑步时间。

配对比较（Paired Comparisons）

配对比较是一种减少误差的聪明方法。它涉及根据相似特征（如同卵双胞胎）将受试者两两配对，并让其中一个接受一种处理，另一个接受另一种处理。

更棒的是，有时你可以直接用同一个人作为他自己的“配对对象”。
例子：测试两款不同的防晒霜，在同一个人的左手臂涂抹防晒霜 A，右手臂涂抹防晒霜 B。这几乎消除了所有“人与人之间”的差异！

4. 实验设计的类型

你需要能够区分这两种主要的设置：

完全随机设计（Completely Randomised Design）

这是最简单的设置。你将所有受试者混在一起，然后随机分配到各个组别。
优点：非常容易设置。
缺点：如果你的受试者差异很大（例如，有非常老的，也有非常年轻的），“运气”可能会不小心让所有老人分到同一组，从而破坏公平性。

随机区组设计（Randomised Block Design）

首先，你将受试者分成不同的区组（相似的组别）。然后，在每个区组内，再随机分配处理方式。
优点：准确性高得多，因为它确保了每种处理在各类受试者中都能得到公平测试。
缺点：组织起来较复杂。

关键点：
当你知道某个特定因素（如年龄、性别或体重）可能会影响结果时，请使用区组化。它有助于“过滤掉”该因素的影响，让你看到处理本身的真实效果。

考试总结检查清单

当题目要求你讨论或评论一个实验时，请检查以下几点：

● 是否进行了随机化？如果没有，请指出存在偏差的风险。
● 是否有对照组？如果没有，我们怎么知道变化真的是由处理引起的？
● 是否进行了重复？样本量是否大到足以可靠？
● 是否可以采用盲法？如果涉及人类，他们通常应该对处理方式保持“盲目”。
● 是否应该使用区组化？确定是否有变量（如年龄或物种）应该先进行分组。

如果这部分看起来比数学密集的章节更啰嗦，请别担心！在 Paper 1 中，你解释为什么某个设计好坏的能力才是得分关键。只需不断思考：“这个测试公平吗？它能保持一致性吗？”

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。