欢迎来到随机变量的组合!
在你之前的统计单元中,已经学过如何处理单一随机变量,例如学生的身高或苹果的重量。但如果袋子里装了三个苹果会怎样?又或者,如果你想找出盒子重量与盒内物品重量之间的差异,该怎么算呢?
在本章中,我们将探讨如何结合不同的独立随机变量。这对于单元 S3 来说是一项至关重要的技能,因为它构成了稍后更进阶统计检验(Testing)的基础。如果刚开始觉得有点抽象也不用担心,只要看懂了其中的规律,它就像照着食谱做菜一样简单!
1. 先修知识:游戏规则
在结合变量之前,我们先快速重温统计学一 (S1) 中你需要用到的两条规则。若 \(X\) 为随机变量,而 \(a\) 与 \(b\) 为常数:
- 期望值(平均值): \(E(aX + b) = aE(X) + b\)
- 方差(离散程度): \(Var(aX + b) = a^2Var(X)\)
小贴士:请注意,对于方差而言,\(b\) 会消失(加上一个常数并不会改变数据的离散程度),而 \(a\) 需要平方,因为方差的单位是原始单位的平方!
2. 结合两个不同的变量
想象你有两个独立变量:\(X\)(咖啡杯的重量)和 \(Y\)(杯内咖啡的重量)。要找出总重量,我们关注的是 \(X + Y\)。
组合的平均值
计算新的平均值非常直接。只需根据期望值进行加减即可:
\(E(aX \pm bY) = aE(X) \pm bE(Y)\)
组合的方差
这是学生最容易出错的地方,请务必留意!如果 \(X\) 和 \(Y\) 是独立的:
\(Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)\)
等等,为什么两者中间都是加号?
把方差想成“不确定性”或“误差”。如果你加上两件物品,你的不确定性就会增加。即使你是从一个物品中减去另一个,总体的不确定性依然会增加,因为你结合了两次测量的“不稳定性”。
类比:如果你尝试测量两张摇晃的桌子之间的缝隙,这个缝隙会比单张桌子摇晃得更厉害!
避免常见错误:永远不要将方差相减。即使公式要求的是 \(X - Y\),你依然要相加方差:\(Var(X - Y) = Var(X) + Var(Y)\)。
3. 正态分布变量的线性组合
S3 课程大纲的核心重点在于,当 \(X\) 和 \(Y\) 皆服从正态分布 (Normal Distribution) 时会发生什么。
黄金法则:如果 \(X\) 和 \(Y\) 都是正态分布,那么它们的任何线性组合(例如 \(X + Y\) 或 \(2X - 3Y\))也必定是正态分布。
主公式
如果 \(X \sim N(\mu_x, \sigma_x^2)\) 和 \(Y \sim N(\mu_y, \sigma_y^2)\) 是独立的,那么:
\(aX \pm bY \sim N(a\mu_x \pm b\mu_y, a^2\sigma_x^2 + b^2\sigma_y^2)\)
解题步骤:
- 找出每个变量的平均值 (\(\mu\)) 和方差 (\(\sigma^2\))。
- 使用期望值规则计算新的平均值。
- 计算新的方差(记得将系数平方,并且永远执行加法)。
- 写出新的分布形式:\(N(\text{新平均值}, \text{新方差})\)。
- 使用计算器或正态分布表查出所需的概率。
范例:
饼干的重量 \(C \sim N(30, 2)\),其包装的重量 \(P \sim N(5, 0.5)\)。总重量 \(T = C + P\) 的分布为何?
\(E(T) = 30 + 5 = 35\)
\(Var(T) = 2 + 0.5 = 2.5\)
所以,\(T \sim N(35, 2.5)\)。
4. “总和”与“倍数”的陷阱
这是 Further Maths S3 最容易失分的地方之一。单一物品乘以 \(n\) 倍与 \(n\) 个独立物品相加之间有巨大的差异。
情况 A:单一变量的倍数 (\(nX\))
想象你拿取了一袋巨大的 2kg 面粉。
\(E(2X) = 2E(X)\)
\(Var(2X) = 2^2Var(X) = 4Var(X)\)
情况 B:独立变量的总和 (\(X_1 + X_2\))
想象你拿取了两袋分开的 1kg 面粉。因为它们是分开的,它们的变异可能会稍微抵消(一袋可能重一点,另一袋可能轻一点)。
\(E(X_1 + X_2) = E(X) + E(X) = 2E(X)\)
\(Var(X_1 + X_2) = Var(X) + Var(X) = 2Var(X)\)
重点总结:相加独立项目(情况 B)所得的方差会比将单一项目乘以倍数(情况 A)的方差小。在考试中请务必细读题目:你买的是“一瓶 5 公升的瓶子”(\(5X\)) 还是“五瓶 1 公升的瓶子”(\(X_1 + X_2 + X_3 + X_4 + X_5\))?
5. 总结与快速回顾
你知道吗?这种结合正态变量的能力,就是我们稍后在 S3 学到的中心极限定理 (Central Limit Theorem) 的基础,它能让我们对平均值进行预测!
快速回顾栏:
- 平均值:\(E(aX + bY) = aE(X) + bE(Y)\)
- 方差:\(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)
- 方差:\(Var(aX - bY) = a^2Var(X) + b^2Var(Y)\)(永远执行加法)
- 正态变量的线性组合永远是正态的。
- 标准差是方差的平方根——使用这些公式前,请务必先换算成方差!
鼓励一下:如果方差的规则让你感到奇怪,记住“摇晃的桌子”那个类比就好。误差永远只会叠加!多练习几个关于 \(X_1 + X_2\) 对比 \(2X\) 的题目,很快你就会成为这部分的专家了。