欢迎来到随机变量的线性组合 (Linear Combinations of Random Variables)!
在之前的学习中,你已经学过如何求出单一随机变量的期望值 (Expectation) 和方差 (Variance)。但当我们奖它们组合在一起时会发生什么事呢?在现实世界中,事件很少是独立发生的。如果你要计算旅程的总时间,你可能需要将“步行时间”和“乘车时间”加总。如果你是一位企业主,你的总利润则是“总收入”减去“成本”。
在本章中,我们将探讨当结合不同的随机变量时,如何计算平均结果以及风险的离散程度。别担心,起初看起来可能会有点复杂——但只要你看出了其中的规律,其实就只是遵循几个黄金法则而已!
1. 组合任意随机变量
我们先从适用于任何随机变量(无论其分布为何,如二项分布、泊松分布等)的规则开始。
期望值规则(“友好”规则)
由 \(E(X)\) 表示的期望值表现非常“乖巧”。它完全符合你所预期的线性组合方式。如果你对变量进行缩放或将变量相加,平均值也会随之进行相同的运算。
课程大纲中的通用公式为:
\(E(aX + bY + c) = aE(X) + bE(Y) + c\)
其中 \(a, b,\) 和 \(c\) 为常数。
现实生活例子: 想象你在做副业,每小时赚取 \(X\) 元,外加一笔固定的 \(c\) 元小费。如果你工作了 3 小时 (\(a=3\)),你的预期收入就是 \(3 \times E(X) + c\)。
方差规则(“平方”规则)
由 \(Var(X)\) 表示的方差则比较敏感。在组合方差之前,有一个至关重要的条件必须检查:变量必须互相独立 (Independent)。
如果 \(X\) 和 \(Y\) 是独立的,公式如下:
\(Var(aX + bY + c) = a^2Var(X) + b^2Var(Y)\)
为什么 \(a\) 要平方? 记住,方差是一种“平方”度量。如果你将某物的尺寸加倍,其面积(方差)会增加 \(2^2 = 4\) 倍。
为什么 \(c\) 消失了? 加入常数 \(c\) 只会奖整个分布向上或向下平移,但并不会改变数据的“离散程度”。因此,常数对方差没有影响。
快速复习箱:
1. 期望值直接使用 \(a\)。
2. 方差使用 \(a^2\)。
3. 常数 \(c\) 会加进期望值中,但会被方差忽略。
重点总结: 期望值很直观,直接代入计算即可。方差则要求必须独立,并且千万记得要将系数平方!
2. 变量相加 vs. 相减
这就是许多学生容易跌倒的地方!我们来看看当我们奖一个变量减去另一个变量(例如 \(X - Y\))时会发生什么事。
差值的期望值
\(E(X - Y) = E(X) - E(Y)\)
例子:如果你预期收入为 £50,预期支出为 £30,那你预期剩下 £20。很简单吧!
差值的方差
\(Var(X - Y) = Var(X) + Var(Y)\)(前提是独立)
等等,为什么中间是加号?这是进阶数学中最常犯的错误!试着这样想:不确定性总是会累积的。 如果你不确定会赚多少 (\(X\)),也不确定会花多少 (\(Y\)),那么你对最终利润的不确定性只会更多。为了找出总离散程度,我们永远不会奖方差相减。
记忆小撇步: 把方差想象成“杂乱”。如果你奖两个凌乱的房间合并在一起,你得到的永远是更多的杂乱,绝不会减少!
重点总结: 无论是在计算 \(X+Y\) 还是 \(X-Y\),方差永远都是相加的:\(Var(X) + Var(Y)\)。
3. 加总相同变量 vs. 缩放变量
\(2X\)(取一个观测值并将其加倍)与 \(X_1 + X_2\)(取两个独立的观测值并将其相加)之间有很大的区别。
“一个大项目”(缩放:\(nX\))
如果你取一个随机变量并将其乘以 \(n\):
\(E(nX) = nE(X)\)
\(Var(nX) = n^2Var(X)\)
“多个小项目”(加总:\(X_1 + X_2 + ... + X_n\))
如果你对同一个变量取 \(n\) 个独立的观测值:
\(E(X_1 + ... + X_n) = nE(X)\)
\(Var(X_1 + ... + X_n) = nVar(X)\)
类比: 想象你要买 10 个苹果。
情境 A (\(10X\)):你挑选了一个苹果,收银员告诉你要总价是那颗苹果的 10 倍。如果那颗苹果特别重,那么整批苹果就很重。这风险很大(方差高)。
情境 B (\(X_1 + ... + X_{10}\)):你挑选了 10 个不同的苹果。有些可能重,有些可能轻。它们倾向于“相互抵消”。这风险较小(方差低)。
重点总结: 加总 \(n\) 个独立变量后的方差为 \(nVar(X)\);而奖单一变量缩放 \(n\) 倍后的方差则大得多,为 \(n^2Var(X)\)。
4. 正态分布变量的线性组合
正态分布有一个非常特殊的“超能力”:如果你结合正态分布变量,结果永远是另一个正态分布。这被称为再生性质 (Reproductive Property)。
根据课程大纲 (5.04b):
1. 若 \(X \sim N(\mu, \sigma^2)\),则 \(aX + b\) 也服从正态分布。
2. 若 \(X\) 和 \(Y\) 是独立的正态分布,则 \(aX + bY\) 也服从正态分布。
逐步教学:求出新的分布
如果你已知 \(X \sim N(\mu_X, \sigma_X^2)\) 和 \(Y \sim N(\mu_Y, \sigma_Y^2)\),且需要求出 \(W = aX + bY\) 的分布:
步骤 1:求出新的平均值。
\(E(W) = a\mu_X + b\mu_Y\)
步骤 2:求出新的方差。
\(Var(W) = a^2\sigma_X^2 + b^2\sigma_Y^2\)
步骤 3:写出分布。
\(W \sim N(E(W), Var(W))\)
你知道吗? 这个性质正是正态分布如此著名的原因。在许多科学实验中,“总误差”是许多小正态误差的总和,这意味着总误差本身也服从正态分布!
重点总结: “正态进,正态出”。只需算出新的平均值和方差,之后就可以使用标准正态分布步骤(或计算器)来求得概率。
总结检查表
在开始练习题目之前,请奖这些要点记在心里:
• 检查独立性: 除非变量互相独立,否则不能奖方差相加。
• 奖系数平方: 当奖数字从 \(Var(...)\) 括号中移出时,记得要平方 (\(a \rightarrow a^2\))。
• 永远不要相减方差: 即使变量是在相减 (\(X - Y\)),方差依然是相加的。
• 常数: 常数会平移平均值,但会被方差忽略。
• 正态依旧是正态: 正态变量的线性组合结果仍为正态分布。
鼓励的话: 你一定做得到的!从期望值(较简单的部分)开始建立信心,然后再仔细地一步步处理方差。加油!