Linear combinations of random variables 学习笔记

随机变量的线性组合（Paper 6，第 6.2 节）

你好！欢迎来到 P2 统计学中最实用且考试频率最高的课题之一：随机变量的线性组合。别被这个长长的名字吓到了——这一章的核心就是：当你把不同的随机结果合并、相加或相减时，如何计算它们的均值（期望值）和方差（离散程度）。

可以这样理解： 如果你知道你早上通勤时间（X）和下午返程时间（Y）的平均值和波动情况，那么如何找到你每日总通勤时间（X + Y）的平均值和波动情况呢？本章将为你提供解决这些问题的简单规则！

1. 对单个随机变量进行变换：\(aX + b\)

在合并两个变量（如 \(X+Y\)）之前，我们先看如何变换单个变量 \(X\)。这在计算成本、缩放测量值或转换单位时非常必要。

A. 期望值（均值）的规则

期望值，即均值（\(E\)），衡量的是分布的中心。它遵循非常直观的规则：

规则 1：缩放与平移

\[ E(aX + b) = aE(X) + b \]

类比： 假设 \(X\) 是一杯咖啡的价格，均值 \(E(X) = 4\) 美元。如果政府增加了 \(0.5\) 美元的固定税费（\(b=0.5\)），然后商店将基础价格翻倍（\(a=2\)），那么新的预期价格简单地就是 \(2(4) + 0.5 = 8.5\) 美元。期望值非常容易——它是线性的。

B. 方差（离散程度）的规则

方差（\(Var\)）衡量的是围绕均值的离散程度或波动性。这是学生最容易犯小错的地方，所以请务必仔细阅读！

规则 2：方差不受平移影响

对每个值加上或减去一个常数（\(b\)）会使整个分布发生平移，但这并不会改变数值之间的离散程度。

\[ Var(X + b) = Var(X) \]

规则 3：缩放因子对方差的影响需平方

如果你将变量乘以一个常数 \(a\)，离散程度会被乘以 \(a^2\)。这是因为方差是用与均值的差值的平方来计算的。

\[ Var(aX + b) = a^2 Var(X) \]

关键点： 常数 \(b\) 在计算方差时完全消失了。

快速回顾：单个变量的变换

对于 \(Y = aX + b\)：

期望值 (\(E\))： 线性的！直接乘以系数并进行加减即可。\(E(Y) = aE(X) + b\)。
方差 (\(Var\))： 将乘数 \(a\) 平方，并忽略常数 \(b\)。\(Var(Y) = a^2 Var(X)\)。

2. 合并两个独立的随机变量：\(aX \pm bY\)

在现实世界中，我们很少只处理一个变量。我们需要规则来合并两个（或多个）不同的变量，比如计算随机挑选的两个苹果的总重量（\(X+Y\)）。

以下方差规则的关键前提条件是变量 \(X\) 和 \(Y\) 必须是相互独立的。（在 AS & A Level 数学中，除非另有说明，否则通常假设变量间是独立的。）

A. 合并期望值的规则

期望值保持着美妙的直观性，并且总是线性合并的：

规则 4：和与差的期望值

和的均值等于均值之和，差的均值等于均值之差。

\[ E(aX + bY) = aE(X) + bE(Y) \]

注意： 即使 X 和 Y 不是独立的，此规则也成立，但教学大纲重点在于将其与方差的独立性假设结合使用。

B. 合并方差的黄金准则

这是本章中最重要且最常被误用的公式。

规则 5：方差永远相加（针对独立变量）

无论你是计算和的方差（\(X+Y\)）还是差的方差（\(X-Y\)），各变量的方差永远相加。

\[ Var(aX \pm bY) = Var(aX) + Var(bY) = a^2 Var(X) + b^2 Var(Y) \]

为什么即使是相减，方差也要相加？
类比： 考虑两个旅程时间 X 和 Y。如果你计算总时间 \(X+Y\)，不确定性增加了。如果你计算差值 \(X-Y\)，不确定性依然会增加！你对 X 有不确定性，对 Y 也有不确定性。相减并不会神奇地抵消不确定性，反而会使它叠加。你对最终结果的把握越小，意味着离散程度（方差）越大。

常见错误预警！
永远不要写 \(Var(X - Y) = Var(X) - Var(Y)\)。这是错误的。如果你看到变量之间有减号，请立刻在脑海中将其对方差的处理方式转为加法：\(Var(X - Y) = Var(X) + Var(Y)\)。

要点总结：规则检查清单（针对独立的 X 和 Y）

设 \(W = aX + bY\)。

\(E(W)\)： \(aE(X) + bE(Y)\)。（直接进行加减运算。）
\(Var(W)\)： \(a^2 Var(X) + b^2 Var(Y)\)。（系数平方，方差永远相加。）

3. 特殊分布的合并

在合并随机变量时，结果分布的形状很重要，尤其是如果你打算计算概率（例如使用正态分布表）。这里的关键概念是，对于某些常见的分布，线性组合的结果通常保持相同的分布族。

A. 正态变量的线性组合

如果 \(X\) 服从正态分布，且 \(Y\) 服从正态分布，那么它们的线性组合（前提是它们相互独立）也必然服从正态分布。

如果 \(X \sim N(\mu_X, \sigma_X^2)\)，\(Y \sim N(\mu_Y, \sigma_Y^2)\)，且它们相互独立，则：

\[ aX \pm bY \sim N \left( E(aX \pm bY), \ Var(aX \pm bY) \right) \]

这意味着： 如果你在相加或相减两个正态变量，新的变量也是正态分布的。你只需要使用第 2 节中的规则算出新的均值和新的方差即可。

示例场景： 成年男性体重（\(M\)）服从正态分布，儿童体重（\(C\)）也服从正态分布。如果你各随机挑选一人，总重量（\(M+C\)）也是正态分布的。这一点至关重要，因为它意味着你可以使用标准正态分布（\(Z\)）来计算总重量的概率。

你知道吗？

这一特性——两个独立正态变量之和依然服从正态分布——正是正态分布在统计学中如此特殊且实用的原因！

B. 泊松变量的线性组合

教学大纲要求你掌握两个独立泊松变量之和的结果。缩放或相减泊松变量通常超出 Paper 6 的考试范围。

规则 6：独立泊松变量之和

如果 \(X\) 和 \(Y\) 是独立的泊松分布，它们的和 \(X+Y\) 也是泊松分布，其中均值参数（\(\lambda\)）相加。

如果 \(X \sim Po(\lambda_X)\)，\(Y \sim Po(\lambda_Y)\)，且它们独立，则：

\[ X + Y \sim Po(\lambda_X + \lambda_Y) \]

示例场景： Jane 收到的邮件数量（\(X\)）服从 \(Po(2)\)，David 收到的邮件数量（\(Y\)）服从 \(Po(3)\)。如果他们相互独立，两人收到的邮件总数（\(X+Y\)）服从 \(Po(2+3) = Po(5)\)。

这一特性与通用规则一致，因为对于泊松分布，\(E(X) = \lambda\) 且 \(Var(X) = \lambda\)。

\(E(X+Y) = E(X) + E(Y) = \lambda_X + \lambda_Y\)
\(Var(X+Y) = Var(X) + Var(Y) = \lambda_X + \lambda_Y\)

由于新变量 \(X+Y\) 的均值和方差都是 \(\lambda_X + \lambda_Y\)，它完全符合参数为 \(\lambda_X + \lambda_Y\) 的泊松分布的条件。

4. 分步解题策略

大多数涉及线性组合的问题，都需要在计算概率之前仔细应用期望值和方差规则。

示例：总生产时间

组装零件 A 所需时间（分钟）为 \(T_A \sim N(10, 4)\)。零件 B 所需时间为 \(T_B \sim N(15, 9)\)。某工人独立完成了 3 个零件 A 和 2 个零件 B。求总时间 \(T_{Total}\) 的分布。

第 1 步：定义组合变量。
总时间为 \(T_{Total} = T_{A1} + T_{A2} + T_{A3} + T_{B1} + T_{B2}\)。
或者，由于所有的 \(T_A\) 都是独立且相同的，我们可以写成： \[ T_{Total} = 3T_A + 2T_B \]

第 2 步：计算期望值 (\(E\))。

\[ E(T_{Total}) = E(3T_A + 2T_B) = 3E(T_A) + 2E(T_B) \] \[ E(T_{Total}) = 3(10) + 2(15) = 30 + 30 = 60 \text{ 分钟} \]

第 3 步：计算方差 (\(Var\))。

记住，方差永远相加，且系数要平方！

\[ Var(T_{Total}) = Var(3T_A + 2T_B) = 3^2 Var(T_A) + 2^2 Var(T_B) \] \[ Var(T_{Total}) = 9(4) + 4(9) = 36 + 36 = 72 \]

第 4 步：说明最终分布。

由于 \(T_A\) 和 \(T_B\) 均服从正态分布，它们的组合也服从正态分布。

\[ T_{Total} \sim N(60, 72) \]

接下来，你可以利用这个新分布通过标准正态变换（Z-score）来求解任何概率问题。

关于系数平方的重要提示：
一个常见的困惑点是 \(X_1 + X_2 + X_3\) 与 \(3X\) 之间的区别。

如果你观察的是三个独立观察值之和（例如三个随机抽取的不同零件），方差是 \(Var(X_1) + Var(X_2) + Var(X_3)\)。如果它们是相同的，则为 \(3 Var(X)\)。
如果你观察的是一个观察值乘以 3（缩放因子），方差则是 \(Var(3X) = 3^2 Var(X) = 9 Var(X)\)。

请确保你的公式反映了问题的实际情况：你是将多个物品相加，还是在缩放同一个物品？ 当 \(Y\) 为零常数时，公式 \(Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\) 可以优雅地处理这两种情况。

线性组合检查清单

确定新变量（例如 \(W = X - Y\) 或 \(W = 5X + 2Y\)）。
计算新的期望值（均值进行线性加减）。
计算新的方差（系数平方，方差永远相加）。
确定新变量的分布类型（通常，若原始分量是正态分布，组合后仍为正态分布；若原始分量是泊松分布且做加法，则仍为泊松分布）。
使用新分布的参数（\(\mu_W\) 和 \(\sigma_W^2\)）计算所需概率。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

Linear combinations of random variables