随机变量的线性组合(Paper 6,第 6.2 节)

你好!欢迎来到 P2 统计学中最实用且考试频率最高的课题之一:随机变量的线性组合。别被这个长长的名字吓到了——这一章的核心就是:当你把不同的随机结果合并、相加或相减时,如何计算它们的均值(期望值)和方差(离散程度)。

可以这样理解: 如果你知道你早上通勤时间(X)和下午返程时间(Y)的平均值和波动情况,那么如何找到你每日总通勤时间(X + Y)的平均值和波动情况呢?本章将为你提供解决这些问题的简单规则!

1. 对单个随机变量进行变换:\(aX + b\)

在合并两个变量(如 \(X+Y\))之前,我们先看如何变换单个变量 \(X\)。这在计算成本、缩放测量值或转换单位时非常必要。

A. 期望值(均值)的规则

期望值,即均值(\(E\)),衡量的是分布的中心。它遵循非常直观的规则:

规则 1:缩放与平移

\[ E(aX + b) = aE(X) + b \]

类比: 假设 \(X\) 是一杯咖啡的价格,均值 \(E(X) = 4\) 美元。如果政府增加了 \(0.5\) 美元的固定税费(\(b=0.5\)),然后商店将基础价格翻倍(\(a=2\)),那么新的预期价格简单地就是 \(2(4) + 0.5 = 8.5\) 美元。期望值非常容易——它是线性的。

B. 方差(离散程度)的规则

方差(\(Var\))衡量的是围绕均值的离散程度或波动性。这是学生最容易犯小错的地方,所以请务必仔细阅读!

规则 2:方差不受平移影响

对每个值加上或减去一个常数(\(b\))会使整个分布发生平移,但这并不会改变数值之间的离散程度。

\[ Var(X + b) = Var(X) \]

规则 3:缩放因子对方差的影响需平方

如果你将变量乘以一个常数 \(a\),离散程度会被乘以 \(a^2\)。这是因为方差是用与均值的差值的平方来计算的。

\[ Var(aX + b) = a^2 Var(X) \]

关键点: 常数 \(b\) 在计算方差时完全消失了。

快速回顾:单个变量的变换

对于 \(Y = aX + b\):

  • 期望值 (\(E\)): 线性的!直接乘以系数并进行加减即可。\(E(Y) = aE(X) + b\)。
  • 方差 (\(Var\)): 将乘数 \(a\) 平方,并忽略常数 \(b\)。\(Var(Y) = a^2 Var(X)\)。

2. 合并两个独立的随机变量:\(aX \pm bY\)

在现实世界中,我们很少只处理一个变量。我们需要规则来合并两个(或多个)不同的变量,比如计算随机挑选的两个苹果的总重量(\(X+Y\))。

以下方差规则的关键前提条件是变量 \(X\) 和 \(Y\) 必须是相互独立的。(在 AS & A Level 数学中,除非另有说明,否则通常假设变量间是独立的。)

A. 合并期望值的规则

期望值保持着美妙的直观性,并且总是线性合并的:

规则 4:和与差的期望值

和的均值等于均值之和,差的均值等于均值之差。

\[ E(aX + bY) = aE(X) + bE(Y) \]

注意: 即使 X 和 Y 不是独立的,此规则也成立,但教学大纲重点在于将其与方差的独立性假设结合使用。

B. 合并方差的黄金准则

这是本章中最重要且最常被误用的公式。

规则 5:方差永远相加(针对独立变量)

无论你是计算的方差(\(X+Y\))还是的方差(\(X-Y\)),各变量的方差永远相加

\[ Var(aX \pm bY) = Var(aX) + Var(bY) = a^2 Var(X) + b^2 Var(Y) \]

为什么即使是相减,方差也要相加?
类比: 考虑两个旅程时间 X 和 Y。如果你计算总时间 \(X+Y\),不确定性增加了。如果你计算差值 \(X-Y\),不确定性依然会增加!你对 X 有不确定性,对 Y 也有不确定性。相减并不会神奇地抵消不确定性,反而会使它叠加。你对最终结果的把握越小,意味着离散程度(方差)越大。

常见错误预警!
永远不要写 \(Var(X - Y) = Var(X) - Var(Y)\)。这是错误的。如果你看到变量之间有减号,请立刻在脑海中将其对方差的处理方式转为加法:\(Var(X - Y) = Var(X) + Var(Y)\)。

要点总结:规则检查清单(针对独立的 X 和 Y)

设 \(W = aX + bY\)。

  • \(E(W)\): \(aE(X) + bE(Y)\)。(直接进行加减运算。)
  • \(Var(W)\): \(a^2 Var(X) + b^2 Var(Y)\)。(系数平方,方差永远相加。)

3. 特殊分布的合并

在合并随机变量时,结果分布的形状很重要,尤其是如果你打算计算概率(例如使用正态分布表)。这里的关键概念是,对于某些常见的分布,线性组合的结果通常保持相同的分布族。

A. 正态变量的线性组合

如果 \(X\) 服从正态分布,且 \(Y\) 服从正态分布,那么它们的线性组合(前提是它们相互独立)也必然服从正态分布

如果 \(X \sim N(\mu_X, \sigma_X^2)\),\(Y \sim N(\mu_Y, \sigma_Y^2)\),且它们相互独立,则:

\[ aX \pm bY \sim N \left( E(aX \pm bY), \ Var(aX \pm bY) \right) \]

这意味着: 如果你在相加或相减两个正态变量,新的变量也是正态分布的。你只需要使用第 2 节中的规则算出新的均值和新的方差即可。

示例场景: 成年男性体重(\(M\))服从正态分布,儿童体重(\(C\))也服从正态分布。如果你各随机挑选一人,总重量(\(M+C\))也是正态分布的。这一点至关重要,因为它意味着你可以使用标准正态分布(\(Z\))来计算总重量的概率。

你知道吗?

这一特性——两个独立正态变量之和依然服从正态分布——正是正态分布在统计学中如此特殊且实用的原因!

B. 泊松变量的线性组合

教学大纲要求你掌握两个独立泊松变量之和的结果。缩放或相减泊松变量通常超出 Paper 6 的考试范围。

规则 6:独立泊松变量之和

如果 \(X\) 和 \(Y\) 是独立的泊松分布,它们的和 \(X+Y\) 也是泊松分布,其中均值参数(\(\lambda\))相加。

如果 \(X \sim Po(\lambda_X)\),\(Y \sim Po(\lambda_Y)\),且它们独立,则:

\[ X + Y \sim Po(\lambda_X + \lambda_Y) \]

示例场景: Jane 收到的邮件数量(\(X\))服从 \(Po(2)\),David 收到的邮件数量(\(Y\))服从 \(Po(3)\)。如果他们相互独立,两人收到的邮件总数(\(X+Y\))服从 \(Po(2+3) = Po(5)\)。

这一特性与通用规则一致,因为对于泊松分布,\(E(X) = \lambda\) 且 \(Var(X) = \lambda\)。

  • \(E(X+Y) = E(X) + E(Y) = \lambda_X + \lambda_Y\)
  • \(Var(X+Y) = Var(X) + Var(Y) = \lambda_X + \lambda_Y\)

由于新变量 \(X+Y\) 的均值和方差都是 \(\lambda_X + \lambda_Y\),它完全符合参数为 \(\lambda_X + \lambda_Y\) 的泊松分布的条件。

4. 分步解题策略

大多数涉及线性组合的问题,都需要在计算概率之前仔细应用期望值和方差规则。

示例:总生产时间

组装零件 A 所需时间(分钟)为 \(T_A \sim N(10, 4)\)。零件 B 所需时间为 \(T_B \sim N(15, 9)\)。某工人独立完成了 3 个零件 A 和 2 个零件 B。求总时间 \(T_{Total}\) 的分布。

第 1 步:定义组合变量。
总时间为 \(T_{Total} = T_{A1} + T_{A2} + T_{A3} + T_{B1} + T_{B2}\)。
或者,由于所有的 \(T_A\) 都是独立且相同的,我们可以写成: \[ T_{Total} = 3T_A + 2T_B \]

第 2 步:计算期望值 (\(E\))。

\[ E(T_{Total}) = E(3T_A + 2T_B) = 3E(T_A) + 2E(T_B) \] \[ E(T_{Total}) = 3(10) + 2(15) = 30 + 30 = 60 \text{ 分钟} \]

第 3 步:计算方差 (\(Var\))。

记住,方差永远相加,且系数要平方!

\[ Var(T_{Total}) = Var(3T_A + 2T_B) = 3^2 Var(T_A) + 2^2 Var(T_B) \] \[ Var(T_{Total}) = 9(4) + 4(9) = 36 + 36 = 72 \]

第 4 步:说明最终分布。

由于 \(T_A\) 和 \(T_B\) 均服从正态分布,它们的组合也服从正态分布。

\[ T_{Total} \sim N(60, 72) \]

接下来,你可以利用这个新分布通过标准正态变换(Z-score)来求解任何概率问题。

关于系数平方的重要提示:
一个常见的困惑点是 \(X_1 + X_2 + X_3\) 与 \(3X\) 之间的区别。

  • 如果你观察的是三个独立观察值之和(例如三个随机抽取的不同零件),方差是 \(Var(X_1) + Var(X_2) + Var(X_3)\)。如果它们是相同的,则为 \(3 Var(X)\)。
  • 如果你观察的是一个观察值乘以 3(缩放因子),方差则是 \(Var(3X) = 3^2 Var(X) = 9 Var(X)\)。

请确保你的公式反映了问题的实际情况:你是将多个物品相加,还是在缩放同一个物品? 当 \(Y\) 为零常数时,公式 \(Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\) 可以优雅地处理这两种情况。

线性组合检查清单
  1. 确定新变量(例如 \(W = X - Y\) 或 \(W = 5X + 2Y\))。
  2. 计算新的期望值(均值进行线性加减)。
  3. 计算新的方差(系数平方,方差永远相加)。
  4. 确定新变量的分布类型(通常,若原始分量是正态分布,组合后仍为正态分布;若原始分量是泊松分布且做加法,则仍为泊松分布)。
  5. 使用新分布的参数(\(\mu_W\) 和 \(\sigma_W^2\))计算所需概率。