Linear combinations of discrete random variables

📚 高等数学（Further Maths）学习笔记：离散随机变量的线性组合 (FS1.5)

欢迎来到高等统计学中最实用、最强大的课题之一！本章我们将重点探讨如何将两个或多个随机变量（例如不同产品线的利润或不同实验的测量数据）合并为一个全新的变量。

你已经掌握了如何求解单个随机变量的期望值 (\(E(X)\)) 和方差 (\(Var(X)\))。现在，我们将学习当对变量进行缩放、平移或混合时，这些统计特性会发生怎样的变化。这是构建现实世界不确定性模型必不可少的技能！

1. 快速回顾：期望值与方差基础

在合并变量之前，让我们先温习一下单个离散随机变量 \(X\) 的基本概念：

期望值（均值），\(E(X)\) 或 \(\mu\)： 这是变量的长期平均值。
方差，\(Var(X)\) 或 \(\sigma^2\)： 这是衡量变量围绕其均值波动或离散程度的指标。方差越大，说明数据分布越分散。

1.1 缩放与平移的影响

如果我们通过变换 \(X\) 来创建一个新变量 \(W\)（例如 \(W = aX + b\)），期望值和方差的变化规律如下：

期望值法则：

\[E(aX + b) = a E(X) + b\]

（示例：如果你将所有分数翻倍 (a=2) 并额外加 5 分 (b=5)，平均分也会相应翻倍并增加 5 分。）

方差法则：

\[Var(aX + b) = a^2 Var(X)\]

（示例：平移数据（加 b）不会改变波动幅度，因此 \(b\) 会被消去。但缩放数据（乘 a）会将方差扩大 \(a^2\) 倍。）

⚠ 学习小贴士： 请记住，常数项只影响均值（它们平移了分布），但绝不会影响方差（它们不改变分布的离散程度！）。

2. 两个变量的线性组合

两个离散随机变量 \(X\) 和 \(Y\) 的线性组合通常写成如下形式：

\[W = aX + bY + c\]

其中 \(a\)、\(b\) 和 \(c\) 为常数（系数）。

想象一家咖啡店，\(X\) 是拿铁的日销量，\(Y\) 是卡布奇诺的日销量。如果拿铁售价 3 英镑 (a=3)，卡布奇诺售价 4 英镑 (b=4)，则总营业额 (W) 为 \(W = 3X + 4Y\)。

2.1 计算组合的期望值

期望值的计算法则非常简单。无论 \(X\) 和 \(Y\) 是否相关（相依或独立），其法则都是一致的：

和/差的期望值法则：

\[E(aX + bY + c) = a E(X) + b E(Y) + c\]

核心要点： 组合的期望值等于期望值的组合。

3. 引入相关性：协方差与相关系数

当我们处理方差时，情况会变得复杂——除非这些变量是相互独立的。我们必须考虑 \(X\) 和 \(Y\) 之间的相互关系。

3.1 什么是协方差？

协方差，记作 \(Cov(X, Y)\)，描述了 \(X\) 与 \(Y\) 之间关系的趋势。

若 \(Cov(X, Y) > 0\)，当 \(X\) 较大时，\(Y\) 往往也较大（反之亦然）。它们呈同向变动。（正相关关系）
若 \(Cov(X, Y) < 0\)，当 \(X\) 较大时，\(Y\) 往往较小（反之亦然）。它们呈反向变动。（负相关关系）
若 \(Cov(X, Y) = 0\)，说明没有线性关系。如果 \(X\) 和 \(Y\) 独立，则该式始终成立。

⚠ 常见误区提示： 若 \(Cov(X, Y) = 0\)，意味着不存在“线性”关系，但这并不自动等同于相互独立（不过在大多数高等数学考试中，若已知独立，则可假设协方差为 0）。一定要结合题目背景来判断！

3.2 相关系数

相关系数 (\(\rho\) 或 \(r\)) 是由协方差导出的标准化度量。它衡量线性关系的强度和方向，取值始终在 -1 到 1 之间。

\[\rho = \frac{Cov(X, Y)}{\sqrt{Var(X)Var(Y)}}\]

教学大纲要求你理解并应用这些概念，但通常情况下，题目会给出协方差或相关系数的值，或者要求你利用定义公式计算，而不是进行推导。

你知道吗？ 协方差的单位是 \(X\) 的单位乘以 \(Y\) 的单位，这通常不够直观。相关系数通过将度量转化为 -1 到 1 之间的纯数字，解决了这个问题。

4. 线性组合的方差（关键公式）

计算组合的方差时，如果变量之间存在相关性，必须引入协方差项。这是通用的普遍法则：

4.1 通用法则（相依变量）

对于两个离散随机变量 \(X\) 和 \(Y\)，以及新变量 \(W = aX + bY\)：

\[Var(W) = Var(aX + bY) = a^2 Var(X) + b^2 Var(Y) + 2ab Cov(X, Y)\]

如果存在附加常数 \(c\)，则可忽略，因为常数不影响方差：\(Var(aX + bY + c) = Var(aX + bY)\)。

\(2ab\) 项至关重要！ 它解释了变量之间如何放大或抵消彼此的波动。

若 \(Cov(X, Y)\) 为正，组合的方差会增大（波动相互叠加）。
若 \(Cov(X, Y)\) 为负，组合的方差会减小（变量趋向于相互平衡）。

计算方差的步骤：

确定系数 \(a\) 和 \(b\)。
将系数平方后乘以各自方差：\(a^2 Var(X)\) 和 \(b^2 Var(Y)\)。
计算协方差项：\(2ab Cov(X, Y)\)。
将这三项相加。

4.2 独立变量的法则（简化形式）

如果 \(X\) 和 \(Y\) 相互独立，它们的协方差必然为 0：\(Cov(X, Y) = 0\)。此时公式大大简化：

\[Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\]

记忆口诀（VAA）： 方差永远相加（Variance Always Adds）！当合并独立变量时，始终将它们的方差（或缩放后的方差 \(a^2 Var(X)\) 和 \(b^2 Var(Y)\)）相加。

4.3 处理减法：\(Var(X - Y)\)

减法是一个常见的陷阱。考虑 \(W = X - Y\)，此时 \(a=1\)，\(b=-1\)。

减法的通用法则（相依）：

\[Var(X - Y) = (1)^2 Var(X) + (-1)^2 Var(Y) + 2(1)(-1) Cov(X, Y)\]

\[Var(X - Y) = Var(X) + Var(Y) - 2 Cov(X, Y)\]

减法的法则（独立）：

如果 \(X\) 和 \(Y\) 独立，则 \(Cov(X, Y)=0\)。方差依然相加：

\[Var(X - Y) = Var(X) + Var(Y)\]

⚠ 核心重点： 无论变量是相加还是相减，它们的方差对总波动的贡献总是正向的（因为波动是由平方 \(a^2\) 和 \(b^2\) 衡量的）。如果你对变量做减法，你只需要减去协方差项即可。

🔖 快速回顾：方差检查清单

计算 \(Var(aX + bY)\) 时，问自己一个问题：

X 和 Y 独立吗？
是：使用 \(a^2 Var(X) + b^2 Var(Y)\)。
否：使用 \(a^2 Var(X) + b^2 Var(Y) + 2ab Cov(X, Y)\)。（你必须先找到或通过题目获取 \(Cov(X, Y)\)！）

5. 应用与推广

这些规则可以顺畅地推广到处理超过两个变量或重复相同变量的情况。

5.1 \(n\) 个独立变量的和

如果你有 \(n\) 个独立同分布（i.i.d.）的随机变量 \(X_1, X_2, \dots, X_n\)，且求其总和 \(S = X_1 + X_2 + \dots + X_n\)：

期望值：

\[E(S) = E(X_1) + E(X_2) + \dots + E(X_n) = n E(X)\]

（如果你抛一枚公平的硬币 10 次，正面朝上的期望次数是单次抛掷期望值的 10 倍。）

方差：

由于它们相互独立，协方差均为零。我们只需将方差相加：

\[Var(S) = Var(X_1) + Var(X_2) + \dots + Var(X_n) = n Var(X)\]

（这一原理对于理解二项分布至关重要，因为二项分布本质上就是多次独立伯努利试验的和。）

5.2 应用示例：产品包装

设 \(X\) 为一瓶果汁的重量（kg），已知 \(E(X) = 1.2\)，\(Var(X) = 0.04\)。
设 \(P\) 为包装重量，是一个常数 \(P = 0.05\) kg。

一个木箱装有 5 瓶果汁。总重量 \(W\) 为 \(W = X_1 + X_2 + X_3 + X_4 + X_5 + 5P\)。假设每瓶果汁重量相互独立。

1. 求总重量的期望值：

\[E(W) = E(X_1) + \dots + E(X_5) + E(5P)\]

由于 \(E(X) = 1.2\)：

\[E(W) = 5(1.2) + 5(0.05) = 6.0 + 0.25 = 6.25 \text{ kg}\]

2. 求总重量的方差：

由于瓶子重量独立，且 \(5P\) 是常数（方差为 0）：

\[Var(W) = Var(X_1) + \dots + Var(X_5) + Var(5P)\]

\[Var(W) = 5(0.04) + 0 = 0.20\]

标准差为 \(\sqrt{0.20}\)。

核心要点： 始终将独立变量（其方差相加）与常数（影响均值但不影响方差）分离开来。

6. 关于相关性与决策的说明

在解决实际应用问题时，理解相关性对于解读结果至关重要，即使你不直接计算 \(\rho\)。

如果你相加的两个变量（如投资收益）是正相关的，那么组合的总风险（方差）会比它们独立时更高。
如果它们是负相关的（例如，当一种产品卖得好时，另一种卖得差），协方差项为负，从而导致整体方差减小。这就是为什么多元化投资（选择负相关资产）能降低风险的原因！

总结：公式的力量
线性组合法则让我们能够模拟复杂的系统——无论它们涉及的是相互独立的组件（如一系列制造工序），还是高度关联的组件（如两种竞争产品的相关销售额）——仅需利用各部分的均值、方差和协方差即可完成分析。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。