Discrete random variables

欢迎来到离散随机变量的世界！

你好！如果你曾经尝试预测掷骰子的结果、一场体育比赛的胜负，甚至是上下班路上会遇到几个红灯，其实你已经在思考概率问题了。在本章——离散随机变量（Discrete Random Variables, DRVs）中，我们将不再仅仅计算简单的几率，而是开始以结构化的方式计算预期结果以及这些结果的波动情况。

如果起初觉得有些抽象也不用担心——我们只是将概率的概念与你之前在描述统计学中已经掌握的平均值和离散度概念联系起来。让我们深入探究吧！

1. 定义离散随机变量 (DRVs)

什么是随机变量？

随机变量（Random Variable）通常用 $X$ 或 $Y$ 表示，本质上是一个函数，它将随机实验的每一个可能结果映射为一个数值。

离散随机变量（Discrete Random Variable, DRV）是指只能取可数个值的随机变量。这些值通常（但不一定总是）是整数。

离散的例子： 掷硬币 3 次出现正面的次数（结果为：0, 1, 2, 3）。
非离散的例子（连续型）： 学生的升高（在一定范围内可以是任何数值）。

概率分布

离散随机变量的概率分布（Probability Distribution）（或称为概率质量函数，PMF）准确地告诉我们 $X$ 可以取哪些值，以及每个值对应的概率。

分布通常以两种方式呈现：

表格法： 这是你在题目中最常看到的形式。
简单函数法： 一个可以为给定值 $x$ 生成对应概率 $P(X=x)$ 的公式。

核心规则：概率之和

所有可能结果的总概率必须始终等于 1。

对于所有的 $i$，都有 $P(X=x_i) \ge 0$。
重要公式： $\sum P(X=x) = 1$

示例：掷一枚不均匀的骰子。

$x$	1	2	3	4
$P(X=x)$	0.1	0.2	$k$	0.4

由于概率之和必须为 1：$0.1 + 0.2 + k + 0.4 = 1$。因此，$k = 1 - 0.7 = 0.3$。

第 1 节重点总结： 离散随机变量（DRV）的结果是可数的。其分布列出了这些结果及其概率，所有概率之和必须等于 1。

2. 集中趋势的度量：均值（期望值）

当我们谈论随机变量的“平均值”时，我们使用期望值（Expected Value）这个术语。如果你重复实验很多很多次，它就是你预期的平均结果。

我们用 $E(X)$ 或希腊字母 $\mu$（mu）来表示期望值。

计算期望值 $E(X)$

期望值是一个加权平均值。我们将每个结果 ($x$) 乘以它发生的可能性 ($P$) 进行加权。

公式： $$E(X) = \mu = \sum x_i P(X=x_i)$$

类比： 想象一下你在某门课程中的总分取决于四项任务。如果任务 1 占比 10%，任务 4 占比 40%，那么任务 4 的分数权重就要高得多。同样地，概率越大的结果，对期望值的贡献也越大。

逐步示例（使用之前的不均匀骰子）：

$x$	1	2	3	4
$P(X=x)$	0.1	0.2	0.3	0.4

1. 将每个 $x$ 值与其对应的概率 $P(X=x)$ 相乘：
$1 \times 0.1 = 0.1$
$2 \times 0.2 = 0.4$
$3 \times 0.3 = 0.9$
$4 \times 0.4 = 1.6$
2. 将结果相加：
$E(X) = 0.1 + 0.4 + 0.9 + 1.6 = 3.0$

期望值为 $3.0$。请注意，$E(X)$ 不一定是实际可能出现的某个结果（例如，如果我们期望正面出现 $2.5$ 次，这是完全合理的，即便你不可能真的得到“半个”正面）。

第 2 节重点总结： 期望值 $E(X)$ 是长期平均结果，通过对所有结果计算 $x \times P(X=x)$ 的总和得出。

3. 离散度的度量：方差与标准差

均值告诉我们中心位置，但我们需要了解离散度（spread）——即数值平均偏离均值的程度。这通过方差（Variance），$Var(X)$，和标准差（Standard Deviation），$\sigma$ 来衡量。

3.1. 计算方差 $Var(X)$

方差是结果与均值之间离差平方的期望值。

定义公式（计算较少使用）：

$$Var(X) = E((X - \mu)^2) = \sum (x_i - \mu)^2 P(X=x_i)$$

这个公式用起来比较繁琐，因为你需要先计算 $\mu$，然后用每个 $x$ 减去它，平方后乘以对应的 $P$，最后求和。

计算公式（你应该掌握的那个）：

下面这个等价公式在计算上要容易得多：

$$Var(X) = E(X^2) - [E(X)]^2$$

要使用它，只需两步：

计算 $E(X^2)$：即 $X$ 平方的期望值。
平方 $E(X)$：即将第 2 节中求出的均值平方。

计算 $E(X^2)$： $$E(X^2) = \sum x_i^2 P(X=x_i)$$

千万别把 $E(X^2)$ 和 $[E(X)]^2$ 搞混了！

逐步示例（续接上面的不均匀骰子，已知 $E(X)=3.0$）：

$x$	1	2	3	4
$x^2$	1	4	9	16
$P(X=x)$	0.1	0.2	0.3	0.4

1. 计算 $E(X^2)$：将每个 $x^2$ 值乘以其对应的概率 $P(X=x)$。
$E(X^2) = (1 \times 0.1) + (4 \times 0.2) + (9 \times 0.3) + (16 \times 0.4)$
$E(X^2) = 0.1 + 0.8 + 2.7 + 6.4 = 10.0$

2. 计算 $Var(X)$：使用 $Var(X) = E(X^2) - [E(X)]^2$。
已知 $E(X)=3.0$，所以 $[E(X)]^2 = 3.0^2 = 9.0$。
$Var(X) = 10.0 - 9.0 = 1.0$

3.2. 标准差 $\sigma$

标准差（Standard Deviation）（$\sigma$）就是方差的算术平方根。它很有用，因为它的量纲与随机变量 $X$ 的量纲相同。

$$ \sigma = \sqrt{Var(X)} $$

在我们的例子中，$\sigma = \sqrt{1.0} = 1.0$。

需要避免的常见错误！

不要使用处理原始数据时用的那个（除以 $n$ 的）频率方差公式。在这里，隐含的除数已经是 1（总概率）。请严格使用 $E(X^2) - [E(X)]^2$。
记住 $E(X^2)$ 并不等于 $E(X)$ 的平方！

第 3 节重点总结： 方差衡量离散程度。使用简便公式：$Var(X) = E(X^2) - [E(X)]^2$。标准差即为方差的开方。

4. 离散随机变量的函数

有时我们感兴趣的不是 $X$ 本身，而是一个关于 $X$ 的新变量，例如 $Y = X^2$ 或 $Z = 3X + 5$。

4.1. 一般函数的期望值 $E(g(X))$

如果 $Y = g(X)$ 是 $X$ 的任意函数，那么 $Y$ 的期望值可以通过先对结果应用该函数，再根据概率进行加权来得出。

公式： $$E(g(X)) = \sum g(x_i) P(X=x_i)$$

注意：你在计算 $E(X^2)$ 时就已经这么做了！这里 $g(X)=X^2$。

4.2. 线性函数：$Y = aX + b$（缩放与平移）

这是最常见的一类函数。其中 $a$ 是缩放因子，$b$ 是平移量。

类比：将摄氏度 (X) 转换为华氏度 (Y)。公式为 $Y = 1.8X + 32$。

期望值（均值）的规则：

期望值完全遵循该变换规律。

$$E(aX + b) = aE(X) + b$$

方差和标准差（离散度）的规则：

离散度受到缩放 ($a$) 的影响，但不受平移 ($b$) 的影响。如果你给每个结果都加上 10，平均值会增加 10，但数据的离散程度保持不变。

关键点在于，因为方差衡量的是距离的平方，所以缩放因子 $a$ 会变成 $a^2$：

$$Var(aX + b) = a^2Var(X)$$ $$SD(aX + b) = |a|SD(X)$$

示例：若 $E(X)=10$，$Var(X)=4$。求 $E(2X - 5)$ 和 $Var(2X - 5)$。

$E(2X - 5) = 2E(X) - 5 = 2(10) - 5 = 15$
$Var(2X - 5) = 2^2 Var(X) = 4(4) = 16$

第 4 节重点总结： 对于线性变换，均值遵循 $E(aX+b) = aE(X)+b$，但方差只受缩放因子影响，且需平方 ($Var(aX+b) = a^2Var(X)$)。常数 $b$ 对离散度没有任何影响。

5. 多个独立随机变量的组合

我们经常需要处理两个独立且不相关的实验的组合结果。

如果两个随机变量 $X$ 和 $Y$ 的结果互不影响（例如，投掷两枚不同的骰子），则称它们是独立（independent）的。

5.1. 期望值的规则（和或差）

和或差的期望值就是各自期望值的和或差。无论 $X$ 和 $Y$ 是否独立，该规则都成立。

$$E(aX + bY) = aE(X) + bE(Y)$$ $$E(X - Y) = E(X) - E(Y)$$

5.2. 方差的规则（和或差）—— 独立性要求

方差规则成立的前提是：$X$ 和 $Y$ 必须相互独立。

当组合独立变量时，无论你是相加还是相减，离散度总是会增加。这是因为组合多个结果会引入更多的整体随机性。

关键公式： $$Var(aX + bY) = a^2Var(X) + b^2Var(Y)$$ $$Var(aX - bY) = a^2Var(X) + b^2Var(Y)$$

记忆窍门：方差永远是相加的

如果 $X$ 和 $Y$ 是独立的，方差永远为正，且永远是相加的。

示例：若 $E(X)=10$，$Var(X)=4$，$E(Y)=20$，$Var(Y)=9$。求 $E(X-Y)$ 和 $Var(3X + 2Y)$。

$E(X - Y) = E(X) - E(Y) = 10 - 20 = -10$
$Var(3X + 2Y) = 3^2 Var(X) + 2^2 Var(Y)$
$Var(3X + 2Y) = 9(4) + 4(9) = 36 + 36 = 72$

5.3. $n$ 个独立随机变量之和

这个规则可以自然推广。如果 $X_1, X_2, ..., X_n$ 是相互独立的 DRVs（例如，掷一枚骰子 $n$ 次），则：

$$E(\sum X_i) = \sum E(X_i)$$ $$Var(\sum X_i) = \sum Var(X_i)$$

你知道吗？ 如果你连续投掷一枚公平骰子 10 次，总得分的期望值就是 $10 \times E(X)$，总方差就是 $10 \times Var(X)$。

快速回顾：核心公式

设 $X$ 和 $Y$ 为相互独立的 DRVs，$a, b$ 为常数。

期望值（均值）：

$E(X) = \sum x P(X=x)$
$E(aX + b) = aE(X) + b$
$E(X \pm Y) = E(X) \pm E(Y)$

方差（离散度）：

$Var(X) = E(X^2) - [E(X)]^2$
$Var(aX + b) = a^2Var(X)$ （常数 $b$ 被消除了！）
$Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)$ （对于独立变量，方差永远相加！）

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。