Discrete random variables (DRVs) and expectation

欢迎来到离散随机变量的世界！

在本章中，我们将探讨离散随机变量 (Discrete Random Variables, 简称 DRVs)。别被这个名字吓到了！其实它只是一种运用数学来预测偶然事件（例如掷骰子、玩桌游，甚至是预测商店当天的客流量）的一种高级方式。学完这些笔记后，你就能像专家一样轻松计算这些情境下的平均值与“离散程度”了。

1. 理解离散随机变量 (DRVs)

随机变量 (Random Variable) 是指其数值取决于随机事件结果的量。我们称之为离散 (Discrete)，是因为它只能取特定的、独立的数值（例如 1、2 或 3），而不是某个范围内的任何数值（例如 1.572...）。

我们如何表示 DRVs

我们通常用大写字母（例如 \(X\)）来表示变量，并用小写字母（例如 \(x\)）来表示它可能取的特定数值。展示分布的方式主要有两种：

1. 列表概率分布：这是一个简单的表格，列出了 \(X\) 所有可能的取值及其对应的概率 \(P(X = x)\)。

2. 概率质量函数 (Probability Mass Function, PMF)：这是一个用于计算任何给定 \(x\) 之概率的公式，通常写作 \(P(X = x) = f(x)\)。

黄金法则：对于任何有效的 DRV，所有概率的总和必须等于 1。用数学式表示为：\(\sum P(X = x) = 1\)。

例子：如果你掷一枚硬币，正面朝上赢 2 英镑，反面朝上赢 0 英镑，那么你的 DRV \(X\) 取值为 {0, 2}，每个值的概率均为 0.5。

快速回顾：
- 离散 (Discrete)：仅限可数的数值。
- 随机 (Random)：基于偶然性。
- 变量 (Variable)：会发生变动。
- 总概率：加起来永远等于 1！

重点总结：DRV 本质上是一个将实验结果与数值及其概率链接起来的映射图。

2. 平均值与离散程度：平均数、众数与中位数

就像在 GCSE 统计学中一样，我们想找出数据的“中心”和“离散程度”。然而，由于我们处理的是概率，方法会有些许不同。

众数 (Mode)

众数就是 \(x\) 值中概率最高的那一个。只需观察你的表格或公式，找出拥有最大 \(P(X = x)\) 的“赢家”即可。

中位数 (Median)

中位数是中间的数值。要找到它，你需要将概率累加（累积概率），直到达到或超过 0.5 为止。达到这个位置时的 \(x\) 值就是你的中位数。

平均数 (期望值)

在进阶数学 (Further Maths) 中，我们将平均数称为期望值 (Expectation)，写作 \(E(X)\)。你可以将其理解为：如果你重复进行该实验数千次，最终得到的平均数值。

公式为：\(E(X) = \sum x_i p_i\)
翻译：将每一个 \(x\) 值乘以其对应的概率，然后将它们全部加起来。

重点总结：\(E(X)\) 不一定是 \(X\) 能够实际取得 的数值（例如掷骰子的平均值是 3.5），但它代表了长期的平均表现。

3. 方差与标准差

方差 (Variance)，写作 \(Var(X)\)，告诉我们 \(X\) 的取值与平均数之间的偏差程度。方差大表示结果分布很广；方差小表示结果很集中（一致）。

计算步骤

要找到方差，我们首先需要 \(E(X^2)\)，即“\(X\) 平方的期望值”。
公式：\(E(X^2) = \sum x_i^2 p_i\)
（先将每个 \(x\) 值平方，再乘以其概率，最后加总。）

现在，使用方差公式：
\(Var(X) = E(X^2) - [E(X)]^2\)

记忆口诀：一个好记的韵文是：“平方的平均值，减去平均值的平方”。

标准差 (Standard Deviation)

标准差就是方差的平方根：\(\sigma = \sqrt{Var(X)}\)。

避免常见错误：千万别忘了先将平均数 (\(E(X)\)) 平方，再从 \(E(X^2)\) 中减去！这是学生最常犯的错误。

重点总结：方差用于衡量风险或离散程度。\(E(X^2) - [E(X)]^2\) 这个公式将成为你本章最好的朋友。

4. DRVs 的线性函数

有时候，我们可能会改变我们的 DRV。例如，如果你玩一个游戏赢得 \(X\) 金额，但主办方额外加赠 5 英镑奖金，随后将你的总奖金加倍。这就是一种线性变换 (linear transformation)，通常写作 \(aX + b\)。

期望值与方差的规则

1. 关于期望值：它完全遵循线性规律。
\(E(aX + b) = aE(X) + b\)
（如果你将分数加倍并加上 5，平均数也会加倍并增加 5。）

2. 关于方差：它比较敏感！
\(Var(aX + b) = a^2 Var(X)\)
（加上常数 \(b\) 对离散程度完全没有影响，但乘以 \(a\) 会使方差增加 \(a^2\) 倍。）

类比：想象一群人排成一列。如果每个人都向右走 5 步（加上 \(b\)），“平均”位置会移动，但人与人之间的距离（离散程度）完全没变。这就是为什么 \(+b\) 在方差公式中会消失的原因！

重点总结：在对方差进行变换时，务必将乘数 (\(a\)) 平方，并忽略相加的常数 (\(b\))。

5. 离散均匀分布

离散均匀分布 (Discrete Uniform Distribution) 是一种特殊情况，每个结果都有完全相同的概率。最常见的例子是公平的六面骰子，从 1 到 6 的每个数字概率都是 \(1/6\)。

如果 \(X\) 定义在集合 \(\{1, 2, ..., n\}\) 上，那么对于每个值，都有 \(P(X = x) = 1/n\)。

快捷公式

与其制作繁琐的表格，我们可以使用这些“作弊码”（你之后需要学会证明它们）：
- 平均数： \(E(X) = \frac{n + 1}{2}\)
- 方差： \(Var(X) = \frac{n^2 - 1}{12}\)

你知道吗？这些公式源自前 \(n\) 个整数的和。例如，从 1 加到 \(n\) 的和为 \(\frac{n(n+1)}{2}\)。将此和除以 \(n\)（值的个数）即可得到平均数：\(\frac{n+1}{2}\)。

重点总结：仅在确定每个结果概率相同，且取值为 1 到 \(n\) 的连续整数时，才使用这些快捷公式。

本章总结

- DRVs：使用表格或函数；总概率必须为 1。
- 期望值 \(E(X)\)：平均结果 (\(\sum xp\))。
- 方差 \(Var(X)\)：结果的离散程度 (\(E(X^2) - [E(X)]^2\))。
- 变量变换 (Coding)：\(E(aX+b)\) 保持线性关系；\(Var(aX+b)\) 需将乘数平方并舍弃常数。
- 均匀分布：对于公平且连续的整数结果，使用 \(\frac{n+1}{2}\) 和 \(\frac{n^2-1}{12}\) 快捷公式。

如果方差公式一开始让你觉得有点别扭，别担心。多练习几题后，你就会运用自如了！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。