欢迎来到离散随机变量的世界!

在本章中,我们将探讨离散随机变量 (Discrete Random Variables, 简称 DRVs)。别被这个名字吓到了!其实它只是一种运用数学来预测偶然事件(例如掷骰子、玩桌游,甚至是预测商店当天的客流量)的一种高级方式。学完这些笔记后,你就能像专家一样轻松计算这些情境下的平均值与“离散程度”了。

1. 理解离散随机变量 (DRVs)

随机变量 (Random Variable) 是指其数值取决于随机事件结果的量。我们称之为离散 (Discrete),是因为它只能取特定的、独立的数值(例如 1、2 或 3),而不是某个范围内的任何数值(例如 1.572...)。

我们如何表示 DRVs

我们通常用大写字母(例如 \(X\))来表示变量,并用小写字母(例如 \(x\))来表示它可能取的特定数值。展示分布的方式主要有两种:

1. 列表概率分布:这是一个简单的表格,列出了 \(X\) 所有可能的取值及其对应的概率 \(P(X = x)\)。

2. 概率质量函数 (Probability Mass Function, PMF):这是一个用于计算任何给定 \(x\) 之概率的公式,通常写作 \(P(X = x) = f(x)\)。

黄金法则:对于任何有效的 DRV,所有概率的总和必须等于 1。用数学式表示为:\(\sum P(X = x) = 1\)。

例子:如果你掷一枚硬币,正面朝上赢 2 英镑,反面朝上赢 0 英镑,那么你的 DRV \(X\) 取值为 {0, 2},每个值的概率均为 0.5。

快速回顾:
- 离散 (Discrete):仅限可数的数值。
- 随机 (Random):基于偶然性。
- 变量 (Variable):会发生变动。
- 总概率:加起来永远等于 1!

重点总结:DRV 本质上是一个将实验结果与数值及其概率链接起来的映射图。

2. 平均值与离散程度:平均数、众数与中位数

就像在 GCSE 统计学中一样,我们想找出数据的“中心”和“离散程度”。然而,由于我们处理的是概率,方法会有些许不同。

众数 (Mode)

众数就是 \(x\) 值中概率最高的那一个。只需观察你的表格或公式,找出拥有最大 \(P(X = x)\) 的“赢家”即可。

中位数 (Median)

中位数是中间的数值。要找到它,你需要将概率累加(累积概率),直到达到或超过 0.5 为止。达到这个位置时的 \(x\) 值就是你的中位数。

平均数 (期望值)

在进阶数学 (Further Maths) 中,我们将平均数称为期望值 (Expectation),写作 \(E(X)\)。你可以将其理解为:如果你重复进行该实验数千次,最终得到的平均数值。

公式为:\(E(X) = \sum x_i p_i\)
翻译:将每一个 \(x\) 值乘以其对应的概率,然后将它们全部加起来。

重点总结:\(E(X)\) 不一定是 \(X\) 能够实际取得 的数值(例如掷骰子的平均值是 3.5),但它代表了长期的平均表现。

3. 方差与标准差

方差 (Variance),写作 \(Var(X)\),告诉我们 \(X\) 的取值与平均数之间的偏差程度。方差大表示结果分布很广;方差小表示结果很集中(一致)。

计算步骤

要找到方差,我们首先需要 \(E(X^2)\),即“\(X\) 平方的期望值”。
公式:\(E(X^2) = \sum x_i^2 p_i\)
(先将每个 \(x\) 值平方,再乘以其概率,最后加总。)

现在,使用方差公式
\(Var(X) = E(X^2) - [E(X)]^2\)

记忆口诀:一个好记的韵文是:“平方的平均值,减去平均值的平方”。

标准差 (Standard Deviation)

标准差就是方差的平方根:\(\sigma = \sqrt{Var(X)}\)。

避免常见错误:千万别忘了先将平均数 (\(E(X)\)) 平方,再从 \(E(X^2)\) 中减去!这是学生最常犯的错误。

重点总结:方差用于衡量风险或离散程度。\(E(X^2) - [E(X)]^2\) 这个公式将成为你本章最好的朋友。

4. DRVs 的线性函数

有时候,我们可能会改变我们的 DRV。例如,如果你玩一个游戏赢得 \(X\) 金额,但主办方额外加赠 5 英镑奖金,随后将你的总奖金加倍。这就是一种线性变换 (linear transformation),通常写作 \(aX + b\)。

期望值与方差的规则

1. 关于期望值:它完全遵循线性规律。
\(E(aX + b) = aE(X) + b\)
(如果你将分数加倍并加上 5,平均数也会加倍并增加 5。)

2. 关于方差:它比较敏感!
\(Var(aX + b) = a^2 Var(X)\)
(加上常数 \(b\) 对离散程度完全没有影响,但乘以 \(a\) 会使方差增加 \(a^2\) 倍。)

类比:想象一群人排成一列。如果每个人都向右走 5 步(加上 \(b\)),“平均”位置会移动,但人与人之间的距离(离散程度)完全没变。这就是为什么 \(+b\) 在方差公式中会消失的原因!

重点总结:在对方差进行变换时,务必将乘数 (\(a\)) 平方,并忽略相加的常数 (\(b\))。

5. 离散均匀分布

离散均匀分布 (Discrete Uniform Distribution) 是一种特殊情况,每个结果都有完全相同的概率。最常见的例子是公平的六面骰子,从 1 到 6 的每个数字概率都是 \(1/6\)。

如果 \(X\) 定义在集合 \(\{1, 2, ..., n\}\) 上,那么对于每个值,都有 \(P(X = x) = 1/n\)。

快捷公式

与其制作繁琐的表格,我们可以使用这些“作弊码”(你之后需要学会证明它们):
- 平均数: \(E(X) = \frac{n + 1}{2}\)
- 方差: \(Var(X) = \frac{n^2 - 1}{12}\)

你知道吗?这些公式源自前 \(n\) 个整数的和。例如,从 1 加到 \(n\) 的和为 \(\frac{n(n+1)}{2}\)。将此和除以 \(n\)(值的个数)即可得到平均数:\(\frac{n+1}{2}\)。

重点总结:仅在确定每个结果概率相同,且取值为 1 到 \(n\) 的连续整数时,才使用这些快捷公式。

本章总结

- DRVs:使用表格或函数;总概率必须为 1。
- 期望值 \(E(X)\):平均结果 (\(\sum xp\))。
- 方差 \(Var(X)\):结果的离散程度 (\(E(X^2) - [E(X)]^2\))。
- 变量变换 (Coding):\(E(aX+b)\) 保持线性关系;\(Var(aX+b)\) 需将乘数平方并舍弃常数。
- 均匀分布:对于公平且连续的整数结果,使用 \(\frac{n+1}{2}\) 和 \(\frac{n^2-1}{12}\) 快捷公式。

如果方差公式一开始让你觉得有点别扭,别担心。多练习几题后,你就会运用自如了!