Discrete random variables - Further Mathematics B (MEI) - H635 - Cambridge OCR AS Level

欢迎来到离散随机变量世界！

在本章中，我们将探讨如何将「机会」转化为「数学」。想象你在玩桌上游戏，你知道掷出 6 点纯属运气，但如果你掷了 1,000 次骰子，你其实是可以预测平均点数的。离散随机变量 (Discrete Random Variables) 让我们能利用精确的数学公式来建立这些现实世界不确定性的模型。无论是预测进入店铺的顾客人数，还是你需要掷多少次硬币才能得到「正面」，这些工具都能将不可预测的情况变得可以预测。

如果公式起初看起来有点吓人，别担心；我们会一步步为你拆解！

1. 什么是离散随机变量？

随机变量 (Random Variable)（通常以大写字母如 \(X\) 表示）是一个数值，其取决于随机事件的结果。
离散 (Discrete) 一词意味着它只能取特定的、分离的数值（如 1, 2, 3...），而不是连续尺度上的任何数值（如 1.234...）。

概率函数 (Probability Function)：
我们使用 \(P(X = x)\) 来表示变量 \(X\) 取特定数值 \(x\) 的概率。这些通常以表格或公式形式呈现。

两大金科玉律：
1. 每个个别概率必须介于 0 和 1 之间：\(0 \leq P(X=x) \leq 1\)。
2. 分布中所有概率的总和必须为 1：\(\sum P(X=x) = 1\)。
小贴士：如果你解题时概率总和不等于 1，检查一下你的加法吧！这是最常见的错误。

总结要点：离散随机变量就是一种列出事件所有可能结果及其发生概率的方法。

2. 期望值 (平均值) 与方差

如果你进行了数百万次实验，平均结果会是多少？这就是期望值 (Expectation)，记作 \(E(X)\) 或 \(\mu\)。
公式： \(E(X) = \sum x P(X = x)\)
类比：把它想象成一个「加权平均数」，概率越高的数值会将平均值拉向它们。

方差 (Variance) 用来衡量结果偏离平均值的「散布程度」。高方差代表结果非常分散；低方差则代表结果大多集中在平均值附近。
公式： \(Var(X) = E(X^2) - [E(X)]^2\)
要计算 \(E(X^2)\)，你只需将每个 \(x\) 值平方，再乘以其相应的概率即可。

标准差 (Standard Deviation)： 这仅仅是方差的平方根：\(\sigma = \sqrt{Var(X)}\)。

重点速览：
- 期望值 = 平均结果。
- 方差 = 结果的一致性。
- 务必先计算 \(E(X)\)，因为方差公式会用到它！

3. 编码：变量的转换

有时我们会更改数据。例如，如果 \(X\) 是游戏得分，也许新得分是 \(2X + 5\)。这会如何改变我们的平均值和方差？

线性转换规则：
- 期望值： \(E(a + bX) = a + bE(X)\)。（它完全遵循运算规则！）
- 方差： \(Var(a + bX) = b^2 Var(X)\)。
记忆法：方差讨厌加法！ 加上常数 (\(a\)) 不会改变数据的散布程度，因此它会被忽略。乘以 \(b\) 会使散布变大，但由于方差是「平方」单位，我们必须使用 \(b^2\)。

关键要点：加上一个数只会平移整个图表，但不改变散布；乘以一个数会拉伸图表，并显著增加散布。

4. 独立变量的线性组合

如果我们有两个独立的变量 \(X\) 和 \(Y\)，且想将它们加起来怎么办？（例如，两名随机挑选的人的身高总和）。
期望值： \(E(X \pm Y) = E(X) \pm E(Y)\)
方差： \(Var(X \pm Y) = Var(X) + Var(Y)\)
关键点：即使你是在进行减法运算 (\(X - Y\))，你仍然要相加方差！这是因为将两个不确定的事物结合起来，总是不确定性（散布）增加。

5. 离散均匀分布 (Discrete Uniform Distribution)

这是最简单的模型。当每个结果发生的可能性相等时使用。
例子：公平的 6 面骰子。每个数字的概率均为 \(1/6\)。

如果 \(X\) 在集合 \(\{1, 2, ..., n\}\) 上均匀分布：
- 平均值： \(E(X) = \frac{n + 1}{2}\)
- 方差： \(Var(X) = \frac{1}{12}(n^2 - 1)\)
你知道吗？这些公式仅适用于你的数值从 1 开始，且以 1 为步长递增的情况。如果你的数值是 \(\{4, 5, 6, 7\}\)，它仍然是均匀分布，但你会通过寻找中间值来计算平均值！

6. 二项分布 (Binomial Distribution)

你可能在 AS Level 就记得这个。它模拟在固定次数的试验中「成功」的次数。
符号： \(X \sim B(n, p)\)
进阶数学新知： 你需要掌握二项分布的平均值和方差公式：
- 平均值： \(E(X) = np\)
- 方差： \(Var(X) = np(1 - p)\)

7. 泊松分布 (Poisson Distribution)

这用于「随机发生在时间或空间中」的事件。
例子：你在一个小时内收到的邮件数量，或一平方米草地上的杂草数量。

条件（CRIS 准则）：
- C (Constant)： 恒定的平均率 (\(\lambda\))。
- R (Randomly/Independently)： 随机且独立发生。
- I (In isolation)： 互斥（事件不能在完全同一时间发生）。
- S (Singly)： 单次（一次发生一个）。

主要特征：
- 符号： \(X \sim Po(\lambda)\)。
- 平均值与方差： 在泊松分布中，平均值和方差是相等的！ \(E(X) = Var(X) = \lambda\)。
快速检查：如果题目给出的数据中平均值是 5 而方差是 20，那么泊松模型很可能不适用！

泊松相加： 如果你有两个独立的泊松变量 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\)，那么 \(X + Y \sim Po(\lambda + \mu)\)。你只需将比率相加即可！

8. 几何分布 (Geometric Distribution)

几何分布模拟的是直到第一次成功前所需的试验次数。
例子：掷硬币直到你得到第一个「正面」。

符号： \(X \sim Geo(p)\)，其中 \(p\) 是成功的概率。
概率：
- 在第 \(r\) 次试验才得到第一次成功：\(P(X = r) = (1 - p)^{r-1} p\)。
- 等待超过 \(r\) 次试验才成功：\(P(X > r) = (1 - p)^r\)。
类比：若要失败 5 次，直到第 6 次才成功，你必须经历 (失败 \(\times\) 失败 \(\times\) 失败 \(\times\) 失败 \(\times\) 失败 \(\times\) 成功)。

性质：
- 平均值： \(E(X) = \frac{1}{p}\)
- 方差： \(Var(X) = \frac{1 - p}{p^2}\)

避免常见错误： 确保你清楚题目定义的 \(X\) 是「试验次数」（本课程大纲）还是「第一次成功前的失败次数」。务必仔细阅读题目！

关键模型总结

1. 二项分布： 固定次数的试验，计算成功的次数。
2. 泊松分布： 固定区间（时间/空间），计算发生的次数。
3. 几何分布： 不断尝试，直到第一次成功。
4. 均匀分布： 每个结果的可能性均等。

如果起初觉得棘手，请别担心！掌握这些模型最好的方法是多练习，学会辨认哪种模型适合题目中的情境。你一定能做到的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。