Discrete random variables - Further Mathematics B (MEI) - H645 - Cambridge OCR A Level

欢迎来到离散随机变量的世界！

在本章中，我们将从观察单一事件转向从“宏观”角度理解概率。我们利用离散随机变量 (Discrete Random Variables) 来建立现实生活中的模型，例如商店中顾客的到达数量，或是掷硬币直到出现“正面”所需的次数。理解这些模式能让我们进行预测并计算风险，而这正是统计学的核心。

如果刚开始觉得公式有点深奥，别担心！我们会将它们拆解成简单的步骤，保证大家都能跟上！

1. 基础概念：什么是随机变量？

随机变量 (Random Variable)（通常记作 \(X\)）是一个将实验的每个结果赋予一个数值的规则。如果它只能取特定的、分离的数值（如 1, 2, 3...）而不能取范围内的任意值，它就是离散 (discrete) 的。

概率分布 (Probability Distributions)

概率分布简单来说就是一个列表或公式，列出 \(X\) 所有可能的数值及其各自发生的概率。我们将其写为 \(P(X = x)\)。

两大黄金法则：
1. 每个个别的概率必须介于 0 和 1 之间：\(0 \le P(X=x) \le 1\)。
2. 分布中所有概率的总和必须等于 1：\(\sum P(X=x) = 1\)。

例子：设 \(X\) 为投掷一颗公平 4 面骰子的点数。数值为 {1, 2, 3, 4}，每个数值的概率皆为 0.25。如果你将它们相加（\(0.25 \times 4\)），结果就是 1！

快速复习小撇步：如果在表中漏掉了一个概率，只要把其他的概率加起来，再用 1 减去总和即可！

2. 期望值与方差

我们该如何找出一个模式的“平均值”呢？我们使用期望值 (Expectation) 和方差 (Variance)。

期望值 \(E(X)\)

期望值（或平均值，\(\mu\)）是长期的平均数值。要计算它，将每个数值乘以其对应的概率，然后全部加总：
\(E(X) = \mu = \sum x P(X = x)\)

方差 \(Var(X)\)

方差 (\(\sigma^2\)) 用来衡量数值的分布离散程度。最容易使用的公式是：
\(Var(X) = E(X^2) - [E(X)]^2\)

计算方差的步骤：
1. 先计算 \(E(X)\)。
2. 将每个 \(x\) 的数值平方，乘以其概率，再全部加总以得到 \(E(X^2)\)。
3. 用第二步的答案减去第一步答案的平方。

记忆口诀：你可以将方差公式记作“平方的平均值减去平均值的平方”。

重点提示：标准差 (Standard Deviation) (\(\sigma\)) 其实就是方差的平方根：\(\sigma = \sqrt{Var(X)}\)。

3. 编码：变量转换

有时候我们需要改变数据（例如，将分数转换为现金奖励）。我们使用以下简单规则来处理期望值代数：

1. 期望值： \(E(a + bX) = a + bE(X)\)。（完全符合直觉！）
2. 方差： \(Var(a + bX) = b^2 Var(X)\)。（加上常数 \(a\) 不会改变离散程度，但乘数 \(b\) 需要平方！）

常见错误：永远不要从方差中减去常数。即使你将数据平移了 -10，数据的“分布范围”保持不变，因此方差不会改变！

4. 离散均匀分布 (Discrete Uniform Distribution)

这是最简单的模型。当每个结果发生的概率皆相等时使用，例如公平的骰子或转盘。

若 \(X\) 在数值 \(\{1, 2, \dots, n\}\) 上呈均匀分布：
\(E(X) = \frac{n + 1}{2}\)
\(Var(X) = \frac{1}{12}(n^2 - 1)\)

例子：对于标准的 6 面骰子（\(n=6\)），平均点数 \(E(X)\) 为 \(\frac{6+1}{2} = 3.5\)。

5. 二项分布 \(X \sim B(n, p)\)

你在 A Level 数学中已经见过它，但在进阶数学 (Further Maths) 中，我们更深入探讨其性质。当你拥有固定次数的试验 (\(n\)) 且只有两种结果（成功或失败）时使用。

核心性质：
平均值： \(E(X) = np\)
方差： \(Var(X) = np(1 - p)\)

你知道吗？二项分布变量其实就是 \(n\) 个独立伯努利试验 (Bernoulli trials)（即 \(n=1\) 的试验）的总和。这就是为什么平均值简单地等于 \(n \times p\)！

6. 泊松分布 \(X \sim Po(\lambda)\)

这用于建立在固定时间或空间区间内发生的事件次数模型（例如一小时内收到的邮件数量）。

泊松模型的条件：
- 事件随机且独立发生。
- 事件以固定的平均速率 (\(\lambda\)) 发生。
- 事件不能同时发生。

“神奇”的性质：
在泊松分布中，平均值与方差相等！
\(E(X) = \lambda\)
\(Var(X) = \lambda\)

快速复习：如果你被问到泊松模型是否适用于某组数据，检查计算出的平均值和方差是否接近。如果差异很大，泊松模型就不是一个好选择！

合并泊松分布：如果 \(X \sim Po(\lambda)\) 与 \(Y \sim Po(\mu)\) 是独立的，那么它们的总和也符合泊松分布：\(X + Y \sim Po(\lambda + \mu)\)。

7. 几何分布 \(X \sim Geo(p)\)

几何分布用于模拟直到第一次成功为止的试验次数。你可以把它想成是“我需要等多久？”的分布。

公式：
- 在第 \(r\) 次试验成功的概率： \(P(X = r) = (1 - p)^{r-1}p\)
- 成功需要超过 \(r\) 次试验的概率： \(P(X > r) = (1 - p)^r\)
- 平均值： \(E(X) = \frac{1}{p}\)
- 方差： \(Var(X) = \frac{1 - p}{p^2}\)

例子：如果赢得游戏的概率是 0.2，为了赢一次平均需要玩的游戏次数为 \(\frac{1}{0.2} = 5\) 场。

8. 独立变量的线性组合

这就是进阶数学精彩的地方！如果我们有两个不同的随机变量 \(X\) 和 \(Y\)，想要找出它们组合后的平均值与方差该怎么办？如果 \(X\) 和 \(Y\) 是独立的：

组合平均值（期望值）

\(E(X + Y) = E(X) + E(Y)\)
\(E(X - Y) = E(X) - E(Y)\)
\(E(aX + bY) = aE(X) + bE(Y)\)

组合方差（平方规则）

关键法则：当你组合变量时，方差永远是相加的（前提是它们必须独立）。即使你是在减去变量，不确定性（方差）仍然会增加！
\(Var(X + Y) = Var(X) + Var(Y)\)
\(Var(X - Y) = Var(X) + Var(Y)\)（没错，这里还是加号！）
\(Var(aX \pm bY) = a^2 Var(X) + b^2 Var(Y)\)

类比：想像 \(X\) 和 \(Y\) 是两台不同的震动机器人。如果你把一台机器人叠在另一台上面，总体的“震动程度”（方差）会加剧，无论它们是往相同方向还是相反方向移动！

总结摘要：
- 使用期望值来求平均，使用方差来衡量分布程度。
- 泊松分布用于计数时间间隔内的事件；几何分布用于等待成功的次数。
- 对于独立变量：平均值遵循运算符号，但方差永远相加！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。