Discrete random variables (DRVs) and expectation

欢迎来到离散随机变量的世界！

在 AQA Further Mathematics 课程的这个章节中，我们将深入探讨离散随机变量 (Discrete Random Variables, DRVs) 与期望值 (Expectation)。简单来说，我们将学习如何预测那些结果为数值且可数的游戏、实验或现实事件的“平均”结果。

如果起初觉得这些概念有点抽象，请别担心。你可以把 DRV 想像成一种将“运气”量化的方法！无论你是数学高手，还是觉得统计学有点“撞彩”，这些笔记都会将所有内容拆解成简单、易懂的步骤。

1. 什么是离散随机变量？

随机变量 (Random Variable) 就是一个数值，其大小取决于随机事件的结果。我们通常使用大写字母（例如 \( X \)）来代表变量本身，并使用小写字母（例如 \( x \)）来代表它实际可以取到的值。

离散 (Discrete) 意味着变量只能取特定的、分开的数值（例如 1, 2, 3...），而不是范围内的任何值（例如身高或体重）。
例子：抛掷硬币三次所得的正面次数就是一个 DRV。你可以得到 0, 1, 2 或 3 次正面，但不可能得到 1.5 次！

概率分布

我们通常使用概率分布表 (Probability Distribution Table) 来展示 DRV。这张表会列出每个可能的数值 \( x \)，以及该数值发生的概率 \( P(X=x) \)。

黄金法则： 分布中所有概率的总和必须等于 1。
\( \sum P(X=x) = 1 \)

有时候，我们不会得到表格，而是得到一个概率质量函数 (Probability Mass Function, PMF)。这只是一个能帮你计算任意给定 \( x \) 对应概率的公式。
例子：对于 \( x = 1, 2, 3 \)，设 \( P(X=x) = kx \)。要找出 \( k \)，你需要计算 \( k(1) + k(2) + k(3) = 1 \)。

重点速查：
• 离散： 可数的数值（中间没有小数）。
• 随机变量： 基于随机结果的一个数值。
• 概率总和： 永远是 1！

2. 平均与离散程度的度量

就像处理基本数据一样，我们想知道 DRV 的“中间位置”和“离散程度”。以下是你需要掌握的关键度量：

众数 (Mode)： 具有最高概率的 \( x \) 值，也就是“最可能”出现的结果。

中位数 (Median)： “中间”的值。要找到它，请将 \( x \) 从最小开始累加概率，直到总和达到或超过 0.5。该对应的 \( x \) 值就是你的中位数。

平均值（期望值）： 这就是如果你进行无数次实验后，预期得到的平均结果。在 Further Maths 中，我们称之为期望值 (Expectation)，记作 \( E(X) \)。

期望值公式

要计算平均值，请将每个数值乘以其对应的概率，然后将它们全部加起来：
\( E(X) = \sum x_i p_i \)

方差公式

方差 (Variance)，记作 \( Var(X) \)，用来衡量数值偏离平均值的程度。方差越高，代表结果越不可预测。为了计算它，我们使用这个“MS-SM”技巧：

“MS-SM”口诀：
Mean of the Squares (平方值的平均) 减去 Square of the Mean (平均值的平方)。

1. 找出 \( E(X^2) \)：将每个 \( x \) 值平方，乘以其概率，然后加总：\( E(X^2) = \sum x_i^2 p_i \)。
2. 计算平均值的平方：\( (E(X))^2 \)。
3. 相减：\( Var(X) = E(X^2) - (E(X))^2 \)。

标准差 (Standard Deviation)： 这就是方差的平方根：\( \sigma = \sqrt{Var(X)} \)。

关键总结： \( E(X) \) 是平均结果，\( Var(X) \) 是结果偏离该平均值的“震荡”幅度。

3. X 函数的期望值

有时候我们不只需要 \( X \) 的平均值；我们可能想要 \( X^2 \)、\( 5X^3 \) 甚至 \( 18X^{-3} \) 的平均值。规则很简单：将求和公式中的 \( x \) 替换为你想要的函数即可。

一般规则： \( E(g(X)) = \sum g(x_i) p_i \)

例子：如果你想计算 \( E(5X^3) \)，你需要计算 \( \sum (5x_i^3 \times P(X=x_i)) \)。

线性变换

如果你将变量乘以常数 \( a \) 再加上常数 \( b \)，你不需要重新计算整个表！使用这些便捷的快捷方式：

对于期望值： \( E(aX + b) = aE(X) + b \)
（平均值会按照预期进行平移和缩放）。

对于方差： \( Var(aX + b) = a^2 Var(X) \)
（重要！ 加上 \( b \) 不会改变数据的离散程度，所以 \( b \) 会消失。此外，缩放因子 \( a \) 需要平方，因为方差是一种“平方”度量）。

常见错误： 许多学生认为 \( E(X^2) \) 等于 \( (E(X))^2 \)。它们并不相等！ 这正是方差存在的意义——这两个数值之间的差值反映了数据的离散程度。

4. 离散均匀分布 (Discrete Uniform Distribution)

想像一个完美公平的六面骰子。每个结果 (1, 2, 3, 4, 5, 6) 的概率都完全相同 (\( 1/6 \))。这就是一个离散均匀分布。

离散均匀分布定义在集合 \( \{1, 2, 3, ..., n\} \) 上，其中 \( n \) 个数值中的每一个概率均为 \( 1/n \)。

均匀分布的特殊公式

如果 \( X \) 是从 1 到 \( n \) 的离散均匀分布，你可以使用这些快捷公式（考试要求掌握其证明过程！）：

平均值： \( E(X) = \frac{n + 1}{2} \)
（这只是第一个数和最后一个数的平均值）。

方差： \( Var(X) = \frac{n^2 - 1}{12} \)

小知识： 这些公式仅适用于数值从 1 开始且以 1 为单位递增至 \( n \) 的情况。如果数值不同（例如 10, 20, 30），你应该使用前一节提到的线性变换规则来调整公式！

平均值证明 (SA7)

证明 \( E(X) = \frac{n+1}{2} \)：
1. 使用定义：\( E(X) = \sum_{x=1}^n x \times \frac{1}{n} \)。
2. 将 \( \frac{1}{n} \) 提出：\( E(X) = \frac{1}{n} \sum_{x=1}^n x \)。
3. 使用整数求和公式 \( \sum x = \frac{n(n+1)}{2} \)。
4. 相乘：\( E(X) = \frac{1}{n} \times \frac{n(n+1)}{2} = \frac{n+1}{2} \)。

重点总结：
• 对于任何 DRV：\( E(X) = \sum xp \) 及 \( Var(X) = E(X^2) - [E(X)]^2 \)。
• 对于线性平移：\( E(aX+b) = aE(X)+b \) 及 \( Var(aX+b) = a^2Var(X) \)。
• 对于均匀分布 (1 至 \( n \))：平均值 = \( \frac{n+1}{2} \)，方差 = \( \frac{n^2-1}{12} \)。

你已经完成这部分的笔记了！做得好。请继续练习不同的概率表，很快地，计算“期望值”就会成为你的直觉反应。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。