欢迎来到离散随机变量的世界!

AQA Further Mathematics 课程的这个章节中,我们将深入探讨离散随机变量 (Discrete Random Variables, DRVs)期望值 (Expectation)。简单来说,我们将学习如何预测那些结果为数值且可数的游戏、实验或现实事件的“平均”结果。

如果起初觉得这些概念有点抽象,请别担心。你可以把 DRV 想像成一种将“运气”量化的方法!无论你是数学高手,还是觉得统计学有点“撞彩”,这些笔记都会将所有内容拆解成简单、易懂的步骤。

1. 什么是离散随机变量?

随机变量 (Random Variable) 就是一个数值,其大小取决于随机事件的结果。我们通常使用大写字母(例如 \( X \))来代表变量本身,并使用小写字母(例如 \( x \))来代表它实际可以取到的值。

离散 (Discrete) 意味着变量只能取特定的、分开的数值(例如 1, 2, 3...),而不是范围内的任何值(例如身高或体重)。
例子:抛掷硬币三次所得的正面次数就是一个 DRV。你可以得到 0, 1, 2 或 3 次正面,但不可能得到 1.5 次!

概率分布

我们通常使用概率分布表 (Probability Distribution Table) 来展示 DRV。这张表会列出每个可能的数值 \( x \),以及该数值发生的概率 \( P(X=x) \)。

黄金法则: 分布中所有概率的总和必须等于 1。
\( \sum P(X=x) = 1 \)

有时候,我们不会得到表格,而是得到一个概率质量函数 (Probability Mass Function, PMF)。这只是一个能帮你计算任意给定 \( x \) 对应概率的公式。
例子:对于 \( x = 1, 2, 3 \),设 \( P(X=x) = kx \)。要找出 \( k \),你需要计算 \( k(1) + k(2) + k(3) = 1 \)。

重点速查:
离散: 可数的数值(中间没有小数)。
随机变量: 基于随机结果的一个数值。
概率总和: 永远是 1!

2. 平均与离散程度的度量

就像处理基本数据一样,我们想知道 DRV 的“中间位置”和“离散程度”。以下是你需要掌握的关键度量:

众数 (Mode): 具有最高概率的 \( x \) 值,也就是“最可能”出现的结果。

中位数 (Median): “中间”的值。要找到它,请将 \( x \) 从最小开始累加概率,直到总和达到或超过 0.5。该对应的 \( x \) 值就是你的中位数。

平均值(期望值): 这就是如果你进行无数次实验后,预期得到的平均结果。在 Further Maths 中,我们称之为期望值 (Expectation),记作 \( E(X) \)。

期望值公式

要计算平均值,请将每个数值乘以其对应的概率,然后将它们全部加起来:
\( E(X) = \sum x_i p_i \)

方差公式

方差 (Variance),记作 \( Var(X) \),用来衡量数值偏离平均值的程度。方差越高,代表结果越不可预测。为了计算它,我们使用这个“MS-SM”技巧:

“MS-SM”口诀:
Mean of the Squares (平方值的平均) 减去 Square of the Mean (平均值的平方)。

1. 找出 \( E(X^2) \):将每个 \( x \) 值平方,乘以其概率,然后加总:\( E(X^2) = \sum x_i^2 p_i \)。
2. 计算平均值的平方:\( (E(X))^2 \)。
3. 相减:\( Var(X) = E(X^2) - (E(X))^2 \)。

标准差 (Standard Deviation): 这就是方差的平方根:\( \sigma = \sqrt{Var(X)} \)。

关键总结: \( E(X) \) 是平均结果,\( Var(X) \) 是结果偏离该平均值的“震荡”幅度。

3. X 函数的期望值

有时候我们不只需要 \( X \) 的平均值;我们可能想要 \( X^2 \)、\( 5X^3 \) 甚至 \( 18X^{-3} \) 的平均值。规则很简单:将求和公式中的 \( x \) 替换为你想要的函数即可。

一般规则: \( E(g(X)) = \sum g(x_i) p_i \)

例子:如果你想计算 \( E(5X^3) \),你需要计算 \( \sum (5x_i^3 \times P(X=x_i)) \)。

线性变换

如果你将变量乘以常数 \( a \) 再加上常数 \( b \),你不需要重新计算整个表!使用这些便捷的快捷方式:

对于期望值: \( E(aX + b) = aE(X) + b \)
(平均值会按照预期进行平移和缩放)。

对于方差: \( Var(aX + b) = a^2 Var(X) \)
重要! 加上 \( b \) 不会改变数据的离散程度,所以 \( b \) 会消失。此外,缩放因子 \( a \) 需要平方,因为方差是一种“平方”度量)。

常见错误: 许多学生认为 \( E(X^2) \) 等于 \( (E(X))^2 \)。它们并不相等! 这正是方差存在的意义——这两个数值之间的差值反映了数据的离散程度。

4. 离散均匀分布 (Discrete Uniform Distribution)

想像一个完美公平的六面骰子。每个结果 (1, 2, 3, 4, 5, 6) 的概率都完全相同 (\( 1/6 \))。这就是一个离散均匀分布

离散均匀分布定义在集合 \( \{1, 2, 3, ..., n\} \) 上,其中 \( n \) 个数值中的每一个概率均为 \( 1/n \)。

均匀分布的特殊公式

如果 \( X \) 是从 1 到 \( n \) 的离散均匀分布,你可以使用这些快捷公式(考试要求掌握其证明过程!):

平均值: \( E(X) = \frac{n + 1}{2} \)
(这只是第一个数和最后一个数的平均值)。

方差: \( Var(X) = \frac{n^2 - 1}{12} \)

小知识: 这些公式仅适用于数值从 1 开始且以 1 为单位递增至 \( n \) 的情况。如果数值不同(例如 10, 20, 30),你应该使用前一节提到的线性变换规则来调整公式!

平均值证明 (SA7)

证明 \( E(X) = \frac{n+1}{2} \):
1. 使用定义:\( E(X) = \sum_{x=1}^n x \times \frac{1}{n} \)。
2. 将 \( \frac{1}{n} \) 提出:\( E(X) = \frac{1}{n} \sum_{x=1}^n x \)。
3. 使用整数求和公式 \( \sum x = \frac{n(n+1)}{2} \)。
4. 相乘:\( E(X) = \frac{1}{n} \times \frac{n(n+1)}{2} = \frac{n+1}{2} \)。

重点总结:
• 对于任何 DRV:\( E(X) = \sum xp \) 及 \( Var(X) = E(X^2) - [E(X)]^2 \)。
• 对于线性平移:\( E(aX+b) = aE(X)+b \) 及 \( Var(aX+b) = a^2Var(X) \)。
• 对于均匀分布 (1 至 \( n \)):平均值 = \( \frac{n+1}{2} \),方差 = \( \frac{n^2-1}{12} \)。

你已经完成这部分的笔记了!做得好。请继续练习不同的概率表,很快地,计算“期望值”就会成为你的直觉反应。