欢迎来到离散随机变量的世界!

在你 S1: Statistics 课程的这个章节中,我们将从简单的“概率是多少?”这类问题,进阶到预测事件的长期行为。无论你是对游戏设计、金融还是科学感兴趣,理解“随机性”如何遵循特定的模式是一项非常强大的技能。

我们将学习如何整理可能的结论、计算“期望值”,以及测量结论的变异程度。如果起初觉得有些抽象也不用担心——我们会通过掷骰子和玩游戏等简单的例子来为你拆解!

1. 什么是离散随机变量 (Discrete Random Variable)?

让我们拆解这个名称:
离散 (Discrete): 这意味着结论是明确、个别的数值(例如 1, 2, 3),而不是连续的量度(例如身高或体重)。
随机 (Random): 结论取决于机会。
变量 (Variable): 它能够取不同的数值。

概率分布 (Probability Distribution)
这简单来说就是一个列表(通常是表格),列出了变量 \(X\) 可能取的所有数值,以及每个数值发生的概率。
例子: 如果 \(X\) 是掷两枚硬币时出现的正面的次数:
\(X\) 可以是 0, 1 或 2。
\(P(X=0) = 0.25\)
\(P(X=1) = 0.50\)
\(P(X=2) = 0.25\)

重要规则: 一个分布中所有概率的总和必须等于 1。
\( \sum P(X=x) = 1 \)

快速复习:
X(大写)代表实验的“名称”(例如:“得分”)。
x(小写)代表具体的结论(例如:“得分为 5”)。

2. 期望值:代表性的“平均”结论

期望值 (Expected Value),写作 \(E(X)\) 或希腊字母 \(\mu\) (mu),是你重复进行该实验非常多次后,预期得到的平均值。

公式:
\( E(X) = \mu = \sum x_i p_i \)

计算步骤:
1. 将每个可能的数值 (\(x\)) 乘以它对应的概率 (\(p\))。
2. 将所有乘积相加。
类比: 这就像是一个“加权平均数”,出现概率越高的结论,对最终结论的“影响力”就越大。

函数的期望值:
如果你想找出数据经过变换后的期望值,例如 \(X^2\),你可以使用:
\( E(g(X)) = \sum g(x_i) p_i \)
例子: 若要找 \(E(X^2)\),你需要先将每个 \(x\) 值平方,然后再乘以概率。

关键点: \(E(X)\) 不一定会是一个“实际出现”的数值(例如:掷骰子的期望值是 3.5,尽管你不可能掷出 3.5!)。它代表的是长期平均。

3. 方差与标准差:测量离散程度

方差 (Variance),写作 \(\text{Var}(X)\)\(\sigma^2\),告诉我们结论的分散程度。方差高意味着结论“分布得很广”,而方差低则意味着结论较为集中、稳定。

公式:
\( \text{Var}(X) = \sigma^2 = E(X^2) - [E(X)]^2 \)

记忆技巧: 将其想象为“平方的平均值减去平均值的平方”。

标准差 (Standard Deviation):
标准差 (\(\sigma\)) 简单来说就是方差的平方根。
\( \sigma = \sqrt{\text{Var}(X)} \)

常见错误: 在计算 \(\text{Var}(X)\) 时,学生常忘记在最后将平均值 (\(\mu\)) 平方。计算时请务必检查这一步!

4. 编码与线性变换 (Linear Transformations)

有时候我们想对数据进行调整——例如给每个人加额外分数,或是将所有结论翻倍。我们可以使用这些规则来找出新的平均值和方差,而不需要从头重新计算。

规则:
1. 期望值: \( E(aX + b) = aE(X) + b \)
(所有动作都会影响平均值:加、减、乘、除皆然。)
2. 方差: \( \text{Var}(aX + b) = a^2 \text{Var}(X) \)
(加上或减去常数 \(b\) 不会改变离散程度。乘以 \(a\) 会使方差变为原来的 \(a^2\) 倍。)

类比: 想象一群人站在巴士上。如果巴士向前移动了 10 公尺 (\(+b\)),“平均位置”会移动 10 公尺,但人与人之间的距离(离散程度)完全保持不变!

5. 独立随机变量

如果我们有两个互不影响的随机变量 \(X\) 和 \(Y\),会发生什么事呢?我们可以将它们结合起来!

和与差:
• \( E(aX \pm bY) = aE(X) \pm bE(Y) \)
• \( \text{Var}(aX \pm bY) = a^2 \text{Var}(X) + b^2 \text{Var}(Y) \)

重要提示: 请注意,对于方差,我们永远是是将组件相加,即使我们是在计算变量的差 (\(X - Y\))。这是因为结合两个随机事件总是会增加总体的重度不确定性或“混乱度”。

求和的快速复习:
如果你有多个相同的独立变量 \(X_1, X_2... X_n\):
• \( E(\sum X_i) = \sum E(X_i) \)
• \( \text{Var}(\sum X_i) = \sum \text{Var}(X_i) \)

6. 伯努利分布与二项分布

这些是遵循特定规则的特殊离散分布。

伯努利分布 (Bernoulli Distribution)

这是最简单的实验:只有两个结论,成功 (1) 或 失败 (0)。
令 \(p\) 为成功的概率。
• \( E(X) = p \)
• \( \text{Var}(X) = p(1 - p) \)

二项分布 (Binomial Distribution)

当你重复进行 \(n\) 次伯努利试验(例如:掷硬币 10 次)时,就会产生二项分布
条件:
1. 固定次数的试验 (\(n\))。
2. 只有两种结论(成功/失败)。
3. 成功的概率 (\(p\)) 是恒定的。
4. 每次试验都是独立的。

符号: \( X \sim B(n, p) \)

二项分布的平均值与方差:
平均值: \( E(X) = np \)
方差: \( \text{Var}(X) = np(1 - p) \)
标准差: \( \sigma = \sqrt{np(1 - p)} \)

冷知识: “Binomial” 这个词来自 “bi”(二)和 “nomen”(名称/项)。它字面上就是指每次试验的两种可能结论!

关键点: 如果题目提到“成功次数”、“命中或未命中”或“固定次数的试验”,请立即检查它是否符合二项分布的条件!

总结清单

在进入下一章之前,请确保你能:
• 检查概率分布是否有效(总和 = 1)。
• 从表格中计算 \(E(X)\) 和 \(\text{Var}(X)\)。
• 应用线性变换规则来处理 \(E(aX+b)\) 和 \(\text{Var}(aX+b)\)。
• 结合独立变量 \(X\) 和 \(Y\)。
• 识别二项分布并使用 \(np\) 和 \(np(1-p)\) 的捷径公式。