欢迎来到离散随机变量的世界!
在你 S1: Statistics 课程的这个章节中,我们将从简单的“概率是多少?”这类问题,进阶到预测事件的长期行为。无论你是对游戏设计、金融还是科学感兴趣,理解“随机性”如何遵循特定的模式是一项非常强大的技能。
我们将学习如何整理可能的结论、计算“期望值”,以及测量结论的变异程度。如果起初觉得有些抽象也不用担心——我们会通过掷骰子和玩游戏等简单的例子来为你拆解!
1. 什么是离散随机变量 (Discrete Random Variable)?
让我们拆解这个名称:
• 离散 (Discrete): 这意味着结论是明确、个别的数值(例如 1, 2, 3),而不是连续的量度(例如身高或体重)。
• 随机 (Random): 结论取决于机会。
• 变量 (Variable): 它能够取不同的数值。
概率分布 (Probability Distribution)
这简单来说就是一个列表(通常是表格),列出了变量 \(X\) 可能取的所有数值,以及每个数值发生的概率。
例子: 如果 \(X\) 是掷两枚硬币时出现的正面的次数:
\(X\) 可以是 0, 1 或 2。
\(P(X=0) = 0.25\)
\(P(X=1) = 0.50\)
\(P(X=2) = 0.25\)
重要规则: 一个分布中所有概率的总和必须等于 1。
\( \sum P(X=x) = 1 \)
快速复习:
• X(大写)代表实验的“名称”(例如:“得分”)。
• x(小写)代表具体的结论(例如:“得分为 5”)。
2. 期望值:代表性的“平均”结论
期望值 (Expected Value),写作 \(E(X)\) 或希腊字母 \(\mu\) (mu),是你重复进行该实验非常多次后,预期得到的平均值。
公式:
\( E(X) = \mu = \sum x_i p_i \)
计算步骤:
1. 将每个可能的数值 (\(x\)) 乘以它对应的概率 (\(p\))。
2. 将所有乘积相加。
类比: 这就像是一个“加权平均数”,出现概率越高的结论,对最终结论的“影响力”就越大。
函数的期望值:
如果你想找出数据经过变换后的期望值,例如 \(X^2\),你可以使用:
\( E(g(X)) = \sum g(x_i) p_i \)
例子: 若要找 \(E(X^2)\),你需要先将每个 \(x\) 值平方,然后再乘以概率。
关键点: \(E(X)\) 不一定会是一个“实际出现”的数值(例如:掷骰子的期望值是 3.5,尽管你不可能掷出 3.5!)。它代表的是长期平均。
3. 方差与标准差:测量离散程度
方差 (Variance),写作 \(\text{Var}(X)\) 或 \(\sigma^2\),告诉我们结论的分散程度。方差高意味着结论“分布得很广”,而方差低则意味着结论较为集中、稳定。
公式:
\( \text{Var}(X) = \sigma^2 = E(X^2) - [E(X)]^2 \)
记忆技巧: 将其想象为“平方的平均值减去平均值的平方”。
标准差 (Standard Deviation):
标准差 (\(\sigma\)) 简单来说就是方差的平方根。
\( \sigma = \sqrt{\text{Var}(X)} \)
常见错误: 在计算 \(\text{Var}(X)\) 时,学生常忘记在最后将平均值 (\(\mu\)) 平方。计算时请务必检查这一步!
4. 编码与线性变换 (Linear Transformations)
有时候我们想对数据进行调整——例如给每个人加额外分数,或是将所有结论翻倍。我们可以使用这些规则来找出新的平均值和方差,而不需要从头重新计算。
规则:
1. 期望值: \( E(aX + b) = aE(X) + b \)
(所有动作都会影响平均值:加、减、乘、除皆然。)
2. 方差: \( \text{Var}(aX + b) = a^2 \text{Var}(X) \)
(加上或减去常数 \(b\) 不会改变离散程度。乘以 \(a\) 会使方差变为原来的 \(a^2\) 倍。)
类比: 想象一群人站在巴士上。如果巴士向前移动了 10 公尺 (\(+b\)),“平均位置”会移动 10 公尺,但人与人之间的距离(离散程度)完全保持不变!
5. 独立随机变量
如果我们有两个互不影响的随机变量 \(X\) 和 \(Y\),会发生什么事呢?我们可以将它们结合起来!
和与差:
• \( E(aX \pm bY) = aE(X) \pm bE(Y) \)
• \( \text{Var}(aX \pm bY) = a^2 \text{Var}(X) + b^2 \text{Var}(Y) \)
重要提示: 请注意,对于方差,我们永远是是将组件相加,即使我们是在计算变量的差 (\(X - Y\))。这是因为结合两个随机事件总是会增加总体的重度不确定性或“混乱度”。
求和的快速复习:
如果你有多个相同的独立变量 \(X_1, X_2... X_n\):
• \( E(\sum X_i) = \sum E(X_i) \)
• \( \text{Var}(\sum X_i) = \sum \text{Var}(X_i) \)
6. 伯努利分布与二项分布
这些是遵循特定规则的特殊离散分布。
伯努利分布 (Bernoulli Distribution)
这是最简单的实验:只有两个结论,成功 (1) 或 失败 (0)。
令 \(p\) 为成功的概率。
• \( E(X) = p \)
• \( \text{Var}(X) = p(1 - p) \)
二项分布 (Binomial Distribution)
当你重复进行 \(n\) 次伯努利试验(例如:掷硬币 10 次)时,就会产生二项分布。
条件:
1. 固定次数的试验 (\(n\))。
2. 只有两种结论(成功/失败)。
3. 成功的概率 (\(p\)) 是恒定的。
4. 每次试验都是独立的。
符号: \( X \sim B(n, p) \)
二项分布的平均值与方差:
• 平均值: \( E(X) = np \)
• 方差: \( \text{Var}(X) = np(1 - p) \)
• 标准差: \( \sigma = \sqrt{np(1 - p)} \)
冷知识: “Binomial” 这个词来自 “bi”(二)和 “nomen”(名称/项)。它字面上就是指每次试验的两种可能结论!
关键点: 如果题目提到“成功次数”、“命中或未命中”或“固定次数的试验”,请立即检查它是否符合二项分布的条件!
总结清单
在进入下一章之前,请确保你能:
• 检查概率分布是否有效(总和 = 1)。
• 从表格中计算 \(E(X)\) 和 \(\text{Var}(X)\)。
• 应用线性变换规则来处理 \(E(aX+b)\) 和 \(\text{Var}(aX+b)\)。
• 结合独立变量 \(X\) 和 \(Y\)。
• 识别二项分布并使用 \(np\) 和 \(np(1-p)\) 的捷径公式。