Discrete random variables

欢迎来到离散随机变量的世界！

在你 S1: Statistics 课程的这个章节中，我们将从简单的“概率是多少？”这类问题，进阶到预测事件的长期行为。无论你是对游戏设计、金融还是科学感兴趣，理解“随机性”如何遵循特定的模式是一项非常强大的技能。

我们将学习如何整理可能的结论、计算“期望值”，以及测量结论的变异程度。如果起初觉得有些抽象也不用担心——我们会通过掷骰子和玩游戏等简单的例子来为你拆解！

1. 什么是离散随机变量 (Discrete Random Variable)？

让我们拆解这个名称：
• 离散 (Discrete)： 这意味着结论是明确、个别的数值（例如 1, 2, 3），而不是连续的量度（例如身高或体重）。
• 随机 (Random)： 结论取决于机会。
• 变量 (Variable)： 它能够取不同的数值。

概率分布 (Probability Distribution)
这简单来说就是一个列表（通常是表格），列出了变量 \(X\) 可能取的所有数值，以及每个数值发生的概率。
例子： 如果 \(X\) 是掷两枚硬币时出现的正面的次数：
\(X\) 可以是 0, 1 或 2。
\(P(X=0) = 0.25\)
\(P(X=1) = 0.50\)
\(P(X=2) = 0.25\)

重要规则： 一个分布中所有概率的总和必须等于 1。
\( \sum P(X=x) = 1 \)

快速复习：
• X（大写）代表实验的“名称”（例如：“得分”）。
• x（小写）代表具体的结论（例如：“得分为 5”）。

2. 期望值：代表性的“平均”结论

期望值 (Expected Value)，写作 \(E(X)\) 或希腊字母 \(\mu\) (mu)，是你重复进行该实验非常多次后，预期得到的平均值。

公式：
\( E(X) = \mu = \sum x_i p_i \)

计算步骤：
1. 将每个可能的数值 (\(x\)) 乘以它对应的概率 (\(p\))。
2. 将所有乘积相加。
类比： 这就像是一个“加权平均数”，出现概率越高的结论，对最终结论的“影响力”就越大。

函数的期望值：
如果你想找出数据经过变换后的期望值，例如 \(X^2\)，你可以使用：
\( E(g(X)) = \sum g(x_i) p_i \)
例子： 若要找 \(E(X^2)\)，你需要先将每个 \(x\) 值平方，然后再乘以概率。

关键点： \(E(X)\) 不一定会是一个“实际出现”的数值（例如：掷骰子的期望值是 3.5，尽管你不可能掷出 3.5！）。它代表的是长期平均。

3. 方差与标准差：测量离散程度

方差 (Variance)，写作 \(\text{Var}(X)\) 或 \(\sigma^2\)，告诉我们结论的分散程度。方差高意味着结论“分布得很广”，而方差低则意味着结论较为集中、稳定。

公式：
\( \text{Var}(X) = \sigma^2 = E(X^2) - [E(X)]^2 \)

记忆技巧： 将其想象为“平方的平均值减去平均值的平方”。

标准差 (Standard Deviation)：
标准差 (\(\sigma\)) 简单来说就是方差的平方根。
\( \sigma = \sqrt{\text{Var}(X)} \)

常见错误： 在计算 \(\text{Var}(X)\) 时，学生常忘记在最后将平均值 (\(\mu\)) 平方。计算时请务必检查这一步！

4. 编码与线性变换 (Linear Transformations)

有时候我们想对数据进行调整——例如给每个人加额外分数，或是将所有结论翻倍。我们可以使用这些规则来找出新的平均值和方差，而不需要从头重新计算。

规则：
1. 期望值： \( E(aX + b) = aE(X) + b \)
（所有动作都会影响平均值：加、减、乘、除皆然。）
2. 方差： \( \text{Var}(aX + b) = a^2 \text{Var}(X) \)
（加上或减去常数 \(b\) 不会改变离散程度。乘以 \(a\) 会使方差变为原来的 \(a^2\) 倍。）

类比： 想象一群人站在巴士上。如果巴士向前移动了 10 公尺 (\(+b\))，“平均位置”会移动 10 公尺，但人与人之间的距离（离散程度）完全保持不变！

5. 独立随机变量

如果我们有两个互不影响的随机变量 \(X\) 和 \(Y\)，会发生什么事呢？我们可以将它们结合起来！

和与差：
• \( E(aX \pm bY) = aE(X) \pm bE(Y) \)
• \( \text{Var}(aX \pm bY) = a^2 \text{Var}(X) + b^2 \text{Var}(Y) \)

重要提示： 请注意，对于方差，我们永远是是将组件相加，即使我们是在计算变量的差 (\(X - Y\))。这是因为结合两个随机事件总是会增加总体的重度不确定性或“混乱度”。

求和的快速复习：
如果你有多个相同的独立变量 \(X_1, X_2... X_n\)：
• \( E(\sum X_i) = \sum E(X_i) \)
• \( \text{Var}(\sum X_i) = \sum \text{Var}(X_i) \)

6. 伯努利分布与二项分布

这些是遵循特定规则的特殊离散分布。

伯努利分布 (Bernoulli Distribution)

这是最简单的实验：只有两个结论，成功 (1) 或失败 (0)。
令 \(p\) 为成功的概率。
• \( E(X) = p \)
• \( \text{Var}(X) = p(1 - p) \)

二项分布 (Binomial Distribution)

当你重复进行 \(n\) 次伯努利试验（例如：掷硬币 10 次）时，就会产生二项分布。
条件：
1. 固定次数的试验 (\(n\))。
2. 只有两种结论（成功/失败）。
3. 成功的概率 (\(p\)) 是恒定的。
4. 每次试验都是独立的。

符号： \( X \sim B(n, p) \)

二项分布的平均值与方差：
• 平均值： \( E(X) = np \)
• 方差： \( \text{Var}(X) = np(1 - p) \)
• 标准差： \( \sigma = \sqrt{np(1 - p)} \)

冷知识： “Binomial” 这个词来自 “bi”（二）和 “nomen”（名称/项）。它字面上就是指每次试验的两种可能结论！

关键点： 如果题目提到“成功次数”、“命中或未命中”或“固定次数的试验”，请立即检查它是否符合二项分布的条件！

总结清单

在进入下一章之前，请确保你能：
• 检查概率分布是否有效（总和 = 1）。
• 从表格中计算 \(E(X)\) 和 \(\text{Var}(X)\)。
• 应用线性变换规则来处理 \(E(aX+b)\) 和 \(\text{Var}(aX+b)\)。
• 结合独立变量 \(X\) 和 \(Y\)。
• 识别二项分布并使用 \(np\) 和 \(np(1-p)\) 的捷径公式。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。