Discrete random variables

离散随机变量简介

欢迎来到 Statistics 1 中最重要的章节之一！在此之前，你可能接触的都是已经发生的数据（例如班上同学的身高）。但在这一章，我们的焦点会转向模型（Models）——即用数学方式预测未来“可能”发生的事情。

理解离散随机变量（Discrete Random Variables）就像在玩游戏前先弄懂规则一样。它让我们能够针对尚未发生的事件计算平均值与风险，这正是保险公司、游戏设计师和科学家做决策的核心方法！

1. 什么是离散随机变量？

让我们把这个术语拆解成两个简单的部分：

1. 离散（Discrete）： 指的是结果是明确且分开的。你可以计算它们（例如 1, 2, 3...）。在这些情况下，你不可能得到“一半”的结果。例如，掷 3 次硬币出现的人头数就是离散的（你不可能得到 1.5 次人头）。
2. 随机变量（Random Variable）： 这是一个数值取决于随机事件结果的量。我们通常使用大写字母（例如 \(X\)）来代表变量的“名称”，并使用小写字母（例如 \(x\)）来代表它实际取到的数值。

比喻： 想象一台自动售货机。这台机器本身就是随机变量 \(X\)。掉出来的特定零食（巧克力棒、薯片或饼干）就是数值 \(x\)。因为你无法确切知道会掉出哪一个，所以它是“随机”的。

重要术语小提醒：

• 样本空间（Sample Space）： 所有可能结果的列表（例如，对于一颗骰子，样本空间为 {1, 2, 3, 4, 5, 6}）。
• 概率分布（Probability Distribution）： 一份完整的说明（通常是表格），显示了每一个可能结果及其对应的概率。

快速复习： 对于任何有效的概率分布，所有概率的总和必须等于 1。 \( \sum P(X = x) = 1 \)。

2. 概率函数与累积分配函数 (CDF)

概率函数 \(p(x)\)

概率函数写作 \(P(X = x)\)，告诉我们特定结果发生的机会。有时候它会以公式呈现，例如 \(P(X = x) = kx\)。要找出 \(k\) 的值，只需记住“总和为 1”的规则！

累积分配函数 (CDF)

CDF 写作 \(F(x)\)。你可以把“累积（Cumulative）”想象成累计总数。它告诉我们变量小于或等于某个特定数值的概率。

公式： \(F(x_0) = P(X \le x_0) = \sum_{x \le x_0} p(x)\)

例子： 如果你投掷一颗骰子，\(F(2)\) 就是掷出 1 或 2 的概率。
\(F(2) = P(X=1) + P(X=2) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6}\)。

关键重点： \(P(X = x)\) 是单一个点的概率；\(F(x)\) 则是累积到该点为止的总和概率。

3. 期望值 (Expected Value)：\(X\) 的“平均值”

期望值写作 \(E(X)\) 或用希腊字母 \(\mu\) (mu) 表示，这是指如果你重复实验很多很多次后，长期下来所期望得到的平均数值。

如何计算 \(E(X)\)：
1. 将每个数值 \(x\) 乘以它对应的概率 \(P(X=x)\)。
2. 将所有乘积加起来。

公式： \(E(X) = \sum x \cdot P(X = x)\)

如果一开始觉得有点难，别担心！ 把它想象成“加权平均数”就好。如果赢 1 元的概率是 90%，赢 100 元的概率是 10%，那么“期望值”会高于 1 元，因为 100 元会把平均值“拉高”，即使它很少发生。

你知道吗？ 期望值不一定要是该变量实际可以取到的数值。对于一颗公平的骰子，\(E(X)\) 是 3.5，尽管你永远无法掷出 3.5 这个数字！

4. 方差 (Variance) 与标准差 (Standard Deviation)

虽然平均值告诉我们中心位置，但方差（写作 \(Var(X)\) 或 \(\sigma^2\)）则告诉我们数值的离散程度（分布有多广）。

我们使用这个非常通用的公式来计算方差：
\(Var(X) = E(X^2) - [E(X)]^2\)

方差计算步骤：

1. 找出 \(E(X)\)（平均值），然后将它平方。
2. 找出 \(E(X^2)\)：先将每个 \(x\) 值平方，然后乘以其概率，再将它们全部加总。
3. 相减： 用 \(E(X^2)\) 减去平均值的平方。

记忆小贴士： 记住“平方的平均值减去平均值的平方”。

常见错误： 很多同学最后会忘记将平均值平方。计算相减步骤时一定要再三检查！

标准差： 这就是方差的平方根。 \(\sigma = \sqrt{Var(X)}\)。

5. 数据编码：线性变换 (Linear Transformations)

有时候我们会通过加上常数或乘上系数来改变数据（例如将分数转换成百分比），这称为编码（Coding）。

如果我们有一个新变量 \(Y = aX + b\)，会发生以下情况：

1. 平均值受所有运算影响：
\(E(aX + b) = aE(X) + b\)
（如果你把每个人的分数乘以 2 再加 5 分，平均值也会乘以 2 再加 5。）

2. 方差只受乘数影响（且必须平方！）：
\(Var(aX + b) = a^2 Var(X)\)
（每个分数加 5 分并不会改变分数的“离散程度”，所以 '+ b' 会消失。乘数 'a' 必须平方，因为方差是一种平方度量。）

快速总结：
• 平均值：完全遵循运算规则。
• 方差：忽略加减项，将乘数平方。

6. 离散均匀分布 (Discrete Uniform Distribution)

这是一种特殊的“公平”分布。当每个可能结果的概率完全相同时，就是离散均匀分布。

例子： 投掷一颗公平的 6 面骰子。从 1 到 6 的每个数字概率都是 \(\frac{1}{6}\)。
如果随机变量 \(X\) 可以取值 \(1, 2, ..., n\)，那么：
• 对于所有 \(x\)，\(P(X = x) = \frac{1}{n}\)。
• 平均值 \(E(X)\) 会正好在中间： \(\frac{n+1}{2}\)。

关键重点： 当你看到“Uniform（均匀）”这个词，就想到“相等”或“公平”。这会简化你的计算，因为你不需要复杂的表格——你已经知道每个概率都是一样的！

总结检查清单：
• 我的所有概率加起来等于 1 吗？
• 计算方差时，我有记得将平均值平方吗？
• 在处理 \(Var(aX+b)\) 的编码时，我有记得把 \(a\) 平方并忽略 \(b\) 吗？
• 我的 \(E(X)\) 是否落在最小值与最大值 \(x\) 之间？（如果不是，检查一下算式！）

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。