离散随机变量简介

欢迎来到 Statistics 1 中最重要的章节之一!在此之前,你可能接触的都是已经发生的数据(例如班上同学的身高)。但在这一章,我们的焦点会转向模型(Models)——即用数学方式预测未来“可能”发生的事情。

理解离散随机变量(Discrete Random Variables)就像在玩游戏前先弄懂规则一样。它让我们能够针对尚未发生的事件计算平均值与风险,这正是保险公司、游戏设计师和科学家做决策的核心方法!

1. 什么是离散随机变量?

让我们把这个术语拆解成两个简单的部分:

1. 离散(Discrete): 指的是结果是明确且分开的。你可以计算它们(例如 1, 2, 3...)。在这些情况下,你不可能得到“一半”的结果。例如,掷 3 次硬币出现的人头数就是离散的(你不可能得到 1.5 次人头)。
2. 随机变量(Random Variable): 这是一个数值取决于随机事件结果的量。我们通常使用大写字母(例如 \(X\))来代表变量的“名称”,并使用小写字母(例如 \(x\))来代表它实际取到的数值。

比喻: 想象一台自动售货机。这台机器本身就是随机变量 \(X\)。掉出来的特定零食(巧克力棒、薯片或饼干)就是数值 \(x\)。因为你无法确切知道会掉出哪一个,所以它是“随机”的。

重要术语小提醒:

样本空间(Sample Space): 所有可能结果的列表(例如,对于一颗骰子,样本空间为 {1, 2, 3, 4, 5, 6})。
概率分布(Probability Distribution): 一份完整的说明(通常是表格),显示了每一个可能结果及其对应的概率。

快速复习: 对于任何有效的概率分布,所有概率的总和必须等于 1。 \( \sum P(X = x) = 1 \)。

2. 概率函数与累积分配函数 (CDF)

概率函数 \(p(x)\)

概率函数写作 \(P(X = x)\),告诉我们特定结果发生的机会。有时候它会以公式呈现,例如 \(P(X = x) = kx\)。要找出 \(k\) 的值,只需记住“总和为 1”的规则!

累积分配函数 (CDF)

CDF 写作 \(F(x)\)。你可以把“累积(Cumulative)”想象成累计总数。它告诉我们变量小于或等于某个特定数值的概率。

公式: \(F(x_0) = P(X \le x_0) = \sum_{x \le x_0} p(x)\)

例子: 如果你投掷一颗骰子,\(F(2)\) 就是掷出 1 或 2 的概率。
\(F(2) = P(X=1) + P(X=2) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6}\)。

关键重点: \(P(X = x)\) 是单一个点的概率;\(F(x)\) 则是累积到该点为止的总和概率

3. 期望值 (Expected Value):\(X\) 的“平均值”

期望值写作 \(E(X)\) 或用希腊字母 \(\mu\) (mu) 表示,这是指如果你重复实验很多很多次后,长期下来所期望得到的平均数值。

如何计算 \(E(X)\):
1. 将每个数值 \(x\) 乘以它对应的概率 \(P(X=x)\)。
2. 将所有乘积加起来。

公式: \(E(X) = \sum x \cdot P(X = x)\)

如果一开始觉得有点难,别担心! 把它想象成“加权平均数”就好。如果赢 1 元的概率是 90%,赢 100 元的概率是 10%,那么“期望值”会高于 1 元,因为 100 元会把平均值“拉高”,即使它很少发生。

你知道吗? 期望值不一定要是该变量实际可以取到的数值。对于一颗公平的骰子,\(E(X)\) 是 3.5,尽管你永远无法掷出 3.5 这个数字!

4. 方差 (Variance) 与标准差 (Standard Deviation)

虽然平均值告诉我们中心位置,但方差(写作 \(Var(X)\)\(\sigma^2\))则告诉我们数值的离散程度(分布有多广)。

我们使用这个非常通用的公式来计算方差:
\(Var(X) = E(X^2) - [E(X)]^2\)

方差计算步骤:

1. 找出 \(E(X)\)(平均值),然后将它平方。
2. 找出 \(E(X^2)\):先将每个 \(x\) 值平方,然后乘以其概率,再将它们全部加总。
3. 相减: 用 \(E(X^2)\) 减去平均值的平方。

记忆小贴士: 记住“平方的平均值减去平均值的平方”。

常见错误: 很多同学最后会忘记将平均值平方。计算相减步骤时一定要再三检查!

标准差: 这就是方差的平方根。 \(\sigma = \sqrt{Var(X)}\)。

5. 数据编码:线性变换 (Linear Transformations)

有时候我们会通过加上常数或乘上系数来改变数据(例如将分数转换成百分比),这称为编码(Coding)

如果我们有一个新变量 \(Y = aX + b\),会发生以下情况:

1. 平均值受所有运算影响:
\(E(aX + b) = aE(X) + b\)
(如果你把每个人的分数乘以 2 再加 5 分,平均值也会乘以 2 再加 5。)

2. 方差只受乘数影响(且必须平方!):
\(Var(aX + b) = a^2 Var(X)\)
(每个分数加 5 分并不会改变分数的“离散程度”,所以 '+ b' 会消失。乘数 'a' 必须平方,因为方差是一种平方度量。)

快速总结:
• 平均值:完全遵循运算规则。
• 方差:忽略加减项,将乘数平方。

6. 离散均匀分布 (Discrete Uniform Distribution)

这是一种特殊的“公平”分布。当每个可能结果的概率完全相同时,就是离散均匀分布

例子: 投掷一颗公平的 6 面骰子。从 1 到 6 的每个数字概率都是 \(\frac{1}{6}\)。
如果随机变量 \(X\) 可以取值 \(1, 2, ..., n\),那么:
• 对于所有 \(x\),\(P(X = x) = \frac{1}{n}\)。
• 平均值 \(E(X)\) 会正好在中间: \(\frac{n+1}{2}\)。

关键重点: 当你看到“Uniform(均匀)”这个词,就想到“相等”或“公平”。这会简化你的计算,因为你不需要复杂的表格——你已经知道每个概率都是一样的!

总结检查清单:
• 我的所有概率加起来等于 1 吗?
• 计算方差时,我有记得将平均值平方吗?
• 在处理 \(Var(aX+b)\) 的编码时,我有记得把 \(a\) 平方并忽略 \(b\) 吗?
• 我的 \(E(X)\) 是否落在最小值与最大值 \(x\) 之间?(如果不是,检查一下算式!)