欢迎来到离散随机变量的世界!

在以往的数学学习中,你可能处理过只有单一固定值的变量。在统计学中,我们进入了一个数值不确定、取决于机遇的世界。离散随机变量 (Discrete Random Variable, DRV) 本质上是一种将随机过程的结果(例如掷骰子或计算网站的点击次数)映射为数字的方法。

别担心,起初这听起来可能有点抽象!你可以把离散随机变量想象成一份“数学菜单”,它告诉你可能会发生什么事,以及每道“菜”(结果)出现的可能性。读完这些笔记后,你将能够计算平均值、衡量数据的“离散程度”,并利用特殊的模型来预测从体育赛事结果到饼干中巧克力豆数量等各种事物。


1. 基本概念:什么是离散随机变量?

随机变量 (Random Variable)(通常用大写字母如 \( X \) 表示)是一个其值由随机事件结果决定的量。如果它只能取某些特定的离散值(例如 0, 1, 2...),而不是某个区间内的任何值,那么它就是离散的

概率分布

概率分布 (Probability distribution) 仅仅是一份清单,列出了离散随机变量所有可能的取值及其对应的概率。你通常会在表格中或以函数形式 \( P(X = x) = f(x) \) 看到这些表示。

例子:设 \( X \) 为投掷一枚公平硬币两次时出现正面的次数。

可能的取值为 \( x = 0, 1, 2 \)。表格看起来会像这样:

  • \( P(X=0) = 0.25 \)
  • \( P(X=1) = 0.50 \)
  • \( P(X=2) = 0.25 \)

快速复习:黄金法则
分布中所有概率的总和必须等于 1。
\( \sum P(X = x) = 1 \)

常见错误:别忘了 \( x \) 代表的是数值(例如“3 个入球”),而 \( P(X=x) \) 代表的是机会(例如“0.1”)。在计算时千万不要混淆它们!


2. 期望值与方差

有了概率分布后,我们通常想知道两件事:什么是“平均”结果,以及结果的波动有多大?

期望值 (平均值)

期望值 (Expectation),记作 \( E(X) \),是如果你进行该实验非常多次后,长远下来的平均值。它也称为平均值,记作 \( \mu \)。

公式: \( E(X) = \mu = \sum x_i p_i \)

类比: 想象一个跷跷板。期望值就是该分布的“平衡点”,所有概率在两侧会完美平衡。

方差

方差 (Variance),记作 \( Var(X) \),衡量的是数据的离散程度。高方差代表结果非常分散;低方差则代表结果集中在平均值附近。

公式: \( Var(X) = \sigma^2 = \sum x_i^2 p_i - \mu^2 \)

记忆技巧:“平方的平均值减去平均值的平方”。
1. 先计算 \( E(X^2) \),即将每个 \( x \) 平方后乘以其对应概率。
2. 减去你刚才算出的平均值的平方。

线性变换 (改变尺度)

如果将所有数值加倍并加上 5,会发生什么事呢?我们可以使用以下这些实用的规则:
1. \( E(aX + b) = aE(X) + b \)(平均值会随你的操作而变化)。
2. \( Var(aX + b) = a^2 Var(X) \)(加上常数不会改变离散程度,但乘以 \( a \) 会使方差增加 \( a^2 \) 倍)。

核心要点: 期望值告诉你“在哪里?”(位置),而方差告诉你“有多宽?”(离散程度)。


3. 离散均匀分布 (Discrete Uniform Distribution)

这是最简单的分布,当每个结果都同样可能发生时就会出现。

符号: \( X \sim U(n) \),其中 \( X \) 取值为 \( 1, 2, ..., n \)。

现实生活例子: 投掷一枚公平的六面骰子。从 1 到 6 的每个数字概率都是 \( \frac{1}{6} \)。

你知道吗? 因为每个结果出现的机会均等,所以平均值永远刚好在区间的正中间!


4. 二项分布 (Binomial Distribution)

你在 A-Level 数学中已经见过它了,但在进阶数学 (Further Maths) 中,我们更专注于它的总结性质。

条件: 固定试验次数 (\( n \)),两种结果(成功/失败),以及固定的成功概率 (\( p \))。

\( X \sim B(n, p) \) 的公式:
1. 平均值: \( E(X) = np \)
2. 方差: \( Var(X) = np(1 - p) \)

逐步计算: 如果你投篮 10 次 (\( n=10 \)),成功率为 70% (\( p=0.7 \)),你预期会投进的次数为 \( 10 \times 0.7 = 7 \)。你的方差则为 \( 10 \times 0.7 \times 0.3 = 2.1 \)。


5. 几何分布 (Geometric Distribution)

当我们计算直到第一次成功出现所需的试验次数时,就会使用这种分布。

符号: \( X \sim Geo(p) \)

核心公式:
- 在第 \( x \) 次试验才第一次成功的概率: \( P(X=x) = (1-p)^{x-1}p \)
- 需要超过 \( x \) 次试验的概率: \( P(X > x) = (1-p)^x \)
- 平均值: \( E(X) = \frac{1}{p} \)
- 方差: \( Var(X) = \frac{1-p}{p^2} \)

类比: 想象尝试掷骰子得到“6”。概率是 \( \frac{1}{6} \)。预期得到第一次“6”所需的掷骰次数是 \( \frac{1}{1/6} = 6 \) 次。

常见错误: 学生经常混淆 \( P(X=x) \) 和 \( P(X > x) \)。记住,\( P(X > x) \) 其实就是连续失败 \( x \) 次的概率!


6. 泊松分布 (Poisson Distribution)

泊松分布模拟了事件在固定时间或空间区间内发生的次数。

符号: \( X \sim Po(\lambda) \),其中 \( \lambda \) (lambda) 是平均发生率。

条件 (「SIM」规则):

  • Singly (单次性):事件一次只发生一个。
  • Independently (独立性):一个事件的发生不会影响下一个。
  • Maintain a constant rate (恒定速率):平均速率 (\( \lambda \)) 保持不变。

数学运算:

- 概率公式: \( P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!} \)
- 神奇特性: 对于泊松分布,平均值 = 方差
\( E(X) = \lambda \) 且 \( Var(X) = \lambda \)。

泊松变量的加总:

如果你有两个独立的泊松变量 \( X \sim Po(\lambda_1) \) 和 \( Y \sim Po(\lambda_2) \),它们的和也是泊松分布:
\( X + Y \sim Po(\lambda_1 + \lambda_2) \)

例子: 如果一间商店早上每小时有 3 位顾客,下午每小时有 5 位,那么每日总顾客数(假设各计 1 小时)遵循 \( Po(3 + 5) = Po(8) \)。


成功的小贴士

  • 计算器技能: 确保你知道如何使用计算器的分布菜单(二项分布、泊松分布)来快速计算概率。
  • 检查语境: 你是在计算固定试验次数中的成功次数(二项分布)?直到成功的试验次数(几何分布)?还是特定时间段内的事件次数(泊松分布)?正确识别模型就已经成功了 80%!
  • 舍入问题: 在计算方差时,请保持平均值 (\( \mu \)) 的精确数值,以避免“累进式舍入误差”。

总结: 你现在已经掌握了描述任何离散随机事件的工具。你可以找出它的平均值(期望值)、一致性(方差),并应用专业模型(均匀、二项、几何、泊松)来解决复杂的现实问题。持续练习,这些规律将成为你的本能!