离散随机变量(9709 Paper 5,第5.4节)
各位未来的统计学家们,你们好!这一章标志着你们正式进入了形式化概率分布的世界。离散随机变量听起来可能很复杂,但它们本质上就是指那些取值可以数出来的变量。
我们将学习如何用数学方式描述这些数值,计算平均结果(期望值),并衡量结果的离散程度(方差)。这些工具对于从掷硬币到制造业质量控制等各种问题的建模都至关重要!
1. 什么是离散随机变量 (DRV)?
随机变量(通常用大写字母如 \(X\) 表示)是指取值由随机现象的结果决定的变量。
核心定义
- 离散随机变量 (DRV): 只能取特定、离散数值的随机变量。这些值通常是整数(whole numbers)。
- 类比:想象一下数人数(你可以有1、2或3个人,但不可能有2.5个人)。
- 可能取值(定义域): 如果掷一枚骰子,\(X\) 的取值可以是 {1, 2, 3, 4, 5, 6}。如果你计算掷4次硬币中正面的次数,\(X\) 的取值可以是 {0, 1, 2, 3, 4}。
1.1 概率分布表 (PDT)
离散随机变量完全由其概率分布定义。这就是列出变量可以取的每一个可能的值 (\(x\)),以及每个值对应的概率 \(P(X=x)\)。
这种分布通常用表格展示:
| \(x\) | \(x_1\) | \(x_2\) | \(x_3\) | ... |
| \(P(X=x)\) | \(p_1\) | \(p_2\) | \(p_3\) | ... |
任何概率分布必须满足的规则:
- 所有概率必须非负: 对于所有 \(x\),\(P(X=x) \ge 0\)。(某件事情发生的概率不可能是负数!)
- 所有概率之和必须等于 1: \(\sum P(X=x) = 1\)。(总得发生点什么吧!)
例题: 袋子里有2个红球 (R) 和 3个蓝球 (B)。不放回地取出两个球。令 \(X\) 为取出的红球数量。\(X\) 的取值可以是 0, 1 或 2。
P(X=0) = P(BB) = (3/5) * (2/4) = 6/20
P(X=1) = P(RB 或 BR) = (2/5)*(3/4) + (3/5)*(2/4) = 12/20
P(X=2) = P(RR) = (2/5) * (1/4) = 2/20
验证: \(6/20 + 12/20 + 2/20 = 20/20 = 1\)。该表格有效。
2. 期望值(平均值)与方差
一旦有了概率分布表,你就可以计算离散随机变量的两个最重要的特征:平均结果和结果的离散程度。
2.1 期望值 \(E(X)\)(平均值)
期望值,或称期望,\(E(X)\)(也常记作 \(\mu\)),代表了随机变量的长期平均值。如果你多次重复这个随机实验,这就是你预期的结果。
期望值公式:
$$E(X) = \sum x P(X=x)$$
分步小技巧: 只需将每个值 (\(x\)) 乘以其对应的概率 (\(P(X=x)\)),然后将所有乘积加起来即可。
2.2 方差 \(Var(X)\)(离散程度)
方差,\(Var(X)\)(或 \(\sigma^2\)),衡量了数值偏离平均值的程度。方差越大,说明结果分布越分散。
常用的计算方法基于以下关系式:
方差公式:
$$Var(X) = E(X^2) - [E(X)]^2$$其中 \(E(X^2)\) 是 \(X^2\) 的期望值,计算方式为: $$E(X^2) = \sum x^2 P(X=x)$$
快速复习:计算 \(Var(X)\)
- 计算 \(E(X) = \sum x P(X=x)\)。
- 计算 \(E(X^2) = \sum x^2 P(X=x)\)(先将 \(x\) 的值平方,*然后再*乘以对应的概率)。
- 代入方差公式:\(Var(X) = E(X^2) - [E(X)]^2\)。
标准差仅仅是 \(\sqrt{Var(X)}\)。
常见错误警示! 千万别忘了方差公式中的括号!它是 \( [E(X)]^2 \),这意味着你要对最终的平均值进行平方,而不是对单个 \(x\) 值进行平方。
3. 二项分布 \(B(n, p)\)
二项分布是一种特殊的离散随机变量分布,用于处理固定次数的重复试验,并且我们关注的是成功的总次数。
我们用 \(X \sim B(n, p)\) 来表示,其中 \(n\) 是试验次数,\(p\) 是单次试验中成功的概率。
3.1 二项分布模型的条件
只有在满足以下全部四个条件时,才能用二项分布进行建模。使用助记词 BITZ 来记住它们:
- Binary(二元):每次试验只有两种可能的结果(成功或失败)。
- Independent(独立):一次试验的结果不会影响其他试验的结果。
- Trials fixed(固定试验次数 \(n\)):试验次数是恒定且预先确定的。
- Zero change in \(p\)(概率不变):每次试验成功的概率 (\(p\)) 保持不变。
3.2 二项分布概率公式
如果 \(X \sim B(n, p)\),则在 \(n\) 次试验中恰好获得 \(r\) 次成功的概率为:
$$P(X=r) = \binom{n}{r} p^r (1-p)^{n-r}$$
其中:
- \(\binom{n}{r}\)(读作“n选r”)计算在 \(n\) 次试验中获得 \(r\) 次成功的方法数。使用计算器上的 nCr 功能即可。
- \(p^r\) 是 \(r\) 次成功的概率。
- \((1-p)^{n-r}\) 是剩余 \((n-r)\) 次失败的概率。
你知道吗? \((1-p)\) 常记作 \(q\)。该公式简单地将获取结果的方法数与特定结果序列的概率结合在了一起。
3.3 二项分布的期望值与方差
对于二项分布,计算平均值和方差可以直接使用专用公式(这些公式会在 MF19 列表里提供):
期望值(平均值):
$$E(X) = np$$方差:
$$Var(X) = np(1-p)$$例题: 如果你抛一枚均匀硬币 100 次 (\(n=100\), \(p=0.5\)),你期望的正面次数为 \(E(X) = 100 \times 0.5 = 50\)。方差为 \(100 \times 0.5 \times 0.5 = 25\)。
4. 几何分布 \(Geo(p)\)
几何分布用于模拟必须等待直到第一次成功发生为止的概率。它是二项分布理念的延伸,但没有固定的试验次数。
我们用 \(X \sim Geo(p)\) 来表示,其中 \(p\) 是单次试验中成功的概率。\(X\) 的可能取值为 \(r=1, 2, 3, \ldots\)(因为第一次成功迟早会发生)。
4.1 几何分布模型的条件
几何分布需要满足 BITZ 条件中的前三项,但将固定的试验次数替换为可变的“等待时间”:
- Binary(二元):只有两种结果(成功或失败)。
- Independent(独立):试验是独立的。
- Zero change in \(p\)(概率不变):成功的概率 (\(p\)) 不变。
类比: 你不停地掷硬币直到出现第一个正面。\(X=5\) 意味着你掷了4次反面,紧接着在第5次掷出了正面 (FFFFH)。
4.2 几何分布概率公式
如果 \(X\) 是第一次成功发生的试验次数,那么对于 \(r = 1, 2, 3, \ldots\):
$$P(X=r) = (1-p)^{r-1} p$$该公式意味着在第 \(r\) 次成功之前,一定经历了 \((r-1)\) 次失败。
例题: 如果 \(p=0.2\),第一次成功发生在第 4 次试验 (\(r=4\)) 的概率为:
\(P(X=4) = (1-0.2)^{4-1} \times 0.2 = (0.8)^3 \times 0.2 = 0.1024\)
4.3 几何分布的期望值
几何分布的期望值 \(E(X)\) 告诉你直到第一次成功为止平均需要等待的试验次数。
期望值(平均值):
$$E(X) = \frac{1}{p}$$例题: 如果击中靶心的概率是 \(p=0.1\),你平均需要等待 \(E(X) = 1/0.1 = 10\) 次投掷才能命中第一次靶心。
(注意:几何分布的方差公式不需要在 P5 考试中掌握,仅需了解期望值即可)。
快速复习与学习建议
- 离散随机变量基础: 记住任何概率分布必须满足的两条规则:概率之和必须为1,且概率必须是非负的。
- 矩的计算: 务必先计算 \(E(X)\)。计算 \(E(X^2)\) 时,一定要*先*对 \(x\) 值平方,再乘以 \(P(X=x)\)。
- 二项分布 vs. 几何分布:
- 二项分布:试验次数固定,计算成功的总次数。(BITZ)
- 几何分布:试验次数可变,等待第一次成功。(等待时间模型)
- 公式手册 (MF19): 二项分布和几何分布的期望值和方差公式均已提供。重点在于理解*何时*使用它们。
如果计算方差看起来很棘手,别担心。通过增加 \(xP(X=x)\) 和 \(x^2 P(X=x)\) 两列来整理表格。条理清晰就是成功的保证!