欢迎来到离散随机变量世界!

在本章中,我们将探讨如何将「机会」转化为「数学」。想象你在玩桌上游戏,你知道掷出 6 点纯属运气,但如果你掷了 1,000 次骰子,你其实是可以预测平均点数的。离散随机变量 (Discrete Random Variables) 让我们能利用精确的数学公式来建立这些现实世界不确定性的模型。无论是预测进入店铺的顾客人数,还是你需要掷多少次硬币才能得到「正面」,这些工具都能将不可预测的情况变得可以预测。

如果公式起初看起来有点吓人,别担心;我们会一步步为你拆解!

1. 什么是离散随机变量?

随机变量 (Random Variable)(通常以大写字母如 \(X\) 表示)是一个数值,其取决于随机事件的结果。
离散 (Discrete) 一词意味着它只能取特定的、分离的数值(如 1, 2, 3...),而不是连续尺度上的任何数值(如 1.234...)。

概率函数 (Probability Function):
我们使用 \(P(X = x)\) 来表示变量 \(X\) 取特定数值 \(x\) 的概率。这些通常以表格或公式形式呈现。

两大金科玉律:
1. 每个个别概率必须介于 0 和 1 之间:\(0 \leq P(X=x) \leq 1\)。
2. 分布中所有概率的总和必须为 1:\(\sum P(X=x) = 1\)。
小贴士:如果你解题时概率总和不等于 1,检查一下你的加法吧!这是最常见的错误。

总结要点:离散随机变量就是一种列出事件所有可能结果及其发生概率的方法。

2. 期望值 (平均值) 与方差

如果你进行了数百万次实验,平均结果会是多少?这就是期望值 (Expectation),记作 \(E(X)\) 或 \(\mu\)。
公式: \(E(X) = \sum x P(X = x)\)
类比:把它想象成一个「加权平均数」,概率越高的数值会将平均值拉向它们。

方差 (Variance) 用来衡量结果偏离平均值的「散布程度」。高方差代表结果非常分散;低方差则代表结果大多集中在平均值附近。
公式: \(Var(X) = E(X^2) - [E(X)]^2\)
要计算 \(E(X^2)\),你只需将每个 \(x\) 值平方,再乘以其相应的概率即可。

标准差 (Standard Deviation): 这仅仅是方差的平方根:\(\sigma = \sqrt{Var(X)}\)。

重点速览:
- 期望值 = 平均结果。
- 方差 = 结果的一致性。
- 务必先计算 \(E(X)\),因为方差公式会用到它!

3. 编码:变量的转换

有时我们会更改数据。例如,如果 \(X\) 是游戏得分,也许新得分是 \(2X + 5\)。这会如何改变我们的平均值和方差?

线性转换规则:
- 期望值: \(E(a + bX) = a + bE(X)\)。(它完全遵循运算规则!)
- 方差: \(Var(a + bX) = b^2 Var(X)\)。
记忆法:方差讨厌加法! 加上常数 (\(a\)) 不会改变数据的散布程度,因此它会被忽略。乘以 \(b\) 会使散布变大,但由于方差是「平方」单位,我们必须使用 \(b^2\)。

关键要点:加上一个数只会平移整个图表,但不改变散布;乘以一个数会拉伸图表,并显著增加散布。

4. 独立变量的线性组合

如果我们有两个独立的变量 \(X\) 和 \(Y\),且想将它们加起来怎么办?(例如,两名随机挑选的人的身高总和)。
期望值: \(E(X \pm Y) = E(X) \pm E(Y)\)
方差: \(Var(X \pm Y) = Var(X) + Var(Y)\)
关键点:即使你是在进行减法运算 (\(X - Y\)),你仍然要相加方差!这是因为将两个不确定的事物结合起来,总是不确定性(散布)增加。

5. 离散均匀分布 (Discrete Uniform Distribution)

这是最简单的模型。当每个结果发生的可能性相等时使用。
例子:公平的 6 面骰子。每个数字的概率均为 \(1/6\)。

如果 \(X\) 在集合 \(\{1, 2, ..., n\}\) 上均匀分布:
- 平均值: \(E(X) = \frac{n + 1}{2}\)
- 方差: \(Var(X) = \frac{1}{12}(n^2 - 1)\)
你知道吗?这些公式仅适用于你的数值从 1 开始,且以 1 为步长递增的情况。如果你的数值是 \(\{4, 5, 6, 7\}\),它仍然是均匀分布,但你会通过寻找中间值来计算平均值!

6. 二项分布 (Binomial Distribution)

你可能在 AS Level 就记得这个。它模拟在固定次数的试验中「成功」的次数。
符号: \(X \sim B(n, p)\)
进阶数学新知: 你需要掌握二项分布的平均值和方差公式:
- 平均值: \(E(X) = np\)
- 方差: \(Var(X) = np(1 - p)\)

7. 泊松分布 (Poisson Distribution)

这用于「随机发生在时间或空间中」的事件。
例子:你在一个小时内收到的邮件数量,或一平方米草地上的杂草数量。

条件(CRIS 准则):
- C (Constant): 恒定的平均率 (\(\lambda\))。
- R (Randomly/Independently): 随机独立发生。
- I (In isolation): 互斥(事件不能在完全同一时间发生)。
- S (Singly): 单次(一次发生一个)。

主要特征:
- 符号: \(X \sim Po(\lambda)\)。
- 平均值与方差: 在泊松分布中,平均值和方差是相等的! \(E(X) = Var(X) = \lambda\)。
快速检查:如果题目给出的数据中平均值是 5 而方差是 20,那么泊松模型很可能适用!

泊松相加: 如果你有两个独立的泊松变量 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\),那么 \(X + Y \sim Po(\lambda + \mu)\)。你只需将比率相加即可!

8. 几何分布 (Geometric Distribution)

几何分布模拟的是直到第一次成功前所需的试验次数
例子:掷硬币直到你得到第一个「正面」。

符号: \(X \sim Geo(p)\),其中 \(p\) 是成功的概率。
概率:
- 在第 \(r\) 次试验才得到第一次成功:\(P(X = r) = (1 - p)^{r-1} p\)。
- 等待超过 \(r\) 次试验才成功:\(P(X > r) = (1 - p)^r\)。
类比:若要失败 5 次,直到第 6 次才成功,你必须经历 (失败 \(\times\) 失败 \(\times\) 失败 \(\times\) 失败 \(\times\) 失败 \(\times\) 成功)。

性质:
- 平均值: \(E(X) = \frac{1}{p}\)
- 方差: \(Var(X) = \frac{1 - p}{p^2}\)

避免常见错误: 确保你清楚题目定义的 \(X\) 是「试验次数」(本课程大纲)还是「第一次成功前的失败次数」。务必仔细阅读题目!

关键模型总结

1. 二项分布: 固定次数的试验,计算成功的次数。
2. 泊松分布: 固定区间(时间/空间),计算发生的次数。
3. 几何分布: 不断尝试,直到第一次成功。
4. 均匀分布: 每个结果的可能性均等。

如果起初觉得棘手,请别担心!掌握这些模型最好的方法是多练习,学会辨认哪种模型适合题目中的情境。你一定能做到的!