欢迎来到离散随机变量的世界!

在本章中,我们将从观察单一事件转向从“宏观”角度理解概率。我们利用离散随机变量 (Discrete Random Variables) 来建立现实生活中的模型,例如商店中顾客的到达数量,或是掷硬币直到出现“正面”所需的次数。理解这些模式能让我们进行预测并计算风险,而这正是统计学的核心。

如果刚开始觉得公式有点深奥,别担心!我们会将它们拆解成简单的步骤,保证大家都能跟上!

1. 基础概念:什么是随机变量?

随机变量 (Random Variable)(通常记作 \(X\))是一个将实验的每个结果赋予一个数值的规则。如果它只能取特定的、分离的数值(如 1, 2, 3...)而不能取范围内的任意值,它就是离散 (discrete) 的。

概率分布 (Probability Distributions)

概率分布简单来说就是一个列表或公式,列出 \(X\) 所有可能的数值及其各自发生的概率。我们将其写为 \(P(X = x)\)。

两大黄金法则:
1. 每个个别的概率必须介于 0 和 1 之间:\(0 \le P(X=x) \le 1\)。
2. 分布中所有概率的总和必须等于 1:\(\sum P(X=x) = 1\)。

例子:设 \(X\) 为投掷一颗公平 4 面骰子的点数。数值为 {1, 2, 3, 4},每个数值的概率皆为 0.25。如果你将它们相加(\(0.25 \times 4\)),结果就是 1!

快速复习小撇步:如果在表中漏掉了一个概率,只要把其他的概率加起来,再用 1 减去总和即可!

2. 期望值与方差

我们该如何找出一个模式的“平均值”呢?我们使用期望值 (Expectation)方差 (Variance)

期望值 \(E(X)\)

期望值(或平均值,\(\mu\))是长期的平均数值。要计算它,将每个数值乘以其对应的概率,然后全部加总:
\(E(X) = \mu = \sum x P(X = x)\)

方差 \(Var(X)\)

方差 (\(\sigma^2\)) 用来衡量数值的分布离散程度。最容易使用的公式是:
\(Var(X) = E(X^2) - [E(X)]^2\)

计算方差的步骤:
1. 先计算 \(E(X)\)。
2. 将每个 \(x\) 的数值平方,乘以其概率,再全部加总以得到 \(E(X^2)\)。
3. 用第二步的答案减去第一步答案的平方。

记忆口诀:你可以将方差公式记作“平方的平均值减去平均值的平方”

重点提示:标准差 (Standard Deviation) (\(\sigma\)) 其实就是方差的平方根:\(\sigma = \sqrt{Var(X)}\)。

3. 编码:变量转换

有时候我们需要改变数据(例如,将分数转换为现金奖励)。我们使用以下简单规则来处理期望值代数

1. 期望值: \(E(a + bX) = a + bE(X)\)。(完全符合直觉!)
2. 方差: \(Var(a + bX) = b^2 Var(X)\)。(加上常数 \(a\) 不会改变离散程度,但乘数 \(b\) 需要平方!)

常见错误:永远不要从方差中减去常数。即使你将数据平移了 -10,数据的“分布范围”保持不变,因此方差不会改变!

4. 离散均匀分布 (Discrete Uniform Distribution)

这是最简单的模型。当每个结果发生的概率皆相等时使用,例如公平的骰子或转盘。

若 \(X\) 在数值 \(\{1, 2, \dots, n\}\) 上呈均匀分布:
\(E(X) = \frac{n + 1}{2}\)
\(Var(X) = \frac{1}{12}(n^2 - 1)\)

例子:对于标准的 6 面骰子(\(n=6\)),平均点数 \(E(X)\) 为 \(\frac{6+1}{2} = 3.5\)。

5. 二项分布 \(X \sim B(n, p)\)

你在 A Level 数学中已经见过它,但在进阶数学 (Further Maths) 中,我们更深入探讨其性质。当你拥有固定次数的试验 (\(n\)) 且只有两种结果(成功或失败)时使用。

核心性质:
平均值: \(E(X) = np\)
方差: \(Var(X) = np(1 - p)\)

你知道吗?二项分布变量其实就是 \(n\) 个独立伯努利试验 (Bernoulli trials)(即 \(n=1\) 的试验)的总和。这就是为什么平均值简单地等于 \(n \times p\)!

6. 泊松分布 \(X \sim Po(\lambda)\)

这用于建立在固定时间或空间区间内发生的事件次数模型(例如一小时内收到的邮件数量)。

泊松模型的条件:
- 事件随机独立发生。
- 事件以固定的平均速率 (\(\lambda\)) 发生。
- 事件不能同时发生。

“神奇”的性质:
在泊松分布中,平均值与方差相等
\(E(X) = \lambda\)
\(Var(X) = \lambda\)

快速复习:如果你被问到泊松模型是否适用于某组数据,检查计算出的平均值和方差是否接近。如果差异很大,泊松模型就不是一个好选择!

合并泊松分布:如果 \(X \sim Po(\lambda)\) 与 \(Y \sim Po(\mu)\) 是独立的,那么它们的总和也符合泊松分布:\(X + Y \sim Po(\lambda + \mu)\)。

7. 几何分布 \(X \sim Geo(p)\)

几何分布用于模拟直到第一次成功为止的试验次数。你可以把它想成是“我需要等多久?”的分布。

公式:
- 在第 \(r\) 次试验成功的概率: \(P(X = r) = (1 - p)^{r-1}p\)
- 成功需要超过 \(r\) 次试验的概率: \(P(X > r) = (1 - p)^r\)
- 平均值: \(E(X) = \frac{1}{p}\)
- 方差: \(Var(X) = \frac{1 - p}{p^2}\)

例子:如果赢得游戏的概率是 0.2,为了赢一次平均需要玩的游戏次数为 \(\frac{1}{0.2} = 5\) 场。

8. 独立变量的线性组合

这就是进阶数学精彩的地方!如果我们有两个不同的随机变量 \(X\) 和 \(Y\),想要找出它们组合后的平均值与方差该怎么办?如果 \(X\) 和 \(Y\) 是独立的

组合平均值(期望值)

\(E(X + Y) = E(X) + E(Y)\)
\(E(X - Y) = E(X) - E(Y)\)
\(E(aX + bY) = aE(X) + bE(Y)\)

组合方差(平方规则)

关键法则:当你组合变量时,方差永远是相加的(前提是它们必须独立)。即使你是在减去变量,不确定性(方差)仍然会增加!
\(Var(X + Y) = Var(X) + Var(Y)\)
\(Var(X - Y) = Var(X) + Var(Y)\)(没错,这里还是加号!)
\(Var(aX \pm bY) = a^2 Var(X) + b^2 Var(Y)\)

类比:想像 \(X\) 和 \(Y\) 是两台不同的震动机器人。如果你把一台机器人叠在另一台上面,总体的“震动程度”(方差)会加剧,无论它们是往相同方向还是相反方向移动!

总结摘要:
- 使用期望值来求平均,使用方差来衡量分布程度。
- 泊松分布用于计数时间间隔内的事件;几何分布用于等待成功的次数。
- 对于独立变量:平均值遵循运算符号,但方差永远相加!