Discrete Random Variables - Further Mathematics A - H245 - Cambridge OCR A Level

离散随机变量简介

欢迎来到离散随机变量（Discrete Random Variables）的世界！虽然这个名字听起来有点深奥，但它其实是你日常生活中无处不在的概念。如果你曾经好奇过一支球队的“平均”进球数，或是计算过在第三次尝试时赢得游戏的概率，那么你其实已经在运用随机变量的思维了。

在这一章中，我们将超越基础的概率概念，探讨如何为具有可数（countable）结果的事件建立模型、进行计算及预测。别担心统计学听起来会很枯燥——我们会将其拆解成易于消化的内容，并配合大量现实生活中的例子来深入浅出地学习！

1. 一般离散随机变量

离散随机变量（DRV）是一个其值取决于随机事件结果的变量，且这些数值必须是离散的（意即你可以数出它们，例如 0, 1, 2... 不包含小数！）。我们通常使用大写字母（如 \( X \)）来表示变量本身，并使用小写字母（如 \( x \)）来表示它所能取得的特定数值。

概率分布

概率分布（probability distribution）仅仅是一种呈现 \( X \) 所有可能取值及其对应发生概率的方式，我们通常以表格形式来表示。

例子：设 \( X \) 为抛掷两次硬币时出现正面的次数。

\( X = 0, 1, 2 \)
\( P(X=0) = 0.25 \)
\( P(X=1) = 0.50 \)
\( P(X=2) = 0.25 \)

重要规则：分布中所有概率的总和必须始终等于 1。符号表示为：\( \sum P(X=x) = 1 \)。如果你的表格相加不等于 1，那就代表哪里出错了！

期望值与方差

它们告诉我们数据的“中心”与“离散程度”。

期望值 \( E(X) \)： 这是长期平均值，我们通常称之为平均数，记作 \( \mu \)。
公式：\( E(X) = \mu = \sum x P(X=x) \)
方差 \( Var(X) \)： 这衡量了数值偏离平均值的程度。
公式：\( Var(X) = \sigma^2 = \sum x^2 P(X=x) - \mu^2 \)

快速复习：
1. 期望值 =（数值 \(\times\) 其概率）的总和。
2. 方差 =（数值² \(\times\) 概率）的总和，减去（平均数）²。

常见错误：在计算方差时，学生常忘记最后要减去 \( \mu^2 \)。记得在最后一步务必进行检查！

核心要点：概率分布告诉你“是什么”以及“多大概率发生”。\( E(X) \) 告诉你平均数，而 \( Var(X) \) 则告诉你数据的稳定性。

2. 线性转换 (Linear Coding)

有时我们想改变数据——例如将每个分数加倍，或为每个人加上 5 分。这称为线性转换，通常表示为 \( Y = aX + b \)。

平均数与方差的变化：

平均数： 它受所有因素影响。如果你给每个分数加 5，平均值就会上升 5；如果你将每个分数加倍，平均值也会加倍。
\( E(aX + b) = aE(X) + b \)
方差： 它仅受乘法影响。加上一个常数并不会改变“离散程度”（数据点之间的距离保持不变）。然而，由于方差是平方运算，倍数 \( a \) 会变成 \( a^2 \)。
\( Var(aX + b) = a^2 Var(X) \)

类比：想象一群朋友排成一列。如果他们都向前跨两步（加上 \( b \)），平均位置会移动，但他们之间的距离（方差）保持不变。如果他们将与起点的距离都加倍（乘以 \( a \)），他们之间的间距就会扩大许多！

核心要点：加减会改变平均数但不影响方差。乘除则会将平均数乘以 \( a \)，将方差乘以 \( a^2 \)。

3. 离散均匀分布 (Discrete Uniform Distribution)

在离散均匀分布中，每个结果发生的概率都相等。想象一颗公正的 6 面骰子：每个数字出现的概率都是 \( 1/6 \)。

对于区间 \( [1, n] \)，我们使用符号 \( X \sim U(n) \)。

概率： \( P(X=x) = \frac{1}{n} \)
平均数： \( E(X) = \frac{n+1}{2} \)
方差： \( Var(X) = \frac{n^2 - 1}{12} \)

核心要点：当在固定的整数范围内，每个事件发生的机会均等时，请使用此模型。

4. 二项分布 (Binomial Distribution)

你可能在 A Level 数学中见过它！我们使用 \( X \sim B(n, p) \)，其中 \( n \) 是试验次数，\( p \) 是成功概率。

进阶数学（Further Maths）的新公式：
除了查表之外，你需要知道以下计算平均数与方差的快捷公式：
\( \mu = np \)
\( \sigma^2 = np(1 - p) \)

例子：如果你抛掷硬币 100 次，预期出现正面的次数为 \( 100 \times 0.5 = 50 \)。

5. 几何分布 (Geometric Distribution)

这是个新概念！几何分布模拟的是直到第一次成功出现前的试验次数。想象你正在练习投篮，你会一直投，直到球进了为止，然后停止。

我们使用符号 \( X \sim Geo(p) \)。

必备公式：

在第 \( x \) 次尝试时成功的概率： \( P(X=x) = (1-p)^{x-1}p \)
（这意味著你经历了 \( x-1 \) 次失败，随后紧接着 1 次成功）。
需要超过 \( x \) 次尝试的概率： \( P(X > x) = (1-p)^x \)
（这是一个方便的捷径！意即你前 \( x \) 次都失败了）。
平均数： \( E(X) = \frac{1}{p} \)
方差： \( Var(X) = \frac{1-p}{p^2} \)

你知道吗？任何几何分布的“众数”（最可能出现的结果）永远是 1。尽管成功的概率很低，但最可能的情况永远是在第一次尝试就成功！

核心要点：当你在“等待第一次成功”时，请使用几何分布。

6. 泊松分布 (Poisson Distribution)

泊松分布用于模拟在固定时间或空间区间内，某事件发生的次数。例如你在一小时内收到的邮件数量，或是一块饼干里的巧克力豆数量。

我们使用符号 \( X \sim Po(\lambda) \)，其中 \( \lambda \) (lambda) 是平均发生率。

泊松模型的条件：

要适用泊松模型，事件必须满足：

独立性：一个事件的发生不会影响下一个。
单一性：两个事件不会在同一瞬间同时发生。
以恒定的平均速率发生。

公式：

\( P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!} \)

特殊性质：

平均数与方差： 在泊松分布中，平均数与方差相等！
\( E(X) = Var(X) = \lambda \)
泊松变量的相加： 如果你有两个独立的泊松变量 \( X \sim Po(\lambda) \) 和 \( Y \sim Po(\mu) \)，那么它们的和也符合泊松分布：
\( X + Y \sim Po(\lambda + \mu) \)

不用担心如果公式看起来很吓人。大多数时候，你只需要利用计算器内置的泊松函数来查找这些概率！

核心要点：寻找“平均速率”或“区间内出现次数”来辨识泊松问题。请记住，平均数 = 方差。

总结复习

离散均匀分布：每件事发生的概率均等。
二项分布：固定次数的试验，寻找成功次数。
几何分布：重复试验直到第一次成功。
泊松分布：计算特定时间/空间内的事件发生次数。

恭喜你！你已经掌握了离散随机变量的核心内容。继续练习那些公式，并且永远记得检查概率总和是否为 1！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。