Discrete probability distributions - Mathematics A - H240 - Cambridge OCR A Level

欢迎来到离散概率分布！

你好！欢迎来到 A Level 统计学课程中最实用的章节之一。在本节中，我们将学习如何针对可以数出来（countable）的事物，建立模型并预测事件发生的“机会”。无论是掷十次硬币出现的正面次数，还是一箱灯泡中坏掉的数量，离散概率分布都能为你提供处理这些问题的工具。

如果觉得这个名字听起来有点深奥，别担心——我们会将其拆解成简单且合乎逻辑的步骤。读完这些笔记后，你将能一眼看出什么是二项分布（Binomial Distribution），并能像专业人士一样运用计算器轻松找出答案！

1. 理解离散随机变量

在探讨分布之前，我们需要先认识主角：离散随机变量（Discrete Random Variable）。

随机变量 (X)：一个由随机事件的结果所决定的变量。我们通常用大写字母 \( X \) 来代表变量本身，用小写字母 \( x \) 来代表它可能取到的特定数值。

离散 (Discrete)：这意味着变量只能取特定的、分离的数值（如 0, 1, 2, 3）。你不可能有 2.5 个兄弟姐妹，也不可能把硬币掷 4.7 次！如果你可以用手指头数出来，它大概就是离散的。

概率分布表

概率分布只是一份详尽的列表，列出了 \( X \) 所有可能的取值及其对应的概率。它最常以表格形式呈现。

例子：设 \( X \) 为投掷一枚公正四面骰子的点数。
\( x \)：1, 2, 3, 4
\( P(X=x) \)：0.25, 0.25, 0.25, 0.25

黄金法则

对于任何离散概率分布，所有概率的总和必须等于 1。
在数学上，写作：\( \sum P(X=x) = 1 \)。
如果你的概率相加不等于 1，那就代表哪里出错了！

概率函数

有时候，题目不会给你表格，而是给你一个公式（即概率函数）来计算每个数值的机会。
例子：\( P(X=x) = kx \)，其中 \( x = 1, 2, 3 \)。
要找出 \( k \)，你需要解方程式：\( k(1) + k(2) + k(3) = 1 \)，所以 \( 6k = 1 \)，即 \( k = 1/6 \)。

快速复习箱：
• 离散 (Discrete) = 可数的数值（没有小数）。
• 随机变量 (Random Variable) = 随机“实验”的结果。
• 概率总和 (Sum of Probabilities) = 永远恰好等于 1。

重点总结：离散概率分布就像一张地图，告诉你所有可能的结果以及它们发生的可能性。

2. 二项分布 (The Binomial Distribution)

这是本章的“主角”。当我们重复执行一项任务多次，并计算得到多少次“成功”时，就会用到二项分布。

什么时候可以使用二项模型？（B.I.N.S. 测试）

要使用二项分布，情况必须通过 B.I.N.S. 测试。如果其中任何一项不符合，你就不能使用它！

B - Binary (二元)：每次试验只有两种可能的结果（通常称为成功与失败）。
I - Independent (独立)：一次试验的结果不会影响下一次（如掷硬币）。
N - Number (次数)：有固定的试验次数 (\( n \))。
S - Success (成功率)：成功的概率 (\( p \)) 在每次试验中必须保持不变。

你知道吗？“二项”(Binomial) 这个名字源自 "bi"（意为二），因为每次试验只有两个结果——就像自行车有两个轮子一样！

符号表示

我们写 \( X \sim B(n, p) \) 来表示 \( X \) 服从一个二项分布，其中 \( n \) 为试验次数，\( p \) 为成功概率。

重点总结：使用 B.I.N.S. 来检查情况是否符合二项分布。如果概率会改变（例如从抽屉拿袜子且不放回去），它就不是二项分布。

3. 计算二项概率

寻找概率有两种方法：使用公式或使用你的计算器。对于 OCR 课程大纲，你需要对两者都感到熟练！

使用公式

要计算在 \( n \) 次试验中得到恰好 \( x \) 次成功的概率：
\( P(X=x) = \binom{n}{x} p^x (1-p)^{n-x} \)

• \( \binom{n}{x} \)：这是你计算器上的 "nCr" 按键。它告诉你从 \( n \) 个项目中选出 \( x \) 个的方法数。
• \( p^x \)：成功概率的 \( x \) 次方。
• \( (1-p)^{n-x} \)：失败概率的剩余试验次数次方。

使用你的计算器

大多数现代计算器（如 Casio ClassWiz）都有专用模式：
1. Binomial PD (概率分布)：用于“恰好”类型的问题，例如 \( P(X = 3) \)。
2. Binomial CD (累积概率分布)：用于“范围”类型的问题，例如 \( P(X \le 3) \)。

小心你的不等式！

这是学生最容易失分的地方。因为数据是离散的，“等于”这一点非常重要！
• \( P(X \le 5) \)：包括 0, 1, 2, 3, 4, 5。（直接使用 Bcd）。
• \( P(X < 5) \)：这等同于 \( P(X \le 4) \)。
• \( P(X \ge 5) \)：这等于 \( 1 - P(X \le 4) \)。
• \( P(X > 5) \)：这等于 \( 1 - P(X \le 5) \)。

类比：如果一家俱乐部规定“未满 18 岁”才能进，那么 18 岁的人就不能进。同样地，\( X < 5 \) 不包含数字 5。

常见错误：别忘了 \( (1-p) \) 只是失败的概率。有时人们会称它为 \( q \)。所以，\( p + q = 1 \)。

重点总结：画一条小数线（0, 1, 2, 3, 4, 5...）并圈出你需要的数字。这能帮助你判断应该从 1 减去哪一个累积概率。

4. 二项分布的平均值与方差

虽然你不需要在本章计算“一般”离散分布的平均值与方差，但对于二项分布，你必须掌握！

平均值 (\( \mu \))

平均值是你若重复多次实验，预期会得到的平均成功次数。
\( \mu = np \)

例子：如果你掷一枚公正硬币 100 次，预期会有 \( 100 \times 0.5 = 50 \) 次正面。很简单吧！

方差 (\( \sigma^2 \))

方差告诉你结果的分散程度。
\( \sigma^2 = np(1-p) \)
（或 \( npq \)，其中 \( q \) 为失败概率）。

快速复习：
• 平均值 (\( \mu \)) = \( np \)
• 方差 (\( \sigma^2 \)) = \( npq \)
• 标准差 (\( \sigma \)) = \( \sqrt{npq} \)

重点总结：这些公式对于描述分布非常有用，并且在你稍后学习课程中的“正态分布近似 (Normal Approximations)”时至关重要。

总结检查清单

在完成本章之前，确保你能：
1. 解释什么是离散随机变量。
2. 检查表格或函数中的概率总和是否等于 1。
3. 使用 B.I.N.S. 准则来识别二项分布。
4. 使用公式计算精确的二项概率。
5. 使用计算器查找累积概率（如 \( P(X \le x) \)）。
6. 使用 \( np \) 和 \( npq \) 计算二项分布的平均值与方差。

如果起初觉得棘手，不用担心！只要在题目中练习识别 \( n \) 和 \( p \)，一切都会变得越来越自然。你一定没问题的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。