Situations leading to a binomial distribution - Mathematics B (MEI) - H640 - Cambridge OCR A Level

欢迎来到二项分布！

在本章中，我们将探索统计学中最有用的“模型”之一。你可以把概率分布想象成一个模板。如果一个现实生活中的情况符合这个模板，我们就可以运用特定的数学规则来预测可能发生的结果。二项分布是模拟“是/否”或“成功/失败”情境最著名的方法。

无论你是要预测篮球运动员能投进多少个罚球，还是检查工厂里有多少个灯泡是坏的，二项分布都是你的得力工具。如果刚开始觉得这些概念有点抽象，别担心——一旦你看出了当中的规律，就会变得简单多了！

1. 我们何时可以使用二项分布？

要使用这个模型，情况必须符合四个特定标准。只要缺少其中任何一项，二项分布的模板就无法使用！要记住这些标准，一个很好的助记法是 BINS。

BINS 标准

B – 二元性 (Binary)： 每次试验必须刚好有两种可能的结果。我们通常称之为成功和失败。
例子：投掷硬币出现正面（成功）或反面（失败）。
I – 独立性 (Independent)： 一次试验的结果不得影响另一次试验的结果。
例子：如果你掷骰子得到 6 点，这不会改变你下一次掷出 6 点的概率。
N – 试验次数 (Number of trials)： 必须有固定的试验次数（我们称之为 \(n\)）。你不能一直试验直到得到想要的结果为止；你必须事先决定好尝试的次数。
S – 成功概率 (Success probability)： 成功的概率（我们称之为 \(p\)）必须在每次试验中都相同。

快速检查盒：
要使用二项分布模型，请问自己：是否有 2 种结果？它们是否独立？试验次数是否固定？概率是否恒定？如果全部答案都是“是”，那么你就有了一个二项分布！

2. 关键符号与术语

在 A Level 数学中，我们使用特定的“速记法”来描述这些情况。如果一个随机变量 \(X\) 服从二项分布，我们会这样写：

\[X \sim B(n, p)\]

这些字母代表什么意思？

\(X\)： 这是随机变量 (Random Variable)。在本章中，\(X\) 代表“成功的次数”。
\(\sim\)： 这个符号的意思是“服从……的分布”。
\(n\)： 试验次数。
\(p\)： 成功的概率。
\(q\)： 失败的概率。由于总概率必须为 1，我们计算为 \(q = 1 - p\)。

例子：如果你投掷一枚公正硬币 10 次，想知道得到多少个正面，你的模型就是 \(X \sim B(10, 0.5)\)。这里 \(n=10\)，\(p=0.5\)。

“你知道吗？”

“成功”这个词并不总是意味着好的事情！在统计学中，“成功”仅仅是你所寻找的事件。如果你正在研究有多少人感冒，那么“感冒”在你的模型中就是“成功”。

3. 现实世界的例子 vs. 常见陷阱

让我们看看两个情境，看看它们是否符合二项分布模型。

情境 A：质量控制检查

一家工厂生产数以千计的螺栓，其中 5% 是次品。你随机抽取 20 个螺栓，并计算有多少个是次品。这符合吗？

二元性？ 是（次品或非次品）。
独立性？ 是（一个螺栓是次品并不会让下一个变成次品）。
试验次数固定？ 是 (\(n = 20\))。
概率相同？ 是 (\(p = 0.05\))。

结果： 这是 \(X \sim B(20, 0.05)\)。它适用！

情境 B：一副扑克牌

你从一副牌中不放回地抽取 5 张牌，计算你得到了多少张“A”。这符合吗？

二元性？ 是（是 A 或不是 A）。
独立性？ 不是。 因为你不把牌放回去，概率就会改变。如果第一张牌是 A，那么下一次抽牌时剩下的 A 就会变少。

结果： 这不是二项分布，因为概率 (\(p\)) 并非恒定。

常见错误：
考试中最常见的陷阱是“不放回抽样”。如果物品被拿出来而不放回去，试验就不是独立的，且概率会改变。这通不过 BINS 测试！

4. 期望频率（平均值）

如果你知道试验次数 (\(n\)) 和成功概率 (\(p\))，你可以轻松计算出平均预期会获得多少次成功。这被称为平均值 (Mean) 或期望值 (Expected Value)。

公式非常简单：

\[\text{平均值 } E(X) = np\]

类比：如果你进行 20 次罚球投篮 (\(n=20\))，且你的成功率是 80% (\(p=0.8\))，你预期会投进 \(20 \times 0.8 = 16\) 球。这很合理，对吧？

重点总结： “期望频率”只是一种比较高级的说法，意思是“我们认为成功事件平均会发生的次数”。

5. 计算概率

虽然你通常会使用计算器的 Binomial CD 或 Binomial PD 功能，但理解求出恰好 \(r\) 次成功的概率背后的逻辑是很重要的：

\[P(X = r) = \binom{n}{r} \times p^r \times q^{n-r}\]

等等，那个 \(\binom{n}{r}\) 是什么？

别被它吓到了！那是二项系数 (Binomial Coefficient)（在你的计算器上通常称为 "\(nCr\)"）。它告诉我们排列成功与失败的方法数。

公式分步解析：
1. \(\binom{n}{r}\)： 我有多少种方法可以选出哪些试验是成功的？
2. \(p^r\)： 得到恰好 \(r\) 次成功的概率。
3. \(q^{n-r}\)： 剩下几次试验为失败的概率。

例子：如果你投掷硬币 3 次，恰好出现 2 次正面的概率是多少？
这里 \(n=3, p=0.5, q=0.5, r=2\)。
\(P(X=2) = \binom{3}{2} \times 0.5^2 \times 0.5^1 = 3 \times 0.25 \times 0.5 = 0.375\)。

章节总结

二项分布模拟了在固定次数的独立试验中成功的次数。
一定要检查 BINS 标准：Binary（二元）、Independent（独立）、Number of trials fixed（试验次数固定）、Same probability（概率相同）。
符号标记为 \(X \sim B(n, p)\)。
平均值（期望成功次数）为 \(np\)。
注意相关性——如果概率会改变（例如不放回抽牌），它就不是二项分布！

如果公式起初看起来有点吓人，别担心。这一节大部分的工作都在于识别 "n" 和 "p" 的值，然后交给你的计算器来完成繁重的计算！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。