欢迎来到二项分布(Binomial Distribution)的世界!
在本章中,我们将学习如何预测那些只有两种可能结果的事件——比如投掷硬币出现正面或反面、种子发芽或不发芽、灯泡坏掉或运作良好。这是统计学中最实用的工具之一,因为我们生活中有太多事物都是「非此即彼」的。
如果一开始觉得有点棘手,不用担心! 我们会一步步拆解。学完这些笔记后,你将能一眼看出什么情况适用二项分布,并能用计算器在几秒钟内算出答案。
1. 我们什么时候可以使用二项分布模型?
在开始计算之前,我们需要确认二项分布是否为适用的工具。一个情况若要称为「二项式」,必须符合四个严格的条件。你可以利用助记词 BINS 来记忆:
- B – 二元(Binary): 每次试验只有两种可能的结果(通常称为「成功」与「失败」)。
- I – 独立(Independent): 一次试验的结果不得影响下一次的结果。(就像投硬币,第一次投掷不会改变第二次出现正面的概率)。
- N – 试验次数(Number of trials): 必须有固定的试验次数,我们称之为 \(n\)。
- S – 概率相同(Same probability): 每次试验中成功的概率(我们称之为 \(p\))必须保持不变。
例子:在篮球赛中投篮 10 次。如果我们假设你的技术水平不变且每次投篮都是独立的,这就是一个 \(n = 10\) 的二项分布情况。
关键术语与符号
我们将该分布写作:\(X \sim B(n, p)\)
- \(X\):随机变量(我们正在计算的成功次数)。
- \(n\):试验次数。
- \(p\):单次试验成功的概率。
- \(q\):失败的概率,计算方式为 \(1 - p\)。
小撇步: 如果问题无法符合 BINS 的条件,它就不是二项分布!
2. 计算概率
要找出获得特定成功次数 (\(r\)) 的概率,主要有两种方法。
A. 使用公式
获得刚好 \(r\) 次成功的概率为:
\(P(X = r) = \binom{n}{r} \times p^r \times (1-p)^{n-r}\)
公式拆解:
- \(\binom{n}{r}\):这是「组合」部分(计算器上的 \(nCr\) 按键)。它告诉我们在 \(n\) 次试验中选出 \(r\) 次成功的方法有多少种。
- \(p^r\):成功概率的 \(r\) 次方(对应每一次成功)。
- \((1-p)^{n-r}\):失败概率的 \(n-r\) 次方(对应剩余的所有试验)。
B. 使用你的计算器(专业做法!)
Pearson Edexcel 强烈建议使用计算器功能。在大多数 A Level 计算器(如 Casio ClassWiz)上:
- 二项式概率分布 (Binomial PD): 用于找出刚好某个数值的概率。例如:\(P(X = 3)\)。
- 二项式累积概率分布 (Binomial CD): 用于找出一个范围的概率。注意:大多数计算器计算的是 \(P(X \leq r)\)——即 \(r\) 次或更少成功的概率。
常见错误警示!
如果题目问的是「至少 5 次成功」(\(P(X \geq 5)\)),你的计算器无法直接算出。你必须使用「补数」规则:
\(P(X \geq 5) = 1 - P(X \leq 4)\)。
如果你对该减去哪个数字感到困惑,画一条简单的数线就一目了然了!
小撇步: 「刚好」用 PD, 「小于或等于」用 CD。
3. 平均值与方差
有时我们想知道如果多次进行实验,会出现什么「平均」结果。这就是平均值(也称为期望值)。
- 平均值 (\(\mu\)): \(\mu = E(X) = np\)
- 方差 (\(\sigma^2\)): \(\sigma^2 = Var(X) = np(1-p)\)
类比:如果你投一枚公平的硬币 (\(p=0.5\)) 100 次 (\(n=100\)),你的直觉会告诉你大约会出现 50 次正面。公式也证明了这一点:\(100 \times 0.5 = 50\)。
你知道吗?
标准差就是方差的平方根:\(\sigma = \sqrt{np(1-p)}\)。如果你需要比较两组不同的二项式数据的分散程度,这会派上用场。
小撇步: 平均值就是「试验次数乘以概率」。就是这么简单!
4. 现实世界的建模与假设
在考试中,你可能会被要求评论一个二项模型或解释为何使用它。要回答这些问题,请回到 BINS 条件。
二项模型适用吗?
- 适用: 如果试验明显是独立的(例如从大批产品中随机抽取的物件)。
- 不适用: 如果概率会改变。例如,如果你从一个小袋子里拿彩色糖果且不放回,那么下一次拿到某种颜色的概率就会改变。这就违反了 BINS 中的「S」。
考试题目的步骤:
1. 找出 \(n\) 和 \(p\)。
2. 写下分布:\(X \sim B(n, p)\)。
3. 确认题目要求:是 \(P(X=r)\)、\(P(X \leq r)\) 还是 \(P(X > r)\)?
4. 如果是「大于」的问题,记得使用「1 减去」的技巧。
5. 让计算器帮你完成繁重的计算!
重点复习:
- BINS 用来检查是否为二项分布。
- PD 用于「等于」。
- CD 用于「小于或等于」。
- 平均值 是 \(np\)。
5. 与假设检验的链接(预览)
在稍后的试卷一(第 8.5 节)中,你将会使用二项分布来检验某个主张是否属实。例如,如果有人声称他们有 70% 的概率能预测天气,但 10 次里一次都没猜对,你就可以利用二项分布算出这种情况发生的可能性有多低。如果概率非常低(通常小于 5%),你可能就会拒绝他们的主张!
不用担心检验的细节——只要记得你现在学的二项分布数学,正是解决那些「这是不是碰巧?」问题的基础。
最后建议: 务必仔细阅读题目中的关键词,如「多于」、「至少」或「不多于」。这些字眼会改变你输入计算器的数字!