欢迎来到二项分布!

在本章中,我们将探索统计学中最有用的“模型”之一。你可以把概率分布想象成一个模板。如果一个现实生活中的情况符合这个模板,我们就可以运用特定的数学规则来预测可能发生的结果。二项分布是模拟“是/否”或“成功/失败”情境最著名的方法。

无论你是要预测篮球运动员能投进多少个罚球,还是检查工厂里有多少个灯泡是坏的,二项分布都是你的得力工具。如果刚开始觉得这些概念有点抽象,别担心——一旦你看出了当中的规律,就会变得简单多了!

1. 我们何时可以使用二项分布?

要使用这个模型,情况必须符合四个特定标准。只要缺少其中任何一项,二项分布的模板就无法使用!要记住这些标准,一个很好的助记法是 BINS

BINS 标准

  • B – 二元性 (Binary): 每次试验必须刚好有两种可能的结果。我们通常称之为成功失败
    例子:投掷硬币出现正面(成功)或反面(失败)。
  • I – 独立性 (Independent): 一次试验的结果不得影响另一次试验的结果。
    例子:如果你掷骰子得到 6 点,这不会改变你下一次掷出 6 点的概率。
  • N – 试验次数 (Number of trials): 必须有固定的试验次数(我们称之为 \(n\))。你不能一直试验直到得到想要的结果为止;你必须事先决定好尝试的次数。
  • S – 成功概率 (Success probability): 成功的概率(我们称之为 \(p\))必须在每次试验中都相同

快速检查盒:
要使用二项分布模型,请问自己:是否有 2 种结果?它们是否独立?试验次数是否固定?概率是否恒定?如果全部答案都是“是”,那么你就有了一个二项分布

2. 关键符号与术语

在 A Level 数学中,我们使用特定的“速记法”来描述这些情况。如果一个随机变量 \(X\) 服从二项分布,我们会这样写:

\[X \sim B(n, p)\]

这些字母代表什么意思?

  • \(X\): 这是随机变量 (Random Variable)。在本章中,\(X\) 代表“成功的次数”。
  • \(\sim\): 这个符号的意思是“服从……的分布”。
  • \(n\): 试验次数
  • \(p\): 成功的概率
  • \(q\): 失败的概率。由于总概率必须为 1,我们计算为 \(q = 1 - p\)。

例子:如果你投掷一枚公正硬币 10 次,想知道得到多少个正面,你的模型就是 \(X \sim B(10, 0.5)\)。这里 \(n=10\),\(p=0.5\)。

“你知道吗?”

“成功”这个词并不总是意味着好的事情!在统计学中,“成功”仅仅是你所寻找的事件。如果你正在研究有多少人感冒,那么“感冒”在你的模型中就是“成功”。

3. 现实世界的例子 vs. 常见陷阱

让我们看看两个情境,看看它们是否符合二项分布模型。

情境 A:质量控制检查

一家工厂生产数以千计的螺栓,其中 5% 是次品。你随机抽取 20 个螺栓,并计算有多少个是次品。这符合吗?

  • 二元性? 是(次品或非次品)。
  • 独立性? 是(一个螺栓是次品并不会让下一个变成次品)。
  • 试验次数固定? 是 (\(n = 20\))。
  • 概率相同? 是 (\(p = 0.05\))。

结果: 这是 \(X \sim B(20, 0.05)\)。它适用!

情境 B:一副扑克牌

你从一副牌中不放回地抽取 5 张牌,计算你得到了多少张“A”。这符合吗?

  • 二元性? 是(是 A 或不是 A)。
  • 独立性? 不是。 因为你不把牌放回去,概率就会改变。如果第一张牌是 A,那么下一次抽牌时剩下的 A 就会变少。

结果:不是二项分布,因为概率 (\(p\)) 并非恒定。

常见错误:
考试中最常见的陷阱是“不放回抽样”。如果物品被拿出来而不放回去,试验就不是独立的,且概率会改变。这通不过 BINS 测试!

4. 期望频率(平均值)

如果你知道试验次数 (\(n\)) 和成功概率 (\(p\)),你可以轻松计算出平均预期会获得多少次成功。这被称为平均值 (Mean)期望值 (Expected Value)

公式非常简单:

\[\text{平均值 } E(X) = np\]

类比:如果你进行 20 次罚球投篮 (\(n=20\)),且你的成功率是 80% (\(p=0.8\)),你预期会投进 \(20 \times 0.8 = 16\) 球。这很合理,对吧?

重点总结: “期望频率”只是一种比较高级的说法,意思是“我们认为成功事件平均会发生的次数”。

5. 计算概率

虽然你通常会使用计算器的 Binomial CDBinomial PD 功能,但理解求出恰好 \(r\) 次成功的概率背后的逻辑是很重要的:

\[P(X = r) = \binom{n}{r} \times p^r \times q^{n-r}\]

等等,那个 \(\binom{n}{r}\) 是什么?

别被它吓到了!那是二项系数 (Binomial Coefficient)(在你的计算器上通常称为 "\(nCr\)")。它告诉我们排列成功与失败的方法数

公式分步解析:
1. \(\binom{n}{r}\): 我有多少种方法可以选出哪些试验是成功的?
2. \(p^r\): 得到恰好 \(r\) 次成功的概率。
3. \(q^{n-r}\): 剩下几次试验为失败的概率。

例子:如果你投掷硬币 3 次,恰好出现 2 次正面的概率是多少?
这里 \(n=3, p=0.5, q=0.5, r=2\)。
\(P(X=2) = \binom{3}{2} \times 0.5^2 \times 0.5^1 = 3 \times 0.25 \times 0.5 = 0.375\)。

章节总结

  • 二项分布模拟了在固定次数的独立试验中成功的次数。
  • 一定要检查 BINS 标准:Binary(二元)、Independent(独立)、Number of trials fixed(试验次数固定)、Same probability(概率相同)。
  • 符号标记为 \(X \sim B(n, p)\)
  • 平均值(期望成功次数)为 \(np\)
  • 注意相关性——如果概率会改变(例如不放回抽牌),它就不是二项分布!

如果公式起初看起来有点吓人,别担心。这一节大部分的工作都在于识别 "n" 和 "p" 的值,然后交给你的计算器来完成繁重的计算!