Statistical distributions

简介：为什么数据模式如此重要

欢迎来到统计分布这一章！如果你曾好奇为什么赌场总是赚钱，或是保险公司如何预测理赔数量，那你其实正在探索分布的力量。在本章中，我们将学习如何描述随机性的“形状”，并聚焦于数学中最有用的模型之一：二项分布 (Binomial Distribution)。

如果起初觉得有点抽象，别担心。我们本质上只是将你对基本概率的认识，整理成一种可预测的模式。一旦掌握了这个模式，你就能预测未来（至少在数学层面上是这样）！

1. 理解离散随机变量

在深入研究分布之前，我们需要先了解我们在测量什么。我们称这些为离散随机变量 (Discrete Random Variables)（通常记作 \(X\)）。

这意味着什么？
- 离散：变量只能取特定的、分离的值（例如 0, 1, 2...）。你不可能有 1.5 个亲兄弟姐妹！
- 随机：在事件发生前，我们无法得知确切结果。
- 变量：每次试验的结果都可能改变。

例子：如果你掷一枚硬币 3 次并计算“正面”的次数，可能的结果是 0, 1, 2 或 3。这就是一个离散随机变量。

概率分布表

我们通常用一个小表格来展示离散分布。它会列出 \(x\) 的每一个可能值，以及该值发生的概率，写作 \(P(X = x)\)。

黄金法则：

分布中所有概率的总和必须等于 1。
\(\sum P(X=x) = 1\)

快速复习：
如果表格显示 \(P(X=1) = 0.2\)，\(P(X=2) = 0.5\)，而 \(P(X=3) = k\)，你可以通过 \(1 - 0.2 - 0.5 = 0.3\) 来求出 \(k\)。

重点总结：离散分布只是一份关于所有可能结果及其发生概率的清单。

2. 二项分布：我们的主要模型

二项分布是一种特殊的模式，出现在你面对“成功/失败”的情境时。把它想象成一系列“是/否”的问题。

我们何时可以使用它？（BINS 记忆法）

要使用二项模型，你的实验必须通过 BINS 测试：

1. B - Binary（二元）：只有两种可能的结果（成功或失败）。
2. I - Independent（独立）：每次试验互不影响（就像掷硬币）。
3. N - Fixed Number（固定次数）：你必须提前知道试验次数（记作 \(n\)）。
4. S - Success Probability（成功概率）：每次试验成功的概率 (\(p\)) 必须保持不变。

比喻：想象你在篮球场投篮 10 次。如果你的技术水平不变，且每次投篮都是独立的，这就是一个典型的二项分布情境！

符号表示

我们写作：\(X \sim B(n, p)\)
- \(n\) = 试验次数
- \(p\) = 成功概率

重点总结：如果一个情况有固定次数的独立试验，且只有两种结果，它很可能就是二项分布。

3. 计算二项概率

为了找出恰好获得 \(x\) 次成功的概率，我们使用以下公式（别惊慌，我们会拆解它！）：

\(P(X = x) = \binom{n}{x} \times p^x \times (1-p)^{n-x}\)

公式各部分的含义：

- \(\binom{n}{x}\)：这是你计算器上的“nCr”键。它告诉我们成功可以通过多少种不同的方式发生。
- \(p^x\)：这是成功概率自乘，次数取决于我们想要的成功次数。
- \((1-p)^{n-x}\)：这是失败概率自乘，次数为剩余的所有试验次数。

例子：如果你掷一枚不公正的硬币（\(p=0.6\)）五次，恰好得到 3 个正面的概率是多少？
1. 确定 \(n=5, p=0.6, x=3\)。
2. 公式：\(P(X=3) = \binom{5}{3} \times 0.6^3 \times 0.4^2\)
3. 结果：\(10 \times 0.216 \times 0.16 = 0.3456\)

你知道吗？\((1-p)\) 通常写作 \(q\)。所以，成功 = \(p\)，失败 = \(q\)。很简单吧！

4. 累积概率：善用你的计算器

在考试中，题目经常会要求计算“至多”或“小于”某个数值的概率。这称为累积概率 (Cumulative Probability)，写作 \(P(X \le x)\)。

计算器操作步骤：
大多数获 AQA 认可的计算器（如 Casio ClassWiz）都有专用模式：
1. 进入 Menu -> Distribution。
2. 选择 Binomial CD（累积分布，用于“范围”问题），或 Binomial PD（概率分布，用于“精确值”问题）。
3. 输入你的 \(x\)、\(n\) 和 \(p\)。

常用语言“翻译”表：

“至多 3 次”意味着 \(P(X \le 3)\)。（直接使用 Binomial CD）
“少于 3 次”意味着 \(P(X \le 2)\)。（要小心！“少于”不包含 3）
“多于 3 次”意味着 \(1 - P(X \le 3)\)。（总概率减去你不需要的部分）
“至少 3 次”意味着 \(1 - P(X \le 2)\)。（因为我们想要 3, 4, 5... 所以减去 0, 1 和 2）

重点总结：永远画一条简单的数轴（0, 1, 2, 3, 4, 5）并圈出你需要的数字。这能避免犯下简单的错误！

5. 避免常见错误

1. 忘记“0”：在 10 次试验的二项分布中，有 11 个可能的结果（0 到 10）。别忘了“零次成功”也是一个有效的结果！
2. 混淆 \(p\) 和 \(q\)：确保概率 (\(p\)) 对应的是你所计算的“成功”。如果你是在计算“坏掉的灯泡”，那么 \(p\) 必须是灯泡坏掉的概率。
3. “多于”vs“至少”：务必再次检查数字本身是否包含在范围内。“多于 5”从 6 开始；“至少 5”从 5 开始。

快速复习箱：
- 精确值？使用 Binomial PD。
- 数值范围？使用 Binomial CD。
- 所有概率之和？永远是 1。

总结：宏观视野

统计分布让我们能够模拟现实生活中的随机性。通过使用二项分布 \(B(n, p)\)，我们可以计算任何“通过/失败”情境下结果的可能性。掌握 BINS 条件并熟悉你计算器的分布菜单，你就能征服 Paper 2 的这一部分！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。