Statistical distributions

统计分布简介

欢迎！在这一章，我们将探讨如何用数学来模拟现实生活中的事件。统计分布（statistical distribution）本质上就像一张“地图”或清单，列出了实验中所有可能的结果及其发生的可能性。无论是你要预测掷硬币出现正面的次数，还是预测一包种子中有多少会发芽，这些工具都能帮助我们用概率来理解这个世界。如果刚开始觉得有点抽象也不用担心，我们会透过大量例子来让你轻松掌握！

1. 离散随机变量 (Discrete Random Variables)

在深入研究具体的分布之前，我们需要先了解我们在测量什么。我们使用一种称为离散随机变量（Discrete Random Variable，通常记作 \( X \)）的概念。

● 随机 (Random)： 结果是由概率决定的。
● 变量 (Variable)： 它可以取不同的数值。
● 离散 (Discrete)： 它只能取特定的、分开的数值（例如 1, 2, 3...），而不是连续数值（例如 1.543...）。

例子：如果你掷一颗骰子，骰子落下的点数就是一个离散随机变量，因为你可以得到 1 或 2，但不可能得到 1.5。

2. 离散均匀分布 (The Discrete Uniform Distribution)

这是最简单的分布类型。在离散均匀分布中，每一个可能的结果发生的概率都是完全一样的。

经典例子：公平的骰子
如果你掷一颗公平的六面骰子，可能的结果是 {1, 2, 3, 4, 5, 6}。
得到其中任何一个数字的概率都是 \( \frac{1}{6} \)。因为所有概率都相等（均匀），所以我们称之为离散均匀分布。

快速复习小盒子

● 离散 (Discrete)： 结果是可以数出来的。
● 均匀 (Uniform)： 所有结果都有相同的发生机会。

3. 二项分布 (The Binomial Distribution)

二项分布是这一章的“超级巨星”。它用于模拟在固定次数的试验中“成功”的次数。例如：“如果我投篮 10 次，投中 7 次的概率是多少？”

什么时候可以使用二项模型？

要使用这个模型，情况必须满足四个严格的条件。你可以用助记词 BINS 来记忆：

● B - Binary (二元)： 每次试验只有两种可能的结果（通常称为成功与失败）。
● I - Independent (独立)： 一次试验的结果不会影响下一次。
● N - Number (次数)： 有固定的试验次数（我们称之为 \( n \)）。
● S - Success (成功概率)： 每次试验成功的概率（我们称之为 \( p \)）必须相同。

符号表示

如果一个变量 \( X \) 服从二项分布，我们可以这样写：
\( X \sim B(n, p) \)

● \( n \) = 试验次数
● \( p \) = 成功概率

例子：如果你掷公平硬币 10 次并记录出现正面的次数，你会写作：\( X \sim B(10, 0.5) \)。

4. 计算二项概率

在考试中，你需要使用计算器来算出这些概率。你主要会用到两种计算方式：

A. 概率密度函数 (Probability Density, PD)

当你想求某个确切数值的概率时使用。
\( P(X = r) \)
例子：掷 10 次硬币，恰好出现 3 次正面的概率是多少？

B. 累积概率分布 (Cumulative Distribution, CD)

当你想求一个范围的概率时使用。大多数计算器都能算出 \( P(X \le r) \)，意思就是“r 次或更少”。
例子：至多出现 3 次正面的概率是多少？这就是 \( P(X \le 3) \)，即等于 \( P(X=0) + P(X=1) + P(X=2) + P(X=3) \)。

常见错误：“大于”vs“至少”

计算器通常只会算“小于或等于”（\( \le \)）。如果题目问的是 \( P(X \ge 3) \)（至少 3 次），你必须使用补集规则 (complement rule)：
\( P(X \ge 3) = 1 - P(X \le 2) \)
小贴士： 把所有可能的数字（0, 1, 2, 3, 4, 5...）列出来，并把你想要的数字圈起来。这样你就能一眼看出需要从 1 减去哪些部分！

5. 期望值 (Expected Value/Mean)

虽然 AS Level 不需要计算复杂的方差，但你应该对期望值有一个“直观的理解”。这简单来说就是如果你重复该实验很多次，平均预期会出现多少次成功。

公式为：期望值 = \( n \times p \)

例子：如果一颗种子发芽的概率是 0.8，而你种下 100 颗种子，你“预期”会有 \( 100 \times 0.8 = 80 \) 颗种子发芽。

6. 模拟现实世界的情况

你可能会被问到某个现实情况是否适合作二项分布模型。请留意 BINS 条件在哪些地方可能失效。

例子：从袋子里不放回地抽取玻璃珠。
● 它是二项分布吗？不是。
● 为什么？因为如果你不把珠子放回去，下一次抽到特定颜色珠子的概率就会改变。这违反了 BINS 中的“S”（相同的概率）和“I”（独立性）。

你知道吗？

二项分布的名字源于你在纯数 (Pure Maths) 中学过的“二项式展开”！其中的系数（来自帕斯卡三角形的数字）正是用来计算这些概率的相同数字。

总结：重点回顾

● 当所有结果出现的机会均等时（如公平的骰子），使用离散均匀分布。
● 当你有固定的试验次数且只有两种结果时，使用二项分布 \( B(n, p) \)。
● 在假设某个情况是二项分布之前，请务必检查 BINS。
● 熟练使用计算器的“Binomial PD”和“Binomial CD”功能——它们是你在考试中的最佳伙伴！
● 对于 \( P(X \ge r) \)，记得要用 \( 1 - P(X \le r-1) \)。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。