统计分布简介

欢迎!在这一章,我们将探讨如何用数学来模拟现实生活中的事件。统计分布(statistical distribution)本质上就像一张“地图”或清单,列出了实验中所有可能的结果及其发生的可能性。无论是你要预测掷硬币出现正面的次数,还是预测一包种子中有多少会发芽,这些工具都能帮助我们用概率来理解这个世界。如果刚开始觉得有点抽象也不用担心,我们会透过大量例子来让你轻松掌握!

1. 离散随机变量 (Discrete Random Variables)

在深入研究具体的分布之前,我们需要先了解我们在测量什么。我们使用一种称为离散随机变量(Discrete Random Variable,通常记作 \( X \))的概念。

随机 (Random): 结果是由概率决定的。
变量 (Variable): 它可以取不同的数值。
离散 (Discrete): 它只能取特定的、分开的数值(例如 1, 2, 3...),而不是连续数值(例如 1.543...)。

例子:如果你掷一颗骰子,骰子落下的点数就是一个离散随机变量,因为你可以得到 1 或 2,但不可能得到 1.5。

2. 离散均匀分布 (The Discrete Uniform Distribution)

这是最简单的分布类型。在离散均匀分布中,每一个可能的结果发生的概率都是完全一样的。

经典例子:公平的骰子
如果你掷一颗公平的六面骰子,可能的结果是 {1, 2, 3, 4, 5, 6}。
得到其中任何一个数字的概率都是 \( \frac{1}{6} \)。因为所有概率都相等(均匀),所以我们称之为离散均匀分布。

快速复习小盒子

离散 (Discrete): 结果是可以数出来的。
均匀 (Uniform): 所有结果都有相同的发生机会。

3. 二项分布 (The Binomial Distribution)

二项分布是这一章的“超级巨星”。它用于模拟在固定次数的试验中“成功”的次数。例如:“如果我投篮 10 次,投中 7 次的概率是多少?”

什么时候可以使用二项模型?

要使用这个模型,情况必须满足四个严格的条件。你可以用助记词 BINS 来记忆:

B - Binary (二元): 每次试验只有两种可能的结果(通常称为成功失败)。
I - Independent (独立): 一次试验的结果不会影响下一次。
N - Number (次数):固定的试验次数(我们称之为 \( n \))。
S - Success (成功概率): 每次试验成功的概率(我们称之为 \( p \))必须相同

符号表示

如果一个变量 \( X \) 服从二项分布,我们可以这样写:
\( X \sim B(n, p) \)

● \( n \) = 试验次数
● \( p \) = 成功概率

例子:如果你掷公平硬币 10 次并记录出现正面的次数,你会写作:\( X \sim B(10, 0.5) \)。

4. 计算二项概率

在考试中,你需要使用计算器来算出这些概率。你主要会用到两种计算方式:

A. 概率密度函数 (Probability Density, PD)

当你想求某个确切数值的概率时使用。
\( P(X = r) \)
例子:掷 10 次硬币,恰好出现 3 次正面的概率是多少?

B. 累积概率分布 (Cumulative Distribution, CD)

当你想求一个范围的概率时使用。大多数计算器都能算出 \( P(X \le r) \),意思就是“r 次或更少”。
例子:至多出现 3 次正面的概率是多少?这就是 \( P(X \le 3) \),即等于 \( P(X=0) + P(X=1) + P(X=2) + P(X=3) \)。

常见错误:“大于”vs“至少”

计算器通常只会算“小于或等于”(\( \le \))。如果题目问的是 \( P(X \ge 3) \)(至少 3 次),你必须使用补集规则 (complement rule)
\( P(X \ge 3) = 1 - P(X \le 2) \)
小贴士: 把所有可能的数字(0, 1, 2, 3, 4, 5...)列出来,并把你想要的数字圈起来。这样你就能一眼看出需要从 1 减去哪些部分!

5. 期望值 (Expected Value/Mean)

虽然 AS Level 不需要计算复杂的方差,但你应该对期望值有一个“直观的理解”。这简单来说就是如果你重复该实验很多次,平均预期会出现多少次成功。

公式为:期望值 = \( n \times p \)

例子:如果一颗种子发芽的概率是 0.8,而你种下 100 颗种子,你“预期”会有 \( 100 \times 0.8 = 80 \) 颗种子发芽。

6. 模拟现实世界的情况

你可能会被问到某个现实情况是否适合作二项分布模型。请留意 BINS 条件在哪些地方可能失效。

例子:从袋子里不放回地抽取玻璃珠。
● 它是二项分布吗?不是。
● 为什么?因为如果你不把珠子放回去,下一次抽到特定颜色珠子的概率就会改变。这违反了 BINS 中的“S”(相同的概率)和“I”(独立性)。

你知道吗?

二项分布的名字源于你在纯数 (Pure Maths) 中学过的“二项式展开”!其中的系数(来自帕斯卡三角形的数字)正是用来计算这些概率的相同数字。

总结:重点回顾

● 当所有结果出现的机会均等时(如公平的骰子),使用离散均匀分布
● 当你有固定的试验次数且只有两种结果时,使用二项分布 \( B(n, p) \)
● 在假设某个情况是二项分布之前,请务必检查 BINS
● 熟练使用计算器的“Binomial PD”和“Binomial CD”功能——它们是你在考试中的最佳伙伴!
● 对于 \( P(X \ge r) \),记得要用 \( 1 - P(X \le r-1) \)。