欢迎来到离散概率分布!

你好!欢迎来到 A Level 统计学课程中最实用的章节之一。在本节中,我们将学习如何针对可以数出来(countable)的事物,建立模型并预测事件发生的“机会”。无论是掷十次硬币出现的正面次数,还是一箱灯泡中坏掉的数量,离散概率分布都能为你提供处理这些问题的工具。

如果觉得这个名字听起来有点深奥,别担心——我们会将其拆解成简单且合乎逻辑的步骤。读完这些笔记后,你将能一眼看出什么是二项分布(Binomial Distribution),并能像专业人士一样运用计算器轻松找出答案!


1. 理解离散随机变量

在探讨分布之前,我们需要先认识主角:离散随机变量(Discrete Random Variable)

随机变量 (X):一个由随机事件的结果所决定的变量。我们通常用大写字母 \( X \) 来代表变量本身,用小写字母 \( x \) 来代表它可能取到的特定数值。

离散 (Discrete):这意味着变量只能取特定的、分离的数值(如 0, 1, 2, 3)。你不可能有 2.5 个兄弟姐妹,也不可能把硬币掷 4.7 次!如果你可以用手指头数出来,它大概就是离散的。

概率分布表

概率分布只是一份详尽的列表,列出了 \( X \) 所有可能的取值及其对应的概率。它最常以表格形式呈现。

例子:设 \( X \) 为投掷一枚公正四面骰子的点数。
\( x \):1, 2, 3, 4
\( P(X=x) \):0.25, 0.25, 0.25, 0.25

黄金法则

对于任何离散概率分布,所有概率的总和必须等于 1
在数学上,写作:\( \sum P(X=x) = 1 \)。
如果你的概率相加不等于 1,那就代表哪里出错了!

概率函数

有时候,题目不会给你表格,而是给你一个公式(即概率函数)来计算每个数值的机会。
例子:\( P(X=x) = kx \),其中 \( x = 1, 2, 3 \)。
要找出 \( k \),你需要解方程式:\( k(1) + k(2) + k(3) = 1 \),所以 \( 6k = 1 \),即 \( k = 1/6 \)。

快速复习箱:
离散 (Discrete) = 可数的数值(没有小数)。
随机变量 (Random Variable) = 随机“实验”的结果。
概率总和 (Sum of Probabilities) = 永远恰好等于 1。

重点总结:离散概率分布就像一张地图,告诉你所有可能的结果以及它们发生的可能性。


2. 二项分布 (The Binomial Distribution)

这是本章的“主角”。当我们重复执行一项任务多次,并计算得到多少次“成功”时,就会用到二项分布

什么时候可以使用二项模型?(B.I.N.S. 测试)

要使用二项分布,情况必须通过 B.I.N.S. 测试。如果其中任何一项不符合,你就不能使用它!

B - Binary (二元):每次试验只有两种可能的结果(通常称为成功失败)。
I - Independent (独立):一次试验的结果不会影响下一次(如掷硬币)。
N - Number (次数):有固定的试验次数 (\( n \))。
S - Success (成功率):成功的概率 (\( p \)) 在每次试验中必须保持不变。

你知道吗?“二项”(Binomial) 这个名字源自 "bi"(意为二),因为每次试验只有两个结果——就像自行车有两个轮子一样!

符号表示

我们写 \( X \sim B(n, p) \) 来表示 \( X \) 服从一个二项分布,其中 \( n \) 为试验次数,\( p \) 为成功概率。

重点总结:使用 B.I.N.S. 来检查情况是否符合二项分布。如果概率会改变(例如从抽屉拿袜子且不放回去),它就不是二项分布。


3. 计算二项概率

寻找概率有两种方法:使用公式或使用你的计算器。对于 OCR 课程大纲,你需要对两者都感到熟练!

使用公式

要计算在 \( n \) 次试验中得到恰好 \( x \) 次成功的概率:
\( P(X=x) = \binom{n}{x} p^x (1-p)^{n-x} \)

• \( \binom{n}{x} \):这是你计算器上的 "nCr" 按键。它告诉你从 \( n \) 个项目中选出 \( x \) 个的方法数。
• \( p^x \):成功概率的 \( x \) 次方。
• \( (1-p)^{n-x} \):失败概率的剩余试验次数次方。

使用你的计算器

大多数现代计算器(如 Casio ClassWiz)都有专用模式:
1. Binomial PD (概率分布):用于“恰好”类型的问题,例如 \( P(X = 3) \)。
2. Binomial CD (累积概率分布):用于“范围”类型的问题,例如 \( P(X \le 3) \)。

小心你的不等式!

这是学生最容易失分的地方。因为数据是离散的,“等于”这一点非常重要!
• \( P(X \le 5) \):包括 0, 1, 2, 3, 4, 5。(直接使用 Bcd)。
• \( P(X < 5) \):这等同于 \( P(X \le 4) \)。
• \( P(X \ge 5) \):这等于 \( 1 - P(X \le 4) \)。
• \( P(X > 5) \):这等于 \( 1 - P(X \le 5) \)。

类比:如果一家俱乐部规定“未满 18 岁”才能进,那么 18 岁的人就不能进。同样地,\( X < 5 \) 不包含数字 5。

常见错误:别忘了 \( (1-p) \) 只是失败的概率。有时人们会称它为 \( q \)。所以,\( p + q = 1 \)。

重点总结:画一条小数线(0, 1, 2, 3, 4, 5...)并圈出你需要的数字。这能帮助你判断应该从 1 减去哪一个累积概率。


4. 二项分布的平均值与方差

虽然你不需要在本章计算“一般”离散分布的平均值与方差,但对于二项分布,你必须掌握!

平均值 (\( \mu \))

平均值是你若重复多次实验,预期会得到的平均成功次数。
\( \mu = np \)

例子:如果你掷一枚公正硬币 100 次,预期会有 \( 100 \times 0.5 = 50 \) 次正面。很简单吧!

方差 (\( \sigma^2 \))

方差告诉你结果的分散程度。
\( \sigma^2 = np(1-p) \)
(或 \( npq \),其中 \( q \) 为失败概率)。

快速复习:
平均值 (\( \mu \)) = \( np \)
方差 (\( \sigma^2 \)) = \( npq \)
标准差 (\( \sigma \)) = \( \sqrt{npq} \)

重点总结:这些公式对于描述分布非常有用,并且在你稍后学习课程中的“正态分布近似 (Normal Approximations)”时至关重要。


总结检查清单

在完成本章之前,确保你能:
1. 解释什么是离散随机变量
2. 检查表格或函数中的概率总和是否等于 1。
3. 使用 B.I.N.S. 准则来识别二项分布。
4. 使用公式计算精确的二项概率。
5. 使用计算器查找累积概率(如 \( P(X \le x) \))。
6. 使用 \( np \) 和 \( npq \) 计算二项分布的平均值方差

如果起初觉得棘手,不用担心!只要在题目中练习识别 \( n \) 和 \( p \),一切都会变得越来越自然。你一定没问题的!