欢迎来到离散概率分布!

在本章中,我们将从基础概率进入统计分布的世界。在这里,我们不再只关注单次发生的事件,而是开始审视在多次试验下,各种结果发生的“大局”。这就像是从观察一滴雨点,进阶到了解整场暴雨!对于未来从事科学、金融,甚至是游戏设计等职业,这是一项至关重要的技能。

1. 什么是离散随机变量?

在我们深入数学细节之前,先拆解一下这个听起来很深奥的名词:离散随机变量 (Discrete Random Variable)

变量 (Variable):一个可以改变数值的量(通常称为 \(X\))。
随机 (Random):在事件发生前,我们无法预知确切的结果。
离散 (Discrete):数值是分隔且独立的。你可以数出它们(例如 0、1、2、3)。你不可能在掷硬币时得到“2.5 个正面”或“3.14 个小孩”。

生活中的例子:
想象一下你正在进行 5 次篮球罚球。你投进篮球的次数就是一个离散随机变量。你可能投进 0、1、2、3、4 或 5 球。你不可能投进 2.7 球!

重点提示:我们使用大写 \(X\) 作为变量的名称(例如“投进篮球的次数”),并使用小写 \(x\) 代表特定的数值(例如“投进了 3 球”)。因此,\(P(X = x)\) 的意思就是“投进篮球的次数刚好等于特定数值的概率”。

2. 描述分布

OCR 课程要求你主要通过两种方式来理解这些分布:表格公式

概率表格

这是最常见的分布表示方式。它列出了每一个可能的结果及其发生的机会。

例子:设 \(X\) 为投掷一个公平四面骰子的得分。
\(x\):1, 2, 3, 4
\(P(X = x)\):0.25, 0.25, 0.25, 0.25

黄金法则:分布中所有概率的总和必须等于 1。
\(\sum P(X = x) = 1\)
如果你将表格底部的数值加总后不等于 1.0,那就代表哪里出错了!

概率函数(公式)

有时,概率会以一个小型“机器”的形式给出。你代入 \(x\),它就会吐出概率。
例子:\(P(X = x) = kx\),其中 \(x = 1, 2, 3\)。

要找出 \(k\) 的值,你可以代入数值:
当 \(x=1\) 时,\(P = 1k\)
当 \(x=2\) 时,\(P = 2k\)
当 \(x=3\) 时,\(P = 3k\)
因为总和必须为 1:\(1k + 2k + 3k = 1\),所以 \(6k = 1\),即 \(k = 1/6\)。

关键点:无论是表格还是公式,总概率永远是 1。利用这一事实来找出缺失的值!

3. 二项分布 (Binomial Distribution)

二项分布是一种在各处随处可见的特殊离散分布。当你有一组固定的“试验”次数,且每次试验只有两种结果:成功 (Success)失败 (Failure) 时,就会用到它。

我们何时可以使用二项分布模型?

如果觉得这很复杂,别担心!只要记住口诀 B.I.N.S.!要使用二项分布,情境必须满足以下四个条件:

B - Binary (二元):只有两种可能的结果(成功或失败)。
I - Independent (独立):一次试验不会影响下一次的结果(例如抛硬币)。
N - Number of trials (试验次数):有固定数量的试验 (\(n\))。
S - Success probability (成功概率):每次成功的概率 (\(p\)) 保持不变。

符号标记:我们将其写为 \(X \sim B(n, p)\)。
这是数学上的简写,意为:“变量 \(X\) 服从参数为 \(n\) 次试验和成功概率 \(p\) 的二项分布。”

你知道吗?“不放回”抽样(例如从帽子里拿名字且不放回去)严格来说违反了独立性规则。但如果群体非常大,我们通常仍会假设它是二项分布,因为概率的变化微乎其微!

4. 计算二项概率

你需要学会使用两种方法来求得刚好出现 \(x\) 次成功的概率:公式法和计算器法。

公式法

\(P(X = x) = \binom{n}{x} \times p^x \times (1 - p)^{n-x}\)

让我们用“人话”拆解一下:
\(\binom{n}{x}\):这是成功可能出现的不同方式的数量(使用计算器上的 \(nCr\) 按键)。
\(p^x\):成功概率的 \(x\) 次方。
\((1 - p)^{n-x}\):失败概率的剩余次数次方。

例子:如果你抛一枚有偏差的硬币 5 次 (\(n=5\)),出现正面的概率为 0.6 (\(p=0.6\)),那么刚好出现 3 次正面的机会是多少?
\(P(X = 3) = \binom{5}{3} \times 0.6^3 \times 0.4^2\)
\(P(X = 3) = 10 \times 0.216 \times 0.16 = 0.3456\)

使用计算器(专业做法)

在考试中,速度是关键!大多数现代科学计算器都有 Binomial PD (概率密度) 模式用于“刚好”类型的问题,以及 Binomial CD (累积概率分布) 用于“小于或等于”类型的问题。

常见错误:计算器通常计算的是 \(P(X \le x)\)。如果题目问的是 \(P(X > 3)\),你必须计算 \(1 - P(X \le 3)\)。务必检查不等号的方向!

快速复习盒:
\(P(X = x)\) 使用 Binomial PD
\(P(X \le x)\) 使用 Binomial CD
\(P(X < x)\) 转换为 \(P(X \le x-1)\),然后使用 Binomial CD

5. 总结与关键点

1. 离散随机变量代表可数的数值,其总概率永远为 1。
2. B.I.N.S. 是你判断情境是否为二项分布的检查清单(二元、独立、固定次数、相同成功概率)。
3. \(X \sim B(n, p)\) 是你在解题过程中必须使用的符号标记。
4. 平均数与方差:对于 H230 AS Level,你不需要计算这些分布的平均数或方差。请专注于寻找概率!

最后小贴士:在解释情境中的“假设”时,不要只说“它是独立的”。应该说“我们假设一个人患流感的事件与下一个人患流感是独立的”。语境才是最重要的!