欢迎来到伯努利分布与二项分布的世界!
在本章中,我们将探索现实生活中一些最常见的概率测量方法。你有没有想过,掷 10 次硬币,恰好出现 3 次“正面”的概率是多少?或者工厂生产线上会有多少个产品是不合格的?这正是伯努利分布 (Bernoulli distribution) 和 二项分布 (Binomial distribution) 能帮助我们解答的问题。
别担心,如果统计学起初让你觉得有些吃力,我们将把它拆解成简单的“是或否”步骤!
1. 伯努利分布:单次实验的力量
伯努利分布是统计学中最基础的组成部分。它描述了一次实验(称为试验 (trial)),该实验只有两种可能的结果:成功 (Success) 或 失败 (Failure)。
试着这样想:你投篮一次,要么投进(成功),要么投失(失败),没有“中间地带”。
关键组成部分
我们使用以下符号来描述一次伯努利试验:
1. \(p\):成功的概率(通常以数值 1 表示)。
2. \(1 - p\):失败的概率(通常以数值 0 表示)。我们有时称之为 \(q\)。
3. 总概率之和必须永远等于 1:\(p + (1 - p) = 1\)。
平均值与方差
即使只是单次试验,我们也可以计算其平均值 (Mean) 和离散程度(方差, Variance):
平均值: \(E(X) = p\)
方差: \(Var(X) = p(1 - p)\)
小贴士:如果赢得一场比赛的概率是 0.7,那么平均来说,你每玩 1 场比赛,你就“赢”了 0.7 场。听起来有点奇怪,但这就是平均值告诉我们的信息!
重点总结:伯努利分布适用于单次试验,且只有两种结果的情况。
2. 二项分布:重复的成功
如果我们把那单次的伯努利试验重复多次会怎样呢?这就是二项分布发挥作用的地方。它其实就是多个独立伯努利试验的总和。
例子:掷 10 次硬币,计算出现多少次“正面”。每一次投掷都是一次伯努利试验;这 10 次投掷加起来就构成了二项分布。
“BINS”准则
要使用二项分布,情况必须满足以下四个条件(记住单词 BINS):
B - Binary(二元):只有两个结果(成功/失败)。
I - Independent(独立):一次试验不会影响下一次(例如,硬币不会“记得”上一次的结果)。
N - Number(次数):有固定的试验次数 (\(n\))。
S - Success(成功):每次试验成功的概率 (\(p\)) 保持不变。
你知道吗?如果你从袋子里取出弹珠并且不放回去,这就不是二项分布,因为每一次的概率都会改变!
3. 计算二项概率
要找出在 \(n\) 次试验中恰好出现 \(x\) 次成功的概率,我们使用以下公式:
\(P(X = x) = \binom{n}{x} p^x (1 - p)^{n-x}\)
拆解公式
1. \(\binom{n}{x}\):这是组合 (combination)的部分。它告诉我们有多少种不同的排列成功的方式。你可以在计算器上使用 \(nCr\) 按钮找到它。
2. \(p^x\):成功的概率的 \(x\) 次方,其中 \(x\) 是我们想要的成功次数。
3. \((1 - p)^{n-x}\):失败的概率的余下次数次方,代表剩余的失败次数。
例子:如果你抛掷一颗公平的骰子 5 次,恰好得到两次 6 点的概率是多少?
\(n = 5\)(总抛掷次数)
\(x = 2\)(期望出现 6 点的次数)
\(p = 1/6\)(出现 6 点的概率)
\(1 - p = 5/6\)(没有出现 6 点的概率)
计算方式:\(\binom{5}{2} \times (1/6)^2 \times (5/6)^3\)
要避免的常见错误
请确保指数(\(x\) 和 \(n-x\))之和永远等于 \(n\)。在上面的例子中,\(2 + 3 = 5\)。如果它们相加不等于 \(n\),代表你遗漏了某个试验!
重点总结:使用 \(\binom{n}{x}\) 来找出排列方式的数量,然后乘以成功和失败的概率。
4. 平均值、方差与标准差
对于二项分布 \(X \sim B(n, p)\),计算“平均”结果和“离散程度”非常直接:
平均值(期望值): \(E(X) = np\)
类比:如果你抛掷一枚硬币 100 次 (\(n=100\)),且出现正面的概率是 0.5 (\(p=0.5\)),你预期会得到 \(100 \times 0.5 = 50\) 次正面。
方差: \(Var(X) = np(1 - p)\)
这衡量了结果偏离平均值的程度。
标准差: \(\sigma = \sqrt{np(1 - p)}\)
这只是方差的平方根。
5. 使用统计表
有时候,逐一计算概率太慢了——特别是对于“至多 (at most)”或“小于 (less than)”类型的问题(例如 \(P(X \leq 4)\))。
在考试中,你可能会获得累积二项分布表 (cumulative binomial tables)。这些表格会告诉你 \(X\) 小于或等于某个数值的概率。
查表技巧:
1. 如果问题询问 \(P(X \leq 3)\),直接在表中查找 3 对应的数值。
2. 如果问题询问 \(P(X < 3)\),这等同于 \(P(X \leq 2)\)。
3. 如果问题询问 \(P(X \geq 3)\),使用“补集”规则:\(1 - P(X \leq 2)\)。
快速复习盒
伯努利: 1 次试验。平均值 = \(p\)。方差 = \(p(1-p)\)。
二项: \(n\) 次试验。平均值 = \(np\)。方差 = \(np(1-p)\)。
检查“BINS”:Binary(二元)、Independent(独立)、Number fixed(次数固定)、Success constant(成功率固定)。
总概率: 永远等于 1。
如果起初觉得这些很棘手,别担心!只要你多练习识别 \(n\)、\(p\) 和 \(x\),它就会变得越来越容易。你一定可以的!