简介:欢迎来到离散随机变量的世界!

嘿!准备好深入统计学中最实用的章节了吗?在本章中,我们不再只是观察一连串的数字,而是开始建立模型。这些模型能帮助我们(以数学的方式!)预测未来。

我们将学习离散随机变量 (Discrete Random Variables)。「离散」简单来说就是指结果是独立且可数的(例如掷 10 次硬币出现正面次数),而「随机变量」只是一个专有名词,用来表示一个数值取决于概率的变量。无论你未来想成为工程师、游戏玩家还是企业主,理解这些分布都能帮助你计算风险与预期回报。


1. 理解概率分布表 (Probability Distribution Table)

在我们使用复杂的公式之前,需要先整理数据。概率分布就是列出所有可能的结果及其发生的概率。

关键术语:

  • \(X\):随机变量(例如:「掷一颗公平六面骰子的点数」)。
  • \(x\):\(X\) 可以取到的特定数值(例如:1、2、3、4、5 或 6)。
  • \(P(X = x)\):变量 \(X\) 等于该特定数值的概率。

黄金法则:

分布中所有概率的总和必须等于 1
\(\sum P(X = x) = 1\)

快速检查小撇步:如果你看到一张表缺少了一个概率值,只需将其他概率相加,再用 1 减去该总和即可。就是这么简单!

重点总结:分布表就是一张地图,标示了所有可能的结果及其发生的可能性。


2. 期望值 \(E(X)\) 与方差 \(Var(X)\)

现在我们有了表格,我们想知道两件事:什么是「平均」结果?以及结果的波动有多大?

期望值 \(E(X)\)

别被名字吓到了——它其实就是平均值 (mean)。如果你重复实验数千次,预期会得到的平均结果就是它。
公式:\(E(X) = \sum x \cdot P(X = x)\)

简单技巧:在表格中,将每个数值与其对应的概率相乘,然后将所有乘积加总即可。

方差 \(Var(X)\)

方差是用来衡量结果从平均值「分散」开来的程度。
公式:\(Var(X) = E(X^2) - [E(X)]^2\)

要算出 \(E(X^2)\),请将每个 \(x\) 的值平方,乘以其概率后加总。最后千万别忘了减去你之前算出的平均值的平方!

常见错误:学生常常忘记在方差公式的最后要将平均值平方。请记住这句话:「平方平均值,然后用平方后的期望值减去它。」

重点总结:\(E(X)\) 告诉你中心在哪里;\(Var(X)\) 告诉你分布有多宽。


3. 二项分布 \(B(n, p)\)

这是最著名的分布之一!当我们进行固定次数的试验,且目标是寻找特定次数的「成功」时,就会使用它。

何时使用二项分布?(BINS 记忆法)

  • Binary(二元):只有两种结果(成功或失败)。
  • Independent(独立):一次试验不会影响下一次。
  • Number(次数):试验次数固定为 \(n\)。
  • Same(相同):每次试验成功的概率 (\(p\)) 都相同。

公式:

\(P(X = r) = \binom{n}{r} p^r (1-p)^{n-r}\)

其中:
\(n\) = 总试验次数
\(r\) = 你想要的成功次数
\(p\) = 成功的概率
\((1-p)\) = 失败的概率(通常记作 \(q\))

冷知识:其中的 \(\binom{n}{r}\)(读作「n 取 r」)用来计算在整个序列中,出现这些成功次数的所有可能组合方式!

二项分布的快速公式:

  • 平均值:\(E(X) = np\)
  • 方差:\(Var(X) = np(1-p)\)

重点总结:当你知道试验次数 (\(n\)) 并且想找出获得恰好 \(r\) 次成功的概率时,请使用二项分布。


4. 几何分布 \(Geo(p)\)

如果刚开始觉得难也别担心,其实它比二项分布更简单!当我们在等待第一次成功时,就会使用它。

例子:你正在练习投篮。几何分布告诉你,你的第一次进球发生在第 1 球、第 2 球,还是第 10 球的概率。

公式:

\(P(X = r) = p(1-p)^{r-1}\)

如果你思考一下,这个公式其实很直观:若要让第一次成功发生在第 \(r\) 次,意味着你必须先失败了 \(r-1\) 次,然后在最后一次试验中取得成功。

与二项分布的主要区别:

  • 没有固定的 \(n\)。你会一直尝试直到成功为止!
  • 变量 \(X\) 理论上可以无限延伸(1, 2, 3, ... \(\infty\))。

几何分布的平均值:

\(E(X) = \frac{1}{p}\)

比喻:如果你赢得比赛的概率是 1/10 (\(p=0.1\)),你「预期」会玩 \(1 / 0.1 = 10\) 次才能赢得第一次胜利。简单吧?

重点总结:当实验在第一次成功发生时立即停止,就使用几何分布。


成功检查清单

  • 检查所有概率之和是否为 1。
  • 一般表格请使用 \(E(X) = \sum xP\)。
  • 寻找固定的试验次数 (\(n\)) 来识别二项分布
  • 寻找「第一次发生」的描述来识别几何分布
  • 在将数值代入公式前,务必先写下你的 \(n\)、\(p\) 和 \(r\)。

你一定没问题的!先练习几题表格题,然后再挑战二项分布与几何分布的应用题。统计学的精髓就在于识别故事背后的规律