Mathematical models in probability and statistics

欢迎来到概率与统计数学模型的世界！

你好，未来的统计学家！本章将带你领略概率论与现实应用的碰撞。我们将超越基础的概率规则，开始运用强大的数学工具——即模型——来预测结果并量化不确定性。

如果此前你觉得概率论有些抽象，请别担心。学完本单元，你将能够针对各种情境选择合适的模型进行描述，比如篮球比赛中投篮命中的次数，或是大批量产品中次品的检测概率。这些都是高阶统计学必备的核心知识！

第 1 节：离散型随机变量 (Discrete Random Variables, DRVs)

什么是随机变量？

随机变量（通常用大写字母如 \(X\)、\(Y\) 或 \(R\) 表示）是一个其取值由随机事件结果决定的变量。

例如，当你掷骰子时，结果是随机的，但我们可以将这些结果赋予数值（1, 2, 3, 4, 5, 6）。此时，\(X\) 可以代表骰子掷出的点数。

如果一个变量只能取特定的、离散的数值（通常是整数），那么它就是离散型的。你可以清楚地数出可能的结果。

例子：掷三次硬币时正面朝上的次数（\(X\) 可以是 0, 1, 2 或 3）。
非离散例子（连续型）：人的身高（可以在一定范围内取任意值）。

概率分布

离散型随机变量 \(X\) 的概率分布是一份完整的清单，列出了变量所有可能的取值及其对应的概率。

这通常以表格形式呈现：

\(P(X=x)\)

概率分布的关键性质：

每个概率值必须在 0 到 1 之间：\(0 \le P(X=x) \le 1\)。
所有概率的总和必须等于 1：\(\sum P(X=x) = 1\)。

常见错误提醒！务必检查所有概率之和是否正好等于 1。如果不等于 1，说明你漏掉了某种结果或计算出现了偏差。

快速回顾：离散型随机变量

离散型随机变量取值明确且可数。其分布列出了每个取值及相应的概率，且所有概率之和必须为一。

第 2 节：离散分布的描述

得到分布后，我们需要方法来总结它的特征。最重要的两个度量指标是期望值（平均数）和方差（离散程度）。

1. 期望值 \(E(X)\)

期望值 \(E(X)\) 是随机变量的长期平均结果，也称为均值 (\(\mu\))。

比喻：如果你玩某款游戏成千上万次，\(E(X)\) 就是你预期每局赢（或输）的平均金额。

计算公式为： \[E(X) = \mu = \sum x P(X=x)\]

通俗地说：将每个可能的值乘以其对应的概率，然后求和。

2. 方差与标准差

方差 \(Var(X)\) 用于衡量分布的离散程度或波动性——即结果平均偏离均值的距离。

标准公式（定义）： \[Var(X) = E((X - \mu)^2) = \sum (x - \mu)^2 P(X=x)\]

更快捷的计算公式（考试常用）： \[Var(X) = E(X^2) - [E(X)]^2\]

其中 \(E(X^2) = \sum x^2 P(X=x)\)。

标准差 (\(\sigma\)) 仅仅是方差的平方根。因为它与 \(X\) 的单位一致，所以更容易直观理解。 \[\sigma = \sqrt{Var(X)}\]

3. 线性变换

如果我们对随机变量进行线性变换，会发生什么？对于常数 \(a\) 和 \(b\)，以及随机变量 \(X\)：

变换的期望值： \[E(aX + b) = a E(X) + b\] 期望值同时受乘法因子 (\(a\)) 和加法因子 (\(b\)) 的影响。

变换的方差： \[Var(aX + b) = a^2 Var(X)\] 方差只受乘法因子 (\(a\)) 的影响，且必须将系数 \(a\) 平方。加上一个常数 (\(b\)) 只是将整个分布平移，不会改变其离散程度，所以 \(b\) 在方差中消失了！

计算要点提示

记住流程：先算 \(E(X)\)，再算 \(E(X^2)\)，最后利用简化公式求 \(Var(X)\)。计算方差时，一定要注意对整个 \(E(X)\) 项进行平方！

第 3 节：概率中的数学模型

什么是概率模型？

概率模型是一种理论上的概率分布，我们用它来模拟现实世界的情况。使用模型可以避免每次都从头计算每一个概率。

使用模型需要我们对现实场景做出一定的假设。如果这些假设合理，模型拟合度就高。如果假设被违背（即假设不成立），模型的结果就会不准确。

在本单元中，我们要学习的最重要的离散模型是二项分布。

第 4 节：二项分布 \(B(n, p)\)

二项分布是一个强大的模型，适用于固定次数的独立试验，且每次试验只有两种可能的结果：成功或失败。

二项分布的条件（BINS 检查法）

只有满足四个条件，才能使用二项分布 \(X \sim B(n, p)\)。使用记忆术 BINS 来核对：

Binary Outcomes（二元结果）：每次试验只有两种结果（成功或失败）。
Independent Trials（独立试验）：一次试验的结果不影响其他任何试验的结果。
Number of Trials is fixed（试验次数固定）：试验总次数 \(n\) 必须提前确定。
Same Probability（概率相同）：每次试验成功的概率 \(p\) 必须保持不变。

你知道吗？二项分布常用于质量控制（产品是否为次品？）和医学测试（病人是否康复？）。

符号表示

如果 \(X\) 服从二项分布，我们记作： \[X \sim B(n, p)\] 其中：

\(n\) 是试验次数。
\(p\) 是单次试验成功的概率。

二项分布概率公式

在 \(n\) 次试验中恰好获得 \(x\) 次成功的概率由下式给出： \[P(X=x) = \binom{n}{x} p^x (1-p)^{n-x}\]

公式拆解：

\(\binom{n}{x}\)（读作“n 选 x”）是在 \(n\) 次试验中安排 \(x\) 次成功的组合数。计算方法为 \(\frac{n!}{x!(n-x)!}\)。
\(p^x\) 是获得 \(x\) 次成功的概率。
\((1-p)^{n-x}\) 是获得 \(n-x\) 次失败的概率。（失败概率 \(1-p\) 常记作 \(q\)）。

计算示例步骤：
若 \(X \sim B(10, 0.3)\)，求 \(P(X=2)\)。（10 次试验，成功概率 0.3，我们想要 2 次成功）。

确定参数：\(n=10\)，\(x=2\)，\(p=0.3\)，\(1-p=0.7\)。
计算组合数：\(\binom{10}{2} = 45\)。
计算概率：\(P(X=2) = 45 \times (0.3)^2 \times (0.7)^{10-2}\)
\(P(X=2) = 45 \times 0.09 \times (0.7)^8 \approx 0.2335\)

使用二项分布表和计算器（累积概率）

当 \(n\) 很大时，直接套用公式计算非常繁琐。我们通常使用统计表或计算器的内置功能。

统计表通常提供累积概率： \[P(X \le x)\] 这代表成功次数为 \(x\) 次或更少的概率。

如何处理不同的不等式：

\(P(X < x)\) 等同于 \(P(X \le x-1)\)。（如果想要少于 5 次，即意味着 4 次或更少）。
\(P(X \ge x) = 1 - P(X \le x-1)\)。（补集法则）。
\(P(X > x) = 1 - P(X \le x)\)。
\(P(a \le X \le b) = P(X \le b) - P(X \le a-1)\)。

如果一开始觉得绕，别担心。练习将各种不等式转化为 \(P(X \le k)\) 的形式，这是极其关键的技巧！

二项分布的期望与方差

不同于一般离散型随机变量需要对 \(x P(X=x)\) 求和，二项分布的均值和方差有极其简洁的公式，这源于其独特的结构：

期望值（均值）： \[E(X) = np\]

方差： \[Var(X) = np(1-p)\]

例子：掷一枚均匀硬币 (p=0.5) 20 次 (n=20)，正面朝上的期望次数为 \(E(X) = 20 \times 0.5 = 10\)。

要点总结：二项分布模型

当我们需要在固定次数的独立试验中计算成功次数时，使用二项模型 \(B(n, p)\)。务必核对 BINS 条件。利用 \(E(X)=np\) 和 \(Var(X)=np(1-p)\) 可以快速计算分布的中心位置和离散程度。

全章总结

我们首先学习了离散型随机变量，掌握了如何计算其期望值（均值）和方差（离散程度）。接着我们将这些概念应用于第一个重要的数学模型：二项分布。本章的学习成功与否，取决于你能否识别题目是否符合 BINS 条件，并准确使用统计表或公式处理累积概率。继续加油练习那些不等式的转换吧！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。