Statistics and probability

导言：解读随机性——欢迎来到统计与概率！

你好，未来的数学家！统计与概率这一章是 IB AA 课程中最实用且最迷人的部分之一。它将我们从抽象的代数带入到错综复杂的现实世界，让我们能够对本质上随机的事件做出有理有据的推测与预测。

分析与方法 (Analysis and Approaches) 课程对这一主题的处理侧重于理论模型和分布。对于 HL 学生而言，这意味着将概率概念直接与微积分（积分与微分）联系起来——这非常酷！

如果偶尔觉得概率有些反直觉，请别担心；我们将一步步拆解这些规则和概念。让我们开始吧，将数据与随机性转化为清晰的知识！

第 1 节：单变量数据与描述性统计 (SL & HL)

1.1 集中趋势度量（“平均”的概念）

这些度量告诉我们数据的中心在哪里。可以把它们看作“典型”值。

平均数 ($\bar{x}$ 或 $\mu$)： 算术平均值。将所有数值相加，然后除以数值的个数。
中位数： 数据按顺序排列后的中间值。如果有两个中间数，中位数就是它们的平均值。它的优点在于不受离群值（极端值）的影响。
众数： 出现频率最高的值。如果所有值都只出现一次，则没有众数。

类比： 如果你的班级成绩是 (10, 50, 55, 60, 65, 70, 75, 80, 100)，那么 10 和 100 就是离群值。平均数可能会被拉低，但中位数依然是反映中心位置的稳健指标。

1.2 离散程度度量（“散布”的概念）

这些度量告诉我们数据分布得有多广，或者说数据偏离中心的程度。

极差 (Range)： 最大值减去最小值。计算简单，但容易受离群值干扰。
四分位距 (IQR)： $Q_3 - Q_1$。这是中间 50% 数据的分布范围。$Q_1$（第一四分位数）是第 25 百分位数，$Q_3$（第三四分位数）是第 75 百分位数。
方差 ($\sigma^2$)： 与平均值距离平方后的平均值。我们将距离进行平方，是为了避免正负偏差相互抵消。
标准差 ($\sigma$ 或 $s$)： 方差的平方根。这是最重要的离散程度度量，因为它使用的是数据的原始单位。

快速复习：理解标准差 (SD)

标准差小意味着数据点集中在平均值附近（一致性好）。标准差大意味着数据点分布在很广的范围内（一致性差）。

重要公式（总体标准差）：
$$\sigma = \sqrt{\frac{\sum (x_i - \mu)^2}{N}}$$

图形计算器 (GDC) 小贴士： 始终使用计算器的统计功能（通常是 "1-Var Stats"）来求 $\bar{x}$、$\sigma_x$ 和四分位数。这样既能节省时间，又能最大限度地减少计算错误！

核心要点： 描述性统计通过两个主要维度帮助我们总结大型数据集：中心在哪里（趋势）以及数据有多分散（离散程度）。

第 2 节：概率基础 (SL & HL)

2.1 基本概率符号与概念

概率是衡量事件发生可能性的指标，范围从 0（不可能）到 1（必然）。

样本空间 (S)： 所有可能结果的集合。
事件 (A)： 某个特定的结果或结果的集合。
互补事件 ($A'$ 或 $A^c$)： 事件 A 不发生的事件。 $$P(A') = 1 - P(A)$$

2.2 组合事件

我们用 $P(A \cup B)$ 表示“A 或 B”，用 $P(A \cap B)$ 表示“A 且 B”。

2.2.1 互斥事件

这些事件不能同时发生。如果 A 发生，B 就不能发生，反之亦然。它们没有交集。

规则： $P(A \cap B) = 0$
互斥事件的加法法则： $$P(A \cup B) = P(A) + P(B)$$

例子： 掷一次骰子，掷出 1 和掷出 6 是互斥事件。

2.2.2 非互斥事件

这些事件可以同时发生。我们需要通用加法法则来避免重复计算交集部分。

通用加法法则： $$P(A \cup B) = P(A) + P(B) - P(A \cap B)$$

2.3 条件概率与独立性

2.3.1 条件概率

这是在已知事件 B 已经发生的前提下，事件 A 发生的概率。

符号： $P(A|B)$（读作“在 B 发生的条件下 A 的概率”）。
公式： $$P(A|B) = \frac{P(A \cap B)}{P(B)}, \text{ 前提是 } P(B) \neq 0$$

类比： 想象从一副牌中抽一张牌（事件 B：抽到红桃）。下一次抽牌（事件 A）的样本空间变小了（只剩 51 张）。该概率取决于事件 B 是否发生。

2.3.2 独立事件

如果两个事件是独立的，那么其中一个事件的发生不会影响另一个事件的概率。对于独立事件，条件概率公式会简化：

独立性规则： $$P(A \cap B) = P(A) \times P(B)$$ （这是独立事件的乘法法则。）
或者，如果 $P(A|B) = P(A)$，则它们是独立的。

要避免的常见误区： 混淆互斥（不能同时发生，$P(A \cap B)=0$）和独立（互不影响，$P(A \cap B)=P(A)P(B)$）。这是两个非常不同的概念！

核心要点： 务必定义好你的事件。使用树状图或韦恩图来直观展示条件概率和组合概率，特别是在处理顺序事件时。

第 3 节：离散随机变量 (SL & HL)

3.1 随机变量 (RVs)

随机变量 (X) 是一个其值由随机实验结果决定的变量。我们用大写字母 $X$ 表示变量，用小写字母 $x$ 表示一个特定的结果。

离散型随机变量： 只能取有限个或可数无穷多个值（例如：掷硬币正面的次数、鞋码）。

3.2 概率分布与期望值

概率分布列出了所有可能的结果 $x$ 及其对应的概率 $P(X=x)$。

条件： 所有概率之和必须等于 1：$\sum P(X=x) = 1$。

期望值 $E(X)$

离散随机变量的期望值（或平均值，$\mu$）是结果的长期平均水平。

离散随机变量公式： $$E(X) = \sum x \cdot P(X=x)$$

你知道吗？ $E(X)$ 不一定是一个实际可能发生的结果。如果你掷一次骰子，$E(X) = 3.5$，但你永远不可能掷出 3.5！

3.3 二项分布 $B(n, p)$

当我们进行固定次数的独立试验，且每次试验只有两个结果：成功或失败时，使用二项分布。

二项分布的条件：(BINS 记忆法)

Binary（二元）：只有两个结果（成功/失败）。
Independent（独立）：每次试验必须相互独立。
Number（次数）：试验次数 ($n$) 是固定的。
Success（成功概率）：每次试验成功的概率 ($p$) 是恒定的。

概率公式 (SL & HL)

在 $n$ 次试验中恰好获得 $k$ 次成功的概率是：

$$P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$$

其中 $\binom{n}{k} = \frac{n!}{k!(n-k)!}$ 是 $k$ 次成功可能出现的方式数量。

二项分布的期望值与方差

对于二项分布 $X \sim B(n, p)$：

期望值： $E(X) = np$
方差： $\text{Var}(X) = np(1-p)$

GDC 小贴士： 在 GDC 上使用 Binomial PDF（求 $P(X=k)$）和 Binomial CDF（求累积概率，如 $P(X \le k)$）功能。记住，CDF 计算的是包括 $k$ 在内的累计概率。

核心要点： 离散随机变量处理的是可数的结果。二项分布是针对具有重复、独立二元试验的实验所使用的一种特定且广泛应用的分布。

第 4 节：正态分布 (SL & HL)

正态分布可以说是统计学中最重要的一种分布。它用于模拟连续数据，这些数据的数值往往对称地聚集在平均值周围（例如：人类身高、考试成绩、测量误差）。

4.1 正态分布的特征

它是一种连续型概率分布。
它呈钟形，且关于平均值 ($\mu$) 对称。
平均数、中位数和众数都相等。
它由两个参数定义：平均值 ($\mu$) 和标准差 ($\sigma$)。 $$X \sim N(\mu, \sigma^2)$$

4.2 标准化 (Z 分数)

由于每个正态分布都由其平均值和标准差决定，我们可以通过 Z 分数将任何正态分布转换为标准正态分布 $Z \sim N(0, 1)$。

Z 分数衡量观测值 $x$ 距离平均值 $\mu$ 有多少个标准差。 $$Z = \frac{x - \mu}{\sigma}$$
我们使用 Z 分数通过 GDC 功能（或在较旧的语境下通过标准正态表）来求概率。

4.3 计算正态概率

由于正态分布是连续的，取任意一个确切单值的概率为零，即 $P(X=x) = 0$。

我们只计算一个范围内的概率：

$$P(a < X < b) = P(a \le X \le b)$$

处理步骤：

确定 $\mu$ 和 $\sigma$。
列出所需的概率（例如：$P(X > 50)$）。
使用 GDC 的 Normal CDF 功能，输入下界、上界、平均值和标准差。

4.4 反向正态分布问题

有时题目会给出概率（曲线下的面积），让你求对应的 $x$ 或 $z$ 值。

处理步骤：

画出钟形曲线并标出给定的面积。
判断该面积是在未知值 $k$ 的左侧还是右侧。（GDC 的 Inverse Normal 函数通常要求输入左侧的面积）。
使用 Inverse Normal 函数，输入面积、平均值和标准差来求出未知值 $k$。

核心要点： 正态分布是连续统计学的骨架。掌握 Z 分数转换以及正确使用 GDC 的功能（Normal CDF 和 Inverse Normal）至关重要。

第 5 节：HL 扩展 - 连续随机变量与 PDF

对于 HL 学生，我们将连续分布（如正态分布）的概念通过微积分来定义。这为我们提供了在连续设定下概率如何运作的深入分析性理解。

5.1 概率密度函数 (PDF)

连续随机变量 $X$ 由其概率密度函数 $f(x)$ 定义。该函数描述了变量落在某个范围内的可能性。

关键条件： 要使 $f(x)$ 在定义域 $[a, b]$ 内成为有效的 PDF，曲线下的总面积必须为 1。

$$\int_{a}^{b} f(x) dx = 1$$

5.2 作为面积的概率（积分）

由于我们无法计算单点的概率，我们通过寻找曲线下的面积来计算 $X$ 落在区间 $[c, d]$ 内的概率，即使用定积分：

$$P(c < X < d) = \int_{c}^{d} f(x) dx$$

这是 HL 统计学的分析核心！ 我们将概率（面积）直接与微积分（积分）联系了起来。

5.3 累积分布函数 (CDF)

累积分布函数 $F(x)$ 给出了随机变量 $X$ 小于或等于特定值 $x$ 的概率。

$$F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt$$

其中 $t$ 仅是一个积分的虚变量。

PDF 与 CDF 之间的基本联系

由于 CDF 是 PDF 的积分，因此 PDF 必须是 CDF 的导数：

对 CDF 微分得到 PDF： $$f(x) = F'(x)$$

这种关系允许你在两个函数之间进行转换。

5.4 连续随机变量的期望值 (HL)

与离散随机变量相似，期望值可以通过积分求得，而不是求和：

$$E(X) = \mu = \int_{-\infty}^{\infty} x \cdot f(x) dx$$

如果定义域受限，例如在 $[a, b]$ 内，则积分上下限变为 $a$ 和 $b$。

HL 核心要点： 在连续概率中，PDF $f(x)$ 是你的出发点。所有的概率（面积）和期望值都可以使用积分微积分工具求得。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。