Normal distribution - Mathematics (9758) - GCE A-Level - Higher 2 (H2)

欢迎来到钟形曲线的世界！

在本章中，我们将探讨统计学中最重要的概念之一：正态分布 (Normal Distribution)。你可能听过它被称为“钟形曲线”，这是因为它具有独特的形状。无论是身高、考试分数，还是甚至一包薯片的重量，现实世界中许多事物都遵循这种规律。看完这些笔记后，你将能够掌握这些曲线背后的数学原理，并像专家一样利用它们来预测概率！

如果起初觉得这些内容有点抽象，不用担心。我们会一步一步来，很快你就会发现正态分布无处不在！

1. 理解连续随机变量

在深入探讨正态分布之前，我们需要先了解什么是连续随机变量 (Continuous Random Variable)。与离散 (Discrete) 变量（你可以数出具体数值，如 0, 1, 2, 3）不同，连续变量是指你可以测量的事物。

可以这样理解：
如果你计算班上的学生人数，那是离散的（你不可能有 20.5 个学生）。
如果你测量这些学生的身高，那就是连续的（学生身高可能是 170 厘米、170.1 厘米，甚至是 170.154 厘米）。

关键区别： 对于连续变量，变量等于特定数值的概率为零 \( (P(X = x) = 0) \)。相反，我们通常寻求的是变量落在某个范围内的概率，例如 \( P(160 < X < 170) \)。

快速复习：

离散：可数的（例如：蓝色笔的数量）。
连续：可测量的（例如：跑完一场比赛所需的时间）。
我们通过计算曲线下的面积来求出连续变量的概率。

2. 什么是正态分布？

正态分布是一种特定类型的连续概率分布。我们记作：\( X \sim N(\mu, \sigma^2) \)。

有两个“大佬”控制着这条曲线的外观：

平均值 (\(\mu\))： 这是曲线的中心，它告诉你峰值位于何处。
方差 (\(\sigma^2\))： 这告诉你曲线有多“分散”。(注意：\(\sigma\) 是标准差)。

正态曲线的特性：

对称性： 左侧是右侧的镜像。
钟形： 中间有一个峰值。
“三者相等”： 在完美的正态分布中，平均值 = 中位数 = 众数。
总面积 = 1： 因为任何事件的总概率必须等于 100%。

你知道吗？ 因为曲线是对称的，所以平均值以下刚好占 0.5 (或 50%) 的数据，平均值以上也占 0.5！

重点总结： 正态分布完全由其平均值和方差定义。只要知道这两个参数，你就掌握了整条曲线。

3. 标准正态分布 (\(Z\))

由于 \(\mu\) 和 \(\sigma^2\) 有无限种组合，数学家创造了一种“万用翻译机”，称为标准正态分布，用字母 \(Z\) 表示。

标准正态分布总是满足：
平均值 \((\mu) = 0\)
方差 \((\sigma^2) = 1\)
因此，我们记作：\( Z \sim N(0, 1) \)。

标准化公式：

要将任何值 \(X\) 转换为 \(Z\)-分数，我们使用以下公式：
\( Z = \frac{X - \mu}{\sigma} \)

类比： 把 \(X\) 想像成本地货币（如日元），把 \(Z\) 想像成全球通用货币（如美元）。这个公式就是“汇率”，让你可以把不同的曲线放在同一个尺度下进行比较。

记忆小贴士：

“X 是定位点，减去平均值，再除以离散程度（标准差）。”

4. 使用你的图形计算器 (GC)

在 H2 课程大纲中，你不需要手动计算这些概率。你的 GC 是你最好的朋友！

A. 求概率：normCDF

当你拥有数值并想求概率（面积）时使用。
语法：normCDF(下限, 上限, \(\mu\), \(\sigma\))

B. 求数值：invNorm

当题目给予概率（左侧面积）并需要求数值 \(x\) 时使用。
语法：invNorm(左侧面积, \(\mu\), \(\sigma\))

常见错误： 务必检查题目给的是方差 (\(\sigma^2\)) 还是标准差 (\(\sigma\))。GC 需要的是标准差 \(\sigma\)。如果题目给出 \(\sigma^2 = 16\)，你输入时必须换算成 \(\sigma = 4\)！

5. 正态变量的线性变换

有时我们会想改变变量。例如，如果 \(X\) 是员工的日薪，如果每个人都获得 10 元奖金且薪水加倍，会发生什么事？

若 \( X \sim N(\mu, \sigma^2) \)，且我们建立一个新变量 \( Y = aX + b \)：

新平均值： \( E(aX + b) = aE(X) + b \)
新方差： \( Var(aX + b) = a^2Var(X) \)

等等，为什么是 \(a^2\)？ 方差衡量的是面积或离散程度。如果你将长度加倍 (\(a=2\))，面积会增加 \(2^2 = 4\) 倍。此外，请注意加上常数 (\(b\)) 不会改变方差。如果每个人都向右移动 10 步，群体的离散程度依然与原来相同！

重点总结： 缩放 (\(a\)) 会同时影响平均值和方差。平移 (\(b\)) 只会影响平均值。

6. 独立变量的线性组合

如果我们把两个不同的独立正态变量加在一起会怎样？（例如：箱子的重量 \(X\) 和里面水果的重量 \(Y\)）。

若 \( X \sim N(\mu_X, \sigma_X^2) \) 和 \( Y \sim N(\mu_Y, \sigma_Y^2) \) 是独立的：

平均值法则：

\( E(aX + bY) = aE(X) + bE(Y) \)

方差法则：

\( Var(aX + bY) = a^2Var(X) + b^2Var(Y) \)

关键点： 即使你是将两个变量相减 \( (X - Y) \)，你也必须相加方差！
\( Var(X - Y) = Var(X) + Var(Y) \)

为什么？ 把方差想像成“不确定性”。如果你结合两个不确定的事物，总体的不确定性总是会增加，无论你是相加还是相减实际数值。

7. 总结清单与专业建议

在练习习题之前，请记住以下建议：

检查独立性： 只有在变量相互独立时，才能将方差相加。
画出曲线： 在解决概率问题时，务必画出一个简单的钟形曲线并标示出你要求的区域。这能防止粗心错误！
符号标记： 小心 \( N(\mu, \sigma^2) \)。许多题目写成 \( N(50, 4) \)，请务必问自己：“这 4 是方差还是标准差？”（通常是方差）。
对称性： 记住 \( P(X > \mu + k) = P(X < \mu - k) \)。利用这一点，在没有 GC 的情况下也能解决棘手问题。

做得好！你已经掌握了正态分布的精髓。这看起来像是一堆公式，但通过练习，使用 GC 和标准化公式将会变成你的本能。继续努力！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。