Normal distribution - Mathematics (8865) - GCE A-Level - Higher 1 (H1)

欢迎来到常态分布的世界！

你有没有留意过，大多数人的身高都处于平均水平，而极高或极矮的人却寥寥无几？又或者，袋子里的苹果重量大多相近，只有极少数异常值？这种自然界中的规律被称为常态分布（Normal Distribution），人们常把它称为“钟形曲线”（Bell Curve）。

在这一章，我们将学习如何利用数学来模拟这些现实生活中的规律。如果统计学让你觉得有点抽象，别担心——一旦你看懂了这些视觉图案，一切就会豁然开朗！

1. 连续随机变量

在我们深入研究曲线之前，首先要明白我们在测量什么。与二项分布（计算“有多少个”）不同，常态分布处理的是连续随机变量（Continuous Random Variables）。

离散（二项分布）：可数的事物（例如：学生人数、掷硬币出现正面的次数）。
连续（常态分布）：可测量且能在某个范围内取任何值的事物（例如：你的精确身高、跑完比赛所花的时间、巧克力的重量）。

重点提示：如果你是用尺、磅秤或秒表测量出来的数值，它很可能就是一个连续变量！

2. 常态分布：传说中的“钟形曲线”

常态分布由两个重要的参数定义：

平均值（Mean，\(\mu\)）：曲线的中心（平均数）。
变异数（Variance，\(\sigma^2\)）：数据分散的程度。（注：\(\sigma\) 为标准差，Standard Deviation）。

我们将其写作：\(X \sim N(\mu, \sigma^2)\)

钟形曲线的性质：

对称性：左侧是右侧的镜像。最高峰正好位于平均值（\(\mu\)）处。
总面积 = 1：因为所有可能结果的总概率必须等于 1（或 100%）。
渐近线：曲线的“尾巴”会越来越接近横轴，但永远不会真正触碰到它。

比喻：把曲线想象成一堆沙。大部分沙子堆在中间的尖顶（平均值），随着你向左或向右移动，沙子会逐渐变得稀疏。

快速回顾：

如果 \(X \sim N(50, 25)\)，那么平均值是 50，变异数是 25。这意味着标准差（\(\sigma\)）为 \(\sqrt{25} = 5\)。

3. 标准常态分布（Z）

由于 \(\mu\) 和 \(\sigma\) 有无数种组合，数学家创造了一条“黄金标准”曲线来简化计算，这就是标准常态分布，通常用字母 \(Z\) 表示。

对于 \(Z\)-分布：
\(Z \sim N(0, 1)\)（平均值 = 0，变异数 = 1）

标准化公式：

要将任何“常态”值（\(x\)）转换为“标准”值（\(z\)），我们使用：

\(Z = \frac{X - \mu}{\sigma}\)

这告诉你该数值距离平均值有多少个标准差。
- 正 \(Z\) 值：代表该值高于平均。
- 负 \(Z\) 值：代表该值低于平均。

4. 求取概率与数值

在 H1 数学中，你主要会使用图形计算器（Graphing Calculator, GC）来求取概率。你不需要进行复杂的积分计算！

A. 求取概率 \(P(X < x_1)\)

使用 GC 上的 normCdf 功能。你需要输入下限（Lower Bound）、上限（Upper Bound）、\(\mu\) 和 \(\sigma\)。

常见错误：学生经常忘记 GC 要求输入的是 \(\sigma\)（标准差），但题目给出的可能是 \(\sigma^2\)（变异数）。在输入之前，请务必先将变异数开根号！

B. 已知概率求取数值 \(x_1\)

如果题目给出面积（概率）并要求找出“分界值”，请使用 GC 上的 invNorm 功能。

对称之美：

因为曲线是完美对称的：
1. \(P(X > \mu) = 0.5\)
2. \(P(X < \mu - a) = P(X > \mu + a)\)
3. \(P(X < x) = 1 - P(X > x)\)

你知道吗？大约 68% 的常态分布数据都集中在平均值左右 1 个标准差范围内。约 95% 的数据落在 2 个标准差范围内！

5. 随机变量的线性组合

有时候，我们需要将变量相加或相减。例如，如果一杯咖啡的重量（\(X\)）和一只杯碟的重量（\(Y\)）都呈常态分布，那么它们的总重量（\(X+Y\)）的分布为何？

A. 单一变量的缩放：\(aX + b\)

如果 \(X \sim N(\mu, \sigma^2)\)，那么对于新变量 \(W = aX + b\)：

新平均值： \(E(aX + b) = aE(X) + b\)
新变异数： \(Var(aX + b) = a^2Var(X)\)

小贴士：留意一下，“+ b”会影响平均值，但在变异数中却消失了！将整个曲线向左或向右平移，并不会改变其“分散程度”。另外，计算变异数时，记得要将系数 “a” 平方。

B. 结合两个独立变量：\(aX + bY\)

如果 \(X\) 和 \(Y\) 是相互独立的：

新平均值： \(E(aX + bY) = aE(X) + bE(Y)\)
新变异数： \(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)

关键法则：当变量相减（例如 \(X - Y\)）时，你仍然是将变异数相加！
\(Var(X - Y) = Var(X) + Var(Y)\)

为什么？因为将两个具有不确定性的事物结合起来，总是会带来更多的不确定性（分散程度），永远不会减少。

重点总结：

平均值随算式符号改变（相加则加，相减则减）。变异数永远相加，并且永远对系数进行平方。

6. 总结与成功小贴士

绘制曲线：一定要画出简易的钟形曲线，并涂抹出你想要寻找的区域。这能有效防止低级错误！
检查参数：认真阅读题目——题目给的是 \(\sigma\) 还是 \(\sigma^2\)？
\(Z\)-分数是你的好伙伴：如果平均值或变异数未知，你必须先标准化为 \(Z\) 才能解决问题。
独立性：只有当变量相互独立时，你才能将变异数相加。检查题目中是否包含“独立”这个关键词。

如果一开始觉得有点难也不要担心！常态分布是最具规律性的课题之一。只要掌握了 GC 的操作步骤和对称规则，你就能够攻克几乎所有相关题目！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。