欢迎来到常态分布的世界!

你有没有留意过,大多数人的身高都处于平均水平,而极高或极矮的人却寥寥无几?又或者,袋子里的苹果重量大多相近,只有极少数异常值?这种自然界中的规律被称为常态分布(Normal Distribution),人们常把它称为“钟形曲线”(Bell Curve)。

在这一章,我们将学习如何利用数学来模拟这些现实生活中的规律。如果统计学让你觉得有点抽象,别担心——一旦你看懂了这些视觉图案,一切就会豁然开朗!

1. 连续随机变量

在我们深入研究曲线之前,首先要明白我们在测量什么。与二项分布(计算“有多少个”)不同,常态分布处理的是连续随机变量(Continuous Random Variables)

  • 离散(二项分布):可数的事物(例如:学生人数、掷硬币出现正面的次数)。
  • 连续(常态分布):可测量且能在某个范围内取任何值的事物(例如:你的精确身高、跑完比赛所花的时间、巧克力的重量)。

重点提示:如果你是用尺、磅秤或秒表测量出来的数值,它很可能就是一个连续变量!

2. 常态分布:传说中的“钟形曲线”

常态分布由两个重要的参数定义:

  1. 平均值(Mean,\(\mu\)):曲线的中心(平均数)。
  2. 变异数(Variance,\(\sigma^2\)):数据分散的程度。(注:\(\sigma\) 为标准差,Standard Deviation)。

我们将其写作:\(X \sim N(\mu, \sigma^2)\)

钟形曲线的性质:

  • 对称性:左侧是右侧的镜像。最高峰正好位于平均值(\(\mu\))处。
  • 总面积 = 1:因为所有可能结果的总概率必须等于 1(或 100%)。
  • 渐近线:曲线的“尾巴”会越来越接近横轴,但永远不会真正触碰到它。

比喻:把曲线想象成一堆沙。大部分沙子堆在中间的尖顶(平均值),随着你向左或向右移动,沙子会逐渐变得稀疏。

快速回顾:

如果 \(X \sim N(50, 25)\),那么平均值是 50,变异数是 25。这意味着标准差(\(\sigma\))为 \(\sqrt{25} = 5\)。

3. 标准常态分布(Z)

由于 \(\mu\) 和 \(\sigma\) 有无数种组合,数学家创造了一条“黄金标准”曲线来简化计算,这就是标准常态分布,通常用字母 \(Z\) 表示。

对于 \(Z\)-分布:
\(Z \sim N(0, 1)\)(平均值 = 0,变异数 = 1)

标准化公式:

要将任何“常态”值(\(x\))转换为“标准”值(\(z\)),我们使用:

\(Z = \frac{X - \mu}{\sigma}\)

这告诉你该数值距离平均值有多少个标准差。
- 正 \(Z\) 值:代表该值高于平均。
- 负 \(Z\) 值:代表该值低于平均。

4. 求取概率与数值

在 H1 数学中,你主要会使用图形计算器(Graphing Calculator, GC)来求取概率。你不需要进行复杂的积分计算!

A. 求取概率 \(P(X < x_1)\)

使用 GC 上的 normCdf 功能。你需要输入下限(Lower Bound)、上限(Upper Bound)、\(\mu\) 和 \(\sigma\)。

常见错误:学生经常忘记 GC 要求输入的是 \(\sigma\)(标准差),但题目给出的可能是 \(\sigma^2\)(变异数)。在输入之前,请务必先将变异数开根号!

B. 已知概率求取数值 \(x_1\)

如果题目给出面积(概率)并要求找出“分界值”,请使用 GC 上的 invNorm 功能。

对称之美:

因为曲线是完美对称的:
1. \(P(X > \mu) = 0.5\)
2. \(P(X < \mu - a) = P(X > \mu + a)\)
3. \(P(X < x) = 1 - P(X > x)\)

你知道吗?大约 68% 的常态分布数据都集中在平均值左右 1 个标准差范围内。约 95% 的数据落在 2 个标准差范围内!

5. 随机变量的线性组合

有时候,我们需要将变量相加或相减。例如,如果一杯咖啡的重量(\(X\))和一只杯碟的重量(\(Y\))都呈常态分布,那么它们的总重量(\(X+Y\))的分布为何?

A. 单一变量的缩放:\(aX + b\)

如果 \(X \sim N(\mu, \sigma^2)\),那么对于新变量 \(W = aX + b\):

  • 新平均值: \(E(aX + b) = aE(X) + b\)
  • 新变异数: \(Var(aX + b) = a^2Var(X)\)

小贴士:留意一下,“+ b”会影响平均值,但在变异数中却消失了!将整个曲线向左或向右平移,并不会改变其“分散程度”。另外,计算变异数时,记得要将系数 “a” 平方。

B. 结合两个独立变量:\(aX + bY\)

如果 \(X\) 和 \(Y\) 是相互独立的:

  • 新平均值: \(E(aX + bY) = aE(X) + bE(Y)\)
  • 新变异数: \(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)

关键法则:当变量相减(例如 \(X - Y\))时,你仍然是将变异数相加
\(Var(X - Y) = Var(X) + Var(Y)\)

为什么?因为将两个具有不确定性的事物结合起来,总是会带来更多的不确定性(分散程度),永远不会减少。

重点总结:

平均值随算式符号改变(相加则加,相减则减)。变异数永远相加,并且永远对系数进行平方

6. 总结与成功小贴士

  • 绘制曲线:一定要画出简易的钟形曲线,并涂抹出你想要寻找的区域。这能有效防止低级错误!
  • 检查参数:认真阅读题目——题目给的是 \(\sigma\) 还是 \(\sigma^2\)?
  • \(Z\)-分数是你的好伙伴:如果平均值或变异数未知,你必须先标准化为 \(Z\) 才能解决问题。
  • 独立性:只有当变量相互独立时,你才能将变异数相加。检查题目中是否包含“独立”这个关键词。

如果一开始觉得有点难也不要担心!常态分布是最具规律性的课题之一。只要掌握了 GC 的操作步骤和对称规则,你就能够攻克几乎所有相关题目!