欢迎来到钟形曲线的世界!

在本章中,我们将探讨统计学中最重要的概念之一:正态分布 (Normal Distribution)。你可能听过它被称为“钟形曲线”,这是因为它具有独特的形状。无论是身高、考试分数,还是甚至一包薯片的重量,现实世界中许多事物都遵循这种规律。看完这些笔记后,你将能够掌握这些曲线背后的数学原理,并像专家一样利用它们来预测概率!

如果起初觉得这些内容有点抽象,不用担心。我们会一步一步来,很快你就会发现正态分布无处不在!


1. 理解连续随机变量

在深入探讨正态分布之前,我们需要先了解什么是连续随机变量 (Continuous Random Variable)。与离散 (Discrete) 变量(你可以数出具体数值,如 0, 1, 2, 3)不同,连续 变量是指你可以测量的事物。

可以这样理解:
如果你计算班上的学生人数,那是离散的(你不可能有 20.5 个学生)。
如果你测量这些学生的身高,那就是连续的(学生身高可能是 170 厘米、170.1 厘米,甚至是 170.154 厘米)。

关键区别: 对于连续变量,变量等于特定数值的概率为零 \( (P(X = x) = 0) \)。相反,我们通常寻求的是变量落在某个范围内的概率,例如 \( P(160 < X < 170) \)。

快速复习:
  • 离散:可数的(例如:蓝色笔的数量)。
  • 连续:可测量的(例如:跑完一场比赛所需的时间)。
  • 我们通过计算曲线下的面积来求出连续变量的概率。

2. 什么是正态分布?

正态分布是一种特定类型的连续概率分布。我们记作:\( X \sim N(\mu, \sigma^2) \)

有两个“大佬”控制着这条曲线的外观:

  1. 平均值 (\(\mu\)): 这是曲线的中心,它告诉你峰值位于何处。
  2. 方差 (\(\sigma^2\)): 这告诉你曲线有多“分散”。(注意:\(\sigma\) 是标准差)。

正态曲线的特性:

  • 对称性: 左侧是右侧的镜像。
  • 钟形: 中间有一个峰值。
  • “三者相等”: 在完美的正态分布中,平均值 = 中位数 = 众数
  • 总面积 = 1: 因为任何事件的总概率必须等于 100%。

你知道吗? 因为曲线是对称的,所以平均值以下刚好占 0.5 (或 50%) 的数据,平均值以上也占 0.5!

重点总结: 正态分布完全由其平均值和方差定义。只要知道这两个参数,你就掌握了整条曲线。


3. 标准正态分布 (\(Z\))

由于 \(\mu\) 和 \(\sigma^2\) 有无限种组合,数学家创造了一种“万用翻译机”,称为标准正态分布,用字母 \(Z\) 表示。

标准正态分布总是满足:
平均值 \((\mu) = 0\)
方差 \((\sigma^2) = 1\)

因此,我们记作:\( Z \sim N(0, 1) \)

标准化公式:

要将任何值 \(X\) 转换为 \(Z\)-分数,我们使用以下公式:
\( Z = \frac{X - \mu}{\sigma} \)

类比: 把 \(X\) 想像成本地货币(如日元),把 \(Z\) 想像成全球通用货币(如美元)。这个公式就是“汇率”,让你可以把不同的曲线放在同一个尺度下进行比较。

记忆小贴士:

“X 是定位点,减去平均值,再除以离散程度(标准差)。”


4. 使用你的图形计算器 (GC)

在 H2 课程大纲中,你不需要手动计算这些概率。你的 GC 是你最好的朋友!

A. 求概率:normCDF

当你拥有数值并想求概率(面积)时使用。
语法:normCDF(下限, 上限, \(\mu\), \(\sigma\))

B. 求数值:invNorm

当题目给予概率(左侧面积)并需要求数值 \(x\) 时使用。
语法:invNorm(左侧面积, \(\mu\), \(\sigma\))

常见错误: 务必检查题目给的是方差 (\(\sigma^2\)) 还是标准差 (\(\sigma\))。GC 需要的是标准差 \(\sigma\)。如果题目给出 \(\sigma^2 = 16\),你输入时必须换算成 \(\sigma = 4\)!


5. 正态变量的线性变换

有时我们会想改变变量。例如,如果 \(X\) 是员工的日薪,如果每个人都获得 10 元奖金且薪水加倍,会发生什么事?

若 \( X \sim N(\mu, \sigma^2) \),且我们建立一个新变量 \( Y = aX + b \):

  • 新平均值: \( E(aX + b) = aE(X) + b \)
  • 新方差: \( Var(aX + b) = a^2Var(X) \)

等等,为什么是 \(a^2\)? 方差衡量的是面积或离散程度。如果你将长度加倍 (\(a=2\)),面积会增加 \(2^2 = 4\) 倍。此外,请注意加上常数 (\(b\)) 不会改变方差。如果每个人都向右移动 10 步,群体的离散程度依然与原来相同!

重点总结: 缩放 (\(a\)) 会同时影响平均值和方差。平移 (\(b\)) 只会影响平均值。


6. 独立变量的线性组合

如果我们把两个不同的独立正态变量加在一起会怎样?(例如:箱子的重量 \(X\) 和里面水果的重量 \(Y\))。

若 \( X \sim N(\mu_X, \sigma_X^2) \) 和 \( Y \sim N(\mu_Y, \sigma_Y^2) \) 是独立的

平均值法则:

\( E(aX + bY) = aE(X) + bE(Y) \)

方差法则:

\( Var(aX + bY) = a^2Var(X) + b^2Var(Y) \)

关键点: 即使你是将两个变量相减 \( (X - Y) \),你也必须相加方差!
\( Var(X - Y) = Var(X) + Var(Y) \)

为什么? 把方差想像成“不确定性”。如果你结合两个不确定的事物,总体的不确定性总是会增加,无论你是相加还是相减实际数值。


7. 总结清单与专业建议

在练习习题之前,请记住以下建议:

  • 检查独立性: 只有在变量相互独立时,才能将方差相加。
  • 画出曲线: 在解决概率问题时,务必画出一个简单的钟形曲线并标示出你要求的区域。这能防止粗心错误!
  • 符号标记: 小心 \( N(\mu, \sigma^2) \)。许多题目写成 \( N(50, 4) \),请务必问自己:“这 4 是方差还是标准差?”(通常是方差)。
  • 对称性: 记住 \( P(X > \mu + k) = P(X < \mu - k) \)。利用这一点,在没有 GC 的情况下也能解决棘手问题。

做得好!你已经掌握了正态分布的精髓。这看起来像是一堆公式,但通过练习,使用 GC 和标准化公式将会变成你的本能。继续努力!