M1 复习笔记:正态分布的应用

您好!欢迎来到统计学中最实用课题之一的复习笔记:正态分布的应用

您有没有想过,公司如何知道每种尺码的T恤要生产多少件,或者老师如何判断一份新测验的“好”分数是多少?答案往往藏在正态分布中,它也以“钟形曲线”的别称而闻名。

在本章中,我们将超越理论层面,学会如何运用正态分布来解决现实世界的问题。我们会学会如何计算概率(例如学生考获90分以上的机会),以及如何寻找特定数据点(例如考入前10%所需的分数)。如果一开始觉得有些困难,请别担心,我们会逐步拆解!


快速回顾:什么是标准化?

在我们深入新问题之前,让我们先回顾最重要的工具:标准化。大多数现实生活中的数据都是正态分布的,但它们都有自己独特的平均值($$\mu$$)和标准差($$\sigma$$)。这就好比每个国家都有自己的货币。为了方便比较,我们需要将它们转换成一个共同的标准。

在统计学中,我们的“共同标准”就是标准正态分布,它的平均值永远是0,标准差永远是1。我们将其表示为 $$Z \sim N(0, 1)$$.

将任何值 (X) 从正态分布 $$N(\mu, \sigma^2)$$ 转换为标准值 (Z) 的公式就是z分数公式

$$Z = \frac{X - \mu}{\sigma}$$

其中:

  • X 是特定数据点(例如,学生的身高)。
  • $$\mu$$ (mu) 是分布的平均值。
  • $$\sigma$$ (sigma) 是分布的标准差。
常见错误提示!

问题通常会提供方差($$\sigma^2$$),而不是标准差($$\sigma$$)。记住,在使用公式之前,务必先将方差开方!如果 $$X \sim N(100, 25)$$,那么 $$\mu = 100$$ 而 $$\sigma = \sqrt{25} = 5$$。


第一部分:从数值寻找概率(“正向问题”)

这是最常见的问题类型。您会获得一个(或多个)X值,然后需要寻找与之相关的概率。

例题:某学校学生的身高呈正态分布,平均值为165厘米,标准差为5厘米。随机抽取一名学生,其身高矮于172厘米的概率是多少?

寻找概率的步骤指南

让我们一起解决这个问题。过程总是相同的:X → Z → 概率

第一步:识别变量。
我们已知身高的正态分布 X,所以 $$X \sim N(165, 5^2)$$。
平均值,$$\mu = 165$$
标准差,$$\sigma = 5$$
我们感兴趣的值是 $$X = 172$$。我们想寻找 $$P(X < 172)$$。

第二步:将X值标准化为Z分数。
使用公式:$$Z = \frac{X - \mu}{\sigma} = \frac{172 - 165}{5} = \frac{7}{5} = 1.4$$所以,寻找 $$P(X < 172)$$ 与寻找 $$P(Z < 1.4)$$ 完全相同。

第三步:绘制曲线(非必要但强烈建议!)。
快速绘制一条钟形曲线。中心标记为0。标记Z分数(1.4在0的右边),并划定所需的区域。在这种情况下,需要划定1.4左边的所有区域。这有助于可视化答案!

第四步:使用标准正态分布表。
在表格中查找Z分数1.4。表格会提供Z分数左侧的面积,这正是 $$P(Z < 1.4)$$ 的意思。从表格中,$$P(Z < 1.4) = 0.9192$$。

因此,随机抽取一名学生,其身高矮于172厘米的概率是 0.919291.92%

处理不同类型的概率
  • 大于 ( > )
    例如,寻找 $$P(X > 172)$$
    我们知道曲线下的总面积是1。所以,$$P(X > 172) = 1 - P(X < 172)$$。
    根据我们的计算,这是 $$1 - 0.9192 = 0.0808$$。
  • 介乎两值之间 ( < X < )
    例如,寻找学生身高介乎160厘米和172厘米之间的概率,即 $$P(160 < X < 172)$$。
    首先,将两个X值都转换为Z分数。
    $$Z_1 = \frac{160 - 165}{5} = -1.0$$ $$Z_2 = \frac{172 - 165}{5} = 1.4$$ 所以我们需要寻找 $$P(-1.0 < Z < 1.4)$$。
    逻辑是:(大Z分数左侧的面积)-(小Z分数左侧的面积)
    $$P(-1.0 < Z < 1.4) = P(Z < 1.4) - P(Z < -1.0)$$
    使用表格和对称性($$P(Z < -1.0) = P(Z > 1.0) = 1 - P(Z < 1.0)$$),我们得到:
    $$0.9192 - (1 - 0.8413) = 0.9192 - 0.1587 = 0.7605$$
第一部分重点总结

要寻找概率,务必先将X值转换为Z分数。然后使用标准正态分布表。记住,表格给出的是左侧的面积。利用绘图和“总面积 = 1”的规则来寻找任何其他所需的面积。


第二部分:从概率寻找数值(“逆向问题”)

现在我们把问题反过来。您会获得一个概率(曲线下的面积),然后需要寻找与之对应的特定X值。

例题:一次测验的成绩呈正态分布,平均值为70,方差为64。要获得“A”级成绩,学生必须考获前10%。获得“A”级成绩所需的最低分数是多少?

寻找数值的步骤指南

这次,过程是:概率 → Z → X

第一步:识别变量和所需面积。
成绩X的分布为 $$X \sim N(70, 64)$$。
平均值,$$\mu = 70$$
方差,$$\sigma^2 = 64 \implies$$ 标准差,$$\sigma = \sqrt{64} = 8$$。(请勿忘记这一步骤!)
我们正在寻找分数“x”,使得考获高于它的概率是10%(即0.10)。所以,我们需要寻找“x”,其中 $$P(X > x) = 0.10$$。

第二步:绘制曲线并寻找表格可读取的面积。
绘制钟形曲线。“前10%”是右侧很小的一块区域。表格读取的是左侧的面积。如果我们z分数右侧的面积是0.10,那么左侧的面积就是 $$1 - 0.10 = 0.90$$。所以我们需要寻找z分数,其中 $$P(Z < z) = 0.90$$。

第三步:反向使用标准正态分布表。
在表格中查找最接近0.9000的概率值。您会找到0.8997(对应Z=1.28)和0.9015(对应Z=1.29)等值。0.8997更为接近。所以,我们将使用相应的Z分数。
Z = 1.28(大约)。

第四步:将Z分数还原以寻找X值。
重新排列Z分数公式以解出X:$$X = \mu + Z\sigma$$
现在,代入数值:$$X = 70 + (1.28)(8) = 70 + 10.24 = 80.24$$

因此,获得“A”级成绩所需的最低分数是 80.24

第二部分重点总结

要从概率寻找数据值(X),首先弄清楚所需点的左侧面积。然后反向使用表格寻找该面积的Z分数,再利用“还原标准化”公式 $$X = \mu + Z\sigma$$ 转换回最终答案。


第三部分:综合应用——文字题

这就是您展现实力的时候了!现实世界的问题不会直接说“寻找P(X > 50)”。您需要阅读题目,提取关键信息,然后判断它是“正向”还是“逆向”问题。

解题策略
  1. 仔细阅读:情境是什么?(例如,体重、分数、时间)。
  2. 提取数值:平均值($$\mu$$)是什么?方差($$\sigma^2$$)或标准差($$\sigma$$)是什么?
  3. 确定目标:
    • 您是否获提供X值,并被要求寻找概率、百分比或比例? → 这是正向问题(X → Z → P)
    • 您是否获提供概率、百分比(如“前5%”)或比例,并被要求寻找特定数值、分数或量度? → 这是逆向问题(P → Z → X)
  4. 执行计划:按照第一部分或第二部分的步骤进行。
  5. 回答问题:撰写一个在问题情境中有意义的总结句。例如:“因此,最低体重是10.5公斤。”
您知道吗?

正态分布有时也被称为高斯分布,以著名数学家卡尔·弗里德里希·高斯的名字命名,他曾广泛使用它。然而,它最初是由亚伯拉罕·棣莫弗发现,作为二项分布的近似值。这说明即使在数学中,伟大的思想往往是建立于前人的努力之上!


继续练习和绘制曲线,您就能成为解决这些问题的高手。祝您好运!