欢迎来到统计分布的世界!

在本章中,我们将探索如何运用数学模型来预测现实生活中事件发生的可能性。无论是抛硬币出现正面的次数,还是房间内人群的平均身高,统计分布都能协助我们理解身边的“随机性”。

在研读完这份笔记后,你将能灵活决定使用哪种模型,并像专业人士一样计算概率。如果一开始看到很多新符号感到困惑,请别担心——我们会一步一步为你拆解!

1. 基础概念:离散与连续

在进入具体模型之前,我们必须先厘清处理的是哪种类型的数据。在统计学中,数据通常分为两大类:

1. 离散数据 (Discrete Data): 透过计数得到的数值。例如,你有几个兄弟姐妹,或是比赛中入球的数量。你不可能有 2.5 个兄弟姐妹!
2. 连续数据 (Continuous Data): 透过测量得到的数值。例如,身高、体重或时间。这些数值在某个区间内可以是任何值(例如 172.53 cm)。

快速复习:
- 需要计数? 使用离散分布(例如二项分布 Binomial Distribution)。
- 需要测量? 使用连续分布(例如正态分布 Normal Distribution)。

2. 二项分布(离散)

当你进行固定次数的试验,并寻求“成功”或“失败”的结果时,就会用到二项分布。

何时可以使用?“BINS”口诀

要使用二项分布模型,情况必须满足以下四个条件:

B – Binary(二元性): 只有两种可能的结果(成功或失败)。
I – Independent(独立性): 每次试验互不影响(例如抛硬币)。
N – Number(固定次数): 试验总次数 (\(n\)) 是固定的。
S – Success(成功率): 每次试验中,成功的概率 (\(p\)) 保持不变。

标示法

我们这样写: \(X \sim B(n, p)\)

例子:如果你抛一枚均匀硬币 10 次,\(n=10\),\(p=0.5\)。我们写作 \(X \sim B(10, 0.5)\)。

计算概率

要找出刚好出现 \(r\) 次成功的概率,我们使用以下公式:
\(P(X = r) = \binom{n}{r} \times p^r \times (1-p)^{n-r}\)

分步例子:
掷骰子 5 次,刚好掷出两次“6点”的概率是多少?
1. 找出 \(n\):共掷 5 次,所以 \(n = 5\)。
2. 找出 \(p\):掷出 6 点的概率是 \(1/6\)。
3. 找出 \(r\):我们想要刚好 2 次成功,所以 \(r = 2\)。
4. 代入公式:\(P(X=2) = \binom{5}{2} \times (1/6)^2 \times (5/6)^3\)。

常见错误: 忘记所有概率总和必须为 1。如果成功的概率是 \(p\),那么失败的概率永远是 \(1 - p\)(通常记作 \(q\))。

重点总结:

二项分布用于在固定次数的独立试验中计算成功次数

3. 正态分布(连续)

正态分布就是著名的“钟形曲线”。它适用于那些集中在中心平均值附近的数据,例如鞋码或新生儿体重。

主要特征

1. 对称性: 左侧是右侧的镜像。
2. 平均值 (\(\mu\)): 这是曲线的最高点。平均值、中位数和众数全都相同!
3. 标准差 (\(\sigma\)): 这代表钟形曲线的“分散程度”。较大的 \(\sigma\) 表示钟形宽而平坦;较小的 \(\sigma\) 表示钟形高而瘦窄。
4. 反曲点: 出现在距离平均值一个标准差的位置 (\(\mu \pm \sigma\))。这是曲线从“向下弯”转变为“向外弯”的地方。

标示法

我们这样写: \(X \sim N(\mu, \sigma^2)\)

你知道吗? 因为它是一条连续曲线,曲线下的面积即代表概率。整条曲线下的总面积永远刚好等于 1

使用计算器

在 AQA Paper 3 中,我们会使用计算器的统计功能,而不是直接运算正态分布公式。
- 使用 NormalCD 来找出两个数值之间的概率(例如:“一名学生身高在 160cm 至 170cm 之间的概率是多少?”)。
- 使用 Inverse Normal 来反向操作(例如:“如果要进入最高的 5%,一名学生必须有多高?”)。

类比: 把正态分布想像成一座山丘。大部分人站在山顶(平均值附近)。当你远离中心,那里的人数就会越来越少。

重点总结:

正态分布由其平均值方差定义,且具备完美的对称性

4. 选择正确模型 (N3)

在考试中,你常需要解释为何选择特定的分布。

选择二项分布,如果:
- 你在计算“获胜”的次数。
- 试验次数固定。
- 结果是独立的。

选择正态分布,如果:
- 数据是连续的(测量值)。
- 数据围绕平均值对称分布。
- 数据极少出现远离平均值的极端离群值。

5. 分布之间的联系

课程要求了解这两个模型之间的关系。在特定条件下,二项分布看起来会非常像正态分布。具体来说,当试验次数很多 (\(n\)) 且概率 (\(p\)) 接近 0.5 时,二项分布的条形图会形成完美的钟形!

快速复习箱:
- 二项分布: \(P(X=r)\) 用于寻找一个确切数值的概率。
- 正态分布: \(P(X=x)\) 永远为 0!我们只能计算一个区间的概率(例如 \(P(X < 10)\))。
- 标准差: 衡量分散程度。数值小代表数据稳定,数值大代表数据变异度高。

摘要核对清单

- 我能解释二项分布的 BINS 条件吗?
- 我能运用计算器找出正态分布的概率吗?
- 我知道正态曲线下的总面积等于 1 吗?
- 我能从 \(N(10, 4)\) 中找出平均值和标准差吗? (注意:第二个数是 \(\sigma^2\),所以 \(\sigma = 2\))

如果一开始觉得很棘手,不用担心!掌握分布最好的方法就是多用计算器练习。只要熟悉了菜单操作,数学就会变得简单得多!