概率分佈、期望值和方差

數學單元一 (微積分與統計) · 高中 (HKDSE) · 阅读约 4 分钟

M1 章节：概率分布、期望值与方差

大家好！欢迎来到统计学中最有趣的话题之一。如果你之前觉得概率有点抽象，不用担心。在本章中，我们会探讨概率分布，令这些概念更具体。我们将学习如何运用期望值来预测随机事件的“平均”结果，并使用方差来衡量结果的离散程度。

为何这很重要？它支撑着各种博弈游戏、保险政策，甚至金融投资背后的数学原理。学完这些，你将能够分析一个简单的游戏，并判断它是否值得一玩！

1. 离散概率分布：随机事件的“游戏规则”

什么是离散随机变量？

想象“随机变量”是一个变量（我们通常称之为 X），其数值由随机实验的结果决定。“离散”这个词只是指它只能取特定、可数的数值。你不会得到“半个”结果。

例子：设 X 为掷标准六面骰子所得的点数。X 可以是 1、2、3、4、5 或 6。它不可能是 2.5。
例子：设 Y 为掷硬币 3 次所得的正面向上的次数。Y 可以是 0、1、2 或 3。
类比：离散变量就像房间里的人数。你可以有 3 个人或 4 个人，但不能有 3.5 个人。

什么是概率分布？

一个概率分布就是一个表格、图形或公式，它将离散随机变量的每个可能值与其对应的概率链接起来。它就是该随机变量的完整“游戏规则”。

任何概率分布都有两条黄金法则：

概率必须介乎 0 和 1 之间。对于任何值 x，$$0 \le P(X=x) \le 1$$。
所有概率之和必须恰好是 1。 $$\sum P(X=x) = 1$$。（这表示我们已考虑了所有可能的结果。）

想象它像一个披萨：所有的披萨片（概率）加起来必须是一个完整的披萨！

表示概率分布

表示概率分布最常见的方法是使用一个简单的表格。

例子：一个不公平硬币

想象一个不公平的硬币，掷出正面的概率是 0.4。设 X 为掷两次硬币中正面向上的次数。X 的可能值为 0、1 或 2。

P(X=0) = P(反面反面) = 0.6 * 0.6 = 0.36
P(X=1) = P(正面反面或反面正面) = (0.4 * 0.6) + (0.6 * 0.4) = 0.24 + 0.24 = 0.48
P(X=2) = P(正正) = 0.4 * 0.4 = 0.16

我们可以将其表示在分布表中：

x 0 1 2
P(X = x) 0.36 0.48 0.16

让我们检查一下规则：所有概率都介乎 0 和 1 之间。如果我们把它们加起来：$$0.36 + 0.48 + 0.16 = 1.00$$。正确无误！

第一节重点提要

离散概率分布列出了随机事件所有可能的数值结果及其对应的概率。所有概率之和必须为 1。

2. 期望值 (E[X])：长远平均值

什么是期望值？

期望或期望值，记作 E[X]，是我们实验重复无限次后预期会得到的平均值。它是一种“加权平均”，其中较可能发生的结果影响较大。

重要提示：期望值可能不是单次试验中实际会出现的数字！例如，掷一次骰子的期望值是 3.5，但你不可能掷出 3.5。

类比：想象一个简单的游戏。你以 0.1 的概率赢取 10 元，以 0.9 的概率赢取 0 元。如果你玩这个游戏 100 次，你预期会赢取 10 次，总共 100 元。你每次游戏的平均赢取金额将是 $100 / 100 = $1。期望值是 1 元。

计算期望值

公式简单且直观。你将每个结果乘以其概率，然后将它们全部加起来。

公式： $$E[X] = \sum x \cdot P(X=x)$$

逐步示例

让我们找出上述不公平硬币例子中，正面向上的期望次数。

x 0 1 2
P(X = x) 0.36 0.48 0.16

将每个 x 乘以其 P(X=x)：
(0 * 0.36) = 0
(1 * 0.48) = 0.48
(2 * 0.16) = 0.32
将结果加总：
$$E[X] = 0 + 0.48 + 0.32 = 0.8$$

因此，平均而言，我们预期每次试验（两次掷硬币）会得到 0.8 次正面。

期望值的性质（实用捷径！）

这些规则使计算速度大大加快。设 a 和 b 为常数。

性质一： $$E[aX + b] = aE[X] + b$$

换句话说：如果你将每个结果乘以“a”并加上“b”，期望值也会被乘以“a”并加上“b”。

例子：一个游戏的派彩金额为 X（以元计），我们发现 E[X] = 5 元。游戏组织者决定将派彩金额加倍并收取 2 元服务费。新的派彩金额为 Y = 2X - 2。新的期望派彩是多少？

$$E[Y] = E[2X - 2] = 2E[X] - 2 = 2(5) - 2 = 8 元$$ 无需重新计算整个分布！

函数的期望值，E[g(X)]

有时我们对 X 的函数（例如 $$X^2$$）的期望值感兴趣。计算方法非常相似。

公式： $$E[g(X)] = \sum g(x) \cdot P(X=x)$$

为了找出 $$E[X^2]$$，我们只需在乘以概率之前将每个 x 值平方。这对于之后计算方差将会非常重要。

例子：找出 E[X²]

再次使用我们的不公平硬币例子：

$$E[X^2] = (0^2 \cdot 0.36) + (1^2 \cdot 0.48) + (2^2 \cdot 0.16)$$ $$E[X^2] = (0 \cdot 0.36) + (1 \cdot 0.48) + (4 \cdot 0.16)$$ $$E[X^2] = 0 + 0.48 + 0.64 = 1.12$$

常见错误警示：请注意，$$E[X^2] = 1.12$$ 与 $$(E[X])^2 = (0.8)^2 = 0.64$$ 并不相同。这是一个关键区别！

第二节重点提要

期望值 (E[X]) 是随机变量的理论长期平均值。计算方法是将所有结果的“结果 × 概率”相加。其性质，特别是 $$E[aX + b] = aE[X] + b$$，是非常强大的捷径。

3. 方差 (Var(X))：衡量离散程度与风险

什么是方差？

期望值告诉我们分布的“中心”位置，而方差则告诉我们结果与该中心“偏离”的程度。它衡量了波动性或风险。

低方差意味着大多数结果都紧密地聚集在期望值周围。结果可预测且一致。
高方差意味着结果远离期望值。结果不可预测且具风险。

类比：两名学生，Amy 和 Ben，他们的平均考试分数（期望值）都是 80 分。

Amy 的分数：79、80、81、80。（低方差 — 非常稳定）
Ben 的分数：100、60、100、60。（高方差 — 波动很大！）

他们的平均分数相同，但表现却截然不同。方差捕捉了这种差异。

计算方差

方差有两种公式。一种适合理解概念，另一种则是实际计算时的最佳帮手。

公式一：定义式（适合理论理解）

设 $$\mu = E[X]$$。方差是与均值平方差的期望值。 $$Var(X) = E[(X-\mu)^2] = \sum (x-\mu)^2 \cdot P(X=x)$$ 这个公式在实际应用中效率较低。

公式二：计算公式（请用这个！）

这个几乎总是更快、更容易。

公式： $$Var(X) = E[X^2] - (E[X])^2$$

助记口诀：“平方的平均值，减去平均值的平方。”

逐步示例（使用快捷公式）

让我们计算不公平硬币例子的方差。我们在上一节已经完成了大部分繁重的工作！

回顾我们之前的结果：
$$E[X] = 0.8$$
$$E[X^2] = 1.12$$
将它们代入公式：
$$Var(X) = E[X^2] - (E[X])^2$$ $$Var(X) = 1.12 - (0.8)^2$$ $$Var(X) = 1.12 - 0.64 = 0.48$$

正面次数的方差是 0.48。

标准差

请注意，方差的单位是平方的（例如，平方元、平方次），这可能难以理解。为了解决这个问题，我们使用标准差，它就是方差的平方根。

公式： $$SD(X) = \sigma = \sqrt{Var(X)}$$

在我们的例子中，标准差是 $$\sqrt{0.48} \approx 0.693$$。这个值是原始单位（“次”），能更直接地表示离散程度。

方差的性质（更多超实用捷径！）

就像期望值一样，这些规则能省下大量时间。设 a 和 b 为常数。

性质一： $$Var(aX + b) = a^2 Var(X)$$

让我们来拆解一下：

为何“+ b”会消失？加上一个常数“b”会使整个分布平移，但并不会改变其离散程度。想象所有学生的考试分数都加了 10 分。平均分会增加 10 分，但最高分和最低分之间的差距保持不变。离散程度不变，所以方差也不变。
为何是“a²”？方差是基于平方差的。如果你将所有结果乘以“a”，那么它们与均值的距离也会被“a”缩放。当你将这些距离平方时，缩放因子就变成了“a²”。

例子：

一个游戏的派彩金额为 X，其方差 Var(X) = 4。组织者更改游戏规则，使新的派彩金额为 Y = 3X + 10。新的方差是多少？

$$Var(Y) = Var(3X + 10)$$ $$= 3^2 Var(X)$$ $$= 9 \cdot 4 = 36$$

新的方差是 36。请注意，“+ 10”并没有产生影响。

第三节重点提要

方差 (Var(X)) 衡量分布的离散程度或风险。计算时务必使用计算公式 $$Var(X) = E[X^2] - (E[X])^2$$。请记住其关键性质：$$Var(aX + b) = a^2Var(X)$$。标准差就是方差的平方根。

快速检查

你现在能答出来吗？

展开每个问题，快速检查你是否掌握本章重点。

什麼是離散隨機變數？

一個數值由隨機實驗結果決定，且只能取特定、可數數值的變數（通常記作 $ X $）。

離散概率分佈必須遵守哪兩條「黃金法則」？

1. 所有概率必須介乎 0 與 1 之間；2. 所有可能結果的概率總和必須等於 1。

期望值 $ E[X] $ 的定義是什麼？

它是隨機實驗重複無限次後預期會得到的理論長遠平均值，亦可視為各結果的加權平均。

如何計算離散隨機變數的期望值 $ E[X] $？

使用公式 $ E[X] = \sum x \cdot P(X=x) $，即將每個可能結果乘以其對應的概率，然後求和。

期望值的線性性質公式 $ E[aX + b] $ 是什麼？

$ E[aX + b] = aE[X] + b $，其中 $ a $ 和 $ b $ 為常數。

如何計算隨機變數函數的期望值 $ E[g(X)] $？

使用公式 $ E[g(X)] = \sum g(x) \cdot P(X=x) $。

什麼是方差 $ Var(X) $？

方差衡量隨機變數的取值與期望值之間的偏離程度，即數據的離散程度或波動性（風險）。

在實際運算中，計算方差最常用的公式是什麼？

$ Var(X) = E[X^2] - (E[X])^2 $，即「平方的平均值」減去「平均值的平方」。

准备好测试自己了吗？

将这些笔记转化为考试练习。获取此课题的无限AI题目，即时批改及详细解析。

练习此课题

立即实践所学

不要只看笔记，用无限AI题库练习，即时获得批改反馈。加入超过100,000名正在提升成绩的学生。

立即开始练习查看定价

看完笔记了？用AI练习题测试自己

立即练习此课题