M1 章节:概率分布、期望值与方差
大家好!欢迎来到统计学中最有趣的话题之一。如果你之前觉得概率有点抽象,不用担心。在本章中,我们会探讨概率分布,令这些概念更具体。我们将学习如何运用期望值来预测随机事件的“平均”结果,并使用方差来衡量结果的离散程度。
为何这很重要?它支撑着各种博弈游戏、保险政策,甚至金融投资背后的数学原理。学完这些,你将能够分析一个简单的游戏,并判断它是否值得一玩!
1. 离散概率分布:随机事件的“游戏规则”
什么是离散随机变量?
想象“随机变量”是一个变量(我们通常称之为 X),其数值由随机实验的结果决定。“离散”这个词只是指它只能取特定、可数的数值。你不会得到“半个”结果。
- 例子:设 X 为掷标准六面骰子所得的点数。X 可以是 1、2、3、4、5 或 6。它不可能是 2.5。
- 例子:设 Y 为掷硬币 3 次所得的正面向上的次数。Y 可以是 0、1、2 或 3。
- 类比:离散变量就像房间里的人数。你可以有 3 个人或 4 个人,但不能有 3.5 个人。
什么是概率分布?
一个概率分布就是一个表格、图形或公式,它将离散随机变量的每个可能值与其对应的概率链接起来。它就是该随机变量的完整“游戏规则”。
任何概率分布都有两条黄金法则:
- 概率必须介乎 0 和 1 之间。对于任何值 x,$$0 \le P(X=x) \le 1$$。
- 所有概率之和必须恰好是 1。 $$\sum P(X=x) = 1$$。(这表示我们已考虑了所有可能的结果。)
想象它像一个披萨:所有的披萨片(概率)加起来必须是一个完整的披萨!
表示概率分布
表示概率分布最常见的方法是使用一个简单的表格。
例子:一个不公平硬币
想象一个不公平的硬币,掷出正面的概率是 0.4。设 X 为掷两次硬币中正面向上的次数。X 的可能值为 0、1 或 2。
P(X=0) = P(反面反面) = 0.6 * 0.6 = 0.36
P(X=1) = P(正面反面 或 反面正面) = (0.4 * 0.6) + (0.6 * 0.4) = 0.24 + 0.24 = 0.48
P(X=2) = P(正正) = 0.4 * 0.4 = 0.16
我们可以将其表示在分布表中:
x 0 1 2
P(X = x) 0.36 0.48 0.16
让我们检查一下规则:所有概率都介乎 0 和 1 之间。如果我们把它们加起来:$$0.36 + 0.48 + 0.16 = 1.00$$。正确无误!
第一节重点提要
离散概率分布列出了随机事件所有可能的数值结果及其对应的概率。所有概率之和必须为 1。
2. 期望值 (E[X]):长远平均值
什么是期望值?
期望或期望值,记作 E[X],是我们实验重复无限次后预期会得到的平均值。它是一种“加权平均”,其中较可能发生的结果影响较大。
重要提示:期望值可能不是单次试验中实际会出现的数字!例如,掷一次骰子的期望值是 3.5,但你不可能掷出 3.5。
类比:想象一个简单的游戏。你以 0.1 的概率赢取 10 元,以 0.9 的概率赢取 0 元。如果你玩这个游戏 100 次,你预期会赢取 10 次,总共 100 元。你每次游戏的平均赢取金额将是 $100 / 100 = $1。期望值是 1 元。
计算期望值
公式简单且直观。你将每个结果乘以其概率,然后将它们全部加起来。
公式: $$E[X] = \sum x \cdot P(X=x)$$
逐步示例
让我们找出上述不公平硬币例子中,正面向上的期望次数。
x 0 1 2
P(X = x) 0.36 0.48 0.16
- 将每个 x 乘以其 P(X=x):
(0 * 0.36) = 0
(1 * 0.48) = 0.48
(2 * 0.16) = 0.32 - 将结果加总:
$$E[X] = 0 + 0.48 + 0.32 = 0.8$$
因此,平均而言,我们预期每次试验(两次掷硬币)会得到 0.8 次正面。
期望值的性质(实用捷径!)
这些规则使计算速度大大加快。设 a 和 b 为常数。
性质一: $$E[aX + b] = aE[X] + b$$
换句话说:如果你将每个结果乘以“a”并加上“b”,期望值也会被乘以“a”并加上“b”。
例子:一个游戏的派彩金额为 X(以元计),我们发现 E[X] = 5 元。游戏组织者决定将派彩金额加倍并收取 2 元服务费。新的派彩金额为 Y = 2X - 2。新的期望派彩是多少?
$$E[Y] = E[2X - 2] = 2E[X] - 2 = 2(5) - 2 = 8 元$$ 无需重新计算整个分布!
函数的期望值,E[g(X)]
有时我们对 X 的函数(例如 $$X^2$$)的期望值感兴趣。计算方法非常相似。
公式: $$E[g(X)] = \sum g(x) \cdot P(X=x)$$
为了找出 $$E[X^2]$$,我们只需在乘以概率之前将每个 x 值平方。这对于之后计算方差将会非常重要。
例子:找出 E[X²]
再次使用我们的不公平硬币例子:
$$E[X^2] = (0^2 \cdot 0.36) + (1^2 \cdot 0.48) + (2^2 \cdot 0.16)$$ $$E[X^2] = (0 \cdot 0.36) + (1 \cdot 0.48) + (4 \cdot 0.16)$$ $$E[X^2] = 0 + 0.48 + 0.64 = 1.12$$
常见错误警示:请注意,$$E[X^2] = 1.12$$ 与 $$(E[X])^2 = (0.8)^2 = 0.64$$ 并不相同。这是一个关键区别!
第二节重点提要
期望值 (E[X]) 是随机变量的理论长期平均值。计算方法是将所有结果的“结果 × 概率”相加。其性质,特别是 $$E[aX + b] = aE[X] + b$$,是非常强大的捷径。
3. 方差 (Var(X)):衡量离散程度与风险
什么是方差?
期望值告诉我们分布的“中心”位置,而方差则告诉我们结果与该中心“偏离”的程度。它衡量了波动性或风险。
- 低方差意味着大多数结果都紧密地聚集在期望值周围。结果可预测且一致。
- 高方差意味着结果远离期望值。结果不可预测且具风险。
类比:两名学生,Amy 和 Ben,他们的平均考试分数(期望值)都是 80 分。
- Amy 的分数:79、80、81、80。(低方差 — 非常稳定)
- Ben 的分数:100、60、100、60。(高方差 — 波动很大!)
他们的平均分数相同,但表现却截然不同。方差捕捉了这种差异。
计算方差
方差有两种公式。一种适合理解概念,另一种则是实际计算时的最佳帮手。
公式一:定义式(适合理论理解)
设 $$\mu = E[X]$$。方差是与均值平方差的期望值。 $$Var(X) = E[(X-\mu)^2] = \sum (x-\mu)^2 \cdot P(X=x)$$ 这个公式在实际应用中效率较低。
公式二:计算公式(请用这个!)
这个几乎总是更快、更容易。
公式: $$Var(X) = E[X^2] - (E[X])^2$$
助记口诀:“平方的平均值,减去平均值的平方。”
逐步示例(使用快捷公式)
让我们计算不公平硬币例子的方差。我们在上一节已经完成了大部分繁重的工作!
- 回顾我们之前的结果:
$$E[X] = 0.8$$
$$E[X^2] = 1.12$$ - 将它们代入公式:
$$Var(X) = E[X^2] - (E[X])^2$$ $$Var(X) = 1.12 - (0.8)^2$$ $$Var(X) = 1.12 - 0.64 = 0.48$$
正面次数的方差是 0.48。
标准差
请注意,方差的单位是平方的(例如,平方元、平方次),这可能难以理解。为了解决这个问题,我们使用标准差,它就是方差的平方根。
公式: $$SD(X) = \sigma = \sqrt{Var(X)}$$
在我们的例子中,标准差是 $$\sqrt{0.48} \approx 0.693$$。这个值是原始单位(“次”),能更直接地表示离散程度。
方差的性质(更多超实用捷径!)
就像期望值一样,这些规则能省下大量时间。设 a 和 b 为常数。
性质一: $$Var(aX + b) = a^2 Var(X)$$
让我们来拆解一下:
- 为何“+ b”会消失?加上一个常数“b”会使整个分布平移,但并不会改变其离散程度。想象所有学生的考试分数都加了 10 分。平均分会增加 10 分,但最高分和最低分之间的差距保持不变。离散程度不变,所以方差也不变。
- 为何是“a²”?方差是基于平方差的。如果你将所有结果乘以“a”,那么它们与均值的距离也会被“a”缩放。当你将这些距离平方时,缩放因子就变成了“a²”。
例子:
一个游戏的派彩金额为 X,其方差 Var(X) = 4。组织者更改游戏规则,使新的派彩金额为 Y = 3X + 10。新的方差是多少?
$$Var(Y) = Var(3X + 10)$$ $$= 3^2 Var(X)$$ $$= 9 \cdot 4 = 36$$
新的方差是 36。请注意,“+ 10”并没有产生影响。
第三节重点提要
方差 (Var(X)) 衡量分布的离散程度或风险。计算时务必使用计算公式 $$Var(X) = E[X^2] - (E[X])^2$$。请记住其关键性质:$$Var(aX + b) = a^2Var(X)$$。标准差就是方差的平方根。