M1 章节:概率分布、期望值与方差

大家好!欢迎来到统计学中最有趣的话题之一。如果你之前觉得概率有点抽象,不用担心。在本章中,我们会探讨概率分布,令这些概念更具体。我们将学习如何运用期望值来预测随机事件的“平均”结果,并使用方差来衡量结果的离散程度。

为何这很重要?它支撑着各种博弈游戏、保险政策,甚至金融投资背后的数学原理。学完这些,你将能够分析一个简单的游戏,并判断它是否值得一玩!


1. 离散概率分布:随机事件的“游戏规则”

什么是离散随机变量?

想象“随机变量”是一个变量(我们通常称之为 X),其数值由随机实验的结果决定。“离散”这个词只是指它只能取特定、可数的数值。你不会得到“半个”结果。

  • 例子:X 为掷标准六面骰子所得的点数。X 可以是 1、2、3、4、5 或 6。它不可能是 2.5。
  • 例子:Y 为掷硬币 3 次所得的正面向上的次数。Y 可以是 0、1、2 或 3。
  • 类比:离散变量就像房间里的人数。你可以有 3 个人或 4 个人,但不能有 3.5 个人。

什么是概率分布?

一个概率分布就是一个表格、图形或公式,它将离散随机变量的每个可能值与其对应的概率链接起来。它就是该随机变量的完整“游戏规则”。

任何概率分布都有两条黄金法则:

  1. 概率必须介乎 0 和 1 之间。对于任何值 x,$$0 \le P(X=x) \le 1$$。
  2. 所有概率之和必须恰好是 1。 $$\sum P(X=x) = 1$$。(这表示我们已考虑了所有可能的结果。)

想象它像一个披萨:所有的披萨片(概率)加起来必须是一个完整的披萨!

表示概率分布

表示概率分布最常见的方法是使用一个简单的表格。

例子:一个不公平硬币

想象一个不公平的硬币,掷出正面的概率是 0.4。设 X 为掷两次硬币中正面向上的次数。X 的可能值为 0、1 或 2。

P(X=0) = P(反面反面) = 0.6 * 0.6 = 0.36
P(X=1) = P(正面反面 或 反面正面) = (0.4 * 0.6) + (0.6 * 0.4) = 0.24 + 0.24 = 0.48
P(X=2) = P(正正) = 0.4 * 0.4 = 0.16

我们可以将其表示在分布表中:

x                    0         1         2
P(X = x)      0.36      0.48      0.16

让我们检查一下规则:所有概率都介乎 0 和 1 之间。如果我们把它们加起来:$$0.36 + 0.48 + 0.16 = 1.00$$。正确无误!

第一节重点提要

离散概率分布列出了随机事件所有可能的数值结果及其对应的概率。所有概率之和必须为 1。


2. 期望值 (E[X]):长远平均值

什么是期望值?

期望期望值,记作 E[X],是我们实验重复无限次后预期会得到的平均值。它是一种“加权平均”,其中较可能发生的结果影响较大。

重要提示:期望值可能不是单次试验中实际会出现的数字!例如,掷一次骰子的期望值是 3.5,但你不可能掷出 3.5。

类比:想象一个简单的游戏。你以 0.1 的概率赢取 10 元,以 0.9 的概率赢取 0 元。如果你玩这个游戏 100 次,你预期会赢取 10 次,总共 100 元。你每次游戏的平均赢取金额将是 $100 / 100 = $1。期望值是 1 元。

计算期望值

公式简单且直观。你将每个结果乘以其概率,然后将它们全部加起来。

公式: $$E[X] = \sum x \cdot P(X=x)$$

逐步示例

让我们找出上述不公平硬币例子中,正面向上的期望次数。

x                    0         1         2
P(X = x)      0.36      0.48      0.16

  1. 将每个 x 乘以其 P(X=x):
    (0 * 0.36) = 0
    (1 * 0.48) = 0.48
    (2 * 0.16) = 0.32
  2. 将结果加总:
    $$E[X] = 0 + 0.48 + 0.32 = 0.8$$

因此,平均而言,我们预期每次试验(两次掷硬币)会得到 0.8 次正面。

期望值的性质(实用捷径!)

这些规则使计算速度大大加快。设 ab 为常数。

性质一: $$E[aX + b] = aE[X] + b$$

换句话说:如果你将每个结果乘以“a”并加上“b”,期望值也会被乘以“a”并加上“b”。

例子:一个游戏的派彩金额为 X(以元计),我们发现 E[X] = 5 元。游戏组织者决定将派彩金额加倍并收取 2 元服务费。新的派彩金额为 Y = 2X - 2。新的期望派彩是多少?

$$E[Y] = E[2X - 2] = 2E[X] - 2 = 2(5) - 2 = 8 元$$ 无需重新计算整个分布!

函数的期望值,E[g(X)]

有时我们对 X 的函数(例如 $$X^2$$)的期望值感兴趣。计算方法非常相似。

公式: $$E[g(X)] = \sum g(x) \cdot P(X=x)$$

为了找出 $$E[X^2]$$,我们只需在乘以概率之前将每个 x 值平方。这对于之后计算方差将会非常重要。

例子:找出 E[X²]

再次使用我们的不公平硬币例子:

$$E[X^2] = (0^2 \cdot 0.36) + (1^2 \cdot 0.48) + (2^2 \cdot 0.16)$$ $$E[X^2] = (0 \cdot 0.36) + (1 \cdot 0.48) + (4 \cdot 0.16)$$ $$E[X^2] = 0 + 0.48 + 0.64 = 1.12$$

常见错误警示:请注意,$$E[X^2] = 1.12$$ 与 $$(E[X])^2 = (0.8)^2 = 0.64$$ 并不相同。这是一个关键区别!

第二节重点提要

期望值 (E[X]) 是随机变量的理论长期平均值。计算方法是将所有结果的“结果 × 概率”相加。其性质,特别是 $$E[aX + b] = aE[X] + b$$,是非常强大的捷径。


3. 方差 (Var(X)):衡量离散程度与风险

什么是方差?

期望值告诉我们分布的“中心”位置,而方差则告诉我们结果与该中心“偏离”的程度。它衡量了波动性或风险。

  • 低方差意味着大多数结果都紧密地聚集在期望值周围。结果可预测且一致。
  • 高方差意味着结果远离期望值。结果不可预测且具风险。

类比:两名学生,Amy 和 Ben,他们的平均考试分数(期望值)都是 80 分。

  • Amy 的分数:79、80、81、80。(低方差 — 非常稳定)
  • Ben 的分数:100、60、100、60。(高方差 — 波动很大!)

他们的平均分数相同,但表现却截然不同。方差捕捉了这种差异。

计算方差

方差有两种公式。一种适合理解概念,另一种则是实际计算时的最佳帮手。

公式一:定义式(适合理论理解)

设 $$\mu = E[X]$$。方差是与均值平方差的期望值。 $$Var(X) = E[(X-\mu)^2] = \sum (x-\mu)^2 \cdot P(X=x)$$ 这个公式在实际应用中效率较低。

公式二:计算公式(请用这个!)

这个几乎总是更快、更容易。

公式: $$Var(X) = E[X^2] - (E[X])^2$$

助记口诀:“平方的平均值,减去平均值的平方。”

逐步示例(使用快捷公式)

让我们计算不公平硬币例子的方差。我们在上一节已经完成了大部分繁重的工作!

  1. 回顾我们之前的结果:
    $$E[X] = 0.8$$
    $$E[X^2] = 1.12$$
  2. 将它们代入公式:
    $$Var(X) = E[X^2] - (E[X])^2$$ $$Var(X) = 1.12 - (0.8)^2$$ $$Var(X) = 1.12 - 0.64 = 0.48$$

正面次数的方差是 0.48。

标准差

请注意,方差的单位是平方的(例如,平方元、平方次),这可能难以理解。为了解决这个问题,我们使用标准差,它就是方差的平方根。

公式: $$SD(X) = \sigma = \sqrt{Var(X)}$$

在我们的例子中,标准差是 $$\sqrt{0.48} \approx 0.693$$。这个值是原始单位(“次”),能更直接地表示离散程度。

方差的性质(更多超实用捷径!)

就像期望值一样,这些规则能省下大量时间。设 ab 为常数。

性质一: $$Var(aX + b) = a^2 Var(X)$$

让我们来拆解一下:

  • 为何“+ b”会消失?加上一个常数“b”会使整个分布平移,但并不会改变其离散程度。想象所有学生的考试分数都加了 10 分。平均分会增加 10 分,但最高分和最低分之间的差距保持不变。离散程度不变,所以方差也不变。
  • 为何是“a²”?方差是基于平方差的。如果你将所有结果乘以“a”,那么它们与均值的距离也会被“a”缩放。当你将这些距离平方时,缩放因子就变成了“a²”。
例子:

一个游戏的派彩金额为 X,其方差 Var(X) = 4。组织者更改游戏规则,使新的派彩金额为 Y = 3X + 10。新的方差是多少?

$$Var(Y) = Var(3X + 10)$$ $$= 3^2 Var(X)$$ $$= 9 \cdot 4 = 36$$

新的方差是 36。请注意,“+ 10”并没有产生影响。

第三节重点提要

方差 (Var(X)) 衡量分布的离散程度或风险。计算时务必使用计算公式 $$Var(X) = E[X^2] - (E[X])^2$$。请记住其关键性质:$$Var(aX + b) = a^2Var(X)$$。标准差就是方差的平方根。