离散随机变量简介

欢迎来到离散随机变量(Discrete Random Variables)的世界!虽然这个名字听起来有点深奥,但它其实是你日常生活中无处不在的概念。如果你曾经好奇过一支球队的“平均”进球数,或是计算过在第三次尝试时赢得游戏的概率,那么你其实已经在运用随机变量的思维了。

在这一章中,我们将超越基础的概率概念,探讨如何为具有可数(countable)结果的事件建立模型、进行计算及预测。别担心统计学听起来会很枯燥——我们会将其拆解成易于消化的内容,并配合大量现实生活中的例子来深入浅出地学习!

1. 一般离散随机变量

离散随机变量(DRV)是一个其值取决于随机事件结果的变量,且这些数值必须是离散的(意即你可以数出它们,例如 0, 1, 2... 不包含小数!)。我们通常使用大写字母(如 \( X \))来表示变量本身,并使用小写字母(如 \( x \))来表示它所能取得的特定数值。

概率分布

概率分布(probability distribution)仅仅是一种呈现 \( X \) 所有可能取值及其对应发生概率的方式,我们通常以表格形式来表示。

例子:设 \( X \) 为抛掷两次硬币时出现正面的次数。

\( X = 0, 1, 2 \)
\( P(X=0) = 0.25 \)
\( P(X=1) = 0.50 \)
\( P(X=2) = 0.25 \)

重要规则:分布中所有概率的总和必须始终等于 1。符号表示为:\( \sum P(X=x) = 1 \)。如果你的表格相加不等于 1,那就代表哪里出错了!

期望值与方差

它们告诉我们数据的“中心”与“离散程度”。

  • 期望值 \( E(X) \): 这是长期平均值,我们通常称之为平均数,记作 \( \mu \)。
    公式:\( E(X) = \mu = \sum x P(X=x) \)
  • 方差 \( Var(X) \): 这衡量了数值偏离平均值的程度。
    公式:\( Var(X) = \sigma^2 = \sum x^2 P(X=x) - \mu^2 \)

快速复习:
1. 期望值 =(数值 \(\times\) 其概率)的总和。
2. 方差 =(数值² \(\times\) 概率)的总和,减去(平均数)²。

常见错误:在计算方差时,学生常忘记最后要减去 \( \mu^2 \)。记得在最后一步务必进行检查!

核心要点:概率分布告诉你“是什么”以及“多大概率发生”。\( E(X) \) 告诉你平均数,而 \( Var(X) \) 则告诉你数据的稳定性。

2. 线性转换 (Linear Coding)

有时我们想改变数据——例如将每个分数加倍,或为每个人加上 5 分。这称为线性转换,通常表示为 \( Y = aX + b \)。

平均数与方差的变化:

  • 平均数: 它受所有因素影响。如果你给每个分数加 5,平均值就会上升 5;如果你将每个分数加倍,平均值也会加倍。
    \( E(aX + b) = aE(X) + b \)
  • 方差:受乘法影响。加上一个常数并不会改变“离散程度”(数据点之间的距离保持不变)。然而,由于方差是平方运算,倍数 \( a \) 会变成 \( a^2 \)。
    \( Var(aX + b) = a^2 Var(X) \)

类比:想象一群朋友排成一列。如果他们都向前跨两步(加上 \( b \)),平均位置会移动,但他们之间的距离(方差)保持不变。如果他们将与起点的距离都加倍(乘以 \( a \)),他们之间的间距就会扩大许多!

核心要点:加减会改变平均数但不影响方差。乘除则会将平均数乘以 \( a \),将方差乘以 \( a^2 \)。

3. 离散均匀分布 (Discrete Uniform Distribution)

离散均匀分布中,每个结果发生的概率都相等。想象一颗公正的 6 面骰子:每个数字出现的概率都是 \( 1/6 \)。

对于区间 \( [1, n] \),我们使用符号 \( X \sim U(n) \)。

  • 概率: \( P(X=x) = \frac{1}{n} \)
  • 平均数: \( E(X) = \frac{n+1}{2} \)
  • 方差: \( Var(X) = \frac{n^2 - 1}{12} \)

核心要点:当在固定的整数范围内,每个事件发生的机会均等时,请使用此模型。

4. 二项分布 (Binomial Distribution)

你可能在 A Level 数学中见过它!我们使用 \( X \sim B(n, p) \),其中 \( n \) 是试验次数,\( p \) 是成功概率。

进阶数学(Further Maths)的新公式:
除了查表之外,你需要知道以下计算平均数与方差的快捷公式:
\( \mu = np \)
\( \sigma^2 = np(1 - p) \)

例子:如果你抛掷硬币 100 次,预期出现正面的次数为 \( 100 \times 0.5 = 50 \)。

5. 几何分布 (Geometric Distribution)

这是个新概念!几何分布模拟的是直到第一次成功出现前的试验次数。想象你正在练习投篮,你会一直投,直到球进了为止,然后停止。

我们使用符号 \( X \sim Geo(p) \)。

必备公式:

  • 在第 \( x \) 次尝试时成功的概率: \( P(X=x) = (1-p)^{x-1}p \)
    (这意味著你经历了 \( x-1 \) 次失败,随后紧接着 1 次成功)。
  • 需要超过 \( x \) 次尝试的概率: \( P(X > x) = (1-p)^x \)
    (这是一个方便的捷径!意即你前 \( x \) 次都失败了)。
  • 平均数: \( E(X) = \frac{1}{p} \)
  • 方差: \( Var(X) = \frac{1-p}{p^2} \)

你知道吗?任何几何分布的“众数”(最可能出现的结果)永远是 1。尽管成功的概率很低,但最可能的情况永远是在第一次尝试就成功!

核心要点:当你在“等待第一次成功”时,请使用几何分布。

6. 泊松分布 (Poisson Distribution)

泊松分布用于模拟在固定时间或空间区间内,某事件发生的次数。例如你在一小时内收到的邮件数量,或是一块饼干里的巧克力豆数量。

我们使用符号 \( X \sim Po(\lambda) \),其中 \( \lambda \) (lambda) 是平均发生率。

泊松模型的条件:

要适用泊松模型,事件必须满足:

  • 独立性:一个事件的发生不会影响下一个。
  • 单一性:两个事件不会在同一瞬间同时发生。
  • 以恒定的平均速率发生。

公式:

\( P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!} \)

特殊性质:

  • 平均数与方差: 在泊松分布中,平均数与方差相等
    \( E(X) = Var(X) = \lambda \)
  • 泊松变量的相加: 如果你有两个独立的泊松变量 \( X \sim Po(\lambda) \) 和 \( Y \sim Po(\mu) \),那么它们的和也符合泊松分布:
    \( X + Y \sim Po(\lambda + \mu) \)

不用担心如果公式看起来很吓人。大多数时候,你只需要利用计算器内置的泊松函数来查找这些概率!

核心要点:寻找“平均速率”或“区间内出现次数”来辨识泊松问题。请记住,平均数 = 方差。

总结复习

离散均匀分布:每件事发生的概率均等。
二项分布:固定次数的试验,寻找成功次数。
几何分布:重复试验直到第一次成功。
泊松分布:计算特定时间/空间内的事件发生次数。

恭喜你!你已经掌握了离散随机变量的核心内容。继续练习那些公式,并且永远记得检查概率总和是否为 1!