连续型随机变量:S2 统计学笔记

欢迎来到连续型随机变量的精彩世界!如果你已经顺利掌握了离散型随机变量,那么你已经成功了一半。两者的主要区别在于:我们不再对结果进行计数(比如掷骰子),而是对其进行测量(比如时间或身高)。由于无法进行简单的计数,我们将统计工具箱从求和(\(\Sigma\))切换到了强大的微积分语言(积分与微分)!

别担心,如果积分让你觉得棘手——这一章其实是你纯数学(Pure Maths)技能的最佳应用场景,它会让你明白那些积分规则究竟有何用处。

1. 离散 vs. 连续:核心差异

在研究随机变量(Random Variables, RVs)时,我们根据其取值范围进行分类:

离散型随机变量(复习)
  • 取有限个或可列个离散数值(例如:0, 1, 2, 3)。
  • 我们使用概率质量函数(PMF),即 \(P(X=x)\),为每一个点分配一个特定的概率。
  • 我们使用求和(\(\Sigma\))来计算总概率或期望值。
连续型随机变量(CRV)
  • 可以在指定的范围或区间内取任意数值(例如:机器发生故障所需的时间、学生的身高)。
  • 由于在任意两点之间都有无穷多个可能的取值,变量取某一个精确点的概率为零。
  • 关键结论: \(P(X = a) = 0\)。这意味着对于连续型随机变量,\(P(a < X < b)\) 与 \(P(a \le X \le b)\) 是完全一样的!
  • 我们使用积分(\(\int\))来计算区间内的概率(即曲线下的面积)。

类比:想象一下马拉松选手的完赛时间。他们刚好在 4 小时 0 分 0.00000000... 秒完成比赛的概率几乎为零,因为时间是连续的。我们只能计算他们在这 4 小时到 4 小时 5 分钟之间完赛的概率。

关键要点 1:

对于连续型随机变量,概率是在区间(面积)内衡量的,而不是在单个点上。如果你看到 \(P(X=k)\),答案永远是 \(0\)。

2. 概率密度函数(PDF),\(f(x)\)

对于连续型随机变量 \(X\),我们使用一个称为概率密度函数(Probability Density Function, PDF)的函数,记作 \(f(x)\)。

什么是 \(f(x)\)?

PDF 描述了概率在所有可能取值范围内的分布情况。它不是概率本身,而是该点 \(x\) 处的概率“密度”。

有效 PDF 的条件

为了使 \(f(x)\) 成为有效的 PDF,它必须满足两个基本条件:

  1. 非负性: 概率密度不能为负。
    $$\text{即:对于所有 } x \text{,都有 } f(x) \ge 0$$
  2. 总概率(面积为 1): PDF 曲线下的总面积必须等于 1。
    $$\text{即:} \int_{-\infty}^{\infty} f(x) dx = 1$$ (在实际应用中,由于 \(f(x)\) 通常定义在特定的区间 \([a, b]\) 上,该积分变为 \(\int_{a}^{b} f(x) dx = 1\))。
使用 PDF 计算概率

要找到 \(X\) 落在两个值 \(a\) 和 \(b\) 之间的概率,我们只需计算该区间内 PDF 曲线下的面积:

$$P(a < X < b) = \int_{a}^{b} f(x) dx$$

分步指南:寻找未知常数 \(k\)

许多考试题的开头都会要求你求出定义在区间 \([a, b]\) 上的 PDF 中的未知常数 \(k\)。

  1. 列出积分: 使用总概率规则,即 \(\int_{a}^{b} k \cdot (\text{关于 } x \text{ 的函数}) dx = 1\)。
  2. 对函数积分: 对 \(x\) 进行积分运算。
  3. 代入极限: 使用 \(F(b) - F(a)\) 计算定积分。
  4. 解出 \(k\): 将结果令为 1,解出方程求出 \(k\)。
快速回顾:PDF
  • \(f(x)\) 是概率密度。
  • \(f(x)\) 下的总面积必须为 \(1\)。
  • 概率通过积分计算得出。

3. 累积分布函数(CDF),\(F(x)\)

累积分布函数(Cumulative Distribution Function, CDF),记作 \(F(x)\),告诉我们累积到特定值 \(x\) 为止的总概率。其定义为:

$$F(x) = P(X \le x)$$

微积分关系:PDF 与 CDF

这是你纯数学知识最强关联的地方!由于 \(F(x)\) 累积了概率(面积),它正是 PDF \(f(x)\) 的积分:

$$F(x) = \int_{-\infty}^{x} f(t) dt$$

(我们在积分中使用哑变量 \(t\),以免与上限 \(x\) 混淆。)

反之,PDF 是 CDF 的变化率,即它的导数:

$$f(x) = \frac{d}{dx} F(x)$$

CDF 的性质与用途
  • CDF 必须从 0 开始,到 1 结束:
    • 对于 \(X\) 的最小值,\(F(x) = 0\)。
    • 对于 \(X\) 的最大值,\(F(x) = 1\)。
  • 使用 CDF 计算区间概率: 这通常比直接积分 PDF 快得多。
    $$P(a < X < b) = F(b) - F(a)$$
寻找百分位数与中位数

常见的任务是找到对应于给定概率(百分位数或四分位数)的特定值 \(k\)。例如,寻找中位数 \(m\)。

  • 中位数 \(m\) 是满足 \(P(X \le m) = 0.5\) 的值。
  • 要找到 \(m\),你需要解方程 \(F(m) = 0.5\),或者如果你还没求出 \(F(x)\): $$ \int_{a}^{m} f(x) dx = 0.5 $$

你知道吗?中位数是一种至关重要的集中趋势测量指标,因为它不像平均数那样受极端异常值的影响!

关键要点 2:

PDF 和 CDF 通过微分积分相互关联。使用 PDF 求出 CDF,并利用 CDF 快速计算概率和百分位数。

4. 集中趋势与离散程度的度量

就像离散型随机变量一样,我们需要为连续型随机变量计算平均值(期望)、方差和标准差。我们只需要将求和替换为积分即可。

平均值或期望,\(E(X)\)

平均值 \(\mu\) 是随机变量的长期平均值。它代表了分布的“平衡点”。

$$E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx$$

函数的期望,\(E(g(X))\)

如果我们对 \(X\) 的某个函数(例如 \(X^2\)、\(1/X\))的期望值感兴趣,我们使用通用公式:

$$E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) dx$$

常见错误:记得在积分前,将函数 \(g(x)\) 乘以密度函数 \(f(x)\)。

方差,\(\text{Var}(X)\)

方差衡量了数据围绕平均值的离散程度或波动范围。

定义公式是 \(\text{Var}(X) = E((X-\mu)^2)\)。然而,你必须使用的计算公式是:

$$\text{Var}(X) = E(X^2) - [E(X)]^2$$

使用该公式的步骤:

  1. 先计算 \(E(X)\)(如上所述)。
  2. 使用 \(g(x) = x^2\) 的期望公式计算 \(E(X^2)\):
    $$E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx$$
  3. 将两个结果代入方差公式。
标准差,\(\sigma\)

标准差仅仅是方差的平方根,它给出了 \(X\) 在原始单位下的离散程度。

$$\sigma = \sqrt{\text{Var}(X)}$$

关键要点 3:

平均值和方差的计算都涉及积分。对于方差,始终使用简化公式 \(\text{Var}(X) = E(X^2) - [E(X)]^2\)。

5. 连续型随机变量的变换

这些规则规定了当你变换单个变量或组合两个独立变量时,平均值和方差是如何变化的。它们与离散型随机变量的规则完全相同。

5.1 单变量的线性变换

设 \(Y = aX + b\),其中 \(a\) 和 \(b\) 为常数。

期望法则

乘以 \(a\) 并加上 \(b\),平均值会发生同样的位移:

$$E(aX + b) = aE(X) + b$$

例子:如果平均分 \(E(X)\) 为 50,那么乘以 2 再加 10 后的平均分为 \(2(50) + 10 = 110\)。

方差法则

加上常数 \(b\) 不会改变离散程度,但乘以 \(a\) 会使离散程度缩放 \(a^2\) 倍(因为方差的单位是平方):

$$\text{Var}(aX + b) = a^2\text{Var}(X)$$

例子:如果 \(\text{Var}(X)=4\),那么 \(\text{Var}(3X - 5)\) 为 \(3^2 \times 4 = 36\)。

5.2 两个独立变量的和与差

设 \(X\) 和 \(Y\) 是两个独立的连续型随机变量。

期望法则(可加性)

和或差的期望等于期望的和或差:

$$E(aX \pm bY) = aE(X) \pm bE(Y)$$

方差法则(始终相加)

当你组合独立变量时,无论你是相加还是相减,不确定性(方差)总是增加的。两个变量的变异都会导致最终离散程度的扩大。

$$\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)$$

方差记忆辅助: 差的方差仍然是相加!\(\text{Var}(X-Y) = \text{Var}(X) + \text{Var}(Y)\)。
思考:减去两个变量只会使整体结果更加分散且难以预测,因此方差必然增加。

关键要点 4:

线性变换规则至关重要!请记住,期望是线性缩放的,但方差按系数的平方进行缩放,并且在组合独立随机变量时,方差总是相加

快速回顾:连续型随机变量

下表总结了本章计算所需的核心公式:

计算汇总
概念 公式
总面积(归一化) \(\int_{-\infty}^{\infty} f(x) dx = 1\)
区间概率 \(P(a < X < b) = \int_{a}^{b} f(x) dx\)
CDF \(F(x) = \int_{-\infty}^{x} f(t) dt\)
平均值 \(E(X)\) \(\int_{-\infty}^{\infty} x f(x) dx\)
方差 \(\text{Var}(X)\) \(E(X^2) - [E(X)]^2\)
线性期望 \(E(aX+b) = aE(X) + b\)
线性方差 \(\text{Var}(aX+b) = a^2\text{Var}(X)\)
和/差的方差(独立) \(\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)\)