导言:欢迎来到连续变量的世界

你好,未来的统计学家!S2 单元将带我们走进连续随机变量 (Continuous Random Variables) 的奇妙世界。在 S1 中,你已经成为了离散随机变量的专家,我们当时处理的是计数问题(例如掷硬币正面朝上的次数:0、1、2……)。

在本章中,我们将重心转向测量——比如时间、身高、体重或温度。这些测量值可以在某个范围内取任意数值,而不仅仅是特定的整数。

这一部分非常重要,因为它将统计学与微积分(积分和微分)结合在了一起。别担心!我们会一步步拆解每一个概念。掌握了这些计算方法,你将解锁强大的预测能力!


快速回顾:离散 vs. 连续

  • 离散型: 可数的值。概率是在确切的点上定义的:\(P(X = x)\)。
  • 连续型: 在区间内可测量的值。概率是在区间上定义的。

第一节:理解连续随机变量 (CRV)

什么是 CRV?

连续随机变量 (Continuous Random Variable, CRV)(通常记作 \(X\))是指可以在指定区间或一组区间内取任意值的变量。

它与离散变量的主要区别在于我们处理概率的方式:

零概率规则

对于任何连续随机变量 \(X\),它取某个确切单点的概率始终为零

\[P(X = x) = 0\]

类比: 想象一下要击中一个连续的线段目标。你击中“3.000000000……”这个精确点的几率是多少?这个概率微乎其微,所以我们将其视为零。

关键结论: 由于击中精确点的概率为零,因此在计算区间概率时,是否包含区间的端点对结果没有影响:

\[P(a \le X \le b) = P(a < X < b) = P(a \le X < b)\]

与离散变量相比,这简直是一个巨大的简化!


第二节:概率密度函数 (PDF) – \(f(x)\)

由于我们不能给单个点分配概率,我们使用一个函数来描述概率在某个范围内的分布情况。这就是概率密度函数 (Probability Density Function, PDF),记作 \(f(x)\)。

可以将 PDF 想象成概率分布的“形状”。\(f(x)\) 值越高的地方,变量出现的可能性就越大。

PDF 的性质

要使 \(f(x)\) 成为有效的 PDF,它必须满足两个基本规则:

  1. 非负性: 密度函数绝不能为负。 \[f(x) \ge 0 \quad \text{对于所有 } x\]
  2. 总面积为一: 曲线 \(f(x)\) 下方的总面积必须等于 1。这代表总概率(100%)。 \[\int_{\text{所有 } x} f(x) \, dx = 1\]

利用 PDF 计算概率

概率可以通过计算 \(f(x)\) 在所需区间内曲线下方的面积来求得。这意味着我们需要使用积分

随机变量 \(X\) 落在 \(a\) 和 \(b\) 之间的概率为:

\[P(a < X < b) = \int_{a}^{b} f(x) \, dx\]

一步步来:寻找未知常数 (k)

通常,题目会给出形如 \(f(x) = kx^2\) 的 PDF(在定义的区间内)。你需要求出 \(k\)。

  1. 建立积分方程: 使用“总面积为一”的规则(性质 2)。 \[\int_{\text{下限}}^{\text{上限}} f(x) \, dx = 1\]
  2. 积分并代入限值: 对函数关于 \(x\) 进行积分。
  3. 求解 k: 将结果设为 1 并解方程。

步骤 1 的重要提示: 仅在 \(f(x)\) 非零的范围内进行积分。如果定义 \(f(x)\) 的区间是 \(1 \le x \le 3\),那么你的积分限就是 1 和 3。

快速回顾:PDF 要点

PDF (\(f(x)\)): 描述概率密度。

概率: PDF 曲线下方的面积(通过积分计算)。

核心特征: 总面积必须等于 1。


第三节:累积分布函数 (CDF) – \(F(x)\)

如果说 PDF 告诉我们的是某一点的密度,那么累积分布函数 (Cumulative Distribution Function, CDF) 告诉我们的就是达到某个值 \(x\) 之前的累计概率。

定义与计算

CDF 记作 \(F(x)\),定义为随机变量 \(X\) 小于或等于特定值 \(x\) 的概率。

\[F(x) = P(X \le x) = \int_{\text{最小值}}^{x} f(t) \, dt\]

注:我们在积分中使用 \(t\) 作为虚拟变量,以避免与上限 \(x\) 混淆。

CDF 的性质
  1. \(F(x)\) 是非减函数(随着 \(x\) 的增加,概率只能增加或保持不变)。
  2. 在分布起点(下限 L):\(F(L) = 0\)。
  3. 在分布终点(上限 U):\(F(U) = 1\)。

PDF 与 CDF 的关系:微积分是你的好伙伴

这两个函数通过微积分基本定理联系在一起:

  1. PDF \(\to\) CDF: 对 \(f(x)\) 积分得到 \(F(x)\)。
  2. CDF \(\to\) PDF: 对 \(F(x)\) 微分得到 \(f(x)\)。 \[f(x) = \frac{d}{dx} F(x)\]

记忆小技巧: 在字母表中 C 排在 P 后面。如果你从 F(x) 到 f(x)(字母表倒退),你需要微分(较简单的操作);如果你从 f(x) 到 F(x)(字母表前进),你需要积分(较复杂的操作)。

使用 CDF 求区间概率

一旦你得到了 \(F(x)\),求区间概率只需做简单的减法:

\[P(a < X < b) = F(b) - F(a)\]

这通常比重新对 PDF 进行积分要快得多!

避免常见错误!

在通过积分计算 \(F(x)\) 时,千万别忘了加上积分常数 +C(如果进行的是不定积分)。你需要利用边界条件 \(F(\text{下限}) = 0\) 来确定 C 的值。


第四节:位置度量(平均值、中位数、众数)

就像处理任何数据集一样,我们需要找到分布的中心值和典型值。

1. 平均值(期望值,\(\mu\) 或 \(E(X)\))

平均值代表如果你对该变量进行多次采样后所预期的平均结果。它是分布的“重心”。

对于连续变量,期望值的计算公式如下:

\[E(X) = \mu = \int_{\text{所有 } x} x \cdot f(x) \, dx\]

你知道吗? 这是离散公式 \(\sum x P(X=x)\) 的连续版本。在这里,积分取代了求和,\(f(x) \, dx\) 取代了 \(P(X=x)\)。

2. 中位数 (\(m\))

中位数 \(m\) 是将概率分布平分为两半的值。50% 的分布位于 \(m\) 以下,50% 位于 \(m\) 以上。

要寻找中位数 \(m\),请解以下方程之一:

使用 CDF: \[F(m) = 0.5\]

使用 PDF: \[\int_{\text{下限}}^{m} f(x) \, dx = 0.5\]

给同学们的建议: 如果你已经推导出了 CDF,\(F(x)\),那么求中位数通常会更容易。只需把你推导出的 \(F(x)\) 表达式等于 0.5 并求解 \(x\) 即可。

3. 众数

众数是 \(X\) 的值,在此处概率密度函数 \(f(x)\) 达到最大高度(即曲线的峰值)。

寻找众数(无需微积分):
如果 \(f(x)\) 的形状很简单(例如常数或直线),通常可以直接观察得出,或者众数就在区间的边界上。

寻找众数(使用微积分):
如果 \(f(x)\) 是复杂的曲线(例如二次或三次函数):

  1. 对 PDF 求导:找到 \(f'(x)\)。
  2. 令导数为零:\(f'(x) = 0\)。
  3. 解出 \(x\)。
  4. 检查边界并使用二阶导数测试(或通过观察)以确保此处是极大值,而不是极小值。


第五节:离散度量(方差和标准差)

离散度量告诉我们数据在平均值周围是聚集还是分散的。

\(X^2\) 的期望值

在计算方差之前,我们必须先计算 \(X^2\) 的期望值,记作 \(E(X^2)\)。其计算方法与 \(E(X)\) 类似,但我们要积分的是 \(x^2 f(x)\)。

\[E(X^2) = \int_{\text{所有 } x} x^2 \cdot f(x) \, dx\]

方差 (\(Var(X)\) 或 \(\sigma^2\))

方差衡量的是偏离平均值的平方距离的平均值。它定义为著名的恒等式:

\[Var(X) = E(X^2) - [E(X)]^2\]

方差计算步骤:

  1. 使用 \(\int x f(x) \, dx\) 计算 \(E(X) = \mu\)。
  2. 使用 \(\int x^2 f(x) \, dx\) 计算 \(E(X^2)\)。
  3. 代入方差公式:\(E(X^2) - (\mu)^2\)。

标准差 (\(\sigma\))

标准差是方差的平方根。它更常用,因为它与随机变量 \(X\) 的单位相同。

\[\sigma = \sqrt{Var(X)}\]

🚨 常见错误警告!

千万不要混淆 \(E(X^2)\) 和 \([E(X)]^2\)。它们完全不同。你必须先计算 \(X\) 的期望值,然后在计算方差时将该结果平方。

现在你已经掌握了连续随机变量的所有核心概念!请记住,多练习积分技巧是学好这一章的关键。