Continuous random variables

导言：欢迎来到连续变量的世界

你好，未来的统计学家！S2 单元将带我们走进连续随机变量 (Continuous Random Variables) 的奇妙世界。在 S1 中，你已经成为了离散随机变量的专家，我们当时处理的是计数问题（例如掷硬币正面朝上的次数：0、1、2……）。

在本章中，我们将重心转向测量——比如时间、身高、体重或温度。这些测量值可以在某个范围内取任意数值，而不仅仅是特定的整数。

这一部分非常重要，因为它将统计学与微积分（积分和微分）结合在了一起。别担心！我们会一步步拆解每一个概念。掌握了这些计算方法，你将解锁强大的预测能力！

快速回顾：离散 vs. 连续

离散型： 可数的值。概率是在确切的点上定义的：\(P(X = x)\)。
连续型： 在区间内可测量的值。概率是在区间上定义的。

第一节：理解连续随机变量 (CRV)

什么是 CRV？

连续随机变量 (Continuous Random Variable, CRV)（通常记作 \(X\)）是指可以在指定区间或一组区间内取任意值的变量。

它与离散变量的主要区别在于我们处理概率的方式：

零概率规则

对于任何连续随机变量 \(X\)，它取某个确切单点的概率始终为零。

\[P(X = x) = 0\]

类比： 想象一下要击中一个连续的线段目标。你击中“3.000000000……”这个精确点的几率是多少？这个概率微乎其微，所以我们将其视为零。

关键结论： 由于击中精确点的概率为零，因此在计算区间概率时，是否包含区间的端点对结果没有影响：

\[P(a \le X \le b) = P(a < X < b) = P(a \le X < b)\]

与离散变量相比，这简直是一个巨大的简化！

第二节：概率密度函数 (PDF) – \(f(x)\)

由于我们不能给单个点分配概率，我们使用一个函数来描述概率在某个范围内的分布情况。这就是概率密度函数 (Probability Density Function, PDF)，记作 \(f(x)\)。

可以将 PDF 想象成概率分布的“形状”。\(f(x)\) 值越高的地方，变量出现的可能性就越大。

PDF 的性质

要使 \(f(x)\) 成为有效的 PDF，它必须满足两个基本规则：

非负性： 密度函数绝不能为负。 \[f(x) \ge 0 \quad \text{对于所有 } x\]
总面积为一： 曲线 \(f(x)\) 下方的总面积必须等于 1。这代表总概率（100%）。 \[\int_{\text{所有 } x} f(x) \, dx = 1\]

利用 PDF 计算概率

概率可以通过计算 \(f(x)\) 在所需区间内曲线下方的面积来求得。这意味着我们需要使用积分。

随机变量 \(X\) 落在 \(a\) 和 \(b\) 之间的概率为：

\[P(a < X < b) = \int_{a}^{b} f(x) \, dx\]

一步步来：寻找未知常数 (k)

通常，题目会给出形如 \(f(x) = kx^2\) 的 PDF（在定义的区间内）。你需要求出 \(k\)。

建立积分方程： 使用“总面积为一”的规则（性质 2）。 \[\int_{\text{下限}}^{\text{上限}} f(x) \, dx = 1\]
积分并代入限值： 对函数关于 \(x\) 进行积分。
求解 k： 将结果设为 1 并解方程。

步骤 1 的重要提示： 仅在 \(f(x)\) 非零的范围内进行积分。如果定义 \(f(x)\) 的区间是 \(1 \le x \le 3\)，那么你的积分限就是 1 和 3。

快速回顾：PDF 要点

PDF (\(f(x)\))： 描述概率密度。

概率： PDF 曲线下方的面积（通过积分计算）。

核心特征： 总面积必须等于 1。

第三节：累积分布函数 (CDF) – \(F(x)\)

如果说 PDF 告诉我们的是某一点的密度，那么累积分布函数 (Cumulative Distribution Function, CDF) 告诉我们的就是达到某个值 \(x\) 之前的累计概率。

定义与计算

CDF 记作 \(F(x)\)，定义为随机变量 \(X\) 小于或等于特定值 \(x\) 的概率。

\[F(x) = P(X \le x) = \int_{\text{最小值}}^{x} f(t) \, dt\]

注：我们在积分中使用 \(t\) 作为虚拟变量，以避免与上限 \(x\) 混淆。

CDF 的性质

\(F(x)\) 是非减函数（随着 \(x\) 的增加，概率只能增加或保持不变）。
在分布起点（下限 L）：\(F(L) = 0\)。
在分布终点（上限 U）：\(F(U) = 1\)。

PDF 与 CDF 的关系：微积分是你的好伙伴

这两个函数通过微积分基本定理联系在一起：

PDF \(\to\) CDF： 对 \(f(x)\) 积分得到 \(F(x)\)。
CDF \(\to\) PDF： 对 \(F(x)\) 微分得到 \(f(x)\)。 \[f(x) = \frac{d}{dx} F(x)\]

记忆小技巧： 在字母表中 C 排在 P 后面。如果你从 F(x) 到 f(x)（字母表倒退），你需要微分（较简单的操作）；如果你从 f(x) 到 F(x)（字母表前进），你需要积分（较复杂的操作）。

使用 CDF 求区间概率

一旦你得到了 \(F(x)\)，求区间概率只需做简单的减法：

\[P(a < X < b) = F(b) - F(a)\]

这通常比重新对 PDF 进行积分要快得多！

避免常见错误！

在通过积分计算 \(F(x)\) 时，千万别忘了加上积分常数 +C（如果进行的是不定积分）。你需要利用边界条件 \(F(\text{下限}) = 0\) 来确定 C 的值。

第四节：位置度量（平均值、中位数、众数）

就像处理任何数据集一样，我们需要找到分布的中心值和典型值。

1. 平均值（期望值，\(\mu\) 或 \(E(X)\)）

平均值代表如果你对该变量进行多次采样后所预期的平均结果。它是分布的“重心”。

对于连续变量，期望值的计算公式如下：

\[E(X) = \mu = \int_{\text{所有 } x} x \cdot f(x) \, dx\]

你知道吗？ 这是离散公式 \(\sum x P(X=x)\) 的连续版本。在这里，积分取代了求和，\(f(x) \, dx\) 取代了 \(P(X=x)\)。

2. 中位数 (\(m\))

中位数 \(m\) 是将概率分布平分为两半的值。50% 的分布位于 \(m\) 以下，50% 位于 \(m\) 以上。

要寻找中位数 \(m\)，请解以下方程之一：

使用 CDF： \[F(m) = 0.5\]

使用 PDF： \[\int_{\text{下限}}^{m} f(x) \, dx = 0.5\]

给同学们的建议： 如果你已经推导出了 CDF，\(F(x)\)，那么求中位数通常会更容易。只需把你推导出的 \(F(x)\) 表达式等于 0.5 并求解 \(x\) 即可。

3. 众数

众数是 \(X\) 的值，在此处概率密度函数 \(f(x)\) 达到最大高度（即曲线的峰值）。

寻找众数（无需微积分）：
如果 \(f(x)\) 的形状很简单（例如常数或直线），通常可以直接观察得出，或者众数就在区间的边界上。

寻找众数（使用微积分）：
如果 \(f(x)\) 是复杂的曲线（例如二次或三次函数）：

对 PDF 求导：找到 \(f'(x)\)。
令导数为零：\(f'(x) = 0\)。
解出 \(x\)。
检查边界并使用二阶导数测试（或通过观察）以确保此处是极大值，而不是极小值。

第五节：离散度量（方差和标准差）

离散度量告诉我们数据在平均值周围是聚集还是分散的。

\(X^2\) 的期望值

在计算方差之前，我们必须先计算 \(X^2\) 的期望值，记作 \(E(X^2)\)。其计算方法与 \(E(X)\) 类似，但我们要积分的是 \(x^2 f(x)\)。

\[E(X^2) = \int_{\text{所有 } x} x^2 \cdot f(x) \, dx\]

方差 (\(Var(X)\) 或 \(\sigma^2\))

方差衡量的是偏离平均值的平方距离的平均值。它定义为著名的恒等式：

\[Var(X) = E(X^2) - [E(X)]^2\]

方差计算步骤：

使用 \(\int x f(x) \, dx\) 计算 \(E(X) = \mu\)。
使用 \(\int x^2 f(x) \, dx\) 计算 \(E(X^2)\)。
代入方差公式：\(E(X^2) - (\mu)^2\)。

标准差 (\(\sigma\))

标准差是方差的平方根。它更常用，因为它与随机变量 \(X\) 的单位相同。

\[\sigma = \sqrt{Var(X)}\]

🚨 常见错误警告！

千万不要混淆 \(E(X^2)\) 和 \([E(X)]^2\)。它们完全不同。你必须先计算 \(X\) 的期望值，然后在计算方差时将该结果平方。

现在你已经掌握了连续随机变量的所有核心概念！请记住，多练习积分技巧是学好这一章的关键。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。