连续型随机变量:S2 统计学笔记
欢迎来到连续型随机变量的精彩世界!如果你已经顺利掌握了离散型随机变量,那么你已经成功了一半。两者的主要区别在于:我们不再对结果进行计数(比如掷骰子),而是对其进行测量(比如时间或身高)。由于无法进行简单的计数,我们将统计工具箱从求和(\(\Sigma\))切换到了强大的微积分语言(积分与微分)!
别担心,如果积分让你觉得棘手——这一章其实是你纯数学(Pure Maths)技能的最佳应用场景,它会让你明白那些积分规则究竟有何用处。
1. 离散 vs. 连续:核心差异
在研究随机变量(Random Variables, RVs)时,我们根据其取值范围进行分类:
离散型随机变量(复习)
- 取有限个或可列个离散数值(例如:0, 1, 2, 3)。
- 我们使用概率质量函数(PMF),即 \(P(X=x)\),为每一个点分配一个特定的概率。
- 我们使用求和(\(\Sigma\))来计算总概率或期望值。
连续型随机变量(CRV)
- 可以在指定的范围或区间内取任意数值(例如:机器发生故障所需的时间、学生的身高)。
- 由于在任意两点之间都有无穷多个可能的取值,变量取某一个精确点的概率为零。
- 关键结论: \(P(X = a) = 0\)。这意味着对于连续型随机变量,\(P(a < X < b)\) 与 \(P(a \le X \le b)\) 是完全一样的!
- 我们使用积分(\(\int\))来计算区间内的概率(即曲线下的面积)。
类比:想象一下马拉松选手的完赛时间。他们刚好在 4 小时 0 分 0.00000000... 秒完成比赛的概率几乎为零,因为时间是连续的。我们只能计算他们在这 4 小时到 4 小时 5 分钟之间完赛的概率。
关键要点 1:
对于连续型随机变量,概率是在区间(面积)内衡量的,而不是在单个点上。如果你看到 \(P(X=k)\),答案永远是 \(0\)。
2. 概率密度函数(PDF),\(f(x)\)
对于连续型随机变量 \(X\),我们使用一个称为概率密度函数(Probability Density Function, PDF)的函数,记作 \(f(x)\)。
什么是 \(f(x)\)?
PDF 描述了概率在所有可能取值范围内的分布情况。它不是概率本身,而是该点 \(x\) 处的概率“密度”。
有效 PDF 的条件
为了使 \(f(x)\) 成为有效的 PDF,它必须满足两个基本条件:
- 非负性: 概率密度不能为负。
$$\text{即:对于所有 } x \text{,都有 } f(x) \ge 0$$ - 总概率(面积为 1): PDF 曲线下的总面积必须等于 1。
$$\text{即:} \int_{-\infty}^{\infty} f(x) dx = 1$$ (在实际应用中,由于 \(f(x)\) 通常定义在特定的区间 \([a, b]\) 上,该积分变为 \(\int_{a}^{b} f(x) dx = 1\))。
使用 PDF 计算概率
要找到 \(X\) 落在两个值 \(a\) 和 \(b\) 之间的概率,我们只需计算该区间内 PDF 曲线下的面积:
$$P(a < X < b) = \int_{a}^{b} f(x) dx$$
分步指南:寻找未知常数 \(k\)
许多考试题的开头都会要求你求出定义在区间 \([a, b]\) 上的 PDF 中的未知常数 \(k\)。
- 列出积分: 使用总概率规则,即 \(\int_{a}^{b} k \cdot (\text{关于 } x \text{ 的函数}) dx = 1\)。
- 对函数积分: 对 \(x\) 进行积分运算。
- 代入极限: 使用 \(F(b) - F(a)\) 计算定积分。
- 解出 \(k\): 将结果令为 1,解出方程求出 \(k\)。
快速回顾:PDF
- \(f(x)\) 是概率密度。
- \(f(x)\) 下的总面积必须为 \(1\)。
- 概率通过积分计算得出。
3. 累积分布函数(CDF),\(F(x)\)
累积分布函数(Cumulative Distribution Function, CDF),记作 \(F(x)\),告诉我们累积到特定值 \(x\) 为止的总概率。其定义为:
$$F(x) = P(X \le x)$$
微积分关系:PDF 与 CDF
这是你纯数学知识最强关联的地方!由于 \(F(x)\) 累积了概率(面积),它正是 PDF \(f(x)\) 的积分:
$$F(x) = \int_{-\infty}^{x} f(t) dt$$
(我们在积分中使用哑变量 \(t\),以免与上限 \(x\) 混淆。)
反之,PDF 是 CDF 的变化率,即它的导数:
$$f(x) = \frac{d}{dx} F(x)$$
CDF 的性质与用途
- CDF 必须从 0 开始,到 1 结束:
- 对于 \(X\) 的最小值,\(F(x) = 0\)。
- 对于 \(X\) 的最大值,\(F(x) = 1\)。
- 使用 CDF 计算区间概率: 这通常比直接积分 PDF 快得多。
$$P(a < X < b) = F(b) - F(a)$$
寻找百分位数与中位数
常见的任务是找到对应于给定概率(百分位数或四分位数)的特定值 \(k\)。例如,寻找中位数 \(m\)。
- 中位数 \(m\) 是满足 \(P(X \le m) = 0.5\) 的值。
- 要找到 \(m\),你需要解方程 \(F(m) = 0.5\),或者如果你还没求出 \(F(x)\): $$ \int_{a}^{m} f(x) dx = 0.5 $$
你知道吗?中位数是一种至关重要的集中趋势测量指标,因为它不像平均数那样受极端异常值的影响!
关键要点 2:
PDF 和 CDF 通过微分和积分相互关联。使用 PDF 求出 CDF,并利用 CDF 快速计算概率和百分位数。
4. 集中趋势与离散程度的度量
就像离散型随机变量一样,我们需要为连续型随机变量计算平均值(期望)、方差和标准差。我们只需要将求和替换为积分即可。
平均值或期望,\(E(X)\)
平均值 \(\mu\) 是随机变量的长期平均值。它代表了分布的“平衡点”。
$$E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx$$
函数的期望,\(E(g(X))\)
如果我们对 \(X\) 的某个函数(例如 \(X^2\)、\(1/X\))的期望值感兴趣,我们使用通用公式:
$$E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) dx$$
常见错误:记得在积分前,将函数 \(g(x)\) 乘以密度函数 \(f(x)\)。
方差,\(\text{Var}(X)\)
方差衡量了数据围绕平均值的离散程度或波动范围。
定义公式是 \(\text{Var}(X) = E((X-\mu)^2)\)。然而,你必须使用的计算公式是:
$$\text{Var}(X) = E(X^2) - [E(X)]^2$$
使用该公式的步骤:
- 先计算 \(E(X)\)(如上所述)。
- 使用 \(g(x) = x^2\) 的期望公式计算 \(E(X^2)\):
$$E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx$$ - 将两个结果代入方差公式。
标准差,\(\sigma\)
标准差仅仅是方差的平方根,它给出了 \(X\) 在原始单位下的离散程度。
$$\sigma = \sqrt{\text{Var}(X)}$$
关键要点 3:
平均值和方差的计算都涉及积分。对于方差,始终使用简化公式 \(\text{Var}(X) = E(X^2) - [E(X)]^2\)。
5. 连续型随机变量的变换
这些规则规定了当你变换单个变量或组合两个独立变量时,平均值和方差是如何变化的。它们与离散型随机变量的规则完全相同。
5.1 单变量的线性变换
设 \(Y = aX + b\),其中 \(a\) 和 \(b\) 为常数。
期望法则
乘以 \(a\) 并加上 \(b\),平均值会发生同样的位移:
$$E(aX + b) = aE(X) + b$$
例子:如果平均分 \(E(X)\) 为 50,那么乘以 2 再加 10 后的平均分为 \(2(50) + 10 = 110\)。
方差法则
加上常数 \(b\) 不会改变离散程度,但乘以 \(a\) 会使离散程度缩放 \(a^2\) 倍(因为方差的单位是平方):
$$\text{Var}(aX + b) = a^2\text{Var}(X)$$
例子:如果 \(\text{Var}(X)=4\),那么 \(\text{Var}(3X - 5)\) 为 \(3^2 \times 4 = 36\)。
5.2 两个独立变量的和与差
设 \(X\) 和 \(Y\) 是两个独立的连续型随机变量。
期望法则(可加性)
和或差的期望等于期望的和或差:
$$E(aX \pm bY) = aE(X) \pm bE(Y)$$
方差法则(始终相加)
当你组合独立变量时,无论你是相加还是相减,不确定性(方差)总是增加的。两个变量的变异都会导致最终离散程度的扩大。
$$\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)$$
方差记忆辅助: 差的方差仍然是相加!\(\text{Var}(X-Y) = \text{Var}(X) + \text{Var}(Y)\)。
思考:减去两个变量只会使整体结果更加分散且难以预测,因此方差必然增加。
关键要点 4:
线性变换规则至关重要!请记住,期望是线性缩放的,但方差按系数的平方进行缩放,并且在组合独立随机变量时,方差总是相加。
快速回顾:连续型随机变量
下表总结了本章计算所需的核心公式:
计算汇总
| 概念 | 公式 |
| 总面积(归一化) | \(\int_{-\infty}^{\infty} f(x) dx = 1\) |
| 区间概率 | \(P(a < X < b) = \int_{a}^{b} f(x) dx\) |
| CDF | \(F(x) = \int_{-\infty}^{x} f(t) dt\) |
| 平均值 \(E(X)\) | \(\int_{-\infty}^{\infty} x f(x) dx\) |
| 方差 \(\text{Var}(X)\) | \(E(X^2) - [E(X)]^2\) |
| 线性期望 | \(E(aX+b) = aE(X) + b\) |
| 线性方差 | \(\text{Var}(aX+b) = a^2\text{Var}(X)\) |
| 和/差的方差(独立) | \(\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)\) |