欢迎来到连续随机变量的世界!

在你的 H2 数学旅程中,你可能已经熟悉了离散随机变量——也就是那些可以「数」出来的数值,例如掷硬币出现正面的次数。在 进阶数学 (Further Mathematics, 9649) 中,我们将进入一个「平滑」的领域:连续随机变量 (Continuous Random Variables, CRVs)。现在,我们不再是「数数」,而是进行「测量」。试想一下你等巴士的精确时间,或者一棵树的精确高度;这些数值可以在一个范围内取任何值,而不仅仅是整数!

在这些笔记结束时,你将学会如何利用微积分来找出这个连续世界中的概率、平均值和离散程度。让我们马上开始吧!


1. 概率密度函数 (PDF)

对于离散变量,我们使用概率质量函数;而对于 CRV,我们则使用 概率密度函数 (Probability Density Function, PDF),通常写作 \( f(x) \)。

关键点: 在连续的世界里,变量等于 某一个特定值 的概率为零,即 \( P(X = c) = 0 \)。相反,我们是计算 \( X \) 落入某个 区间 的概率。这可以透过 曲线下的面积 来表示。

PDF 的两大黄金法则:

1. 函数值永不为负:对于所有 \( x \),都有 \( f(x) \ge 0 \)。
2. 曲线下的总面积必须为 1:\( \int_{-\infty}^{\infty} f(x) \, dx = 1 \)。

分段函数

有时候,PDF 会被「分割」成不同的部分,这称为 分段函数 (piecewise function)。例如:
\( f(x) = \begin{cases} kx & 0 \le x \le 2 \\ 0 & \text{其他} \end{cases} \)
要找出 \( k \),你只需将 \( kx \) 从 0 到 2 进行积分,并将结果设为 1 即可!

快速回顾: 若要找出概率 \( P(a \le X \le b) \),只需计算定积分:\( \int_{a}^{b} f(x) \, dx \)。


2. 平均值、方差与期望值

正如在离散统计中一样,我们想知道数据的「平均值」和「离散程度」。由于我们处理的是连续函数,我们使用 积分 来代替求和。

平均值 (期望值)

平均值 \( E(X) \) 或 \( \mu \) 是分布的「平衡点」。
\( E(X) = \int_{-\infty}^{\infty} x f(x) \, dx \)

方差与标准差

方差衡量数值偏离平均值的程度。
公式: \( Var(X) = E(X^2) - [E(X)]^2 \)
要找出 \( E(X^2) \),请使用:\( \int_{-\infty}^{\infty} x^2 f(x) \, dx \)。

函数的期望值: \( E(g(X)) \)

如果你需要找出 \( X \) 的函数的期望值(例如 \( X^3 \) 或 \( \sin(X) \)),请使用此规则:
\( E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) \, dx \)

常见错误提示: 一个很常见的错误是认为 \( E(X^2) \) 等于 \( (E(X))^2 \)。这两者截然不同!记得务必将 \( x^2 f(x) \) 的积分分开计算。


3. 众数与中位数

除了平均值,我们还可以找出数据的其他「中心」指标。

众数 (Mode)

众数 是 PDF \( f(x) \) 达到 最大值 时的 \( x \) 值。
如何找出它: 在图像上寻找最高点。如果函数是可微分的,你可以透过令 \( f'(x) = 0 \) 并检查该点是否为最大值来找出它。

中位数 (Median)

中位数 (我们称之为 \( m \)) 是将面积精确地平分为两半的值(左侧为 0.5,右侧为 0.5)。
如何找出它: 解方程:\( \int_{-\infty}^{m} f(x) \, dx = 0.5 \),从而求出 \( m \)。

核心总结: 平均值是「算术平均」,众数是「最频繁出现的值」,而中位数则是「中间值」。在偏态分布中,这三个值通常各不相同!


4. 累积分布函数 (CDF)

累积分布函数 (Cumulative Distribution Function),写作 \( F(x) \),告诉我们 \( X \) 小于或等于 某个特定值 \( x \) 的概率。

\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) \, dt \)

PDF 与 CDF 之间的联系

将 PDF 想象成 斜率 (梯度),将 CDF 想象成 面积。这给我们提供了一个优美的微积分关系:
1. 从 PDF 得到 CDF: 对 PDF 进行积分。
2. 从 CDF 得到 PDF: 对 CDF 进行微分:\( f(x) = \frac{d}{dx} F(x) \)。

你知道吗? CDF 总是以 0 开始(在最左端),并以 1 结束(在最右端),因为总概率必须累积到 1。


5. 特殊概率模型

课程大纲中规定了两个你必须掌握的特定连续模型。

A. 均匀分布 (Uniform / Rectangular Distribution)

这是最简单的模型。在特定的区间 \( [a, b] \) 内,概率是恒定的。图形看起来像一个矩形!
PDF: \( f(x) = \frac{1}{b-a} \),其中 \( a \le x \le b \)。
平均值: \( E(X) = \frac{a+b}{2} \) (正中间)。
方差: \( Var(X) = \frac{(b-a)^2}{12} \)。

B. 指数分布 (Exponential Distribution)

此模型经常用于表示 事件之间的时间间隔(例如顾客进入商店的时间间隔)。它取决于速率参数 \( \lambda \)。
PDF: \( f(x) = \lambda e^{-\lambda x} \),其中 \( x \ge 0 \)。
平均值: \( E(X) = \frac{1}{\lambda} \)。
方差: \( Var(X) = \frac{1}{\lambda^2} \)。
CDF: \( F(x) = 1 - e^{-\lambda x} \)。

类比: 想象你在等待流星出现。如果它们以恒定的平均速率随机发生,那么你等待的时间就遵循 指数分布


6. 泊松分布与指数分布的联系

这是考试中最受欢迎的主题之一!离散的「泊松分布」与连续的「指数分布」之间存在着直接的「婚姻关系」。

如果事件发生的 次数 在固定时间区间内遵循参数为 \( \lambda \) 的 泊松分布...
...那么相同事件之间的 时间间隔 就遵循参数为 \( \lambda \) 的 指数分布

记忆小帮手:
Poisson = People (数有多少人/次数)。
Exponential = Elapsed time (测量经过的时间)。


学生检查清单

在开始做练习题之前,确保你能:
• 证明一个函数是有效的 PDF (积分结果 = 1)。
• 使用积分计算 \( P(a < X < b) \)。
• 使用微积分在 PDF \( f(x) \) 和 CDF \( F(x) \) 之间进行转换。
• 为任何给定的 PDF 找出平均值、方差、众数和中位数。
• 识别并使用 均匀分布指数分布 的公式。
• 解释泊松分布和指数分布之间是如何关联的。

如果一开始觉得积分很困难,不要担心!专注于为积分设定正确的上下限,剩下的部分只是应用你已经熟悉的微积分规则而已。加油!