Continuous random variables - Further Mathematics (9649) - GCE A-Level - Higher 2 (H2)

欢迎来到连续随机变量的世界！

在你的 H2 数学旅程中，你可能已经熟悉了离散随机变量——也就是那些可以「数」出来的数值，例如掷硬币出现正面的次数。在 进阶数学 (Further Mathematics, 9649) 中，我们将进入一个「平滑」的领域：连续随机变量 (Continuous Random Variables, CRVs)。现在，我们不再是「数数」，而是进行「测量」。试想一下你等巴士的精确时间，或者一棵树的精确高度；这些数值可以在一个范围内取任何值，而不仅仅是整数！

在这些笔记结束时，你将学会如何利用微积分来找出这个连续世界中的概率、平均值和离散程度。让我们马上开始吧！

1. 概率密度函数 (PDF)

对于离散变量，我们使用概率质量函数；而对于 CRV，我们则使用 概率密度函数 (Probability Density Function, PDF)，通常写作 \( f(x) \)。

关键点： 在连续的世界里，变量等于 某一个特定值 的概率为零，即 \( P(X = c) = 0 \)。相反，我们是计算 \( X \) 落入某个区间的概率。这可以透过 曲线下的面积 来表示。

PDF 的两大黄金法则：

1. 函数值永不为负：对于所有 \( x \)，都有 \( f(x) \ge 0 \)。
2. 曲线下的总面积必须为 1：\( \int_{-\infty}^{\infty} f(x) \, dx = 1 \)。

分段函数

有时候，PDF 会被「分割」成不同的部分，这称为 分段函数 (piecewise function)。例如：
\( f(x) = \begin{cases} kx & 0 \le x \le 2 \\ 0 & \text{其他} \end{cases} \)
要找出 \( k \)，你只需将 \( kx \) 从 0 到 2 进行积分，并将结果设为 1 即可！

快速回顾： 若要找出概率 \( P(a \le X \le b) \)，只需计算定积分：\( \int_{a}^{b} f(x) \, dx \)。

2. 平均值、方差与期望值

正如在离散统计中一样，我们想知道数据的「平均值」和「离散程度」。由于我们处理的是连续函数，我们使用积分来代替求和。

平均值 (期望值)

平均值 \( E(X) \) 或 \( \mu \) 是分布的「平衡点」。
\( E(X) = \int_{-\infty}^{\infty} x f(x) \, dx \)

方差与标准差

方差衡量数值偏离平均值的程度。
公式： \( Var(X) = E(X^2) - [E(X)]^2 \)
要找出 \( E(X^2) \)，请使用：\( \int_{-\infty}^{\infty} x^2 f(x) \, dx \)。

函数的期望值： \( E(g(X)) \)

如果你需要找出 \( X \) 的函数的期望值（例如 \( X^3 \) 或 \( \sin(X) \)），请使用此规则：
\( E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) \, dx \)

常见错误提示： 一个很常见的错误是认为 \( E(X^2) \) 等于 \( (E(X))^2 \)。这两者截然不同！记得务必将 \( x^2 f(x) \) 的积分分开计算。

3. 众数与中位数

除了平均值，我们还可以找出数据的其他「中心」指标。

众数 (Mode)

众数是 PDF \( f(x) \) 达到 最大值 时的 \( x \) 值。
如何找出它： 在图像上寻找最高点。如果函数是可微分的，你可以透过令 \( f'(x) = 0 \) 并检查该点是否为最大值来找出它。

中位数 (Median)

中位数 (我们称之为 \( m \)) 是将面积精确地平分为两半的值（左侧为 0.5，右侧为 0.5）。
如何找出它： 解方程：\( \int_{-\infty}^{m} f(x) \, dx = 0.5 \)，从而求出 \( m \)。

核心总结： 平均值是「算术平均」，众数是「最频繁出现的值」，而中位数则是「中间值」。在偏态分布中，这三个值通常各不相同！

4. 累积分布函数 (CDF)

累积分布函数 (Cumulative Distribution Function)，写作 \( F(x) \)，告诉我们 \( X \) 小于或等于 某个特定值 \( x \) 的概率。

\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) \, dt \)

PDF 与 CDF 之间的联系

将 PDF 想象成 斜率 (梯度)，将 CDF 想象成面积。这给我们提供了一个优美的微积分关系：
1. 从 PDF 得到 CDF： 对 PDF 进行积分。
2. 从 CDF 得到 PDF： 对 CDF 进行微分：\( f(x) = \frac{d}{dx} F(x) \)。

你知道吗？ CDF 总是以 0 开始（在最左端），并以 1 结束（在最右端），因为总概率必须累积到 1。

5. 特殊概率模型

课程大纲中规定了两个你必须掌握的特定连续模型。

A. 均匀分布 (Uniform / Rectangular Distribution)

这是最简单的模型。在特定的区间 \( [a, b] \) 内，概率是恒定的。图形看起来像一个矩形！
PDF： \( f(x) = \frac{1}{b-a} \)，其中 \( a \le x \le b \)。
平均值： \( E(X) = \frac{a+b}{2} \) (正中间)。
方差： \( Var(X) = \frac{(b-a)^2}{12} \)。

B. 指数分布 (Exponential Distribution)

此模型经常用于表示 事件之间的时间间隔（例如顾客进入商店的时间间隔）。它取决于速率参数 \( \lambda \)。
PDF： \( f(x) = \lambda e^{-\lambda x} \)，其中 \( x \ge 0 \)。
平均值： \( E(X) = \frac{1}{\lambda} \)。
方差： \( Var(X) = \frac{1}{\lambda^2} \)。
CDF： \( F(x) = 1 - e^{-\lambda x} \)。

类比： 想象你在等待流星出现。如果它们以恒定的平均速率随机发生，那么你等待的时间就遵循 指数分布。

6. 泊松分布与指数分布的联系

这是考试中最受欢迎的主题之一！离散的「泊松分布」与连续的「指数分布」之间存在着直接的「婚姻关系」。

如果事件发生的次数在固定时间区间内遵循参数为 \( \lambda \) 的 泊松分布...
...那么相同事件之间的 时间间隔 就遵循参数为 \( \lambda \) 的 指数分布。

记忆小帮手：
Poisson = People (数有多少人/次数)。
Exponential = Elapsed time (测量经过的时间)。

学生检查清单

在开始做练习题之前，确保你能：
• 证明一个函数是有效的 PDF (积分结果 = 1)。
• 使用积分计算 \( P(a < X < b) \)。
• 使用微积分在 PDF \( f(x) \) 和 CDF \( F(x) \) 之间进行转换。
• 为任何给定的 PDF 找出平均值、方差、众数和中位数。
• 识别并使用 均匀分布 和 指数分布 的公式。
• 解释泊松分布和指数分布之间是如何关联的。

如果一开始觉得积分很困难，不要担心！专注于为积分设定正确的上下限，剩下的部分只是应用你已经熟悉的微积分规则而已。加油！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。