欢迎来到连续随机变量的世界!

在之前的学习中,你可能接触过离散随机变量(Discrete Random Variables)——即那些可以数出来的数值,例如投掷三次硬币出现正面的次数,或是班级内的人数。但如果是我们“测量”出来的数值呢?想象一下你等巴士的时间、一颗苹果的重量,或是树木的精确高度。这些数值可以在某个范围内取任何值,这就是所谓的连续随机变量(Continuous Random Variables, CRVs)

阅读完这些笔记后,你将学会如何用数学方式描述这些变量、如何找到“平均”结果,以及如何计算事件发生的概率。如果一开始觉得微积分的部分有些困难,别担心!我们会一步一步为你拆解!

1. 离散与连续:两者之间的大不同

要理解连续随机变量,将它与离散变量进行比较会非常有帮助。

离散:就像只显示分钟的电子钟。时间从 10:01“跳”到 10:02。你可以列出所有可能的结果。
连续:就像老式的指针钟,秒针平滑地移动。在 10:01 和 10:02 之间,有无穷多个微小的瞬间(例如 10:01.0001, 10:01.00012 等等)。

你知道吗?由于存在无限多个可能值,连续变量在某个特定数值(例如身高刚好是 1.750000... 米)的概率实际上是!因此,我们总是寻找数值落在某个范围内的概率。

2. 概率密度函数 (PDF)

由于我们无法像离散变量那样用表格列出概率,我们使用图表或公式,称为概率密度函数 (Probability Density Function),记作 \( f(x) \)。

你可以将 PDF 想象成一张显示概率分布情况的“地图”。曲线越高,变量落在该区域的可能性就越大。

PDF 的黄金法则:
1. 曲线绝不能低于 x 轴。用数学表示:对于所有 \( x \),\( f(x) \ge 0 \)。 (概率不可能是负数!)
2. 整个曲线下的总面积必须等于 1。这代表某个事件一定会发生的 100% 概率。

快速复习:要找到总面积,我们使用积分!对于在区间 \( a \) 到 \( b \) 之间定义的 PDF:
\( \int_{a}^{b} f(x) dx = 1 \)

关键总结:PDF 描述了概率的“形状”,且其下方的总面积永远是 1。

3. 计算概率(面积法)

正如我们之前提到的,我们只计算范围的概率。要找出变量 \( X \) 落在两个数值 \( c \) 和 \( d \) 之间的概率,我们只需计算该 PDF 曲线在这两点之间的面积。

公式:
\( P(c \le X \le d) = \int_{c}^{d} f(x) dx \)

常见错误提醒:学生常会纠结该用 \( < \) 还是 \( \le \)。在连续随机变量中,这没有区别!因为取单一点的概率为零,所以 \( P(X < 5) \) 与 \( P(X \le 5) \) 是完全一样的。

例子:如果等待火车的时间是用 PDF 来建模的,那么你等待时间在 2 到 5 分钟之间的概率,就是该函数从 2 到 5 的积分。

4. 累积分布函数 (CDF)

累积分布函数 (Cumulative Distribution Function),记作 \( F(x) \),就像是一个概率的“累计总额”。它告诉你变量小于或等于某个数值 \( x \) 的概率。

定义:
\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt \)

两者之间的转换:
- 如果你有 PDF \( f(x) \) 并想求 CDF \( F(x) \)积分 (Integrate)
- 如果你有 CDF \( F(x) \) 并想求 PDF \( f(x) \)微分 (Differentiate) (\( f(x) = F'(x) \))。

记忆小撇步:CDF 想象成一个 Collector(收集者)。它从起始点开始收集所有概率,直到你关注的那个点为止。

关键总结:\( F(x) \) 的值总是从 0 开始,以 1 结束。它代表了“到目前为止”的累计概率。

5. 集中趋势测量(平均值与中位数)

就像处理数字列表一样,我们也想找到连续分布的“中间”或“平均”位置。

平均值 (期望值)

平均值,或称 \( E(X) \),是 PDF 的“平衡点”。要找到它,我们将 \( x \) 乘以 PDF 并进行积分。

公式:
\( E(X) = \mu = \int_{all \space x} x f(x) dx \)

中位数

中位数 \( m \) 是该点左侧刚好有 50% 概率,右侧有 50% 概率的数值。要找到它,我们使用 CDF!

公式:
解 \( F(m) = 0.5 \) 以求出 \( m \)。

类比:如果 PDF 是一块木板,平均值就是你能用手指保持平衡的位置;而中位数则是你可以将木板锯成两半,使得两块重量相等的位置。

6. 方差与标准差

方差告诉我们概率分布有多“分散”。如果方差很大,数值就更有可能远离平均值。

第 1 步:使用 \( \int x^2 f(x) dx \) 求出 \( E(X^2) \)。
第 2 步:使用方差公式:
\( Var(X) = E(X^2) - [E(X)]^2 \)
第 3 步:如果你需要标准差 (Standard Deviation) (\( \sigma \)),只需将方差开平方根即可。

小技巧:记得先计算 \( E(X) \),因为在方差公式中你也需要用到它!

7. 考试题型检核清单

当你面对连续随机变量的题目时,请遵循这个思路:

1. PDF 中是否有未知的常数 \( k \)?
将函数在其整个定义域范围内进行积分,设其等于 1,然后解出 \( k \)。

2. 需要计算概率吗?
将 PDF 在题目给定的两个数值之间进行积分。

3. 需要找中位数或百分位数吗?
先通过积分求出 CDF \( F(x) \),然后令其等于 0.5(中位数)或对应的百分位数(例如下四分位数为 0.25),并解出 \( x \)。

4. 需要找平均值吗?
对 \( x \times f(x) \) 进行积分。

别担心积分看起来很吓人!大多数 Oxford AQA 的题目涉及的都是多项式(例如 \( x^2 + 2x \)),它们遵循简单的规则:指数加 1,再除以新的指数。你一定可以的!