Continuous random variables

欢迎来到连续随机变量的世界！

在之前的学习中，你可能接触过离散随机变量（Discrete Random Variables）——即那些可以数出来的数值，例如投掷三次硬币出现正面的次数，或是班级内的人数。但如果是我们“测量”出来的数值呢？想象一下你等巴士的时间、一颗苹果的重量，或是树木的精确高度。这些数值可以在某个范围内取任何值，这就是所谓的连续随机变量（Continuous Random Variables, CRVs）。

阅读完这些笔记后，你将学会如何用数学方式描述这些变量、如何找到“平均”结果，以及如何计算事件发生的概率。如果一开始觉得微积分的部分有些困难，别担心！我们会一步一步为你拆解！

1. 离散与连续：两者之间的大不同

要理解连续随机变量，将它与离散变量进行比较会非常有帮助。

离散：就像只显示分钟的电子钟。时间从 10:01“跳”到 10:02。你可以列出所有可能的结果。
连续：就像老式的指针钟，秒针平滑地移动。在 10:01 和 10:02 之间，有无穷多个微小的瞬间（例如 10:01.0001, 10:01.00012 等等）。

你知道吗？由于存在无限多个可能值，连续变量在某个特定数值（例如身高刚好是 1.750000... 米）的概率实际上是零！因此，我们总是寻找数值落在某个范围内的概率。

2. 概率密度函数 (PDF)

由于我们无法像离散变量那样用表格列出概率，我们使用图表或公式，称为概率密度函数 (Probability Density Function)，记作 \( f(x) \)。

你可以将 PDF 想象成一张显示概率分布情况的“地图”。曲线越高，变量落在该区域的可能性就越大。

PDF 的黄金法则：
1. 曲线绝不能低于 x 轴。用数学表示：对于所有 \( x \)，\( f(x) \ge 0 \)。 (概率不可能是负数！)
2. 整个曲线下的总面积必须等于 1。这代表某个事件一定会发生的 100% 概率。

快速复习：要找到总面积，我们使用积分！对于在区间 \( a \) 到 \( b \) 之间定义的 PDF：
\( \int_{a}^{b} f(x) dx = 1 \)

关键总结：PDF 描述了概率的“形状”，且其下方的总面积永远是 1。

3. 计算概率（面积法）

正如我们之前提到的，我们只计算范围的概率。要找出变量 \( X \) 落在两个数值 \( c \) 和 \( d \) 之间的概率，我们只需计算该 PDF 曲线在这两点之间的面积。

公式：
\( P(c \le X \le d) = \int_{c}^{d} f(x) dx \)

常见错误提醒：学生常会纠结该用 \( < \) 还是 \( \le \)。在连续随机变量中，这没有区别！因为取单一点的概率为零，所以 \( P(X < 5) \) 与 \( P(X \le 5) \) 是完全一样的。

例子：如果等待火车的时间是用 PDF 来建模的，那么你等待时间在 2 到 5 分钟之间的概率，就是该函数从 2 到 5 的积分。

4. 累积分布函数 (CDF)

累积分布函数 (Cumulative Distribution Function)，记作 \( F(x) \)，就像是一个概率的“累计总额”。它告诉你变量小于或等于某个数值 \( x \) 的概率。

定义：
\( F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt \)

两者之间的转换：
- 如果你有 PDF \( f(x) \) 并想求 CDF \( F(x) \)：积分 (Integrate)。
- 如果你有 CDF \( F(x) \) 并想求 PDF \( f(x) \)：微分 (Differentiate) (\( f(x) = F'(x) \))。

记忆小撇步：将 CDF 想象成一个 Collector（收集者）。它从起始点开始收集所有概率，直到你关注的那个点为止。

关键总结：\( F(x) \) 的值总是从 0 开始，以 1 结束。它代表了“到目前为止”的累计概率。

5. 集中趋势测量（平均值与中位数）

就像处理数字列表一样，我们也想找到连续分布的“中间”或“平均”位置。

平均值 (期望值)

平均值，或称 \( E(X) \)，是 PDF 的“平衡点”。要找到它，我们将 \( x \) 乘以 PDF 并进行积分。

公式：
\( E(X) = \mu = \int_{all \space x} x f(x) dx \)

中位数

中位数 \( m \) 是该点左侧刚好有 50% 概率，右侧有 50% 概率的数值。要找到它，我们使用 CDF！

公式：
解 \( F(m) = 0.5 \) 以求出 \( m \)。

类比：如果 PDF 是一块木板，平均值就是你能用手指保持平衡的位置；而中位数则是你可以将木板锯成两半，使得两块重量相等的位置。

6. 方差与标准差

方差告诉我们概率分布有多“分散”。如果方差很大，数值就更有可能远离平均值。

第 1 步：使用 \( \int x^2 f(x) dx \) 求出 \( E(X^2) \)。
第 2 步：使用方差公式：
\( Var(X) = E(X^2) - [E(X)]^2 \)
第 3 步：如果你需要标准差 (Standard Deviation) (\( \sigma \))，只需将方差开平方根即可。

小技巧：记得先计算 \( E(X) \)，因为在方差公式中你也需要用到它！

7. 考试题型检核清单

当你面对连续随机变量的题目时，请遵循这个思路：

1. PDF 中是否有未知的常数 \( k \)？
将函数在其整个定义域范围内进行积分，设其等于 1，然后解出 \( k \)。

2. 需要计算概率吗？
将 PDF 在题目给定的两个数值之间进行积分。

3. 需要找中位数或百分位数吗？
先通过积分求出 CDF \( F(x) \)，然后令其等于 0.5（中位数）或对应的百分位数（例如下四分位数为 0.25），并解出 \( x \)。

4. 需要找平均值吗？
对 \( x \times f(x) \) 进行积分。

别担心积分看起来很吓人！大多数 Oxford AQA 的题目涉及的都是多项式（例如 \( x^2 + 2x \)），它们遵循简单的规则：指数加 1，再除以新的指数。你一定可以的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。