欢迎来到连续随机变量的世界!

在之前的学习中,你可能已经接触过离散随机变量 (Discrete Random Variables)——即那些可以数得出来的数值,比如抛硬币出现的正反面次数,或是掷骰子的结果。在这一章,我们将进入连续随机变量 (Continuous Random Variables, 简称 CRV) 的领域。这些变量处理的是在一定范围内可以取任何数值的数据,例如烧开一壶水所需的时间、树木的高度,或是苹果的精确重量。

如果起初觉得这些概念有些抽象,别担心!你可以把它想像成从“楼梯”(你只能站在特定的阶梯上)过渡到“平滑的斜坡”(你可以在任何高度站立)。我们会运用一些微积分来求取概率,但我们会一步步带你拆解。

1. 概率密度函数 (Probability Density Function, pdf)

对于连续随机变量,我们使用一个称为概率密度函数 (pdf) 的函数,记作 \(f(x)\)。这个函数描述了分布的形状。

黄金法则:要让 \(f(x)\) 成为一个有效的 pdf,必须同时满足两点:
1. 函数值永不为负:对于所有的 \(x\),\(f(x) \geq 0\)。
2. 曲线下的总面积必须等于 1。数学上即:\(\int_{-\infty}^{\infty} f(x) dx = 1\)。

比喻:雨量计

想像一个形状特殊的雨量计,它总共能容纳的总水量正好是 1 公升。雨量计在任何一点的高度就像是 \(f(x)\)。若要找出特定区域有多少“概率水”,你只需计算该区域的面积即可。

重点复习:
- 离散:概率是特定点上的数值。
- 连续:概率是曲线下的面积
- 关键事实:连续随机变量等于精确某一点的概率为零!\(P(X = 5) = 0\)。我们只测量区间,例如 \(P(4.9 < X < 5.1)\)。

2. 在区间内求概率

若要找出观测值介于 \(a\) 和 \(b\) 之间的概率,我们使用积分 (integration) 来计算该区间内曲线下的面积。

\(P(a < X < b) = \int_{a}^{b} f(x) dx\)

逐步操作:

1. 确认你感兴趣的范围 \([a, b]\)。
2. 建立函数 \(f(x)\) 在这些上下限之间的积分。
3. 进行积分并求解!

常见错误:遗漏了积分限。务必检查函数定义的范围。如果函数定义在 \(0 < x < 4\),而题目问的是 \(P(x > 3)\),你的积分范围应该是从 3 到 4,而不是 3 到无穷大!

3. 平均数的度量:期望值与中位数

就像处理离散数据一样,我们需要找到连续随机变量的“中心”。

期望值 (Mean / Expected Value)

期望值 (Mean),即 \(E(X)\),代表概率分布的“平衡点”。其公式为:
\(E(X) = \int x f(x) dx\)

(提示:在积分之前,只需将你的函数乘以 \(x\) 即可!)

中位数与四分位数

中位数 (Median, \(m\)) 是指左侧占总面积 50%、右侧也占 50% 的数值。要找到它,请解以下方程式中的 \(m\):
\(\int_{-\infty}^{m} f(x) dx = 0.5\)

同理:
- 对于下四分位数 (Lower Quartile, \(Q_1\)),面积为 0.25。
- 对于上四分位数 (Upper Quartile, \(Q_3\)),面积为 0.75。

你知道吗?中位数是“公平切割”点。如果 pdf 是一个蛋糕,中位数就是你切割的位置,让两个人刚好分到同样多的蛋糕!

4. 离散度的度量:方差与标准差

为了观察数据的分散程度,我们计算方差 (Variance)标准差 (Standard Deviation)

方差公式

\(Var(X) = E(X^2) - [E(X)]^2\)

为了求出 \(E(X^2)\),我们使用与期望值类似的积分,但将 \(x\) 替换为 \(x^2\):
\(E(X^2) = \int x^2 f(x) dx\)

记忆口诀:“平方的期望值减去期望值的平方”。

标准差

标准差 (Standard Deviation) 就是方差的平方根:\(\sigma = \sqrt{Var(X)}\)。

关键步骤:
1. 利用 \(\int x f(x) dx\) 求出 \(E(X)\)。
2. 利用 \(\int x^2 f(x) dx\) 求出 \(E(X^2)\)。
3. 将结果代入方差公式。

5. 函数的期望值:\(E(g(X))\)

有时候,我们感兴趣的不止是 \(X\),而是 \(X\) 的某个函数,例如 \(X^3\) 或 \(1/X\)。课程要求你处理诸如 \(5X^3\)、\(18X^{-3}\) 或 \(6X^{-1}\) 这类函数。

规则很简单:将期望值公式中的 \(x\) 替换为你的新函数 \(g(x)\):
\(E(g(X)) = \int g(x) f(x) dx\)

范例:若要计算 \(E(18X^{-3})\),你需要计算 \(\int (18x^{-3}) f(x) dx\)。

6. 线性变换

如果我们改变数据的刻度该怎么办?例如,将摄氏温度 \(X\) 转换为新的刻度 \(aX + b\)。我们可以使用这些好用的“捷径”规则:

对于期望值: \(E(aX + b) = aE(X) + b\)
(平均数的平移与伸缩正如你所预期。)

对于方差: \(Var(aX + b) = a^2 Var(X)\)
(加上 \(b\) 不会改变分散程度;而缩放因子 \(a\) 会使方差增加 \(a^2\) 倍,因为方差是“平方”单位。)

快速复习框:
若 \(E(X) = 10\) 且 \(Var(X) = 4\):
- \(E(2X + 5) = 2(10) + 5 = 25\)
- \(Var(2X + 5) = 2^2 \times 4 = 16\)

7. 独立随机变量

如果你有两个随机变量 \(X\) 和 \(Y\),且它们是独立的(意味着一个变量的结果不会影响另一个),你可以轻松地结合它们的期望值与方差。

期望值的和: \(E(X + Y) = E(X) + E(Y)\)
方差的和: \(Var(X + Y) = Var(X) + Var(Y)\)

重要提示:这个方差规则在变量独立时成立!此外,即使你是进行减法计算(即求 \(Var(X - Y)\)),你依然要将方差相加,因为当你结合两个变量时,不确定性(分散程度)总是会增加!

总结表:关键公式

总概率: \(\int f(x) dx = 1\)
期望值 \(E(X)\): \(\int x f(x) dx\)
\(E(X^2)\): \(\int x^2 f(x) dx\)
方差 \(Var(X)\): \(E(X^2) - [E(X)]^2\)
中位数 \(m\): 解 \(\int_{-\infty}^{m} f(x) dx = 0.5\)

最后小撇步:如果可以的话,试着画出函数图!这有助于你视觉化面积,并检查你计算出的平均数或中位数在图表上看起来是否“合理”。