Continuous random variables (CRVs)

欢迎来到连续随机变量的世界！

在之前的学习中，你可能已经接触过离散随机变量 (Discrete Random Variables)——即那些可以数得出来的数值，比如抛硬币出现的正反面次数，或是掷骰子的结果。在这一章，我们将进入连续随机变量 (Continuous Random Variables, 简称 CRV) 的领域。这些变量处理的是在一定范围内可以取任何数值的数据，例如烧开一壶水所需的时间、树木的高度，或是苹果的精确重量。

如果起初觉得这些概念有些抽象，别担心！你可以把它想像成从“楼梯”（你只能站在特定的阶梯上）过渡到“平滑的斜坡”（你可以在任何高度站立）。我们会运用一些微积分来求取概率，但我们会一步步带你拆解。

1. 概率密度函数 (Probability Density Function, pdf)

对于连续随机变量，我们使用一个称为概率密度函数 (pdf) 的函数，记作 \(f(x)\)。这个函数描述了分布的形状。

黄金法则：要让 \(f(x)\) 成为一个有效的 pdf，必须同时满足两点：
1. 函数值永不为负：对于所有的 \(x\)，\(f(x) \geq 0\)。
2. 曲线下的总面积必须等于 1。数学上即：\(\int_{-\infty}^{\infty} f(x) dx = 1\)。

比喻：雨量计

想像一个形状特殊的雨量计，它总共能容纳的总水量正好是 1 公升。雨量计在任何一点的高度就像是 \(f(x)\)。若要找出特定区域有多少“概率水”，你只需计算该区域的面积即可。

重点复习：
- 离散：概率是特定点上的数值。
- 连续：概率是曲线下的面积。
- 关键事实：连续随机变量等于精确某一点的概率为零！\(P(X = 5) = 0\)。我们只测量区间，例如 \(P(4.9 < X < 5.1)\)。

2. 在区间内求概率

若要找出观测值介于 \(a\) 和 \(b\) 之间的概率，我们使用积分 (integration) 来计算该区间内曲线下的面积。

\(P(a < X < b) = \int_{a}^{b} f(x) dx\)

逐步操作：

1. 确认你感兴趣的范围 \([a, b]\)。
2. 建立函数 \(f(x)\) 在这些上下限之间的积分。
3. 进行积分并求解！

常见错误：遗漏了积分限。务必检查函数定义的范围。如果函数定义在 \(0 < x < 4\)，而题目问的是 \(P(x > 3)\)，你的积分范围应该是从 3 到 4，而不是 3 到无穷大！

3. 平均数的度量：期望值与中位数

就像处理离散数据一样，我们需要找到连续随机变量的“中心”。

期望值 (Mean / Expected Value)

期望值 (Mean)，即 \(E(X)\)，代表概率分布的“平衡点”。其公式为：
\(E(X) = \int x f(x) dx\)

（提示：在积分之前，只需将你的函数乘以 \(x\) 即可！）

中位数与四分位数

中位数 (Median, \(m\)) 是指左侧占总面积 50%、右侧也占 50% 的数值。要找到它，请解以下方程式中的 \(m\)：
\(\int_{-\infty}^{m} f(x) dx = 0.5\)

同理：
- 对于下四分位数 (Lower Quartile, \(Q_1\))，面积为 0.25。
- 对于上四分位数 (Upper Quartile, \(Q_3\))，面积为 0.75。

你知道吗？中位数是“公平切割”点。如果 pdf 是一个蛋糕，中位数就是你切割的位置，让两个人刚好分到同样多的蛋糕！

4. 离散度的度量：方差与标准差

为了观察数据的分散程度，我们计算方差 (Variance) 和标准差 (Standard Deviation)。

方差公式

\(Var(X) = E(X^2) - [E(X)]^2\)

为了求出 \(E(X^2)\)，我们使用与期望值类似的积分，但将 \(x\) 替换为 \(x^2\)：
\(E(X^2) = \int x^2 f(x) dx\)

记忆口诀：“平方的期望值减去期望值的平方”。

标准差

标准差 (Standard Deviation) 就是方差的平方根：\(\sigma = \sqrt{Var(X)}\)。

关键步骤：
1. 利用 \(\int x f(x) dx\) 求出 \(E(X)\)。
2. 利用 \(\int x^2 f(x) dx\) 求出 \(E(X^2)\)。
3. 将结果代入方差公式。

5. 函数的期望值：\(E(g(X))\)

有时候，我们感兴趣的不止是 \(X\)，而是 \(X\) 的某个函数，例如 \(X^3\) 或 \(1/X\)。课程要求你处理诸如 \(5X^3\)、\(18X^{-3}\) 或 \(6X^{-1}\) 这类函数。

规则很简单：将期望值公式中的 \(x\) 替换为你的新函数 \(g(x)\)：
\(E(g(X)) = \int g(x) f(x) dx\)

范例：若要计算 \(E(18X^{-3})\)，你需要计算 \(\int (18x^{-3}) f(x) dx\)。

6. 线性变换

如果我们改变数据的刻度该怎么办？例如，将摄氏温度 \(X\) 转换为新的刻度 \(aX + b\)。我们可以使用这些好用的“捷径”规则：

对于期望值： \(E(aX + b) = aE(X) + b\)
（平均数的平移与伸缩正如你所预期。）

对于方差： \(Var(aX + b) = a^2 Var(X)\)
（加上 \(b\) 不会改变分散程度；而缩放因子 \(a\) 会使方差增加 \(a^2\) 倍，因为方差是“平方”单位。）

快速复习框：
若 \(E(X) = 10\) 且 \(Var(X) = 4\)：
- \(E(2X + 5) = 2(10) + 5 = 25\)
- \(Var(2X + 5) = 2^2 \times 4 = 16\)

7. 独立随机变量

如果你有两个随机变量 \(X\) 和 \(Y\)，且它们是独立的（意味着一个变量的结果不会影响另一个），你可以轻松地结合它们的期望值与方差。

期望值的和： \(E(X + Y) = E(X) + E(Y)\)
方差的和： \(Var(X + Y) = Var(X) + Var(Y)\)

重要提示：这个方差规则仅在变量独立时成立！此外，即使你是进行减法计算（即求 \(Var(X - Y)\)），你依然要将方差相加，因为当你结合两个变量时，不确定性（分散程度）总是会增加！

总结表：关键公式

总概率： \(\int f(x) dx = 1\)
期望值 \(E(X)\)： \(\int x f(x) dx\)
\(E(X^2)\)： \(\int x^2 f(x) dx\)
方差 \(Var(X)\)： \(E(X^2) - [E(X)]^2\)
中位数 \(m\)： 解 \(\int_{-\infty}^{m} f(x) dx = 0.5\)

最后小撇步：如果可以的话，试着画出函数图！这有助于你视觉化面积，并检查你计算出的平均数或中位数在图表上看起来是否“合理”。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。