Continuous random variables

连续型随机变量：S2 统计学笔记

欢迎来到连续型随机变量的精彩世界！如果你已经顺利掌握了离散型随机变量，那么你已经成功了一半。两者的主要区别在于：我们不再对结果进行计数（比如掷骰子），而是对其进行测量（比如时间或身高）。由于无法进行简单的计数，我们将统计工具箱从求和（$\Sigma$）切换到了强大的微积分语言（积分与微分）！

别担心，如果积分让你觉得棘手——这一章其实是你纯数学（Pure Maths）技能的最佳应用场景，它会让你明白那些积分规则究竟有何用处。

1. 离散 vs. 连续：核心差异

在研究随机变量（Random Variables, RVs）时，我们根据其取值范围进行分类：

离散型随机变量（复习）

取有限个或可列个离散数值（例如：0, 1, 2, 3）。
我们使用概率质量函数（PMF），即 $P(X=x)$，为每一个点分配一个特定的概率。
我们使用求和（$\Sigma$）来计算总概率或期望值。

连续型随机变量（CRV）

可以在指定的范围或区间内取任意数值（例如：机器发生故障所需的时间、学生的身高）。
由于在任意两点之间都有无穷多个可能的取值，变量取某一个精确点的概率为零。
关键结论： $P(X = a) = 0$。这意味着对于连续型随机变量，$P(a < X < b)$ 与 $P(a \le X \le b)$ 是完全一样的！
我们使用积分（$\int$）来计算区间内的概率（即曲线下的面积）。

类比：想象一下马拉松选手的完赛时间。他们刚好在 4 小时 0 分 0.00000000... 秒完成比赛的概率几乎为零，因为时间是连续的。我们只能计算他们在这 4 小时到 4 小时 5 分钟之间完赛的概率。

关键要点 1：

对于连续型随机变量，概率是在区间（面积）内衡量的，而不是在单个点上。如果你看到 $P(X=k)$，答案永远是 $0$。

2. 概率密度函数（PDF），$f(x)$

对于连续型随机变量 $X$，我们使用一个称为概率密度函数（Probability Density Function, PDF）的函数，记作 $f(x)$。

什么是 $f(x)$？

PDF 描述了概率在所有可能取值范围内的分布情况。它不是概率本身，而是该点 $x$ 处的概率“密度”。

有效 PDF 的条件

为了使 $f(x)$ 成为有效的 PDF，它必须满足两个基本条件：

非负性： 概率密度不能为负。
$$\text{即：对于所有 } x \text{，都有 } f(x) \ge 0$$
总概率（面积为 1）： PDF 曲线下的总面积必须等于 1。
$$\text{即：} \int_{-\infty}^{\infty} f(x) dx = 1$$ （在实际应用中，由于 $f(x)$ 通常定义在特定的区间 $[a, b]$ 上，该积分变为 $\int_{a}^{b} f(x) dx = 1$）。

使用 PDF 计算概率

要找到 $X$ 落在两个值 $a$ 和 $b$ 之间的概率，我们只需计算该区间内 PDF 曲线下的面积：

$$P(a < X < b) = \int_{a}^{b} f(x) dx$$

分步指南：寻找未知常数 $k$

许多考试题的开头都会要求你求出定义在区间 $[a, b]$ 上的 PDF 中的未知常数 $k$。

列出积分： 使用总概率规则，即 $\int_{a}^{b} k \cdot (\text{关于 } x \text{ 的函数}) dx = 1$。
对函数积分： 对 $x$ 进行积分运算。
代入极限： 使用 $F(b) - F(a)$ 计算定积分。
解出 $k$： 将结果令为 1，解出方程求出 $k$。

快速回顾：PDF

$f(x)$ 是概率密度。
$f(x)$ 下的总面积必须为 $1$。
概率通过积分计算得出。

3. 累积分布函数（CDF），$F(x)$

累积分布函数（Cumulative Distribution Function, CDF），记作 $F(x)$，告诉我们累积到特定值 $x$ 为止的总概率。其定义为：

$$F(x) = P(X \le x)$$

微积分关系：PDF 与 CDF

这是你纯数学知识最强关联的地方！由于 $F(x)$ 累积了概率（面积），它正是 PDF $f(x)$ 的积分：

$$F(x) = \int_{-\infty}^{x} f(t) dt$$

（我们在积分中使用哑变量 $t$，以免与上限 $x$ 混淆。）

反之，PDF 是 CDF 的变化率，即它的导数：

$$f(x) = \frac{d}{dx} F(x)$$

CDF 的性质与用途

CDF 必须从 0 开始，到 1 结束：
- 对于 $X$ 的最小值，$F(x) = 0$。
- 对于 $X$ 的最大值，$F(x) = 1$。
使用 CDF 计算区间概率： 这通常比直接积分 PDF 快得多。
$$P(a < X < b) = F(b) - F(a)$$

寻找百分位数与中位数

常见的任务是找到对应于给定概率（百分位数或四分位数）的特定值 $k$。例如，寻找中位数 $m$。

中位数 $m$ 是满足 $P(X \le m) = 0.5$ 的值。
要找到 $m$，你需要解方程 $F(m) = 0.5$，或者如果你还没求出 $F(x)$： $$ \int_{a}^{m} f(x) dx = 0.5 $$

你知道吗？中位数是一种至关重要的集中趋势测量指标，因为它不像平均数那样受极端异常值的影响！

关键要点 2：

PDF 和 CDF 通过微分和积分相互关联。使用 PDF 求出 CDF，并利用 CDF 快速计算概率和百分位数。

4. 集中趋势与离散程度的度量

就像离散型随机变量一样，我们需要为连续型随机变量计算平均值（期望）、方差和标准差。我们只需要将求和替换为积分即可。

平均值或期望，$E(X)$

平均值 $\mu$ 是随机变量的长期平均值。它代表了分布的“平衡点”。

$$E(X) = \mu = \int_{-\infty}^{\infty} x f(x) dx$$

函数的期望，$E(g(X))$

如果我们对 $X$ 的某个函数（例如 $X^2$、$1/X$）的期望值感兴趣，我们使用通用公式：

$$E(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) dx$$

常见错误：记得在积分前，将函数 $g(x)$ 乘以密度函数 $f(x)$。

方差，$\text{Var}(X)$

方差衡量了数据围绕平均值的离散程度或波动范围。

定义公式是 $\text{Var}(X) = E((X-\mu)^2)$。然而，你必须使用的计算公式是：

$$\text{Var}(X) = E(X^2) - [E(X)]^2$$

使用该公式的步骤：

先计算 $E(X)$（如上所述）。
使用 $g(x) = x^2$ 的期望公式计算 $E(X^2)$：
$$E(X^2) = \int_{-\infty}^{\infty} x^2 f(x) dx$$
将两个结果代入方差公式。

标准差，$\sigma$

标准差仅仅是方差的平方根，它给出了 $X$ 在原始单位下的离散程度。

$$\sigma = \sqrt{\text{Var}(X)}$$

关键要点 3：

平均值和方差的计算都涉及积分。对于方差，始终使用简化公式 $\text{Var}(X) = E(X^2) - [E(X)]^2$。

5. 连续型随机变量的变换

这些规则规定了当你变换单个变量或组合两个独立变量时，平均值和方差是如何变化的。它们与离散型随机变量的规则完全相同。

5.1 单变量的线性变换

设 $Y = aX + b$，其中 $a$ 和 $b$ 为常数。

期望法则

乘以 $a$ 并加上 $b$，平均值会发生同样的位移：

$$E(aX + b) = aE(X) + b$$

例子：如果平均分 $E(X)$ 为 50，那么乘以 2 再加 10 后的平均分为 $2(50) + 10 = 110$。

方差法则

加上常数 $b$ 不会改变离散程度，但乘以 $a$ 会使离散程度缩放 $a^2$ 倍（因为方差的单位是平方）：

$$\text{Var}(aX + b) = a^2\text{Var}(X)$$

例子：如果 $\text{Var}(X)=4$，那么 $\text{Var}(3X - 5)$ 为 $3^2 \times 4 = 36$。

5.2 两个独立变量的和与差

设 $X$ 和 $Y$ 是两个独立的连续型随机变量。

期望法则（可加性）

和或差的期望等于期望的和或差：

$$E(aX \pm bY) = aE(X) \pm bE(Y)$$

方差法则（始终相加）

当你组合独立变量时，无论你是相加还是相减，不确定性（方差）总是增加的。两个变量的变异都会导致最终离散程度的扩大。

$$\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)$$

方差记忆辅助： 差的方差仍然是相加！$\text{Var}(X-Y) = \text{Var}(X) + \text{Var}(Y)$。
思考：减去两个变量只会使整体结果更加分散且难以预测，因此方差必然增加。

关键要点 4：

线性变换规则至关重要！请记住，期望是线性缩放的，但方差按系数的平方进行缩放，并且在组合独立随机变量时，方差总是相加。

快速回顾：连续型随机变量

下表总结了本章计算所需的核心公式：

计算汇总

概念	公式
总面积（归一化）	$\int_{-\infty}^{\infty} f(x) dx = 1$
区间概率	$P(a < X < b) = \int_{a}^{b} f(x) dx$
CDF	$F(x) = \int_{-\infty}^{x} f(t) dt$
平均值 $E(X)$	$\int_{-\infty}^{\infty} x f(x) dx$
方差 $\text{Var}(X)$	$E(X^2) - [E(X)]^2$
线性期望	$E(aX+b) = aE(X) + b$
线性方差	$\text{Var}(aX+b) = a^2\text{Var}(X)$
和/差的方差（独立）	$\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)$

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

概念	公式
总面积（归一化）	\(\int_{-\infty}^{\infty} f(x) dx = 1\)
区间概率	\(P(a < X < b) = \int_{a}^{b} f(x) dx\)
CDF	\(F(x) = \int_{-\infty}^{x} f(t) dt\)
平均值 \(E(X)\)	\(\int_{-\infty}^{\infty} x f(x) dx\)
方差 \(\text{Var}(X)\)	\(E(X^2) - [E(X)]^2\)
线性期望	\(E(aX+b) = aE(X) + b\)
线性方差	\(\text{Var}(aX+b) = a^2\text{Var}(X)\)
和/差的方差（独立）	\(\text{Var}(aX \pm bY) = a^2\text{Var}(X) + b^2\text{Var}(Y)\)

连续型随机变量：S2 统计学笔记

1. 离散 vs. 连续：核心差异

离散型随机变量（复习）

连续型随机变量（CRV）

关键要点 1：

2. 概率密度函数（PDF），\(f(x)\)

什么是 \(f(x)\)？

有效 PDF 的条件

使用 PDF 计算概率

分步指南：寻找未知常数 \(k\)

快速回顾：PDF

3. 累积分布函数（CDF），\(F(x)\)

微积分关系：PDF 与 CDF

CDF 的性质与用途

寻找百分位数与中位数

关键要点 2：

4. 集中趋势与离散程度的度量

平均值或期望，\(E(X)\)

函数的期望，\(E(g(X))\)

方差，\(\text{Var}(X)\)

标准差，\(\sigma\)