随机变量综述：概念到实践的全景指南

预计阅读时间: 5 分钟

了解随机变量的定义、分布特性、统计数值以及在信息熵、频率直方图和百分位数等实际场景中的应用，帮助读者快速捕捉要点，并引导进一步阅读完整教程。

随机变量的概念

随机变量

随机变量是描述随机试验结果的函数，常用大写字母 $X、Y、Z$ 或希腊字母 $xi、\eta、\zeta$ 表示。它把样本空间 $Omega$ 中的每个基本事件映射为实数值，从而将不确定的实验转化为可量化的数值。

分布函数

分布函数 $F(x$ 给出随机变量 $X$ 小于等于某实数 $x$ 的概率：

$$ F(x) = P( X \le x ) $$

它满足右连续、单调递增并在 $-\infty$ 与 $+\infty$ 处分别取 $0$ 与 $1$。

示性函数

示性函数 $I_A$ 用于指示事件 $A$ 是否发生：

$$ I_A(\omega) = \begin{cases} 1, & \omega \in A \ 0, & \omega \notin A \end{cases} $$

其期望恰好等于事件 $A$ 的概率，即 $E[I_A] = P(A$。

离散型随机变量

离散型随机变量的取值集合是有限或可数无限的。例如掷骰子的点数 ${1,2,3,4,5,6}$。其概率分布可用概率分布列描述：

$P{ X = x_i } = p_i$，且 $sum_i p_i = 1$。

连续型随机变量

连续型随机变量的取值覆盖整个区间（或更广）。单点概率通常为 $0$，而应使用密度函数 $f(x$ 来刻画分布：

$$ F(x) = \int_{-\infty}^{x} f(t) , dt , \qquad f(x) \ge 0 , \qquad \int_{-\infty}^{\infty} f(x) , dx = 1 $$

随机变量的独立性

若对任意实数 $x$ 与 $y$ 都满足

$$ P( X \le x , Y \le y ) = P( X \le x ) , P( Y \le y ) $$

则称 $X$ 与 $Y$ 相互独立。独立性意味着它们的边缘分布互不影响。

随机变量的数字特征

期望

期望是随机变量的平均值。离散情形：

$$ E[X] = \sum_i x_i , p_i $$

连续情形：

$$ E[X] = \int_{-\infty}^{\infty} x , f(x) , dx $$

它具备线性特性 $E[aX + bY + c] = aE[X] + bE[Y] + c$。

方差

方差衡量离散程度：

$$ \operatorname{Var}(X) = E!\left[(X - E[X])^{2}\right] = E[X^{2}] - (E[X])^{2} $$

若对变量作线性变换 $aX + b$，则 $operatorname{Var}(aX + b) = a^{2}\operatorname{Var}(X$。

协方差

协方差描述两个变量的线性相关程度：

$$ \operatorname{Cov}(X, Y) = E!\big[(X - E[X]) (Y - E[Y])\big] $$

它满足 $operatorname{Cov}(X, X) = \operatorname{Var}(X$，以及 $operatorname{Cov}(aX + bY, Z) = a,\operatorname{Cov}(X, Z) + b,\operatorname{Cov}(Y, Z$。

Markov 不等式

对非负随机变量 $X$，任意正数 $a$ 满足

$$ P( X \ge a ) \le \frac{E[X]}{a} $$

该不等式仅依赖期望即可给出上界。

随机变量的应用

信息熵

信息熵衡量随机变量的不确定性：

$$ H(X) = -\sum_{x} P(X = x) , \log_{2} P(X = x) $$

若 $X$ 均匀分布于 ${1,2,\dots ,n}$，则 $H(X) = \log_{2} n$，说明存储 $n$ 个等概率符号至少需要 $log_{2} n$ 比特。

频率分布直方图

直方图以矩形面积表示频率，横轴为取值区间，纵轴为相对频率（频数除以总数）。等距分组常用于展示连续型数据的分布形态。

百分位数和四分位数

将有序数据 $x_{1}\le x_{2}\le \dots \le x_{n}$ 按累计比例划分，可得到第 $k$ 百分位数 $P_{k}$。常见四分位数包括：

$Q_{1}=P_{25}$（上四分位数）
$Q_{2}=P_{50}$（中位数）
$Q_{3}=P_{75}$（下四分位数）

四分位距 $Q_{3} - Q_{1}$ 描述数据的离散程度。

想进一步掌握随机变量的理论细节与实际例题，请访问原文 随机变量专题（https://raineblog.dpdns.org/whk/science/probability/3/），深入阅读完整章节内容。

#随机变量综述：概念到实践的全景指南

#随机变量的概念

#随机变量

#分布函数

#示性函数

#离散型随机变量

#连续型随机变量

#随机变量的独立性

#随机变量的数字特征

#期望

#方差

#协方差

#相关系数

#Markov 不等式

#随机变量的应用

#信息熵

#频率分布直方图

#百分位数和四分位数