随机变量综述:概念到实践的全景指南
预计阅读时间: 5 分钟了解随机变量的定义、分布特性、统计数值以及在信息熵、频率直方图和百分位数等实际场景中的应用,帮助读者快速捕捉要点,并引导进一步阅读完整教程。
随机变量的概念
随机变量
随机变量是描述随机试验结果的函数,常用大写字母 $X、Y、Z$ 或希腊字母 $xi、\eta、\zeta$ 表示。它把样本空间 $Omega$ 中的每个基本事件映射为实数值,从而将不确定的实验转化为可量化的数值。
分布函数
分布函数 $F(x$ 给出随机变量 $X$ 小于等于某实数 $x$ 的概率:
$$ F(x) = P( X \le x ) $$
它满足右连续、单调递增并在 $-\infty$ 与 $+\infty$ 处分别取 $0$ 与 $1$。
示性函数
示性函数 $I_A$ 用于指示事件 $A$ 是否发生:
$$ I_A(\omega) = \begin{cases} 1, & \omega \in A \ 0, & \omega \notin A \end{cases} $$
其期望恰好等于事件 $A$ 的概率,即 $E[I_A] = P(A$。
离散型随机变量
离散型随机变量的取值集合是有限或可数无限的。例如掷骰子的点数 ${1,2,3,4,5,6}$。其概率分布可用概率分布列描述:
- $P{ X = x_i } = p_i$,且 $sum_i p_i = 1$。
连续型随机变量
连续型随机变量的取值覆盖整个区间(或更广)。单点概率通常为 $0$,而应使用密度函数 $f(x$ 来刻画分布:
$$ F(x) = \int_{-\infty}^{x} f(t) , dt , \qquad f(x) \ge 0 , \qquad \int_{-\infty}^{\infty} f(x) , dx = 1 $$
随机变量的独立性
若对任意实数 $x$ 与 $y$ 都满足
$$ P( X \le x , Y \le y ) = P( X \le x ) , P( Y \le y ) $$
则称 $X$ 与 $Y$ 相互独立。独立性意味着它们的边缘分布互不影响。
随机变量的数字特征
期望
期望是随机变量的平均值。离散情形:
$$ E[X] = \sum_i x_i , p_i $$
连续情形:
$$ E[X] = \int_{-\infty}^{\infty} x , f(x) , dx $$
它具备线性特性 $E[aX + bY + c] = aE[X] + bE[Y] + c$。
方差
方差衡量离散程度:
$$ \operatorname{Var}(X) = E!\left[(X - E[X])^{2}\right] = E[X^{2}] - (E[X])^{2} $$
若对变量作线性变换 $aX + b$,则 $operatorname{Var}(aX + b) = a^{2}\operatorname{Var}(X$。
协方差
协方差描述两个变量的线性相关程度:
$$ \operatorname{Cov}(X, Y) = E!\big[(X - E[X]) (Y - E[Y])\big] $$
它满足 $operatorname{Cov}(X, X) = \operatorname{Var}(X$,以及 $operatorname{Cov}(aX + bY, Z) = a,\operatorname{Cov}(X, Z) + b,\operatorname{Cov}(Y, Z$。
相关系数
相关系数 $rho_{X,Y}$ 将协方差标准化:
$$ \rho_{X,Y} = \frac{\operatorname{Cov}(X, Y)}{\sigma_X , \sigma_Y} $$
其中 $sigma_X = \sqrt{\operatorname{Var}(X)}$。其取值范围为 $-1 \le \rho_{X,Y} \le 1$;若 $| \rho_{X,Y} | = 1$,则 $X$ 与 $Y$ 线性相关。
Markov 不等式
对非负随机变量 $X$,任意正数 $a$ 满足
$$ P( X \ge a ) \le \frac{E[X]}{a} $$
该不等式仅依赖期望即可给出上界。
随机变量的应用
信息熵
信息熵衡量随机变量的不确定性:
$$ H(X) = -\sum_{x} P(X = x) , \log_{2} P(X = x) $$
若 $X$ 均匀分布于 ${1,2,\dots ,n}$,则 $H(X) = \log_{2} n$,说明存储 $n$ 个等概率符号至少需要 $log_{2} n$ 比特。
频率分布直方图
直方图以矩形面积表示频率,横轴为取值区间,纵轴为相对频率(频数除以总数)。等距分组常用于展示连续型数据的分布形态。
百分位数和四分位数
将有序数据 $x_{1}\le x_{2}\le \dots \le x_{n}$ 按累计比例划分,可得到第 $k$ 百分位数 $P_{k}$。常见四分位数包括:
- $Q_{1}=P_{25}$(上四分位数)
- $Q_{2}=P_{50}$(中位数)
- $Q_{3}=P_{75}$(下四分位数)
四分位距 $Q_{3} - Q_{1}$ 描述数据的离散程度。
想进一步掌握随机变量的理论细节与实际例题,请访问原文 随机变量专题(https://raineblog.dpdns.org/whk/science/probability/3/),深入阅读完整章节内容。