参考教材:印凡成, 夏乐天, 等. 概率论与数理统计[M]. 第三版. 南京: 河海大学出版社, 2004,35:63.
离散型随机变量
随机变量的概念
设 $E$ 为随机试验,它的样本空间是 $\varOmega=\{\omega\}$ 。如果对于每一个 $\omega\in\varOmega$ ,有一个实数 $X(\omega)$ 与之对应,这样就得到一个定义在 $\varOmega$ 上的单值实函数 $X=X(\omega)$ ,称它为随机变量(Random Variable),简记为 $r.v. X$ 。随机变量一般用英文大写字母 $X$ 、 $Y$ 、 $Z$ 等表示 ,也可用希腊字母 $\xi$ 、$\eta$ 、$\zeta$ 等表示。
全部可能取值为有限个或可列无限个的随机变量为离散型随机变量
一维离散型随机变量的分布律
称 $p_k=P\{X=x_k\}, k=1,2,\cdots$ 为 $r.v. X$ 的分布律或概率分布
也可表为
或
分布率的性质:
- $p_k\ge0$
- $\sum_{k=1}^\infty p_k=1$
几个常见的离散型分布
退化分布(单点分布)
其中 $a$ 为常数
即
(0-1)分布(两点分布)
或
几何分布
一次试验中只考虑某事件 $A$ 出现或不出现,设 $P(A)=p$ , $P(A)=1-p$ 。现重复独立地做试验,一旦 $A$ 发生就立即停止试验。
以 $X$ 表示 $A$ 首次发生所需的试验次数,则其分布律为:
称 $X$ 服从参数为 $p$ 的几何分布
二项分布 $X\sim B(n, p)$
以 $X$ 记 n 重贝努里试验中 $A$ 发生的次数,则其分布率为:
称 $X$ 服从参数为 $(n,p)$ 的二项分布,记为 $X\sim B(n, p)$
泊松(Poisson)分布 $P(\lambda)$
$P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda};k=0,1,2,\cdots$
其中 $\lambda\gt0$ 为常数,称 $X$ 服从参数为 $\lambda$ 的泊松(Poisson)分布,记为 $X\sim P(\lambda)$ 。
泊松分布的应用
若 $X(t)$ 表示在时间区间 $[0, t]$ 中某服务台到达的顾客数。若 $X(t)$ 满足:
- 无后效性:在不重叠的时间区间内到达的顾客数相互独立
- 平稳性:在时间区间 $[a,a+t]$ 内到达的顾客数只与时间长度 $t$ 有关,而与区间起点 $a$ 无关
- 普通性:当 $t$ 充分小时,在区间 $(a,a+t)$ 内到达两个或两个以上的顾客不可能
- 非平凡性:在有限区间中只到达有限个顾客且不可能始终没有顾客到达
在上述条件下,在长度为 $t$ 的时间区间上到达的顾客数 $X(t)$ 服从参数为 $\lambda t$ 的泊松分布,其中 $\lambda\gt0$ 是一个常数。即
负二项分布
以 $X$ 记可列重贝努里试验中 $A$ 恰好发生 $r$ 次所需的试验次数,则其分布率为:
称 $X$ 服从参数为 $(r, p)$ 的负二项分布,记为 $X\sim NB(r, p)$
负二项分布又叫帕斯卡(Pascal)分布
超几何分布
设 $N$ 个元素分为两类,其中 $M$ 个属于第一类, $N-M$ 个属于第二类。现从中按不重复抽样取 $n$ 个,以 $X$ 记这 $n$ 个中属于第一类元素的个数。则 $X$ 的分布律为:
称 $X$ 服从参数为 $(N, M, n)$ 的超几何分布。
常用分布律之间的关系
- (0-1) 分布是二项分布 $B(n, p)$ 中 $n=1$ 时的特例。
- 几何分布是负二项分布 $NB(r, p)$ 中 $r=1$ 时的特例。
- 超几何分布和二项分布的关系:
设在超几何分布中, $n$ 是一个取定的正整数,而 $\lim_{N\rightarrow\infty}\frac MN=p$ ,则
即:当 $N$ 充分大时,超几何分布趋向于二项分布。
事实上,超几何分布用来描述不放回抽样的情况,而二项分布则用来描述放回抽样的情况,当 $N$ 充分大时,两种抽样方式的差别很小。
- 二项分布和泊松分布的关系
设随机变量 $X_n\sim B(n, p_n), (n=0, 1, 2, \cdots)$ ,且 $\lim_{n\rightarrow\infty}np_n=\lambda\gt0$ , $\lambda$ 为常数,则
该定理也称为泊松定理。
泊松定理表明,泊松分布是二项分布的极限分布,当 $n$ 很大, $p$ 很小时,二项分布就可近似地看成是泊松分布。其中 $\lambda=np$
一般的,当 $n\ge10, p\le0.1$ 时就可用泊松分布近似代替二项分布。
二维离散型随机变量
联合分布律
若二维随机变量 $(X,Y)$ 只能取至多可列个值 $(x_i,y_j), (i,j=1, 2, \cdots)$ ,则称 $(X,Y)$ 为二维离散型随机变量。
若二维离散型随机变量 $(X,Y)$ 取 $(x_i,y_j)$ 的概率为 $p_{ij}$,即 $P\{X=x_i,Y=y_j\}=p_{ij},(i,j=1,2,\cdots)$
则称 $p_{ij}$ 为二维离散型随机变量 $(X,Y)$ 的分布律,或随机变量 $X$ 与 $Y$ 的联合分布律。
可记为
联合分布律的性质
- $p_{ij}\ge0,i,j=1,2,\cdots$
- $\sum\limits_{i=1}^\infty\sum\limits_{j=1}^\infty p_{ij}=1$
二维离散型随机变量的联合分布律也可列表表示如下:
边缘分布律
若随机变量 $X$ 与 $Y$ 的联合分布律为
则称
为 $(X,Y)$ 关于 $X$ 的边缘分布律
同理,
称为 $(X,Y)$ 关于 $Y$ 的边缘分布律
边缘分布律自然也满足分布律的性质:
- $p_{i\cdot}\ge0;(p_{\cdot j}\ge0)$
- $\sum\limits_{i=1}^\infty p_{i\cdot}=1;(\sum\limits_{j=1}^\infty p_{\cdot j}=1)$
二维离散型随机变量的边缘分布律也可列表表示如下:
条件分布律
设随机变量 $X$ 与 $Y$ 的联合分布律为
$X$ 和 $Y$ 的边缘分布律为
若对固定的 $j, p_{\cdot j}\gt0$ ,则称
为 $Y=y_j$ 的条件下, $X$ 的条件分布律
记为
同理,若对固定的 $i, p_{i\cdot}\gt0$ ,则称
为 $X=x_i$ 的条件下, $Y$ 的条件分布律
条件分布律也满足分布律的性质
离散型随机变量的相互独立性
设随机变量 $X$ 与 $Y$ 的联合分布律为
若对任意的 $i, j$ 有 $p_{ij}=p_{i\cdot}p_{\cdot j}$
即
则称随机变量 $X$ 和 $Y$ 相互独立。
上述独立的概念不难推广到n维离散型随机变量的情形。
设 $X_1, X_2, \cdots, X_n$ 为一个 $n$ 维离散型随机变量,若对任意的 $x_1,x_2,\cdots,x_n$ 有
则称随机变量 $X_1, X_2, \cdots, X_n$ 相互独立。
以 $X$ 记 $n$ 重贝努里试验中 $A$ 发生的次数,则 $X\sim B(n,p)$
若记 $X_i=\left\{\begin{aligned}
1& & 若在第 i 次试验中 A 发生 \\
0& & 若在第 i 次试验中 A 不发生
\end{aligned}\right.$
且 $X_1,X_2,\cdots,X_n$ 相互独立
于是有
若 $r.v. X_1,X_2,\cdots,X_n$ 相互独立且服从同一 0-1 分布,则
离散型随机变量函数的分布律
一维离散型随机变量函数的分布律
设 $X$ 一个随机变量,若 $y=g(x)$ 是一元单值实函数,则 $Y=g(X)$ 也是一个随机变量。
若
则
其中 $g(x_k)$ 有相同的,其对应概率合并。
显然, $Y$ 的分布律也满足分布律性质。
多维离散型随机变量函数的分布律
设 $X_1, X_2, \cdots, X_n$ 是一个 $n$ 维随机变量,若 $y=g(x_1, x_2, \cdots, x_n)$ 是一个 $n$ 元实值函数,则 $Y=g(X_1,X_2,\cdots,X_n)$ 也是一个随机变量