概率论与数理统计笔记02——离散型随机变量

参考教材:印凡成, 夏乐天, 等. 概率论与数理统计[M]. 第三版. 南京: 河海大学出版社, 2004,35:63.

离散型随机变量

随机变量的概念

设 $E$ 为随机试验,它的样本空间是 $\varOmega=\{\omega\}$ 。如果对于每一个 $\omega\in\varOmega$ ,有一个实数 $X(\omega)$ 与之对应,这样就得到一个定义在 $\varOmega$ 上的单值实函数 $X=X(\omega)$ ,称它为随机变量(Random Variable),简记为 $r.v. X$ 。随机变量一般用英文大写字母 $X$ 、 $Y$ 、 $Z$ 等表示 ,也可用希腊字母 $\xi$ 、$\eta$ 、$\zeta$ 等表示。

全部可能取值为有限个或可列无限个的随机变量为离散型随机变量

一维离散型随机变量的分布律

称 $p_k=P\{X=x_k\}, k=1,2,\cdots$ 为 $r.v. X$ 的分布律或概率分布

也可表为

分布率的性质:

  1. $p_k\ge0$
  2. $\sum_{k=1}^\infty p_k=1$

几个常见的离散型分布

退化分布(单点分布)

其中 $a$ 为常数

(0-1)分布(两点分布)

几何分布

一次试验中只考虑某事件 $A$ 出现或不出现,设 $P(A)=p$ , $P(A)=1-p$ 。现重复独立地做试验,一旦 $A$ 发生就立即停止试验。

以 $X$ 表示 $A$ 首次发生所需的试验次数,则其分布律为:

称 $X$ 服从参数为 $p$ 的几何分布

二项分布 $X\sim B(n, p)$

以 $X$ 记 n 重贝努里试验中 $A$ 发生的次数,则其分布率为:

称 $X$ 服从参数为 $(n,p)$ 的二项分布,记为 $X\sim B(n, p)$

泊松(Poisson)分布 $P(\lambda)$

$P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda};k=0,1,2,\cdots$

其中 $\lambda\gt0$ 为常数,称 $X$ 服从参数为 $\lambda$ 的泊松(Poisson)分布,记为 $X\sim P(\lambda)$ 。

泊松分布的应用

若 $X(t)$ 表示在时间区间 $[0, t]$ 中某服务台到达的顾客数。若 $X(t)$ 满足:

  1. 无后效性:在不重叠的时间区间内到达的顾客数相互独立
  2. 平稳性:在时间区间 $[a,a+t]$ 内到达的顾客数只与时间长度 $t$ 有关,而与区间起点 $a$ 无关
  3. 普通性:当 $t$ 充分小时,在区间 $(a,a+t)$ 内到达两个或两个以上的顾客不可能
  4. 非平凡性:在有限区间中只到达有限个顾客且不可能始终没有顾客到达

在上述条件下,在长度为 $t$ 的时间区间上到达的顾客数 $X(t)$ 服从参数为 $\lambda t$ 的泊松分布,其中 $\lambda\gt0$ 是一个常数。即

负二项分布

以 $X$ 记可列重贝努里试验中 $A$ 恰好发生 $r$ 次所需的试验次数,则其分布率为:

称 $X$ 服从参数为 $(r, p)$ 的负二项分布,记为 $X\sim NB(r, p)$

负二项分布又叫帕斯卡(Pascal)分布

超几何分布

设 $N$ 个元素分为两类,其中 $M$ 个属于第一类, $N-M$ 个属于第二类。现从中按不重复抽样取 $n$ 个,以 $X$ 记这 $n$ 个中属于第一类元素的个数。则 $X$ 的分布律为:

称 $X$ 服从参数为 $(N, M, n)$ 的超几何分布。

常用分布律之间的关系

  1. (0-1) 分布是二项分布 $B(n, p)$ 中 $n=1$ 时的特例。
  2. 几何分布是负二项分布 $NB(r, p)$ 中 $r=1$ 时的特例。
  3. 超几何分布和二项分布的关系:

设在超几何分布中, $n$ 是一个取定的正整数,而 $\lim_{N\rightarrow\infty}\frac MN=p$ ,则

即:当 $N$ 充分大时,超几何分布趋向于二项分布。

事实上,超几何分布用来描述不放回抽样的情况,而二项分布则用来描述放回抽样的情况,当 $N$ 充分大时,两种抽样方式的差别很小。

  1. 二项分布和泊松分布的关系

设随机变量 $X_n\sim B(n, p_n), (n=0, 1, 2, \cdots)$ ,且 $\lim_{n\rightarrow\infty}np_n=\lambda\gt0$ , $\lambda$ 为常数,则

该定理也称为泊松定理

泊松定理表明,泊松分布是二项分布的极限分布,当 $n$ 很大, $p$ 很小时,二项分布就可近似地看成是泊松分布。其中 $\lambda=np$

一般的,当 $n\ge10, p\le0.1$ 时就可用泊松分布近似代替二项分布。

二维离散型随机变量

联合分布律

若二维随机变量 $(X,Y)$ 只能取至多可列个值 $(x_i,y_j), (i,j=1, 2, \cdots)$ ,则称 $(X,Y)$ 为二维离散型随机变量。

若二维离散型随机变量 $(X,Y)$ 取 $(x_i,y_j)$ 的概率为 $p_{ij}$,即 $P\{X=x_i,Y=y_j\}=p_{ij},(i,j=1,2,\cdots)$

则称 $p_{ij}$ 为二维离散型随机变量 $(X,Y)$ 的分布律,或随机变量 $X$ 与 $Y$ 的联合分布律
可记为

联合分布律的性质

  1. $p_{ij}\ge0,i,j=1,2,\cdots$
  2. $\sum\limits_{i=1}^\infty\sum\limits_{j=1}^\infty p_{ij}=1$

二维离散型随机变量的联合分布律也可列表表示如下:

边缘分布律

若随机变量 $X$ 与 $Y$ 的联合分布律为

则称

为 $(X,Y)$ 关于 $X$ 的边缘分布律

同理,

称为 $(X,Y)$ 关于 $Y$ 的边缘分布律

边缘分布律自然也满足分布律的性质:

  1. $p_{i\cdot}\ge0;(p_{\cdot j}\ge0)$
  2. $\sum\limits_{i=1}^\infty p_{i\cdot}=1;(\sum\limits_{j=1}^\infty p_{\cdot j}=1)$

二维离散型随机变量的边缘分布律也可列表表示如下:

条件分布律

设随机变量 $X$ 与 $Y$ 的联合分布律为

$X$ 和 $Y$ 的边缘分布律为

若对固定的 $j, p_{\cdot j}\gt0$ ,则称

为 $Y=y_j$ 的条件下, $X$ 的条件分布律

记为

同理,若对固定的 $i, p_{i\cdot}\gt0$ ,则称

为 $X=x_i$ 的条件下, $Y$ 的条件分布律

条件分布律也满足分布律的性质

离散型随机变量的相互独立性

设随机变量 $X$ 与 $Y$ 的联合分布律为

若对任意的 $i, j$ 有 $p_{ij}=p_{i\cdot}p_{\cdot j}$

则称随机变量 $X$ 和 $Y$ 相互独立。

上述独立的概念不难推广到n维离散型随机变量的情形。

设 $X_1, X_2, \cdots, X_n$ 为一个 $n$ 维离散型随机变量,若对任意的 $x_1,x_2,\cdots,x_n$ 有

则称随机变量 $X_1, X_2, \cdots, X_n$ 相互独立。

以 $X$ 记 $n$ 重贝努里试验中 $A$ 发生的次数,则 $X\sim B(n,p)$

若记 $X_i=\left\{\begin{aligned}
1& & 若在第 i 次试验中 A 发生 \\
0& & 若在第 i 次试验中 A 不发生
\end{aligned}\right.$

且 $X_1,X_2,\cdots,X_n$ 相互独立

于是有

若 $r.v. X_1,X_2,\cdots,X_n$ 相互独立且服从同一 0-1 分布,则

离散型随机变量函数的分布律

一维离散型随机变量函数的分布律

设 $X$ 一个随机变量,若 $y=g(x)$ 是一元单值实函数,则 $Y=g(X)$ 也是一个随机变量。

其中 $g(x_k)$ 有相同的,其对应概率合并。

显然, $Y$ 的分布律也满足分布律性质。

多维离散型随机变量函数的分布律

设 $X_1, X_2, \cdots, X_n$ 是一个 $n$ 维随机变量,若 $y=g(x_1, x_2, \cdots, x_n)$ 是一个 $n$ 元实值函数,则 $Y=g(X_1,X_2,\cdots,X_n)$ 也是一个随机变量