Chapter 3 多元随机变量及其分布¶
约 415 个字 预计阅读时间 2 分钟
二维离散型随机变量¶
联合分布律(Joint Mass Function)¶
- \(P(X=x_i,Y=y_j)=p_{ij}\;\;i,j=1,2,...\);
亦可使用列表来表示:
边际分布律(Marginal Mass Function)¶
边界分布律即联合分布律的行/列求和
- \(P(X=x_i)=P(X=x_1,\bigcup_{j=1}^{\infty}(Y=y_j))=\sum_{j=1}^{\infty}p_{ij}:=p_{i·}\);
- \(P(Y=y_j)=P(\bigcup_{i=1}^{\infty}(X=x_i),Y=y_j)=\sum_{i=1}^{\infty}p_{ij}:=p_{·j}\);
条件分布律(Conditional Mass Function)¶
- \(P\{X=x_i|Y=y_j\}=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_{·j}}\;\;i,j=1,2,...\);
- \(P\{X<x|Y<y\}=\frac{P\{X<x,Y<y\}}{P\{Y<y\}}\)然后根据联合分布律和边际分布律读表计算;
分布函数¶
- 联合分布函数 \(F(x,y) = P(X \leq x, Y \leq y)\) 是二元函数
- 边际分布函数 \(F_X(x) = P(X \leq x) = lim_{y \rarr +\infty}F(x,y)\) 是关于 \(x\) 的一元函数
- 条件分布函数 \(F_{X \mid Y}(x \mid y) = P(X \leq x \mid Y=y)\) 是关于 \(x\) 的一元函数
- \(\lim_{\epsilon \rarr 0^+}P(X\leq x\mid y<Y\leq y+\epsilon)\) 也记为 \(P(X \leq x \mid Y=y)\),请特别注意这个记号所带来的两种理解
联合分布函数¶
\(F(x,y)=P\{X\leq x,Y\leq y\}\)为\((X,Y)\)的联合概率分布函数,简称联合分布函数(Joint Distribution Function),其具有如下性质:
- 固定其中一个变量,则该二元函数关于另外一个变量单调不减;
-
\(0\leq F(x,y)\leq 1\),且\(F(x,-\infty)=F(-\infty,y)=F(-\infty,-\infty)=0\;,\;F(+\infty,+\infty)=1\);
-
\(F(x,y)\)关于\(x\)和\(y\)分别右连续(离散);
-
\(x_1<x_2\;,\;y_1<y_2\)时,有:\(P\{x_1<X\leq x_2\;,\;y_1<Y\leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\geq0\) 这可以由几何意义简单推出。
边际分布函数¶
\(X\)关于联合分布函数\(F(x,y)\)的边际分布函数定义为:
- 对\(y\)来说同理
条件分布函数¶
\(X=x_i\)条件下\(Y\)的条件概率分布函数为:
二维连续型随机变量¶
联合分布¶
设二元随机变量\((X,Y)\)的联合分布函数为\(F(x,y)\),若存在二元函数\(f(x,y)\geq0\),则对于任意的实数\(x\),\(y\)有
则称\((X,Y)\)为二元连续型随机变量(Bivariate Continuous Random Variable),称\(f(x,y)\)为\((X,Y)\)的联合概率密度函数(Joint Probability Density Function),简称为联合密度函数。 其具有以下性质:
- \(f(x,y)\geq 0\);
- \(F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)\mathrm{d}u\mathrm{d}v=F(+\infty,+\infty)=1\);
- 在\(f(x,y)\)的连续点上有\(\frac{ \partial^2F(x,y) }{ \partial x\partial y }=f(x,y)\);
- \((X,Y)\)落入\(xOy\)平面任意区域\(D\)的概率为:\(P\{(X,Y)\in D\}=\iint \limits_{D} f(x,y)\mathrm{d}x\mathrm{d}y\);
- 由于其几何意义为落在以\(D\)为底,以曲面\(z=f(x,y)\)为顶面的立体体积,所以当\(D\)面积为\(0\)时概率为\(0\):
eg
:\(P(X=1,Y=1)=0\),\(P(X+Y=1)=0\),\(P(X^2+Y^2=1)=0\);
边际分布¶
二位连续型随机变量\((X,Y)\)中单个随机变量\(X\)的密度函数为\(X\)的边际概率密度函数(Marginal Probability Density Function),简称边际密度函数。由于
所以:
同理:
条件分布¶
设\((X,Y)\)为二元连续型随机变量,对给定的\(x\),若\(P\{x<X\leq x+\delta\}>0\),则称对任意的\(y\)有:
为\(Y\)在\(X=x\)的条件下的条件分布函数。
一般地
设\((X,Y)\)为二元随机变量,对给定的\(x\),若极限:
$$\lim\limits_{\delta\rightarrow 0^+} P {Y\leq y|x-\delta<X\leq x+\delta }=\lim\limits_{\delta\rightarrow 0^+}P{Y\leq y|x-\delta<X\leq x+\delta} $$
对任意的\(y\)都存在,则称\(Y\)在\(X=x\)的条件下服从条件分布函数
由于对二维连续性随机变量\((X,Y)\)有:
且
所以:
我们由此可给出二维连续型随机变量的条件概率密度函数:
二元均匀分布和二元正态分布¶
均匀分布¶
如果二元随机变量\((X,Y)\)在二维有界区间\(D\)上取值,且具有联合密度函数
则称\((X,Y)\)服从\(D\)上的均匀分布。
得到:\(P\{(X,Y)\in D_1\}=\frac{D_1\text{的面积}}{D\text{的面积}}\;,\;\;\text{且}D_1\subset D\)。
正态分布¶
如果二元随机变量\((X,Y)\)具有联合密度函数
,且有\(|\mu_1|<+\infty,|\mu_2|<+\infty,\sigma_1>0,\sigma_2>0,|\rho|<1\)
则称\((X,Y)\)服从参数为\((\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)的二元正态分布(Bivariate Normal Distribution),记做\((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)。
- 二维正态分布的两个边际分布都是对应参数的一维正态分布,与\(\rho\)无关。
二维正态分布的两个边际分布
二维正态分布的两个条件分布
随机变量的独立性¶
如果对于任意的两个实数集合\(D_1,D_2\),有
则称随机变量\(X,Y\)相互独立,即\(X,Y\)独立。
也可以说:当\(P\{X\leq x,Y\leq y\}=P\{X\leq x\}·P\{Y\leq y\}\),即\(F(x,y)=F_x(x)·F_y(y)\)时,\(X,Y\)独立。
- 若 \((X,Y)\) 是离散型随机变量,则 \(X,Y\) 相互独立等价于 \(p_{ij} = p_{i\cdot}p_{\cdot j}\) 对一切 \(i,j\) 都成立
- 若 \((X,Y)\) 是连续型随机变量,则 \(X,Y\) 相互独立等价于 \(f(x,y) = f_X(x)f_Y(y)\) 总是成立,平面上“面积”为零的集合除外(可以在不连续点上不相等)
- 对于二维正态随机变量\((X,Y)\),\(X\) 与 \(Y\) 相互独立的充要条件是参数 \(\rho = 0\).
\(n\) 维随机变量独立性相关定理:
- 设 \((X_1,X_2,\cdots ,X_m)\) 与 \((Y_1,Y_2,\cdots ,Y_n)\) 相互独立,则 \(X_i(i=1,2,\cdots ,m)\) 与 \(Y_j(j=1,2,\cdots ,n)\) 相互独立
- 设 \((X_1,X_2,\cdots ,X_m)\) 与 \((Y_1,Y_2,\cdots ,Y_n)\) 相互独立,若 \(h(x_1,x_2,\cdots ,x_m)\) 与 \(g(y_1,y_2,\cdots ,y_n)\) 是连续函数,则 \(h(X_1,X_2,\cdots ,X_m)\) 与 \(g(Y_1,Y_2,\cdots ,Y_n)\) 相互独立
多元随机变量函数的分布¶
卷积公式¶
这里讨论连续型,离散型只需把积分符号换成求和符号即可,当\(X\)和\(Y\)相互独立时,\(Z=X+Y\)的条件下:
-
\[\begin{aligned} F_Z(z) &= \iint \limits_{x+y\leq z}f(x,y)\mathrm{d}x\mathrm{d}y\\ &=\int_{-\infty}^{+\infty}[\int_{-\infty}^{z-x}f(x,y)\mathrm{d}y]\mathrm{d}x \quad u=x+y\\ &= \int_{-\infty}^{+\infty}[\int_{-\infty}^{z}f(x,u-x)\mathrm{d}u]\mathrm{d}x\\ &=\int_{-\infty}^{z}[\int_{-\infty}^{+\infty}f(x,u-x)\mathrm{d}x]\mathrm{d}u\\ &=\int_{-\infty}^{z}f_Z(u)\mathrm{d}y \end{aligned}\]
-
其密度函数公式:
- \(f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)\mathrm{d}y=\int_{-\infty} ^ {+\infty}f(x,z-x)\mathrm{d}x\)(\(x\),\(y\)是对称的)
- 当 \(X\) 和 \(Y\) 相互独立时,\(Z\) 的密度函数公式也称为卷积公式:\(f_X*f_Y=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm{d}y=\int_{-\infty} ^ {+\infty}f_X(x)f_Y(z-x)\mathrm{d}x\)
常见分布的卷积¶
分布的卷积问题,也即是分布的可加性问题。
1.二项分布的可加性:设 \(X\sim B(n,p)\),\(Y\sim B(m,p)\),\(0<p<1\),\(m\),\(n\) 均为正整数,若 \(X\) 与 \(Y\) 独立,则
二项分布的可加性有助于理解二项分布与两点分布的可加性。
2.泊松分布的可加性:设 \(X\sim P({\lambda}_1)\),\(Y\sim P({\lambda}_2)\),\({\lambda}_i>0\),\(i=1,2\),若 \(X\) 与 \(Y\) 独立,则
3.正态分布的卷积:设 \(X\sim N({\mu}_1,{\sigma}_1^2)\),\(Y\sim N({\mu}_2,{\sigma}_2^2)\),\(-\infty <{\mu}_i<+\infty\),\({\sigma}_i>0\),\(i=1,2\),若 \(X\) 与 \(Y\) 独立,则
4.\(\Gamma\) 分布的可加性:设 \(X\sim \Gamma ({\alpha}_1,\beta)\),\(Y\sim \Gamma ({\alpha}_2,\beta)\),\({\alpha}_i>0\),\(i=1,2\),\(\beta >0\) 均为正整数,若 \(X\) 与 \(Y\) 独立,则
指数分布是特殊的 \(\Gamma\) 分布,\(E(\lambda)=\Gamma (1,\lambda)\)。
5.均匀分布的卷积:设 \(X\sim U(a_1,b_1)\),\(Y\sim U(a_2,b_2)\),若 \(X\) 与 \(Y\) 独立,则
M=max(X, Y), N=min(X, Y) 的分布¶
-
\[\begin{aligned}F_{max}(z)=P(M\leq z)=&P(X\leq z,Y\leq z)\\\xlongequal{\text{X,Y独立}}&P(X\leq z)P(Y\leq z)=F_X(z)F_Y(z)\end{aligned}\]
- \(\(\begin{aligned}F_{min}(z)=P(N\leq z)=1-P(N>z)=&1-P(X>z,Y>z)\\\xlongequal{\text{X,Y独立}}&1-P(X>z)P(Y>z)\\=&1-(1-F_X(z))(1-F_Y(z))\end{aligned}\)\);