跳转至

Chapter 3 多元随机变量及其分布

约 415 个字 预计阅读时间 2 分钟

二维离散型随机变量

联合分布律(Joint Mass Function)

  • \(P(X=x_i,Y=y_j)=p_{ij}\;\;i,j=1,2,...\)

亦可使用列表来表示:

Alt text

边际分布律(Marginal Mass Function)

边界分布律即联合分布律的行/列求和

  • \(P(X=x_i)=P(X=x_1,\bigcup_{j=1}^{\infty}(Y=y_j))=\sum_{j=1}^{\infty}p_{ij}:=p_{i·}\)
  • \(P(Y=y_j)=P(\bigcup_{i=1}^{\infty}(X=x_i),Y=y_j)=\sum_{i=1}^{\infty}p_{ij}:=p_{·j}\)

Alt text

条件分布律(Conditional Mass Function)

  • \(P\{X=x_i|Y=y_j\}=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_{·j}}\;\;i,j=1,2,...\)
  • \(P\{X<x|Y<y\}=\frac{P\{X<x,Y<y\}}{P\{Y<y\}}\)然后根据联合分布律和边际分布律读表计算;

分布函数

  • 联合分布函数 \(F(x,y) = P(X \leq x, Y \leq y)\) 是二元函数
  • 边际分布函数 \(F_X(x) = P(X \leq x) = lim_{y \rarr +\infty}F(x,y)\) 是关于 \(x\) 的一元函数
  • 条件分布函数 \(F_{X \mid Y}(x \mid y) = P(X \leq x \mid Y=y)\) 是关于 \(x\) 的一元函数
  • \(\lim_{\epsilon \rarr 0^+}P(X\leq x\mid y<Y\leq y+\epsilon)\) 也记为 \(P(X \leq x \mid Y=y)\),请特别注意这个记号所带来的两种理解

联合分布函数

\(F(x,y)=P\{X\leq x,Y\leq y\}\)\((X,Y)\)联合概率分布函数,简称联合分布函数(Joint Distribution Function),其具有如下性质:

  1. 固定其中一个变量,则该二元函数关于另外一个变量单调不减
  2. \(0\leq F(x,y)\leq 1\),且\(F(x,-\infty)=F(-\infty,y)=F(-\infty,-\infty)=0\;,\;F(+\infty,+\infty)=1\)

  3. \(F(x,y)\)关于\(x\)\(y\)分别右连续(离散);

  4. \(x_1<x_2\;,\;y_1<y_2\)时,有:\(P\{x_1<X\leq x_2\;,\;y_1<Y\leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\geq0\) 这可以由几何意义简单推出。

Alt text

边际分布函数

\(X\)关于联合分布函数\(F(x,y)\)边际分布函数定义为:

\[F_X(x)=P\{X\leq x\}=P\{X\leq x ,Y<+\infty\}=F(x,+\infty)\]
  • \(y\)来说同理

条件分布函数

\(X=x_i\)条件下\(Y\)条件概率分布函数为:

\[F_{Y|X}(y|x_i)=P\{Y\leq y | X = x_i\}\]

二维连续型随机变量

联合分布

设二元随机变量\((X,Y)\)的联合分布函数为\(F(x,y)\),若存在二元函数\(f(x,y)\geq0\),则对于任意的实数\(x\)\(y\)

\[F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)\mathrm{d}u\mathrm{d}v\]

则称\((X,Y)\)二元连续型随机变量(Bivariate Continuous Random Variable),称\(f(x,y)\)\((X,Y)\)联合概率密度函数(Joint Probability Density Function),简称为联合密度函数。 其具有以下性质:

  1. \(f(x,y)\geq 0\)
  2. \(F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)\mathrm{d}u\mathrm{d}v=F(+\infty,+\infty)=1\)
  3. \(f(x,y)\)的连续点上有\(\frac{ \partial^2F(x,y) }{ \partial x\partial y }=f(x,y)\)
  4. \((X,Y)\)落入\(xOy\)平面任意区域\(D\)的概率为:\(P\{(X,Y)\in D\}=\iint \limits_{D} f(x,y)\mathrm{d}x\mathrm{d}y\)
  5. 由于其几何意义为落在以\(D\)为底,以曲面\(z=f(x,y)\)为顶面的立体体积,所以当\(D\)面积为\(0\)时概率为\(0\)
  6. eg\(P(X=1,Y=1)=0\)\(P(X+Y=1)=0\)\(P(X^2+Y^2=1)=0\)

边际分布

二位连续型随机变量\((X,Y)\)中单个随机变量\(X\)的密度函数为\(X\)边际概率密度函数(Marginal Probability Density Function),简称边际密度函数。由于

\[\begin{aligned} F_X(x)&=P\{X\leq x\}=P\{X\leq x,Y<+\infty\}\\ &=\int_{-\infty}^x\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y\mathrm{d}x\\ &=\int_{-\infty}^x[\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y]\mathrm{d}x \end{aligned}\]

所以:

\[f_X(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y\]

同理:

\[f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\]

条件分布

\((X,Y)\)为二元连续型随机变量,对给定的\(x\),若\(P\{x<X\leq x+\delta\}>0\),则称对任意的\(y\)有:

\[F_{Y|X}(y|x)=\lim\limits_{\delta\rightarrow 0^+}P\{Y\leq y|x<X\leq x+\delta\}\]

\(Y\)\(X=x\)的条件下的条件分布函数

一般地

\((X,Y)\)为二元随机变量,对给定的\(x\),若极限:

$$\lim\limits_{\delta\rightarrow 0^+} P {Y\leq y|x-\delta<X\leq x+\delta }=\lim\limits_{\delta\rightarrow 0^+}P{Y\leq y|x-\delta<X\leq x+\delta} $$

对任意的\(y\)都存在,则称\(Y\)\(X=x\)的条件下服从条件分布函数

由于对二维连续性随机变量\((X,Y)\)有:

\[\begin{aligned} F_{Y|X}(y|x)&=\lim\limits_{\delta\rightarrow 0^+}P\{Y\leq y|x<X\leq x+\delta\}\\ &=\lim\limits_{\delta\rightarrow 0^+}\frac{P\{Y\leq y,x<X\leq x+\delta\}}{P\{x<X\leq x+\delta\}}\\ &=\lim\limits_{\delta\rightarrow 0^+}\frac{F(x+\delta,y)-F(x,y)}{F_X(x+\delta)-F_X(x)}\\ &=\lim\limits_{\delta\rightarrow 0^+}\frac{(F(x+\delta,y)-F(x,y))/\delta}{(F_X(x+\delta)-F_X(x))/\delta}\\ \end{aligned}\]

\[\begin{aligned} \lim\limits_{\delta\rightarrow 0^+}\frac{F(x+\delta,y)-F(x,y)}{\delta} &=\frac{\partial F(x,y)}{\partial x}\\ &=\frac{\partial}{\partial x}\int_{-\infty}^x[\int_{-\infty}^{y}f(u,v)\mathrm{d}v]\mathrm{d}u\\ &=\int_{-\infty}^yf(x,v)\mathrm{d}v\\ \lim\limits_{\delta\rightarrow 0^+}\frac{F_X(x+\delta)-F_X(x)}{\delta} &=f_X(x)\\ \end{aligned}\]

所以:

\[F_{Y|X}(y|x)=\int_{-\infty}^y\frac{f(x,v)}{f_X(x)}\mathrm{d}v\]

我们由此可给出二维连续型随机变量的条件概率密度函数

\[f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}\]

二元均匀分布和二元正态分布

均匀分布

如果二元随机变量\((X,Y)\)在二维有界区间\(D\)上取值,且具有联合密度函数

\[f(x,y)=\left\{ \begin{aligned} &\frac{1}{\text{D的面积}},&(x,y)\in D,\\ &0,&\text{其他}. \end{aligned} \right.\]

则称\((X,Y)\)服从\(D\)上的均匀分布

得到:\(P\{(X,Y)\in D_1\}=\frac{D_1\text{的面积}}{D\text{的面积}}\;,\;\;\text{且}D_1\subset D\)

正态分布

如果二元随机变量\((X,Y)\)具有联合密度函数

\[f(x,y)=\frac{1}{2\pi\sigma_1\sigma_ 2\sqrt{1-\rho^2}}\exp\{\frac{-1}{2(1-\rho^2)}[\frac{(x-\mu)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\}\]

,且有\(|\mu_1|<+\infty,|\mu_2|<+\infty,\sigma_1>0,\sigma_2>0,|\rho|<1\)

则称\((X,Y)\)服从参数为\((\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)二元正态分布(Bivariate Normal Distribution),记做\((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)

  • 二维正态分布的两个边际分布都是对应参数的一维正态分布,与\(\rho\)无关。

二维正态分布的两个边际分布

\[ \begin{aligned} f_X(x)&=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y\\ &=\frac{1}{\sqrt{2\pi}\sigma_1}\exp\{-\frac{(x-\mu_1)^2}{2\sigma_1^2}\}\\ f_Y(y)&=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\\ &=\frac{1}{\sqrt{2\pi}\sigma_2}\exp\{-\frac{(y-\mu_2)^2}{2\sigma_2^2}\}\\ \end{aligned} \]

二维正态分布的两个条件分布

\[\begin{aligned} f_{Y|X}(y|x)&=\frac{f(x,y)}{f_X(x)}\\ &=\frac{1}{\sqrt{2\pi}\sqrt{1-\rho^2}\sigma_2}\exp\{-\frac{1}{2(1-\rho^2)\sigma_2^2}[y-(\mu_2+\rho\frac{\sigma_2}{\sigma_1}(x-\mu_1))]^2\}\\ f_{X|Y}(x|y)&=\frac{f(x,y)}{f_Y(y)}\\ &=\frac{1}{\sqrt{2\pi}\sqrt{1-\rho^2}\sigma_1}\exp\{-\frac{1}{2(1-\rho^2)\sigma_1^2}[x-(\mu_1+\rho\frac{\sigma_1}{\sigma_2}(y-\mu_2))]^2\}\\ \end{aligned}\]

随机变量的独立性

如果对于任意的两个实数集合\(D_1,D_2\),有

\[P\{X\in D_1,Y\in D_2\}=P\{X\in D_1\}·P\{Y\in D_2\}\]

则称随机变量\(X,Y\)相互独立,即\(X,Y\)独立

也可以说:当\(P\{X\leq x,Y\leq y\}=P\{X\leq x\}·P\{Y\leq y\}\),即\(F(x,y)=F_x(x)·F_y(y)\)时,\(X,Y\)独立。

  • \((X,Y)\) 是离散型随机变量,则 \(X,Y\) 相互独立等价于 \(p_{ij} = p_{i\cdot}p_{\cdot j}\) 对一切 \(i,j\) 都成立
  • \((X,Y)\) 是连续型随机变量,则 \(X,Y\) 相互独立等价于 \(f(x,y) = f_X(x)f_Y(y)\) 总是成立,平面上“面积”为零的集合除外(可以在不连续点上不相等)
  • 对于二维正态随机变量\((X,Y)\)\(X\)\(Y\) 相互独立的充要条件是参数 \(\rho = 0\).

\(n\) 维随机变量独立性相关定理:

  • \((X_1,X_2,\cdots ,X_m)\)\((Y_1,Y_2,\cdots ,Y_n)\) 相互独立,则 \(X_i(i=1,2,\cdots ,m)\)\(Y_j(j=1,2,\cdots ,n)\) 相互独立
  • \((X_1,X_2,\cdots ,X_m)\)\((Y_1,Y_2,\cdots ,Y_n)\) 相互独立,若 \(h(x_1,x_2,\cdots ,x_m)\)\(g(y_1,y_2,\cdots ,y_n)\) 是连续函数,则 \(h(X_1,X_2,\cdots ,X_m)\)\(g(Y_1,Y_2,\cdots ,Y_n)\) 相互独立

多元随机变量函数的分布

卷积公式

这里讨论连续型,离散型只需把积分符号换成求和符号即可,当\(X\)\(Y\)相互独立时,\(Z=X+Y\)的条件下:

  1. \[\begin{aligned} F_Z(z) &= \iint \limits_{x+y\leq z}f(x,y)\mathrm{d}x\mathrm{d}y\\ &=\int_{-\infty}^{+\infty}[\int_{-\infty}^{z-x}f(x,y)\mathrm{d}y]\mathrm{d}x \quad u=x+y\\ &= \int_{-\infty}^{+\infty}[\int_{-\infty}^{z}f(x,u-x)\mathrm{d}u]\mathrm{d}x\\ &=\int_{-\infty}^{z}[\int_{-\infty}^{+\infty}f(x,u-x)\mathrm{d}x]\mathrm{d}u\\ &=\int_{-\infty}^{z}f_Z(u)\mathrm{d}y \end{aligned}\]
  2. 其密度函数公式:

    • \(f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)\mathrm{d}y=\int_{-\infty} ^ {+\infty}f(x,z-x)\mathrm{d}x\)\(x\)\(y\)是对称的)
    • \(X\)\(Y\) 相互独立时,\(Z\) 的密度函数公式也称为卷积公式\(f_X*f_Y=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm{d}y=\int_{-\infty} ^ {+\infty}f_X(x)f_Y(z-x)\mathrm{d}x\)

常见分布的卷积

分布的卷积问题,也即是分布的可加性问题。


1.二项分布的可加性:设 \(X\sim B(n,p)\)\(Y\sim B(m,p)\)\(0<p<1\)\(m\)\(n\) 均为正整数,若 \(X\)\(Y\) 独立,则

\[ X+Y\sim B(m+n,p) \]

二项分布的可加性有助于理解二项分布与两点分布的可加性。


2.泊松分布的可加性:设 \(X\sim P({\lambda}_1)\)\(Y\sim P({\lambda}_2)\)\({\lambda}_i>0\)\(i=1,2\),若 \(X\)\(Y\) 独立,则

\[ X+Y\sim P({\lambda}_1+{\lambda}_2) \]

3.正态分布的卷积:设 \(X\sim N({\mu}_1,{\sigma}_1^2)\)\(Y\sim N({\mu}_2,{\sigma}_2^2)\)\(-\infty <{\mu}_i<+\infty\)\({\sigma}_i>0\)\(i=1,2\),若 \(X\)\(Y\) 独立,则

\[ aX+bY+c\sim N(a{\mu}_1+b{\mu}_2+c,a^2{\sigma}_1^2+b^2{\sigma}_2 ^ 2) \]

4.\(\Gamma\) 分布的可加性:设 \(X\sim \Gamma ({\alpha}_1,\beta)\)\(Y\sim \Gamma ({\alpha}_2,\beta)\)\({\alpha}_i>0\)\(i=1,2\)\(\beta >0\) 均为正整数,若 \(X\)\(Y\) 独立,则

\[ X+Y\sim \Gamma ({\alpha}_1+{\alpha}_2,\beta) \]

指数分布是特殊的 \(\Gamma\) 分布,\(E(\lambda)=\Gamma (1,\lambda)\)


5.均匀分布的卷积:设 \(X\sim U(a_1,b_1)\)\(Y\sim U(a_2,b_2)\),若 \(X\)\(Y\) 独立,则

\[ X+Y\sim U([a_1,a_2]\times[b_1,b_2]) \quad \text{长方形区域} \]

M=max(X, Y), N=min(X, Y) 的分布

  • \[\begin{aligned}F_{max}(z)=P(M\leq z)=&P(X\leq z,Y\leq z)\\\xlongequal{\text{X,Y独立}}&P(X\leq z)P(Y\leq z)=F_X(z)F_Y(z)\end{aligned}\]
  • \(\(\begin{aligned}F_{min}(z)=P(N\leq z)=1-P(N>z)=&1-P(X>z,Y>z)\\\xlongequal{\text{X,Y独立}}&1-P(X>z)P(Y>z)\\=&1-(1-F_X(z))(1-F_Y(z))\end{aligned}\)\)