跳转至

Chapter 7 参数估计

约 2727 个字 预计阅读时间 14 分钟

点估计

设总体 X 的分布函数为 F(x;θ)θ=(θ1,θ2,...,θk) 是未知的待估参数,X1,X2,...,XnX 的一个样本。点估计就是要对每一个未知参数 θi 构造一个适当的统计量 θi^=θi(X1,X2,...,Xn),用作对未知参数 θi 的估计,称为 θi估计量

若已知样本的观察值为 x1,x2,...,xn,则称 θi^=θi(X1,X2,...,Xn)θ 的一个估计值

矩法

思想:用样本矩去估计相应的总体矩,换言之,用原点矩 Ak 去估计 μk,用中心距 Bk 去估计 νk

具体步骤如下(假设有 k 个待求未知参数):

  1. 列出总体的前 k 阶矩

μi=E(Xi)=hi(θ1,θ2,...,θk),i=1,2,...,k

  1. 从方程组中解出这 k 个参数

θi=gi(μ1,μ2,...,μk),i=1,2,...,k

  1. 将上一步解出的参数的表达式中出现的总体矩用相应的样本矩替换

θi^=gi(A1,A2,...,Ak),i=1,2,...,k

值得注意的是:

  • 如果方程中存在恒等式,则可以顺延求 μk+1,μk+2,...
  • 理论上任意 k 个关于 μi 的方程组都可以,但考试要求前 k 个才算对

极大似然法

思想:用“最像” θ 真值的值去估计 θ,换言之,在参数空间中找一个 θ,使得 L(θ) 达到最大。

具体步骤如下(若待估参数不止一个,则对每个待估参数 θi 均执行如下操作):

  1. 构造似然函数 L(θ)=L(θ;x1,x2,...,xn)=i=1nf(xi;θ)
  2. 求解 θ,使得 L(θ) 达到最大值,称这个 θ 为极大似然估计量,记作 θ^

求解似然函数最大值点的常用方法:

  • 解似然方程 L(θ)θi=0,检验极大值点
  • 或者也可以解对数似然方程 lnL(θ)θi=0,检验极大值点
  • L(θ) 关于某个 θi 是单调的,则最大值在边界取得

极大似然估计法的性质:

  • 不变原则:设参数 θ 的极大似然估计为 θ^g() 为连续函数,则 g(θ) 的极大似然估计为 g(θ^)

估计量的评价准则

无偏性准则

若参数 θ 估计量 θ^=θ(X1,X2,...,Xn) 的数学期望存在,且满足 E(θ^)=θ,则称 θ^θ 的一个无偏估计量无偏估计(Unbiased Estimation)

  • E(θ^)θ,则称 |E(θ^)θ| 为估计量 θ^偏差
  • limn+E(θ^)=0,则称 θ^θ渐进无偏估计(Asymptotic Unbiased Estimation)

有效性准则

θ1θ2 是参数 θ 的两个无偏估计,如果对于 θΘVar(θ1)Var(θ2),且不恒取等,则称 θ1θ2 有效

均方误差准则

E[(θ^θ)2] 是估计量 θ^均方误差(Mean Square Error),记为 Mse(θ^)

在均方误差准则下,估计量的均方误差越小越好。若 Mse(θ^1)Mse(θ^2) 且不恒取等,则称 θ^1 优于 θ^2

  • θ^ 是参数 θ 的无偏估计量,则有 Mse(θ^)=Var(θ^)
  • 均方误差有分解式 E[(θ^θ)2]=Var(θ^)+(E(θ^)θ)2
  • 均方误差准则常用于有偏估计量之间,或有偏估计量与无偏估计量之间的比较;实际应用中,有时均方误差准则比无偏性准则更加重要

相合性准则

若对于 ε>0,有 limn+P{|θ^nθ|<ε}=1,即 θ^nPθ,则称 θ^nθ相合估计量(Consistent Estimation)一致估计量

有如下定理:

  • θ^nθ 的一个估计量,若 limnE(θ^)=θlimnVar(θ^n)=0,则 θ^nθ 的相合估计。

区间估计

点估计是由样本求出未知参数 θ 的一个估计值 θ^,而区间估计则要由样本给出参数 θ 的一个估计范围,并指出该区间包含 θ 的可靠程度。

下面给出区间估计的一些基本概念:

  • 置信区间:设总体 X 的分布函数 F(x;θ) 含有一个未知参数 θ,对于给定的值 α,如果有两个统计量 θL=θL(X1,X2,...,Xn)θU=θU(X1,X2,...,Xn)θL<θU,使得 P{θL(X1,X2,...,Xn)<θ<θU(X1,X2,...,Xn)}1α,θΘ,则称随机区间 [θL,θU]θ 的置信水平为 1α双侧置信区间,简称置信区间
  • 置信下限和置信上限:分别是 θLθU
  • 置信度(置信水平):1α
  • 单侧置信区间:在置信区间的定义中,如果修改为 P{θL(X1,X2,...,Xn)<θ}1α,θΘ,则称随机区间 [θL,+]θ 的置信水平为 1α单侧置信区间
    • 相应地,我们还可以定义单侧置信下限,以及具有单侧置信上限的单侧置信区间 (,θU)

双侧置信区间和单侧置信区间的关系:

θL=θL(X1,X2,...,Xn)θU=θU(X1,X2,...,Xn) 分别是 θ 的置信水平为 1α11α2 的单侧置信下限及上限,且对于任何样本都满足 θL<θU,则 (θL,θU)θ 的置信水平为 1α1α2 的双侧置信区间。

评价区间估计的原则

  • 置信度原则

希望随机区间 [θL,θU] 包含真值 θ 的概率越大越好 - 精确度原则

可以用随机区间的平均长度 E(θUθL) 去衡量,希望其越短越好;并称二分之一区间的平均长度为置信区间的误差限 - 这是一对矛盾的标准,现实应用中我们通常希望在保证置信度的前提下,尽可能提高精确度

枢轴量法

枢轴量法是寻求区间估计的常用方法。

枢轴量是样本 X=(X1,X2,...,Xn) 和待估参数 θ 的函数,即 G=G(X1,X2,...,Xn;θ),并且要求 G 的分布已知且不依赖于任何未知参数。

具体步骤如下:

  1. 构造枢轴量 G(X;θ)
  2. 对于给定的置信度 1α,确定两个常数 a,b,使得:

\(P{a<G(X;θ)<b}1α\) 3. 若能从 a<G(X;θ)<b 反解出不等式:

\(θL(X)<θ<θU(X)\)

那么 [θL,θU] 就是 θ 的置信水平为 1α 的置信区间,也称同等置信区间

值得注意的是:

  • 若要求单侧置信限,只需要将 P{a<G(X;θ)<b}1α 相应地改为 P{a<G(X;θ)}1αP{G(X;θ)<b}1α 即可
  • 枢轴量和统计量的区别:
    • 枢轴量是样本和待估参数的函数,其分布不依赖于任何未知参数
    • 统计量只是样本的函数,其分布常依赖于未知参数

正态总体参数的区间估计

单个正态总体的情形

X1,X2,...,Xn 来自总体 N(μ,σ2)XS2 分别为样本均值和样本方差,置信度为 1α

1. σ2 已知时 μ 的置信区间:

取枢轴量 Xμσ/nN(0,1),置信区间为 (Xσnzα/2,X+σnzα/2)

若只考虑单侧置信限,以单侧置信下限为例,单侧置信区间为 (Xσnzα,+)


2. σ2 未知时 μ 的置信区间:

取枢轴量 XμS/nt(n1),置信区间为 (XSntα/2(n1),X+Sntα/2(n1))


3. σ2 的置信区间(当作 μ 未知):

取枢轴量 (n1)S2σ2χ2(n1),置信区间为 ((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))

两个正态总体的情形

X1,X2,...,Xn1 来自 N(μ1,σ12)Y1,Y2,...,Yn2 来自 N(μ2,σ22),这两个样本相互独立,X=1n1i=1n1XiY=1n2i=1n2YiS12S22 分别为它们的样本均值和样本方差,置信度为 1α

  • 比较均值(估计 μ1μ2,也称为 Behrens-Fisher 问题)
  • 比较方差(估计 σ12σ22

1. σ12,σ22 已知时 μ1μ2 的置信区间:

取枢轴量 (XY)(μ1μ2)σ12n1+σ22n2N(0,1),置信区间为 (XY±zα/2σ12n1+σ22n2)


2. σ12=σ22=σ2 未知时 μ1μ2 的置信区间:

取枢轴量 (XY)(μ1μ2)Sω1n1+1n2t(n1+n22),置信区间为 (XY±tα/2(n1+n22)Sw1n1+1n2)


3. σ12σ22 且未知时 μ1μ2 的置信区间:

当样本容量 n1n2 都充分大时(一般要大于 50),取枢轴量 (XY)(μ1μ2)S12n1+S22n2N(0,1),置信区间为 (XY±zα/2S12n1+S22n2)

对于有限小样本,仍取枢轴量 (XY)(μ1μ2)S12n1+S22n2,可以证明其近似服从自由度为 kt 分布,其中 k=(S12n1+S22n2)2(S12)2n12(n11)+(S22)2n22(n21),置信区间为 (XY±tα/2(k)S12n1+S22n2)

实际使用中,也常用 min(n11,n21) 近似代替上述自由度 k


4. σ12σ22 的置信区间(当作 μ1,μ2 未知):

取枢轴量 S12/S22σ12/σ22F(n11,n21),置信区间为 (S12/S22Fα/2(n11,n21),S12/S22F1α/2(n11,n21))

非正态总体参数的区间估计

通常把这个非正态分布根据中心极限定理近似成一个正态分布,从而利用上文的方法构造枢轴量,并求解置信区间。