跳转至

05 概率群式 - 疾病检测

约 1100 个字 预计阅读时间 6 分钟

问题背景

假定 \(n\) 个人相互独立地以概率 \(p\) 患病,如何找出全部的病人,使平均检测次数尽可能少?

名词介绍

\(A\) 为患病,\(B\) 为检测结果为阳性,疾病检测方法的性能指标为

  • 灵敏度(sensitivity)\(p=P(B|A)\) :患病者被检测为阳性(positive)的概率
  • 特异度(specificity)\(q=P(\overline{B}|\overline{A})\) :未患病者被检测为阴性(negative)的概率

设疾病的发病率为 \(r\) ,则被检测出阳性的情况下患病的概率为

\[ P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline{A})P(\overline{A})}=\frac{pr}{pr+(1-q)(1-r)} \]

概率群式

概率群式:假定 \(n\) 个人相互独立地以概率 \(p\) 患病,如何找出全部的病人,使平均检测次数尽可能少?

如何选择群式方案?我们要考虑平均检测次数、检测阶段数、每人最大检测次数、每组最多样本数、方案的可操作性、检测的灵敏度与特异度等多个因素

两阶段群式

\(n\) 人的样本混合后检测。若结果为阴性,说明这 \(n\) 人均未感染。若结果为阳性,说明这 \(n\) 人中至少有一人已感染。此时逐个检测每个人样本。

检测次数

  • 混合样本阴性概率为 \((1-p)^n\) ,总检测次数为 \(1\)
  • 混合样本阳性概率为 \(1-(1-p)^n\) ,总检测次数为 \(n+1\)
  • 检测次数的数学期望为 \(1\cdot(1-p)^n+(n+1)\cdot(1-(1-p)^n)\)
  • 平均检测次数的数学期望为 \(\frac{1\cdot(1-p)^n+(n+1)\cdot(1-(1-p)^n)}{n}\)

矩阵检测方案

自适应思路

\(m\times n\)(\(m\leq n\))个人按矩阵排好,先检测每行样本,若结果为阴性,说明这 \(m\) 人均未感染。若结果为阳性,说明这 \(m\) 人中至少有一人已感染。此时逐个检测每列样本。

检测次数

这里的每行就相当于两阶段群式中的混合样本,每列就相当于两阶段群式中的每个人样本。

非自适应思路

\(m\times n\)(\(m\leq n\))个人按矩阵排好,对每行每列分别进行检测。通过检测结果确定感染者的位置。

检测次数

总检测次数均为 \(m+n\)

三阶段检测方案

第一阶段:有 \(n\) 个人,进行总体的混合检测,若结果为阴性,说明这 \(n\) 人均未感染。若结果为阳性,说明这 \(n\) 人中至少有一人已感染。进入第二阶段。

第二阶段:将这 \(n\) 人分成 \(A\)\(B\) 两组,每组 \(n/2\) 人,先对 \(A\) 组进行检测,若结果为阴性,说明这 \(n/2\) 人均未感染,且确定感染者在 \(B\) 组。若结果为阳性,说明这 \(n/2\) 人中至少有一人已感染,但仍需确定 \(B\) 组是否有感染者,此时对 \(B\) 组进行总体的混合检测。

第三阶段:对有感染者的组进行逐个检测,确定感染者的位置。

Alt text

计算概率:

第一阶段

  • 结果为阴性的概率为 \((1-p)^n\) ,总检测次数为 \(1\)

第二阶段

  • \(A\) 组结果为阴性的概率为 \((1-p)^{n/2}\) ;则\(B\)组肯定为阳性,这发生的概率为 \(1-(1-p)^{n/2}\)

    \[ \begin{aligned} &第一阶段总体检测+检测A组+逐个检测B组\\ =&1+1+n/2 \\=&2+n/2 \end{aligned} \]
  • \(A\) 组结果为阳性的概率为 \(1-(1-p)^{n/2}\)\(B\) 组结果为阴性的概率为 \((1-p)^{n/2}\) ,总检测次数为

    \[ \begin{aligned} &第一阶段总体检测+总体检测A组+逐个检测A组+总体检测B组\\ =&1+1+n/2+1\\ =&3+n/2 \end{aligned} \]
  • \(A\) 组结果为阳性的概率为 \(1-(1-p)^{n/2}\)\(B\) 组结果为阳性的概率为 \(1-(1-p)^{n/2}\) ,总检测次数为

    \[ \begin{aligned} &第一阶段总体检测+总体检测A组+逐个检测A组+总体检测B组+逐个检测B组\\ =&1+1+n/2+1+n/2 \\ =&3+n \end{aligned} \]

所以总检测次数的数学期望为

\[ \begin{aligned} &(1-p)^n\cdot 1+(1-p)^{\frac{n}{2}}(1-(1-p)^{\frac{n}{2}})\cdot(2+\frac{n}{2})+(1-(1-p)^{\frac{n}{2}})(1-p)^{\frac{n}{2}}\cdot(3+\frac{n}{2})+(1-(1-p)^{\frac{n}{2}})^2\cdot(3+n)\\ =&n+3-(n+1)(1-p)^{\frac{n}{2}}-(1-p)^n \end{aligned} \]

平均检测次数的数学期望为

\[ 1+\frac{n}{3}-(1+\frac{1}{n})(1-p)^{\frac{n}{2}}-\frac{1}{n}(1-p)^n \]