08 赌徒破产问题与Pascal问题¶

约 1870 个字 2 张图片预计阅读时间 9 分钟

问题背景

赌徒破产问题：

一个赌徒在初始时拥有 \(h\) 个单位财富。在每局赌博中以概率 \(p\) 赢一个单位财富，以概率 \(q=1-p\) 输一个单位财富。各局赌博结果独立。当赌徒的财富达到 \(N\) 个单位或 \(0\) 个单位（破产）时停止赌博。求赌徒破产的概率。
Pascal问题：

A,B两人玩一种游戏，初始时两人各有12分。一次掷三枚骰子，若点数恰为11则A胜B负，点数恰为14则B胜A负，其他点数不分胜负。对出现胜负的一次投掷，胜一方增1分，负一方减1分。分数先为0分的一方失败。求双方获胜的概率之比

随机过程¶

随机过程是描述随机现象随时间推移而演化的一类数学模型。

• 一族随机变量\(\{X(t),t\in T\}\) ，其中 \(t\) 是参数，\(T\) 为参数集。 • \(T\) 为整数集的随机过程称为随机序列。

Markov 过程¶

Markov 过程意味着：在已知目前的状态（现在）的条件下，它未来的演变（将来）不依赖于它以往的演变（过去）

对随机序列 \(\{X_n,n=0,1,2\cdots\}\)（\(X_n\)为有限个或可数个），\(P(X_{n+1}=i_{n+1})\)只与 \(X_n\) 有关，而与 \(X_{n-1},X_{n-2},\cdots\) 无关，则称 \(\{X_n,n=0,1,2\cdots\}\) 为 Markov 链。用数学语言描述为：

\[P(X_{n+1}=i_{n+1}|X_n=i_n,X_{n-1}=i_{n-1},\cdots,X_0=i_0)=P(X_{n+1}=i_{n+1}|X_n=i_n)\]

递推关系¶

已知\(A_0\)，\(A_n\)及以下相邻两项之间的递推关系，求\(A_n\)的通项公式。

\[\begin{cases}A_0, A_N已知\\A_h-A_{h-1}=r(A_{h-1}-A_{h-2}), 1\leq h\leq N-1\end{cases}\]

很简单的高中数列题，我们有：

\[ \begin{aligned} A_0-A_1 &= r^0(A_0-A_1)\\ A_1-A_2 &= r^1(A_0-A_1)\\ A_2-A_3 &= r^2(A_0-A_1)\\ \cdots\\ A_h-A_{h+1} &= r^{h}(A_0-A_1)\\ \cdots\\ A_{N-1}-A_{N} &= r^{N-1}(A_0-A_1)\\ \end{aligned} \]

当\(r\neq 1\)时，将上述等式相加，得到：

\[A_0-A_N=(1+r+r^2+\cdots+r^{N-1})(A_0-A_1)=\frac{1-r^N}{1-r}(A_0-A_1)\]

将\(A_h\)开始的式子相加，得到：

\[A_h-A_N=(r^h+r^{h+1}+\cdots+r^{N-1})(A_0-A_1)=\frac{r^h-r^N}{1-r}(A_0-A_1)\]

所以：

\[\frac{A_h-A_N}{A_0-A_N}=\frac{r^h-r^N}{1-r^N}\]

因此我们可以得到：

\[A_h=A_N+\frac{A_0-A_N}{1-r^N}(r^h-r^N)=\frac{r^h-r^N}{1-r^N}A_0+\frac{1-r^h}{1-r^N}A_N\]

当\(r=1\)时，将上述等式相加，得到：

\[A_0-A_N=N(A_0-A_1)\]

将\(A_h\)开始的式子相加，得到：

\[A_h-A_N=(N-h)(A_0-A_1)\]

所以：

\[\frac{A_h-A_N}{A_0-A_N}=\frac{N-h}{N}\]

因此我们可以得到：

\[A_h=A_N+\frac{A_0-A_N}{N}(N-h)=\frac{N-h}{N}A_0+\frac{h}{N}A_N\]

综上所述，我们可以得到：

\[A_h=\begin{cases}\frac{r^h-r^N}{1-r^N}A_0+\frac{1-r^h}{1-r^N}A_N, r\neq 1\\ \frac{N-h}{N}A_0+\frac{h}{N}A_N, r=1\end{cases}\]

赌徒破产问题¶

一个赌徒在初始时拥有 \(h\) 个单位财富。在每局赌博中以概率 \(p\) 赢一个单位财富，以概率 \(q=1-p\) 输一个单位财富。各局赌博结果独立。当赌徒的财富达到 \(N\) 个单位或 \(0\) 个单位（破产）时停止赌博。求赌徒破产的概率。

记 \(P_h\) 和 \(Q_h\) 分别为赌徒初始财富为 \(h\) 个单位时，财富最终达到 \(N\) 个单位的和 \(0\) 个单位的概率，显然有初始条件 \(P_N=1\) ，\(P_0=0\) ，\(Q_N=0\) ，\(Q_0=1\) 。

求 \(P_h\)¶

对每一个 \(P_h\) ，可以由如下Markov链得到：

Alt text

以概率 \(p\) 赢一个单位财富，以概率 \(q=1-p\) 输一个单位财富

\[P_h=pP_{h+1}+qP_{h-1}, 1\leq h\leq N-1\]

我们把这个式子转换为我们刚刚递推公式的形式：

\[ \begin{cases} P_0 = 0, P_N = 1\\ P_h - P_{h+1}= \frac{q}{p}(P_{h-1}-P_h), 1\leq h\leq N-1 \end{cases} \]

\[A_h=\begin{cases}\frac{r^h-r^N}{1-r^N}A_0+\frac{1-r^h}{1-r^N}A_N, r\neq 1\\ \frac{N-h}{N}A_0+\frac{h}{N}A_N, r=1\end{cases}\]

其中 \(r= \frac{q}{p}\)，\(A_0=0\)，\(A_N=1\)，\(A_h=P_h\)

所以：

\[P_h=\begin{cases}\frac{1-(\frac{q}{p})^h}{1-(\frac{q}{p})^N}, &q\neq p \\ \frac{h}{N}, &q=p\end{cases}\]

求 \(Q_h\)¶

设想赌徒与另一位在初始时拥有 \(N-h\) 个单位财富的虚拟赌徒赌博。在每局赌博中虚拟赌徒以概率 \(q\) 赢一个单位财富，以概率 \(p\) 输一个单位财富。赌徒破产时，虚拟赌徒财富达到 \(N\) 个单位。

所以真实赌徒从 \(h\) 输到破产就相当于虚拟赌徒从 \(N-h\) 的赚到 \(N\) 个单位，即 \(Q_h = P_{N-h}'\)

因为\(P'_h=\begin{cases}\frac{1-(\frac{p}{q})^h}{1-(\frac{p}{q})^N}, &p\neq q \\ \frac{h}{N}, &p=q\end{cases}\)，（和 \(P_h\) 的输赢概率对调）

所以

\[ Q_h =P_{N-h}'= \begin{cases}\frac{1-(\frac{p}{q})^{N-h} }{1-(\frac{p}{q})^N}=\frac{(\frac{q}{p})^N-(\frac{q}{p})^h}{(\frac{q}{p})^N-1}, &p\neq q \\ \frac{N-h}{N}, &p=q\end{cases}\]

Pascal问题¶

A,B两人玩一种游戏，初始时两人各有12分。一次掷三枚骰子，若点数恰为11则A胜B负，点数恰为14则B胜A负，其他点数不分胜负。对出现胜负的一次投掷，胜一方增1分，负一方减1分。分数先为0分的一方失败。求双方获胜的概率之比

掷三枚骰子，点数恰为 \(j\) 的概率如何计算？我们采用多项式的方法。

\[\begin{aligned} &(x+x^2+x^3+x^4+x^5+x^6)(x+x^2+x^3+x^4+x^5+x^6)(x+x^2+x^3+x^4+x^5+x^6)\\ =&x^{18}+3x^{17}+6x^{16}+10x^{15}+15x^{14}+21x^{13}+25x^{12}+27x^{11}\\&+27x^{10}+25x^9+21x^8+15x^7+10x^6+6x^5+3x^4+x^3 \end{aligned}\]

总可能性为 \(6^3=216\) ，所以点数恰为 \(j\) 的概率为 \(\frac{a_j}{216}\) ，其中 \(a_j\) 为上式中 \(x^j\) 的系数。

一次投掷，A胜的概率为 \(p=\frac{a_{11}}{216}=\frac{27}{216}\) ，B胜的概率为 \(q=\frac{a_{14}}{216}=\frac{15}{216}\) ，不分胜负的概率为 \(1-p-q=\frac{1-a_{11}-a_{14}}{216}=\frac{174}{216}\) 。

我们从获胜的角度来看，就是判断从12分到24分的概率。我们可以用Markov链来解决这个问题。

Alt text

记\(P_h\)为A从\(h\)分到\(24\)分的概率，\(Q_h\)为B从\(h\)分到\(24\)分的概率，显然有初始条件\(P_{24}=1\)，\(P_{0}=0\)，\(Q_{24}=1\)，\(Q_{0}=0\)。

根据Markov链，我们可以得到如下递推关系：

\[\begin{cases}P_h&=pP_{h+1}+qP_{h-1}+(1-p-q)P_h, &1\leq h\leq 23\\Q_h&=qQ_{h+1}+pQ_{h-1}+(1-p-q)Q_h, &1\leq h\leq 23\end{cases}\]

即

\[\begin{cases}P_h-P_{h+1}&=\frac{q}{p}(P_{h-1}-P_{h}), &1\leq h\leq 23\\Q_h-Q_{h+1}&=\frac{p}{q}(Q_{h-1}-Q_{h}), &1\leq h\leq 23\end{cases}\]

\[ \begin{aligned} &\begin{cases}A_0, A_N已知\\A_h-A_{h-1}=r(A_{h-1}-A_{h-2}), 1\leq h\leq N-1\end{cases}\\ \Rightarrow& A_h=\begin{cases}\frac{r^h-r^N}{1-r^N}A_0+\frac{1-r^h}{1-r^N}A_N, r\neq 1\\ \frac{N-h}{N}A_0+\frac{h}{N}A_N, r=1\end{cases} \end{aligned} \]

所以

\[P_h = \frac{1-(\frac{q}{p})^h}{1-(\frac{q}{p})^{24}},\;\;Q_h = \frac{1-(\frac{p}{q})^h}{1-(\frac{p}{q})^{24}}\]

代入 \(h=12\) ，得到

\[P_{12}=\frac{1-(\frac{q}{p})^{12}}{1-(\frac{q}{p})^{24}}=\frac{1-(\frac{15}{27})^{12}}{1-(\frac{15}{27})^{24}}=\frac{1-\frac{5^{12}}{3^{24}}}{1-\frac{5^{24}}{3^{48}}}=\frac{3^{48}-3^{24} 5^{12}}{3^{48}-5^{24}}\]

\[Q_{12}= \frac{1-(\frac{p}{q})^{12}}{1-(\frac{p}{q})^{24}} =\frac{1-(\frac{27}{15})^{12}}{1-(\frac{27}{15})^{24}} =\frac{1-\frac{3^{24}}{5^{12}}}{1-\frac{3^{48}}{5^{24}}} =\frac{5^{24}-3^{24} 5^{12}}{5^{24}-3^{48}}\]

所以

\[\frac{P_{12}}{Q_{12}}=\frac{3^{48}-3^{24} 5^{12}}{3^{24}5^{12}-5^{24}}=\frac{3^{24}}{5^{12}}=\frac{282429536481}{244140625}\]

显然，A获胜的概率要远大于B获胜的概率。