博弈论第二章零和二人博弈——必然有输有赢-全文小说网

在实际进行扑克博弈时，参与赛局中的任意一个人率先叫价，紧接着剩下的局中人进行轮流叫价。在这种博弈过程中，所包含的有利因素和不利因素自身就是一个非常有趣的问题。而且扑克本身是一个比较复杂的博弈，但是为了方便研究叫价和加叫次数的限制，我们将其进行简化。

扑克自身就具有一种不对称性，正是受到这种因素的影响，所以希望在研究的过程中不受这种情况的干扰，这样便能够研究出扑克在最简单的形式下的主要特征。基于此，我们假设参与博弈赛局的两个局中人，在博弈进行中都会根据自己的选择开叫，而且他们不知道另一个局中人做何决策，当这两个局中人分别选择完自己的叫价后，才让对方知道自己的叫价结果，简单说就是让对手知道自己的叫价究竟是“高”还是“低”。

在此基础上，我们再对此种扑克博弈进行简化：假设我们规定参与赛局的每个人都只有两种决策权，即“不看牌”和“看牌”。这就意味着，在进行此次博弈时，排除了“加叫”这种决策。简言之，“加叫”只是在用一种更加巧妙和激烈的方式来达成局中人的某种意图，只是早在其中的一个局中人进行高叫价的时候，便能展现出他的这种意图。由于我们想要更加直白、明了地看待扑克博弈的问题，所以要尽最大可能避免使用多种意图来表示此次博弈中的一种意图。

参照上面的方式，我们设定下面这些条件：除了赛局中的参与者不让对方知道自己的真实意图外，还要考虑到其中的一个局中人的决策被对方知道的情况。试想，当参与扑克博弈的局中人的叫价同为“高”或者同为“低”时，便需要两个参与者将自己手上的牌同时摊开，比较它们的大小。这时，某个局中人手上如果握有强牌，那么他将获得对方手上的数额；假设双方手上握有的牌大小相同，那么便不需要其中的一方进行支付。

除此之外，当其中的一个局中人选择了“高”的叫价，而另一个人选择了“低”叫价时，那么选择“低”叫价的一方便会有两种选择，即选择“不看牌”或者“看牌”。此时，当“低”叫价的一方选择“不看牌”时，而且在不考虑到手上的牌的强弱的前提下，便意味着他将付给对方自己低叫价的数值；当“低”叫价的一方选择“看牌”时，那就意味着他的选择发生了改变，即由“低”叫价变成了“高”叫价，针对这种情况的处理方式便会和最初都选择“高”叫价时一样。

我们再次对扑克的技术性规则进行讨论：在扑克博弈中，我们为了避免局中人会没有限制地加叫，便规定了局中人叫价次数是有限的，这便是终止规则。为了避免不切实际的叫高价发生，因为这对于对手而言将会产生不可预料的后果，所以在博弈赛局中规定了叫价以及加叫的一个上限数值，同时通常情况下，还会规定禁止过小的加叫。因此，我们将会给予叫价和加叫一个限制性的条件，我们在博弈进行前，就设定两个数目，a和b，而且让a＞b＞0。

同时，我们还规定博弈中的局中人的每次叫价，即要么叫价“高”，要么叫价“低”。在这种情况下，我们将前者定义为a，后者定义为b。叫价高低之间的比值是此次博弈中唯一有联系，并且会发生变化的因素。

假设在进行扑克博弈的过程中，a与b的比值明显比1大，那么这就说明博弈的风险和冒险性极高；相反地，若是a与b的比值仅仅比1大一点，那么这就意味着此次博弈较为安全。

现在，我们将叫价和加价的次数限制对整个博弈过程进行简化。实际上，在日常生活中进行扑克游戏时，其中的一个局中人率先开始叫价，之后局中人开始轮流叫价。

由于在扑克博弈中，其中的一个局中人拥有第一次叫加权，同时他也要第一个做出行动。这时，不仅有有利因素，还有不利因素，这自身就是一个非常有趣的问题。我们已经对扑克不对称形式进行过讨论，而且这个问题占有一定地位。只是我们在最初研究这个问题时，希望能够避开这个带有困扰性的问题。换言之，我们避免在此博弈中研究所有的不对称情况。由此一来，我们将会得到扑克博弈的最纯粹、最简单的形式下的重要特征。

为此，我们可以在进行扑克博弈前假设，赛局中的每个局中人都拥有自己的开叫，而且每个局中人在博弈中并不知道其他局中人的选择，当博弈的双方都做出自己的叫价后，其中一个局中人的选择才被另一个局中人得知，即让每个局中人清楚另外一个局中人的选择，这时才知道对手的叫价究竟是“高”还是“低”。

除此之外，我们还能对此种博弈进行简化：我们提供给赛局中的局中人两种选择，一种是选择“看牌”，另一种是选择“不看”。这就意味着，我们在进行此次扑克博弈时，并没有“加叫”这个选择。“加叫”在某种程度上只是局中人巧妙、强烈地表达自己的某种意图的方式，尤其是在一个高开叫价的博弈局中，更明显地表达出了这种意图。我们的研究目的是希望问题能够变得简单，所以会尽可能地避开这些用不同方式表达同种意图的情况。

根据上面的这些前提条件，我们对此做出下面的规定：当两个局中人所做出的选择被对方得知时，假设两个人都选择了“高”的叫价，或者同时选择了“低”的叫价，此时两个局中人手上的牌必须摊开，那么手上拥有较强牌的局中人，将从他的对手那里获得a或者b的数额。假设这两个局中人手上所拥有的牌是相等的，那么双方不需要进行支付。

除此之外，还有另外一种情况，当其中的一个局中人选择了叫“高”价，而另外一个局中人选择了叫“低”价。这时，选择了叫“低”价的人拥有两个选择，即选择“不看”或者选择“看牌”。当另外一个局中人选择了“不看”之后，在不考虑两手牌的强弱的情形下，他将支付给对手低价的数额；若他选择了“看牌”，则表示他的选择发生了改变——由叫“低”价转换成了叫“高”价。而对这种情况的处理方式，则与两个局中人都选择叫“高”价时一样。

我们对于上面提到的简化版的扑克博弈规则加以总结：参与博弈赛局的每个局中人，能够通过一个“机会的着”获得他的一“手”牌；然后，每个局中人可以通过一个“人的着”对a、b进行选择，简单说就是选择叫“高”价还是叫“低”价；最后，赛局中的每个局中人都了解了另外一个局中人的选择，但是他并不知道他手上的牌，即双方都知道自己手中的一手牌以及自己的选择。假设其中的一个局中人在博弈中选择了叫“高”价，而另外一个局中人的选择是叫“低”价，那么后者将会拥有两种选择，即“看牌”或者“不看”。

这是一场博弈赛局的过程，当一场赛局结束时，他们的支付方式如何呢？假设两个局中人同时选择了叫“高”价，或者一个局中人选择叫“高”价，而另外一个局中人选择叫“低”价，并且在后来还选择了“看牌”，那么前一个局中人将从后一个局中人那里获得三个数额，即a、0、-a；假设两个局中人都选择了叫“低”价，那么前一个局中人将从后一个局中人那里获得三个数额，即b、0、-b；假设另外一个局中人选择了叫“低”价，并且在后来选择了“不看”，那么，“人的着”属于选择了叫“低”价的人。

“优胜劣汰”：二人博弈中，到底谁为鱼肉？

我们暂时不对n个局中人的博弈t进行直接的研究，我们在现阶段还不具备此种条件，所以先对另外两个博弈进行思考和研究，因为它们与n个局中人的博弈有着紧密的联系，而且对它们的探究是我们能够非常轻易做到的。

关于n个人的博弈t的难点在于：参与博弈赛局中的局中人1在进行选择时，无法预测到此赛局中的局中人2会做出怎样的策略选择，反之亦是如此。由此一来，我们将带有这种困难的n人博弈t与没有这种困难的其他博弈进行简单的比较。

首先，我们用t1表示所要研究的博弈，它与博弈t在细节上的唯一不同之处在于：当局中人2要做出自己的策略选择时，局中人1必须已经做出了自己的策略选择。简单说，当局中人2进行选择时，已经清楚了局中人1的策略选择，这就意味着局中人1的“着”前备于局中人2的“着”。

在此博弈t1中，我们能够非常清晰地看出，局中人1所处的地位远远低于他在博弈t中的地位，这种博弈赛局相对于局中人1来说是十分不利的，因此我们将博弈t1称为博弈t的劣势博弈。

相似的，我们重新定义另一个博弈t2，它与博弈t唯一不同的细节在于：当局中人1做出自己的策略选择之前，局中人2必须做出自己的策略选择，这就意味着局中人1在做出自己的选择时已经知道了局中人2的选择，即局中人2的“着”前备于局中人1的“着”。在这个博弈中，我们能够明显地发现局中人1所处的地位远远比原来在博弈t中的地位有利，因此，我们讲博弈赛局t2是博弈赛局t的优势博弈。

我们借助这两个博弈t1、t2，帮助我们达到了以下目的：从常识方面来看，对于博弈t1、t2而言，我们清楚地了解到了参加博弈最佳的行为方式。另一方面，我们能够发现博弈t显然是处在博弈t1、t2“之间”。比如，我们从局中人1的角度来看，t1相对于t而言总是不利的，但是t1总是要比t有利。严格意义上说，这里的“不利”应该指的是“不利或者与其相等”，而“有利”则是指“有利或者与其相等”。

由此一来，我们可以想象博弈t中所有重要的量，t1、t2能够帮助它们提供上、下界。事实上，我们还可以用更加严格的形式讨论其中的问题。考虑到上界和下界之间的问题，那么我们在很大程度上，对于博弈t的认知和了解都是不确定的。若是初看起来，很多博弈中的情况都是如此。但是我们可以利用这种技巧，找到某些新的方法，以便在最后能够找到一套严谨的关于博弈t的理论，而且它能够对所有的问题给出合理的解释。

我们针对劣势博弈t1进行讨论，当局中人1做出了自己的策略选择后，局中人2知道了局中人1的选择，并做出了自己的选择。由于局中人1先做出了选择时，他对整个博弈的情况有了简单的了解，便能够做出对自己有利的策略选择。

上面所讲到的情况比较特殊，但是我们能够十分清楚地看到它们之间的相互关系，这能够帮助我们在更加复杂的情况中认识它们，而且这种方式能够帮助我们更加准确地做出判断。

再来考虑优势博弈t2，t2与t1是不同的，不同之处在于局中人1和2的地位发生了转变，即局中人2需要率先做出自己的策略选择，在此基础上，局中人1在清楚局中人2的策略选择之后，才做出自己的策略选择。在这种情形下，我们可以在博弈t1中将局中人1和2进行互换，由此一来便得到了博弈t2。

我们应该清楚博弈t1和t2之间存在着一种对称关系，当对t1和t2的局中人进行互换之后，我们就能从一个研究跨越到另一个研究中，仅从博弈自身来看，这种t1和t2之间的互换是不具有对称性的。实际上，正是由于局中人1和2的互换，使得博弈t1和t2发生了互换，因此，不管是局中人还是两个博弈都发生了改变。

在此，我们应该观察到，博弈t相对于两个局中人1和2来说，在这两个博弈中所处的地位都是不同的，而且有着本质的区别。对于博弈t而言，它处于t1和t2的中间地位，可以采用同样的方式对一个博弈的局进行定义。这些只是一些具有启发性的阐述，直到现在我们还未对博弈t做出证明，通过上述的一些简单讨论，我们逐渐将剩下的空白进行填补，针对现阶段而言，我们的讨论还受到一些限制，但是借用一些新的技巧就有机会解决这些困难。

国际象棋——有智还需有谋

我们已经讲到过关于先现性与前备性是等价的，即具备完全情报的零和二人博弈。这种博弈被称为具有有理性质的博弈。同时我们还证明了这种博弈是严格的，当任何博弈包含“机会的着”时，我们的证明依然成立，而这种事实则是无法根据“通常看法”验证的。

国际象棋自身不具有“机会的着”，而双陆则含有“机会的着”，但它们都属于完全情报博弈，对于所有的这类博弈而言，我们已经讨论过它们具有一个固定的、最佳的策略，只是我们用一种抽象的形式证明了它们的存在性。在大多数情况下，需要我们对它们的结构进行研究，但是它们比较复杂、冗长，还无法在实际中得到应用。

因此，我们将更加细致地对国际象棋进行研究和考察。

最后，我们用一种简单又不形式化的方式针对我们的讨论做出总结，即所有具有完全情报的零和二人博弈都是需要严格确定的。说到这里，一定会有读者十分疑惑，究竟哪种讨论不能算是一个系统的论证呢？我们需要系统地将可信的论证进行归纳，并且我们能够对上述所有类型的博弈t的任意赛局，给出合理的答案，但是这种论证过程会遇到一些难题。事实上，我们在对博弈赛局进行讨论时，没有必要解决掉所有的困难。

一般情况下，在那些具备完全情报的博弈中，我们将采用不同的思路得到最佳的博弈的解。由此一来，便能够让零和二人博弈与一般情形下的差别表现得更加明了，这足以说明处理一般情况时，不得不采用完全不同的方法。

在零和二人博弈的对局中，我们可以假设对手的博弈行为的合理性，倘若对手的行为是不合理的，那就意味着不会给另外的局中人造成不利。事实上，参与零和二人博弈的局中人只有两个，而且利益的和为零。在此种情形下，对手需要为自己的不合理的行为承担损失，同时将会给另一个局中人带去相等的收益，这样的论据在现阶段来看并不十分精准，但是我们能够在某种程度上让它变得更加准确，不过我们并不需要在这里对它进行讨论。

初等博弈中的特殊例子

前面我们已经讨论过零和二人博弈的例子，接下来我们将对其中包含的特殊例子进行讨论。而且，我们将要研究的这些特殊案例，能够更好地帮助我们认识到所研究的理论的各个组成部分。特殊之处在于，它能够帮助我们对理论中的某些形式化的东西进行直观的解释。针对那些“实际的”“心理上的”某些现象，得到较为严格的形式化体系，尤其是那些在通常意义上被认为不容易用严谨的方法进行处理的东西。

我们假设在正规的博弈中，两个局中人所能采用的策略的数量分别为b1和b2，而且针对这两个策略数目的大小对博弈的影响做出了简单的统计，在这里我们不讲两个数之一，或者二者都为一的情况。在此种情况下，其中的某个局中人对于博弈的影响并不重要，甚至可以说局中人没有选择的余地。此时，这里所讲到的博弈实际上是一人博弈，而且不是零和的。所以，我们在讨论这类博弈时，最简单的方式就是让b1和b2相等。

第二章 零和二人博弈——必然有输有赢（第2页，共2页）

第二章零和二人博弈——必然有输有赢（第2页，共2页）