查看《博弈论》小说信息

第二章 零和二人博弈——必然有输有赢(第1页,共2页)

字体:

日常生活中,我们经常会陷入选择两难的困境,有时认为甲比较不错,有时又认为乙也令人满意。那么,我们对此应该做何选择呢?有些事情决策失误后还有重新选择的机会,但是有些事情一旦决策失误就会面临无法改变的状况。如何才能让自己做出正确的决策,远离痛苦和后悔的深渊呢?我们每个人都需要一种更好的选择方法,那就是博弈。

我们需要重视任何一次博弈,并且能充分地从历史资料和研究中掌握博弈的规则和理论,以此提升我们的博弈理论水平以及策略选择能力,更好地面对社会中重要的抉择。其实人生就是一场永无止境的博弈,我们需要学会在博弈中生存,与他人友好相处,以及学会适应和使用世界上的其他法则,在这个过程中更好地为自己做出选择。

一人博弈:一场“斗智”之战

前面的介绍与分析让我们了解到对于博弈的形式化的描述,也了解到了博弈策略的雏形,这让我们能够用简单、直观的形式对复杂的博弈做出清晰的概述。透过一些简单的博弈,让我们看到了前者与后者之间的等价关系。为了方便研究和讨论,我们还会用另外比较简单的方式给它们命名,我们将这些不同的命名方式称为广阔和正规化的不同形式。

我们对其的命名方式是完全等价的,我们可以按照在实际情况中较为方便的形式给它们不同的名称,而且这样的做法并不会影响到我们对其讨论的正确性和一般性。

事实上,那些非常正规化的形式更加适合于我们推导出博弈的一般定理,但是对于其中比较特殊的情况,还需要我们运用更加灵活多变、广阔的形式。换言之,正规化的方式能够帮助我们建立关于博弈所共有的性质,但是后者能够更加直观清楚地告诉我们不同的博弈之间性质的差别,以及如何解决这些博弈所出现的结构性差异。

我们已经对博弈进行了较为完整的描述,那么接下来就需要对此建立正面的理论。我们可以试着想象,若要建立这一理论,需要我们从简单的博弈逐渐过渡到复杂的博弈,这就意味着我们将按照其难度、复杂程度的递增次序对其进行讨论和研究。

我们可以根据参与博弈赛局的参加者数量对其进行划分,即由n个参与者参加的博弈属于n人博弈,同时,这也根据博弈是否为零和进行分类。由此一来,需要我们区分开零和n人博弈与一般n人博弈。

首先,我们对一人博弈做出说明。在正规化的形式中,我们能够看到一人博弈的组成是随机选择一个数,博弈中的唯一的局中人将会得到对应的结果。此时,我们能够非常明了地看出,零和的博弈中是一种空无一物的状态,那么我们便不需要对它再做出任何说明。

其实,我们能够用一种极其简单化的形式对一人博弈做出描述,假设我们用a表示博弈中变化的量,但它所表示的东西,并不只是在一个“着”中,而是代表了局中人的策略,它意味着在一个博弈赛局中所有可能出现的情况。同时,它也代表了这个局中人应对这些情况的所有策略和一套完整的“理论”。

此时,我们需要明白,即使一个人的博弈,可能出现的所有形式也可能是错综复杂的。简单地说,它有可能同时包括“机会的着”“人的着”,而且这些都属于同一个局中人,甚至每一种可能出现的“着”都包含着各种不同的走法。同时在出现任何一个“人的着”时,可以参照局中人掌握的情报信息,也可以根据提前设定的方案应对出现的情况。

我们可以列举出很多单人独玩的游戏,它们的表现形式复杂多变,而且十分细致,但是有一种非常重要的情况——我们所进行的单人独玩的游戏中没有渗透出上述的情形,而这正是不完全情报的一种体现。简言之,在同一局博弈中,唯一的局中人的不同的“人的着”中,具备先现性与前备性等价的情况的要求是:唯一的局中人有两个“人的着”,即a和b,在进行每个“着”时,局中人并不知道另一个“着”的选择结果,在情报不完整的情况下这种情况是难以实现的。

但是我们前面讲到过,可以通过把局中人拆分成两个或者多个具有相同利害关系,同时在情报交换方面是不完全的人,便能够实现先现性和前备性等价的情况。我们可以通过桥牌博弈的例子构造出类似于一人博弈的情形,只是单人游戏的多种形式都不属于这种博弈类型。还有一些双重单人游戏的规则是在两个参与者之间进行的竞争,它属于二人博弈的范畴。

这些情形在实际生活中有一定的意义,诸如一些分配方案的决策,当互相交换已经不存在时,且只有一个机构能够转嫁社会产品,那么所有的社会成员的利益关系是一致的。需要注意的是,在这种情况下,我们不能将每位成员都看作博弈的局中人,主要原因是在成员之间不存在利害关系,更不可能出现某些成员联手对付其他成员的情况。因此,我们需要将这个机构看成一个一人博弈,只是在这些社会成员之间存在着不同的联系,这就意味着其中可能会出现不同的不完全情报。

在这种严谨的分配方案的例子中,我们很难对此种分配方案自身进行鉴定,因此我们可以将分配方案与博弈规则联系起来。由于博弈的规则是绝对的、不容侵犯的、不接受批评的,我们可以通过对博弈策略的了解,简单地解决博弈规则内的方案分配问题。

“偷鸡”:“虚张声势”促成功

配铜钱、石头剪刀布等博弈相对简单,而且它们之间的广阔形式和正规化并无本质性的差别。但是,接下来我们所要讲到的是一种形式更加广阔的博弈,因为这些博弈中的局中人有若干个“着”,这就意味着在这些博弈中,广阔的形式和正规化的过渡之间变得更加丰满而有意义。

我们会对扑克中的博弈进行严格的讨论,而实际过程中的扑克相对复杂,但是我们又想进行极其细致的讨论。在此种情况下,可以对其进行一些简化处理,甚至是进行一些根本性的改变,方便我们对其中的博弈情况进行研究。基于此,我们对扑克的所有修改都会保留其最初的基本性质和观念。

实际上,扑克可以由任意人数参与,但是我们所要研究的是零和二人博弈,因此我们将参与扑克的人数规定为两人。

进行扑克博弈之前,我们将从所有的牌中拿出5张扑克牌给赛局中的每个人,在此种情况下,每个人所获得扑克牌的组合会有2598960种,这种情况下,我们将其称为一“手”牌。此时,每个人将自己所获得的扑克牌按照从大到小的顺序进行排列,按照我们的前提规定,即每个人一“手”牌的大小对应的是扑克牌的强弱。

其实,扑克牌在实际的玩法中有很多种,或者可以说它有多种变形,我们可以将是否换牌作为区分其是何种博弈的参照点,即“换牌”博弈与“不换牌”博弈两种。

在“换牌”博弈中,参与赛局的局中人可以换掉自己手上的某张扑克牌,或者换掉手上的所有扑克牌,而且这种换牌的方式是“千奇百怪”的。在某些换牌变形中,局中人手中的一“手”牌,往往是在同一赛局中相继获得的。相对来说“不换牌”博弈相对简单,即在同一赛局中,必须保证自己手上的扑克牌不发生变化。因此,我们为了在研究过程中偏向简单,所以只研究“不换牌”博弈。

在“不换牌”博弈中,赛局中的参与者便不需要将一“手”牌作为一手牌,这里所说的一手牌指的是局中人所获得的扑克牌的组合。假设我们令局中人所获得的扑克牌的总数为s,每个人所获得的扑克牌数为s。由于前面已经提到在博弈中如果使用全副牌,那么每个局中人手中的扑克牌的组合为s=2598960。由于发牌是按照一定的规则进行的,所以每个人获得扑克牌的可能性是相同的,那么从全副牌中随便抽取一张扑克牌的数作为s,而s便是赛局中的“机会的着”,而且两个局中人获得其中可能的值的概率是相同的。因此,“不换牌”博弈便由“有机会的着”开始了,我们将参与博弈的局中人分别命名为甲和乙,而给他们抽取的扑克牌数为甲1和乙2。

上述为扑克博弈的第一个阶段,通常情况下扑克博弈进行到第二阶段时,便需要赛局中的参与者进行“叫价”。所谓“叫价”,指的是两个参与者需要下赌注,而这个赌注有大有小,完全取决于局中人自己的决策。一般情况下,当其中的一个局中人“叫价”之后,另一个局中人会有三种选择,即“看牌”“不看牌”“加叫”。

“看牌”指的是这个局中人接受了第一个局中人的“叫价”,他需要将自己手上的扑克牌全部摊开,与“叫价”的局中人的扑克牌进行比较,最后两个局中人手上拥有较强的一“手”牌的局中人获胜,而且能够获得此次“叫价”的收益,并且结束此局博弈。

“不看牌”指的是,局中人愿意接受他在前一局中最后一次的“叫价”,而且他所接受的这个金额要比现在的数额低,而且两个参与者都没有其他的异议,此时,两个局中人便不会在意各自手上握有怎样的牌,因为他们手上的牌无须全部摊开。

“加叫”指的是,对方能够给出“叫价”者更多的叫价,以此还击“叫价”者给出的叫价,那么在这种情况下,两个局中人的地位便会发生反转,即前面“叫价”的局中人此时便会有三种选择:“不看牌”“看牌”“加价”。其余的对局,便以此类推。

但是,在进行扑克博弈的对局中,若是参与者中的一方手上握有强牌,那么他有极大的叫高价的可能性,而且会根据情况进行不少加叫,主要是因为他有足够的信心觉得自己能够在赛局中获胜。这就说明在他进行加叫或者叫高价的过程中,向他的对手释放了一个信息,即他的对手可以假设他手上握有强牌,那么对手在这种情况下,极有可能在进行决策时会选择“不看牌”。这也意味着,双方在“不看牌”的决策下,无法对双方的扑克牌进行对比。此时,若是手上的牌是弱牌的一方,他便可以选择加价或者叫高价,进而引起对手不看牌,以此达到一种自己手上握有强牌的假象,利用这种方式极有可能用手上的弱牌赢过对方手上的强牌。

在扑克博弈中,这种现象被称为“偷鸡”。显而易见,这种策略大都是在扑克博弈中有经验的参与者才经常使用的方法,但是对于上面的分析一定会有人产生异议,这种研究是否是“偷鸡”的真实原因呢?

其实,我们对此还有更容易理解的解释:当进行扑克博弈时,假设我们都知道其中的一个局中人手上握有强牌,他便会做出叫高价的行为;此时,面对这种情况,他的对手极有可能选择“不看牌”。因此,手上握有强牌的一方便不能再继续叫高价或者多加叫,正是出于此,他手中的牌才能够帮助他赢得此局博弈。所以,他在这种情况下,尽量不能让对手得知自己的真实情况,反过来说,他需要传递给对手的信息是自己手上握有弱牌,但是还在叫高价。

通过上面的分析,我们能够清晰地发现,扑克博弈中的“偷鸡”其实包含两种可能存在的动机:一种是其中的一个局中人手上握有弱牌,但是想要给对手营造出一种手上握有强牌的假象,进而混淆对方的决策。另一种是其中的一个局中人手上的确握有强牌,却要制造出一种自己手上其实是弱牌的假象。这两种动机都是为了向自己的对手传递出反面的信号,给对手的决策造成干扰,进而增大自己在博弈中获胜的可能性。

关于这两种动机是否能够获得更高的收益,还取决于对手最终的决策。比如在第一种情况下,若想真的“偷鸡”成功,需要对手真正选择“不看牌”,才能获得最终意义上的成功。而对于第二种情况来说,其中的一个局中人在对手选择“看牌”策略时,便能成功给对方制造混乱情报,最后获得此局博弈的胜利。

事实上,采用这种反方向的策略带有一定的风险性,由于其中的一个局中人无法判断出对手是否会顺着自己的方向走,所以这种“叫价”的方式自身具有冒险性。

假设使用了不正确的“偷鸡”法,便会偏离好策略,最后导致局中人利益受损。在这种情况下,对手只需要选择坚持一个正确的策略就可以了。当对手选择了一个完美的策略后,即使不正确的“偷鸡”法,也不会给局中人造成损失。但是,当对手在博弈赛局中逐渐偏离完美的策略后,便会给前面的赛局中的局中人造成损失。

这就告诉我们,若想成功地“偷鸡”,其实并不需要在博弈中遇到一个实力相当的对手,而是在于对手是否会在博弈赛局中偏离完美的策略,同时,“偷鸡”对这种情况是有所防备的。

通过上述描述,我们清楚地发现,扑克的此种变形所拥有的完美策略并非一成不变或者最佳的,所以在这种情况中,永久最优的策略是不存在的,而且“偷鸡”其实是在博弈中的一种具有防御性的措施。

你真的会打扑克吗?——“叫价”的艺术

我们在前面的研究中多次强调指出,让博弈中的两个局中人的策略选择相等,是零和二人博弈中最简单的一种方式。在这种博弈中,局中人的策略选择被称为纯策略。事实上我们不应该用这个名称,用“着”来表示似乎并没有显得太夸张。而且,在上面已经讲到的问题中,它们之间存在的广阔形式和正规化之间似乎没有任何明显的区别。因此,在这些类型的博弈中,我们会将“着”和策略等同起来,而这些原本就属于正规化的形式特征。但是我们现在将对一个广阔形式的博弈进行探究,这类博弈中的局中人有若干个“着”,而且这些“着”能够更直观地向正规化的形式和策略进行过渡。

扑克本身具有很多规则,正是这些技术性的规则才避免了赛局中的局中人进行无限次的加叫,保证叫价的次数是有限的。参与扑克博弈的双方,都会自动避免不现实的叫高价,为了避免对手在叫价的过程中出现超人意料的叫价,所以在每局博弈中,都规定了一个最高叫价的数值。除此之外,还规定不能出现过小的叫价,这种规定保证了博弈顺利进行。

小说目录