零和博弈
零和博弈,作为博弈论中的一个概念,又称为零和游戏。生活中,下棋、扑克、乒乓球等比赛都属于零和游戏。我们可以将博弈看作两个人在下棋,不论是象棋还是围棋,在绝大多数情况下,其中的参与者总会有输有赢。假设我们提前设定好赢的一方可以获得1分,而输的一方自然要扣掉1分,即(-1)。在此情况下,双方的得分便是1+(-1)=0。这便是零和博弈最通俗的概述,一方输另一方赢,那么整个游戏的总成绩便是0。
因此,零和博弈属于非合作博弈。即参与博弈赛局的双方,在严格遵守博弈规则的前提条件下,若是其中一方可以获得利益,也就意味着另一方的利益必然受损。所以,博弈双方的收益和损失之和永远为零,即博弈双方不存在合作的可能。
事实上,早在2000多年以前,零和游戏便被广泛应用于输赢明显的竞争或者对抗中。后来,“零和游戏”受到了更多的关注,因为人们逐渐认识到实际生活中有很多与“零和游戏”十分相似的局面。与之相对的便是我们经常倡导的“双赢”,能够在某种程度上保证双方达成“利己”但不“损人”,并且通过双方建立合作、有效的谈判达到令双方满意的结果。当下,由于零和游戏的胜利者背后隐藏着失败者的辛酸和痛苦,所以零和博弈正逐渐被“双赢”所取代。
其实,不论是个人,还是国家,都在这个世界中进行着一场盛大的零和博弈游戏。零和博弈理论认为,世界是一个封闭的空间,里面的所有机遇、财富、资源等都是有限的,当世界中的某个地区或者国家的财富或者资源增加时,也就意味着别的地区或者国家的财富或者资源在减少,这便像一种无形的掠夺。当我们对稀有资源进行大肆开采时,留给后人的就会越来越少……
虽然能够通过有效的合作或者谈判达到双方皆大欢喜的结果,但是从零和博弈游戏走向双赢是一个比较复杂的过程,不仅需要参与竞争的双方真诚合作,还需要遵守整个“戏”规则,才有可能出现双赢的局面,若是不遵守这种规则,最后承担风险的还是参与者自身。
重复博弈
重复博弈是博弈论中比较特殊的博弈。重复博弈,顾名思义就是将同种赛局或者结构不断进行重复,甚至无限次进行重复,而重复博弈中的每次博弈被称为“段博弈”简单来说,就是参与“段博弈”的每个人都有随时采取行动的可能性,也有可能不会同时采取实际行动。在这个过程中,前面的局中人的所有实际行为是可以被后面的参与者看到的,所以,在重复博弈的赛局中,每个局中人的行动和策略,都会不同程度地受到前面的参与者的决策的影响,甚至可以说每个局中人的选择都会依赖其他参与者的行为。
重复博弈是“态博弈”的主要内容,一方面它包含完全信息(即掌握了某种环境或者状态下的全部信息)的重复博弈,另一方面它还包含不完全信息(即没有掌握在某种情况或者环境下的所有信息)的重复博弈。
事实上,当所有的博弈仅仅进行一次时,人们往往更加关心它的最终结果;假设博弈会重复进行多次,那么人们的注意力将会变成最终的收益,甚至会舍弃眼前的利益,只为获得更加长远的利益,进而根据情况做出不同的策略选择。由此一来,重复博弈的结果便会取决于博弈所进行的总次数,而这个总次数又会影响到最终博弈均衡的结果。
在一次重复博弈中所有的前提条件都是相同的,但是重复博弈脱离不了最终利益的影响,因此,在进行重复博弈的过程中,所有的参与者在进行决策时,更多的会考虑到自身的选择是否会影响到博弈进行到最后阶段的抗争、压力,甚至是出现恶性竞争,简单来说就是重复博弈不能像静态博弈那样只考虑自身或者当前的利益,而丝毫不顾及其他博弈方的利益。某种情况下,当参与重复博弈中的一方表现出合作倾向时,其他的参与者也会在接下来的决策行动中选择与其合作的态度,进而帮助双方达成长期获利的合作。
事实上,可以将重复博弈总结成三个基础特征:第一,在进行重复博弈的过程中并没有“物质”上的关联,简言之就是上一个阶段所进行的博弈,并不会改变接下来所要进行的博弈结构。第二,在进行重复博弈的每个阶段,所有的参与者都能够看到前面的参与者所做出的决策。第三,对于参与重复博弈的参与者而言,他们所获得的收益是在每个阶段所获得收益的加权平均数。
其实,影响重复博弈最终结果的因素,主要是重复博弈所进行的次数以及信息的完整性。在重复博弈中,所有的参与者受到长期利益和短期利益的影响,因此他们可能会优先考虑这两者哪个收益更高,从而做出一些带有舍弃性的决策。
重复博弈所出现的选择的结果,清晰地解释了实际生活中出现的现象。然而,重复博弈中信息的完整性,能够影响博弈的最终结果的主要原因是,当参与博弈的人自身的所有信息都不被他人所了解时,那么他能够在整个重复博弈的过程中建立良好的声誉,借此他极有可能获得长远的利益。
囚徒困境
囚徒困境是博弈论和非零和博弈中最经典的一个例子,它表示在某种情况下,那些有利于个人利益的选择,相对于团体而言并非有益处。简单来说,囚徒困境就是两个被捕的囚徒之间所进行的一场特殊博弈。当这两个囚徒想要建立合作、互相帮助时,便能够让双方获得利益,同时想要保持这种合作也是十分困难的。这种困难看似只是一种模型,实际上在我们的生活中也有很多鲜活的例子,诸如价格的竞争、环境保护,甚至是我们所面临的社交问题,都存在着不同程度的“囚徒困境”。
20世纪50年代,囚徒困境首次被美国的梅里尔·弗勒德和梅尔文·德雷希尔提出,并拟定了相关困境的理论。随后,美国兰德公司的顾问艾伯特·塔克正式用“囚徒”的形式将其表述出来,而且正式命名为“囚徒困境”。
简言之,当两个共谋犯同时被抓捕入狱,而且不能互相交流时,若是这两个人互不揭发对方,便会由于无法找到确切的证据,并且根据实际情况对两人判处同样的罪行,假设会判刑1年。但是,若其中的一方选择揭发对方的罪行,但是另外一方选择沉默,法官可能会将揭发者从轻处置,或者出于揭发者提供的证据,将揭发者利益释放,而沉默的一方则会由于不配合警方的调查、揭发者提供的确凿信息随即立案,被判处10年。还有一种情况便是共谋犯互相揭发、指证,那么便会提供完整的证据,最后双方都判刑8年。最终的结果往往更加偏向于最后一种,即由于无法交流、互不信任,最后互相揭发。这种情况,恰好印证了约翰·纳什的非合作博弈理论。
事实上,囚徒困境仅发生一次和多次的结果是不同的。假设囚徒困境是重复进行的,那么博弈便会在其中不断重复进行,这时所有的参与者都可以做出决策去“惩罚”前面那些不愿意参与到合作中的人,在这种情况下,便会产生所有的参与者想要合作的局面。那些参与此次重复博弈的人,便会主动放弃自身欺骗的动机或者行为,导致所有的参与者的决策都向合作靠拢,最终经过反复博弈后,所有的参与者极有可能从最初的互相猜忌转变为相互信任。
在囚徒困境中,所有的囚徒虽然选择了合作,而且不会向警察或者法官说出事实,还能为其他人带来利益,让所有人都无罪。但是当对方的合作意图并不是非常明显,或者无法确认时,出卖自己的同伙便能够让自己减刑或者立即释放,而且同伙可能也会为了自身的利益而招供出自己,在这种情况下,出卖自己的同伙是能够让自身的利益最大化的。
现实中,那些执法机构并不会用这种博弈的形式诱导罪犯说出作案的信息,主要是由于罪犯不仅会考虑自身的利益,他们还会考虑其他的因素,比如揭发对方之后,很有可能会遭到不同形式的报复,而且他们无法将那些执法者所设定的利益作为自己是否揭发对方的考量标准。
智猪博弈
智猪博弈是纳什理论中的一个经典例子,它是在20世纪50年代由约翰·纳什提出的。若一个猪圈里有一头大猪,还有一头小猪,在猪圈的一边有一个投放饲料的猪槽,与猪槽相对的另外一边则安放着一个可以控制猪槽投食量的按钮,假设我们按一下这个投食按钮,猪槽内便会出现10个单位的猪食,但是想要按这个按钮,则需要拿出2个单位的猪食作为成本。在此种情况下,假设大猪先走到猪槽边,它跟小猪的进食量之比为9:1;假设大猪和小猪同时到达猪槽,它们的进食量之比则为7:3;若是小猪先走到猪槽,那么它们的进食量之比则为6:4。最后,若是两头猪都非常有智慧,那么小猪便会在猪槽边等待着。
其实,小猪选择在猪槽边等待,让大猪去按下食物投放按钮的答案一目了然。即当大猪去按下按钮时,小猪在猪槽边会获得4个单位的猪食,当大猪走到猪槽边时看似还有6个单位的猪食,实际上扣除按按钮所需要的2个单位的猪食,大猪最终得到的只有4个单位的猪食;若是小猪和大猪同时出发,同时到达猪槽,那么它们所获得猪食的比例为1:5。
若是小猪选择按投食开关,大猪在猪槽边等待,那么当小猪达到猪槽边时,大猪已经吃下了9个单位的猪食,小猪只能获得一个单位的猪食,所以小猪最终的收益明显小于它选择行动的成本,这样计算得出小猪最后的净收益为(-1)单位的猪食。假设大猪也选择在猪槽边等待,那么小猪的纯收益将为0,而且小猪选择等待的成本也是0。由此看来,不论大猪是选择主动行动还是等待,小猪都选择等待的收益要高于选择行动所获得的利益,这便是小猪在此次博弈中的占优策略。
我们可以将小猪的这种方法称为“坐船”,或者“搭便车”,暗示人们在某些情况下,若是选择注意等待时机,将是一种明智之举,即,不为才能有所为。
智猪博弈告诉人们,当在博弈赛局中处于弱势的一方时,应该学会选择这种等待的占优策略。不论是在竞争中,还是博弈中,参与的双方都在绞尽脑汁让自己获得最大的收益,但是这也暴露了一个问题,假设对方与你具有同样的理性和智慧,那么他是否会选择和你同样的做法呢?其实,博弈就是一场斗智斗勇的竞争。
斗鸡博弈
斗鸡博弈(chickengame)这个名词其实是一种翻译失误的产物,在美国口语中chicken的释义代表了“懦夫”,因此,它应该是“懦夫博弈”,但是这种音译的失误并不影响我们对它的理解。
假设我们设定一个情景,即两个人狭路相逢。若是其中的一人想要主动行动,攻击对方,而另外一方则选择后退让路,在这种情况下,选择主动行动的一方便会获得胜利,即获得最大的收益。若是双方都选择退让,那么可以称为平局;若是自己一直主动出击,但是对方选择了退让,那么最后的获胜者就是自己,对方则成为失败的一方。还有一种情况就是,双方都选择前进,结果便是两败俱伤。相较这些不同的选择来看,最好的结果便是双方都选择退让,既不会两败俱伤,又不会让其中的某一方丢了颜面。
事实上,在这个博弈中,参与博弈的双方都是平等的主体,假设双方都选择主动行动,便相当于通知对方自身已经处在给对方最后的通牒,甚至可以说是相互威胁的状态。此博弈包含了两个纯策略的纳什均衡原理,即其中的一方选择主动前进,另一方则会后退;或者其中的一方选择后退,而另一方主动前进。只是在这两种决策中,我们不清楚哪一方会选择进或者退,简言之,双方的选择都是随机的,其中的所有选择背后的风险都是无法预料的。
其实,斗鸡博弈除了纯策略外,还包含混合策略均衡,即参与者的所有选择都是随机的,可能是进,也可能是退。但是,我们对于这类博弈更加关注它的纯策略均衡。任何一个博弈,若只有一个纳什均衡点,那么我们便能够轻易地预测出此博弈的结果,因为这个纳什均衡点就是已知的博弈的结果。反之,当一个博弈有多个纳什均衡点时,想要对博弈的结果做出预测,便需要我们了解其中的所有细节信息,诸如参与者究竟是哪一方选择了进,哪一方选择了退。根据这些额外的信息,我们才能对博弈结果做出判断。
猎鹿博弈
猎鹿博弈,最早出现在法国启蒙思想家卢梭的《论人类不平等的起源和基础》一书中,它又称为安全博弈、协调博弈,或者猎鹿模型。
猎鹿博弈源自一则故事,即在古代的一座村庄里,住着两个猎人。而这个村子里主要有两种猎物:鹿和兔子。假设一个猎人单独外出捕猎,只能捕到4只兔子;然而,如果两个猎人同时出动且合作就能捕到1只鹿。而站在填饱肚子的角度看,他所捕到的这4只兔子能够成为他4天的食物,但是1只鹿足以让他在10天内都不用外出捕猎。
由此一来,这两个猎人的行动策略就会产生两种博弈结局:第一种就是单独行动,不建立合作,那么每个人可以获得4只兔子;第二种是建立合作,共同外出捕鹿,则会获得1只鹿,保证两个猎人10天不用外出捕猎。因此,在这两种情况下便会出现两个纳什均衡点,即两个猎人单独行动,每个人获得4只兔子,并且每人能够吃饱4天;或者两个猎人建立合作,那么每个人可以吃饱10天。
显而易见,两个猎人建立合作获得的最终收益远远超过单独行动的利益,但是这便需要两个猎人在合作的过程中,个人的能力和付出是相等的。假设两个人中的任何一个人捕猎能力较强,那么他便会要求分得更多的利益,同时这会使另外一个猎人考虑到自身的利益,而不愿意参加合作。虽然我们都非常清楚合作双赢的目标,但是考虑到实际情况时,原因便十分明显了。若想在博弈中建立合作,便需要参与博弈的双方主动学会与对手建立良好的共赢关系,在保证自身利益的同时,也要考虑对方的利益。
简单概括一下猎鹿模型,当这两个猎人中的任何一个人有足够的信心确定对方一定会捕捉鹿时,那么最好的捕猎策略就是去捕捉鹿,在这种情形下没有任何理由去捕捉兔子。除非这个猎人没有足够的信心,不确定另一个人的做法。这就是信心博弈,但是两个猎人都会面临极大的信任危机。所以便会出现两个纳什均衡点,简单来说就是两种不同的结果,而这种结果无法用纳什均衡点进行衡量。
蜈蚣博弈
蜈蚣博弈的提出者是罗森塞尔,它指的是这样一个简单的博弈,即参与博弈的两个人,分别命名为a和b,提供给他们的策略只有建立“合作”,或者拒绝“合作”(或者称为背叛)这两种可供选择的策略。若我们令a先做出选择,然后再由b做出选择,再轮到a做出选择……由此循环往复。我们设定a与b之间的博弈次数是有限的,即100次。假设此次博弈双方的支付给定如下:
合作合作合作合作……合作合作
ababab(100,100)
合作合作合作合作……合作不合作
ababab(98,101)
那么,在此前提条件下,a与b又会做出何种决策呢?
其实,正是因为这个博弈的形状像极了蜈蚣,所以才被称为蜈蚣博弈。
通过这个策略选择图,我们能够发现蜈蚣博弈有一个极为特殊的地方:参与者a在进行决策时,他会考虑到此次决策的最后一次选择,即第100次选择;但是参与者b在进行决策时,会考虑第100次选择究竟是合作还是不合作,假设b选择合作那么他将获得100的收益,若是他选择不合作,则会带给他101的收益。
在这种情况下,即根据理性人的假定结果,b会选择不合作。但是从此次博弈的次数和顺序来看,是需要经过第99次选择,才是b进行第100次选择,若是a在第99次选择中,考虑到b有可能会选择不合作的情况,那么他的收益将会是98,而且小于b在选择合作时的收益,此时当博弈进行到第99次时,a的最优决策是选择不合作,因为这样的选择能够让他获得99的收益,要比选择合作时的收益高……
按照这种决策的选择情况进行推断,可以得出若是在进行博弈的第一步时a便选择了不合作,那么a和b所获得的最终收益都是1,这样的选择远远小于a选择合作时的收益。
酒吧博弈
酒吧博弈是在博弈论的基础上发展起来的一个博弈理论模型,简单来说这个理论模型如下。
假设有100个人都喜欢去酒吧消遣娱乐,而酒吧的座位是有限的,这就说明这100个人在周末时都会考虑究竟是去酒吧还是待在家中,假设所有的人都选择周末去酒吧,那么去酒吧的人就会感到不舒服,而这时他们会觉得待在家中要比去酒吧更好。若我们设定酒吧的座位数是60,恰好在周末的时候酒吧座无虚席,那么想要去酒吧的人便会有两种决策:一种是不去,待在家中,另外一种是去。那么,这100个喜欢去酒吧的人最终将会做何选择呢?
其实这些喜欢去酒吧的人,往往会受上一次酒吧人数的影响,进而产生一些人数上的浮动,久而久之便会形成一种持续性波动的情况。这是由切斯特·艾伦·阿瑟博士提出的,他的理论如下:
假设每个想要去酒吧的人都是理性的,那么酒吧每天接待的人数几乎不会有过大的浮动。但是每个人都不是理性的。
后来,人们在他的这种研究之上发现了“神奇的60%客满率”定理,即当人们选择去酒吧时,最初的观察结果并未找到任何规律,但是通过长时间的观察发现,每次去酒吧的人数和不去酒吧的人数之比接近60:40。尽管这些人中的任何一个人都不能归属到经常去或者不去的行列中,但是不论这些人是否去,去酒吧的人数整体的比例基本上是保持不变的。但是人并不总能保持理性,当人们在第一次去酒吧时,若发现酒吧人数非常多,那么这种现象会成为他们下次选择的一个参考,他们会认为酒吧人数太多、十分拥挤、喧闹,但是少数人可能会选择去酒吧,这时他们发现酒吧的人数并不多,然后便会在下一次叫上自己的朋友一起去酒吧,由此一来循环便正式开始了。
从心理学的角度来看,最初去酒吧的那些人可能互相不熟悉,但是由于经常去酒吧而且能够遇见对方,久而久之便会由陌生人变成朋友,那么在这种情况下,便会由零散的个体变成一个大的群体,而这个整体中又会分支出小团体,而且这些小团体中的人,有一部分会占据主导地位,另一部分人会处在服从地位。这就意味着团体中的每个人的决策都会受到他人的影响。