博在古代指的是赌博,而弈则是下棋或者围棋;棋盘中的每一步都暗藏着玄机。博弈的观点经常出现在我们的视线中,究竟何为博弈?博弈对于我们的生活又会产生怎样的影响呢?我们从通俗意义上讲,博弈可以被看成“游戏”。简单来说,博弈指的是一个组织或者个人,甚至一个团体,根据自身所掌握的信息,在一定的大环境,以及约束条件下,同时或有先后之分的,一次甚至多次,从符合规则和自身选择的行为以及策略中做出抉择,并且加以实施,最后根据自己的决策从中获得某种收益或者选择结果。
其实,博弈就是根据自己所掌握的情况,在自身所处的环境中做出最佳选择的一种谋略。博弈并非深不可测或者多么高深的一门“学问”,而是一种浅显易懂、非常容易被掌握、在生活中非常实用的一门“艺术”。
何为博弈——博弈的分类与基础构成
对于博弈的分类,有一种表述方式是这样的:在宣布博弈结束时,所有参与博弈的局中人所获得报酬的总和是否永远为零?若总和为零,那么就相当于支付只在局中人之间进行,并不产生其他事物的生产与消耗,即我们所接触到的一切具有娱乐性质的游戏。这种博弈称为零和博弈,反之则称非零和博弈。
首先,如果我们可以建立一套针对零和博弈的理论,那么就可以借助这一理论帮助我们处理其他一切博弈。我们将会在零和二人博弈的基础上应对局中人增多的零和n人博弈,零和n+1人博弈。
在零和二人的博弈中,应该注意的根本问题是:博弈中的每个局中人是怎么策划其活动的?在博弈的各个阶段,他们又有什么情报信息呢?若其中一个参与者了解到另一个参与者的策略,会对整个博弈产生什么样的影响呢?若了解了全部关于博弈论的理论知识,又能起到什么样的作用呢?
我们首先要做的就是在概念上对博弈进行定义。
关于博弈的概念,有很多是比较基本的,但博弈是一个具有组合性质的概念,在日常语言描述中,它的用法经常模棱两可。对于博弈的解释,有时表示一种含义,有时又另有所指,甚至会让人认为对博弈的解释就是它的近义词,基于此,我们将会给出专业的术语:
首先,博弈是一个十分抽象的概念,它与某些博弈比赛有着一定的差别。我们必须将博弈的抽象概念与博弈中的赛局进行区分和分辨。前者指的是,那些能够描写博弈这个抽象概念的规则全体,是博弈从开始到结束,按照特定的方式进行,整个进行的过程称为一场博弈。在日常生活中,我们通常会将“一场”称为一个竞赛,诸如,国际象棋、扑克、体育运动等。
其次,“着”(读作zhao)是博弈的构成元素,我们也应该知道其界定。“着”指的是,在赛局的所有可能选择中做出抉择的权利,此项权利可以交给赛局中的某一个人执行,或者采用随机的方式进行,而这些方式在博弈的具体细则中都有非常明确的规定。因此,“着”不仅代表了博弈中的“决定权”,还是博弈的组成元素。在每一个具体的赛局中,所有的抉择都是由一种特定的走法决定的。所以,“着”对于选择而言就相当于局对于博弈。简言之,一系列的“着”共同组成了博弈,一系列的选择构成了整个局。
最后,要明确博弈的规则与整个赛局中的人的选择、策略并不相同。在赛局中,每个人都可以随意做出自己的选择,我们将这种选择的任意性称为支配个人选择的一般原则。由于每个人的策略在本质上有着好坏之分,是否采用他们的决策则是每个赛局中的参与者的自由,但是这些都是在博弈的规则下进行的,而博弈的规则是不允许被打破的。假设博弈规则遭到破坏,那么整个事件将不再使用最初的规则进行描述了。事实上,在大多数情况中,甚至是在物质基础上,规则都是不会被破坏的。
简单说,国际象棋比赛的规则要求所有棋手都不能使用自身的王棋进行“将军”,这就如同禁止“卒”棋横走一样,这些铁定的规则是不容许违反和破坏的。但是,若是棋手把自己的“将”棋放到了下一步对手就能把他“将”死的位置上,那么这是一种不聪明的下棋方法,自然就不属于国际象棋比赛的规则。
假设在一场博弈t中,有n个局中人,为了方便我们了解博弈的基本组成要素,我们将这n个局中人分别标记为1,……,n。根据我们前面的讲述,这个赛局是由一系列的“着”所组成的;假设在赛局进行之前我们便将所有的数目和它们的顺序全部设定完了,在进行的过程中,我们便会发现这些设定好的东西并不重要,想要把它们取消是一件非常简单的事情。此时,在整个博弈局中,我们用字母v表示“着”中特定的数量,而这个v是一个正整数,它表示1,2,……,我们用m1,……,m(v)表示博弈中的“着”,同时假设这便是它们在规定中出现的顺序。
在此次博弈中,每一个“着”m(k),k=1,……,v,它们代表了无数种可能出现的走法,这些不同的选择构成了“着”。此时,我们用a(k)表示赛局中可能出现的不同的走法的数量,用w(1),……,w(k)(ak)表示博弈中所有走法的自身。
在赛局中,可以将“着”分为两种。假设在局中人中指定任意一人做出选择,那么将会依赖他的自由选择权,其中不掺杂任何其他的因素,这种选择被称为“着”中的“第一类的着”,亦或者“局中人的着”。假设在赛局中所做出的选择是建立在某种机械规则上的,那么便会依据一个确切的概率来决定它最终的结果,这种选择方式被称为“第二类的着”,抑或者“机会的着”。因此,对于前者而言,需要指定任意一个局中人的选择来确定“着”的结果,即应该明确指出这个“着”是哪个局中人的意志选择的。若我们用k(k)来标记这个局中人,即他的序列号码,由此一来,k(k)=1,……,n。
对于第二种“机会的着”,我们提前设定好,令k(k)=0。在此种情形下,便会出现不同的走法,即w(k),……,w(k)(ak),那么前提条件是它们的概率必须是已知的,我们用p(k)1,……,p(k)(ak)来表示这些已知的概率。
因此,在任意一个“着”m(k)中的选择,都是从w(1),……,w(k)(ak)中所得到的。即,随机挑选出一个数1,……,a(k)。假设我们用θ(k)表示随即挑选出来的某个数,那么我们能够非常清晰地看出,这个数便是从θ(k)=1,……,a(k)中选择出来的。在此基础上,我们能够将所有的“着”所对应的不同选择表示出来,即m1,……,m(v),那么整个赛局便能清晰地表示出来。简单说,这个赛局便能够用一个直观的数列表示出来,即θ1,……,θ(v)。
事实上,整个博弈t中的所有规则必须提前明确,若一个赛局是由一个已知数列θ1,……,θ(v)表示,那么,任何一个局中人k=1,……,n,在此赛局中的结果是什么,这就说明,在整个赛局结束时,参与博弈的每个人将会获得怎样的报酬。假设我们用f(k)表示每个局中人应得的报酬,当k获得一笔报酬,那么f(k)>0;假设他在对局中付出了一笔报酬,那么f(k)<0;若以上两种情况都不符合,则f(k)=0。因此,对于每个f(k)都应该是由函数θ1,……,θ(v)所得出的,即:
f(k)=f(k)(θ1,……,θ(v)),k=1,……,n。
此时,必须强调博弈t的规则仅表示了f(k)=f(k)(θ1,……,θ(v))是一个函数,这就意味着每一个f(k)所对应的变量θ1,……,θ(v)是一种抽象的依从关系,而且其中的任意一个θ(k)是一个变量,它的取值范围是1,……,a(k)·θ(k)的特定数值。简言之,它是从数列θ1,……,θ(v)中选择的,并不属于博弈t里。正如我们前面所讲到的,这便是对一个局的定义。
博弈的解——混合策略
假设博弈中的每一个局中人在博弈开始前就已经设想了可能发生的一切情形,并做出了相应的应对决策,也就是说局中人事先已经对博弈有了一套完整的计划,只要局中人对于每一种可能发生的情况,以及在那个时刻他所掌握的每一条情报信息的判断,与博弈规则提供给局中人的情报形式相一致,这个计划将明确他会采取什么样的选择。这时,我们把这种计划称为一个策略。
相信不少人都玩过井字棋游戏,假设在游戏中自己先行,只要自己的方法是正确的,那么对手将无法击败自己。相反地,假设对方采用了正确的方法先行,那么自己将无法赢得对手。对于这种类型的博弈来说,它们最终的胜负结果都是随机的。
假设在某个博弈中,参与者轮流将硬币往桌上放,直到参与博弈的一方放不下硬币时,就意味着这个参与者在博弈中失败了。若在这个博弈中,自己作为先行的一方,那么便会采用完美的策略保证自己最终获胜。最简单、常用的策略是先行的一方将硬币放在圆桌的正中心,由此一来,不论对手将硬币放在何种位置,先行的一方都能够将硬币放在恰好对称的位置,这能够保证先行的一方永远不会输,而且输掉博弈的人只能是对手。
象棋实际上也和上述的博弈一样简单,假设参与博弈的两个人都拥有非常良好的计算能力,那么博弈的结果无外乎:双方打成平手、先行者必然获胜、后行者必然获胜。虽然我们并不知道最终的博弈结果是哪一种,但是我们通过博弈的逆向推理,博弈论很好地证明了象棋必定具有这种简单属性。
假设我们将象棋看成简单的博弈,那么猜硬币则不属于此类博弈,若是参与猜硬币的双方想要保持一致,那么当其中的一方选择正面时,另外一方也需要选择正面,但是假设先行者选择了正面,同时对手知道了先行者的选择,对手为了战胜先行者,便会选择反面。这时先行者又会选择反面,那么对手知道后,便会选择正面。由此看来,这是一个无限循环。
通过这类博弈,我们能够清楚地认识到,如果你不想让对手知道自己的“秘密”,那么自己也不要知道。或许你可以采用投掷硬币的方式,并且用正反面决定自己所要采取的行动,在这种随机的决定下,即使你的对手十分理性,同时知道了你的政策,最后他能获胜的几率也仅仅是一半罢了。
我们经常玩的游戏“石头、剪刀、布”,还有“配铜钱”等,都属于零和二人博弈的问题。但是这些博弈问题中,往往包含参与者自身的经验和生活常识等影响因素。
比如,有些人玩过的“配铜钱”游戏,无非是出“正面”或者“反面”两种博弈的策略选择方式,重中之重是参与博弈的人需要猜测对方的策略,这种方式似乎非常困难,而且不具有规律性。由于这个游戏的博弈规则十分明确地规定了,当其中的一个参与者做出自己的决策时,另外一名参与者禁止得到对方做出的选择的任何信息。但是这种说法仅考虑到理论层面,实际生活中进行类似的游戏时并非如此。
假设,两个局中人进行一次“配铜钱”游戏,其中的一个参与者在此次赛局中不会刻意去揣测对方的意图,而另外一位局中人是智力中上等的参与者。那么,这个局中人在博弈中要做的就是,尽量避免让对方猜到自己的对策。因此,他会在连续的局中毫无规律地出“正面”或者“反面”。
实际上,我们需要了解的是参与博弈的人在同一单独局里的对局策略,那么我们便需要针对一局进行研究和讨论,而不是讨论局中人在一连串的局中的策略。假设我们不用局中人是否出“正面”或者“反面”,而是规定出“正面”的概率为1/2,出“反面”的概率也是1/2。为了保证博弈的有理性,我们规定博弈的局中人可以在他们选择行动前,采用随机的方法,来选择自己究竟是出“正面”还是“反面”,这样就能够保证他们的利益不受到损失。这种前提规定的优点是,不论对方选择出哪一面,前面的局中人对博弈赛局的期望值永远是0。这种方式的特别之处在于,若是其中的一方十分确定对方要出“正面”或者“反面”,那么他对整个赛局的数学期望都将是0。此时,若是对手也选择了和局中人同样的做法,那么结果自然是一样的。
假设我们提前设定,“配铜钱”博弈中的一个局中人能够自主选择他认为的所有可能获胜的策略进行整合,在这种情况下,能够保证他自身的利益不受损。由此一来,采用这种决策方式,不论对手做何选择,他都不会有利益损失。相同地,假设对方也使用这种策略,便能让前面博弈对局中的人不论怎样也赢不了。
“石头、剪刀、布”中的博弈亦是同样的道理,因为每一局的玩法都会出现3种可能,与上面所提到的“配铜钱”游戏相似,选择所有可能的“混合”方式,便能获得最好的博弈策略。
除了“配铜钱”中的博弈外,我们还可以针对生活甚至文学里的内容研究博弈,就像下面这个福尔摩斯探案集中的故事:
为了躲避一直在追踪他的莫里亚蒂教授,夏洛克·福尔摩斯迫切想要离开伦敦,然后前往多维尔港,再从那里前往欧洲。然而一切并非他想象中的那样,当他乘上火车,列车将要出发时,一个他最不想看见的面孔出现在站台上,他看见莫里亚蒂教授正在站台上望着他。