博文

博弈定律11-海盗分金

有五个海盗(记为1、2、3、4、5号)掠得一百枚金币,决定以抽签的方式依次提出分金方案,并由五人共同表决。要想通过方案,必须有超半数的人同意才可以,否则这个人将会被扔进大海。这其实是一个博弈的过程,在分金的过程中,要想不被扔入大海,必须充分考虑其他人的利益,从而以最小的代价获取最大的收益。假设五个海盗都聪明绝顶并有足够理智的判断力,那么该如何进行博弈过程呢? 与其从前往后一个一个地想每个人会怎样选择,不如先把问题简单化,若只剩下最后两人的话,他们会怎么做呢?倒推来看,若1、2、3号都被投入海中,那么5号必定反对4号把一百枚金币全部收入囊中。因此往前推理,4号只有同意3号的方案才有可能保命。 3号猜到这一点,就会采取(100、0、0)的分金方案,因为他清楚地知道即便4号一枚金币也分不到,也仍然会同意他的方案。 2号猜到3号的策略,就会采取(98、0、1、1)的方案,因为2号只要稍微照顾到4、5号的利益,4、5号就会向他投赞成票,而不希望2号出局让3号分配。因此2号最终会获得98枚金币。 1号同样猜到2号的意图,就会采取(97、0、1、2、0)或者(97、0、1、0、2)的方案。对于1号来说,只要放弃2号,再分给3号一枚金币,给4号或5号两枚金币,这样他就可以得到三票,顺利通过方案拿到97枚金币。 当然,以上的分析是建立在一个理想状态上的,即海盗都很聪明并且可以理智分析。而在现实生活中,情况就和模型相去甚远了。 首先,假设3号、4号或者5号有一人没能猜到其他海盗的方案,那么1号被投入海中的概率则大得多了。或者只要1号提出方案,2号就许诺分配给其他人的金币比1号多一枚,这样一来,2号就成了最大赢家。 这是在规则确定的情况下,但只要剩下的四人确定一个分配的新规则,将把握先机的1号先干掉,而后平分一百枚金币,所得的利益会较之前更多。因此,在现实生活中,规则意识的重要性就显得尤为突出了。 如果我们扩大参加博弈的局中人数,同样是一百枚金币,由十个人来分配(记为1、2、3,……,10号),有50%以上的同意票才可通过方案,否则将被投入海中。 推理过程同上,倒推如果只剩下9号和10号,那么无论两人提出什么样的方案,按照规则都将被通过。现在把8号考虑进来,8号知道最后剩下两人的结果,那他会选择让步,只要拿出一枚金币来团结10号,他的方案就会通过,因为8号知道,只剩9号和10号时,10号

博弈定律10-警察与小偷博弈

在某个小镇上只有一名警察,整个小镇的治安全部由他负责。此时,我们假设这个小镇上的一头有一家银行,而小镇的另一头有一个酒馆;若这个小镇上只有一名小偷,那么由于他不具备分身术,所以当这个小镇上的警察在小镇的一头巡视时,小偷只能去小镇的另一头采取他的偷盗行动。 假想一下,当小镇的警察正好在小偷采取行动的地方巡视,便能不费吹灰之力地抓住小偷;若是小镇的警察的巡视方向恰好与小偷采取偷盗行为的方向相反,那么小偷便能在不被警察抓到的情况下成功偷盗。 此时,我们设定此小镇上的银行中需要保护财产的金额为2万元,而小镇的酒馆中需要保护的金额只有1万元。那么,警察应该如何采取巡视行动,才能将小镇的损失降低到最小呢? 警察最好的做法是利用抽签的方式决定去小镇的银行还是酒店。由于小镇银行中所需保护的财产是酒馆的两倍,因此用1、2号两个签表示小镇的银行,用3号签表示酒馆,这样一来,警察去银行巡视的机会将达到2/3,而去酒馆巡视的机会将是1/3。 在小镇警察的此种策略下,小偷的占优策略则要与警察相反,同样采用抽签的方式,与警察不同的是小偷用1、2号签表示去酒馆行动,而用3号签表示去银行,由此一来,小偷去酒馆行动的概率是2/3,而去银行的概率仅有1/3。 在此前提下,即警察和小偷都是选择最佳占优策略时,我们将会获得一个十分有趣的结果,即警察和小偷成功的概率是相等的。(此处略去计算过程) 事实上,警察与小偷的博弈需要有双方一种混合型的策略和思路。简单来说,警察和小偷博弈与我们生活中经常玩的“剪刀、石头、布”游戏更加相似。在这种游戏中,并不存在纳什均衡,因为参与此游戏的每个人出“剪刀”“石头”“布”的情况都是随机的,而且游戏的参与者不会让对方推断出自己的策略,甚至自己在此游戏中的策略倾向性。因为,当对方了解到自己的策略倾向时,自己便会面临极大的输掉游戏的风险。 其实,透过警察与小偷博弈中的混合策略均衡,可以看出博弈中的每个参与者并不会太过在意自己所做出的决策。实际上,当我们需要采取混合策略时,便要找到自己所要做出的策略方法,并且要让对手觉得你所做出的策略不会影响到他们。 这种方式似乎非常混沌,但它是前面所讲到的零和博弈的另一种随机转换。因为它要求参与者必须时刻保持警惕,稍微发现对方有违反规则的行动,便需要立刻采取决策并实施行动。若是对方的确做出了某种较为糟糕的行动,那便说明他们选择了最“愚蠢”的策略。

博弈定律9-枪手博弈

枪手博弈 是指,枪手甲乙丙三人相互怨恨,以决斗的形式进行一场博弈。 其中,甲的枪法最准,十发八中(命中率80%)。乙的枪法在甲之下,屈居第二,也能有十发六中的成绩(命中率60%)。丙的枪法最差,只能十发四中(命中率40%)。假设在三人都了解彼此实力并能理性判断的情况下,会出现以下两种情况:一,三人同时开枪,谁活下来的可能最大? 二,若由丙开第一枪,随后轮流开枪,他会如何选择? 第一种情况: 第一轮: 甲:最佳的策略是先对准乙,因为乙的枪法比丙好。 乙:最佳的策略是先对准甲,因为三人中甲的枪法最准,这样,在乙丙两人中,乙活下来的概率更大。 丙:同样也会先解决枪法最准的甲,干掉甲后再考虑如何应对乙。 现在我们可以分别计算三人活下来的概率。 甲活:即乙和丙都未命中。乙的命中率为60%,那么未命中概率就为40%,丙的未命中率为60%。因此两人都射偏的概率为:40%×60%,所以甲活下来的概率为24%。 乙活:即甲射偏。甲有20%的未命中率,就相当于乙的存活率为20%。 丙活:根据上面的分析,在这一种情况下,没有任何人对准丙,因此丙最有可能活下来,他的存活概率为100%。 由此我们可以看到,在这一轮的决斗中,丙枪法最差但活下来的概率却最大。而甲和乙的枪法都远大于丙,存活率却都比丙低。当然,导致这种结果的前提条件是三人都了解彼此的实力。但我们都清楚,在现实生活中,这样理想的前提条件很难满足,难免会因为信息不对等而产生其他的结果。若甲选择隐藏自己的实力,营造一个枪法最差的假象,那么此时甲的存活概率就会大大提升。 第二轮: 第一轮过后,若甲乙中有一方打偏,那么丙既有可能面对甲也有可能面对乙,若都打偏,那丙将同时面对甲乙两人,或者甲乙皆死。 如果丙只面对甲或乙,那丙的存活率最低。 如果同时面对甲乙两人,则返回第一轮的场景。 如果甲乙皆死,那么无疑丙最终存活。 第二种情况: 由丙先开第一枪,那么可能如下: 丙射中甲:乙与丙对决,且只能由乙先开枪,丙会处于不利位置。 丙射中乙:同上,甲的命中率最高,丙的处境会更糟。 丙都未射中的话:甲乙都不会选择先射击丙,而是会在甲乙双方之间一决胜负,直至其中一人死亡,而这时就会又轮到丙。可以这样说,只要丙谁都不打中,在接下来的对决中他就处于相对而言最有利的位置。

博弈定律8-酒吧博弈

酒吧博弈 是在博弈论的基础上发展起来的一个博弈理论模型,简单来说这个理论模型如下。 假设有100个人都喜欢去酒吧消遣娱乐,而酒吧的座位是有限的,这就说明这100个人在周末时都会考虑究竟是去酒吧还是待在家中,假设所有的人都选择周末去酒吧,那么去酒吧的人就会感到不舒服,而这时他们会觉得待在家中要比去酒吧更好。若我们设定酒吧的座位数是60,恰好在周末的时候酒吧座无虚席,那么想要去酒吧的人便会有两种决策:一种是不去,待在家中,另外一种是去。那么,这100个喜欢去酒吧的人最终将会做何选择呢? 其实这些喜欢去酒吧的人,往往会受上一次酒吧人数的影响,进而产生一些人数上的浮动,久而久之便会形成一种持续性波动的情况。这是由切斯特·艾伦·阿瑟博士提出的,他的理论如下: 假设每个想要去酒吧的人都是理性的,那么酒吧每天接待的人数几乎不会有过大的浮动。但是每个人都不是理性的。 后来,人们在他的这种研究之上发现了“神奇的60%客满率”定理,即当人们选择去酒吧时,最初的观察结果并未找到任何规律,但是通过长时间的观察发现,每次去酒吧的人数和不去酒吧的人数之比接近60:40。尽管这些人中的任何一个人都不能归属到经常去或者不去的行列中,但是不论这些人是否去,去酒吧的人数整体的比例基本上是保持不变的。但是人并不总能保持理性,当人们在第一次去酒吧时,若发现酒吧人数非常多,那么这种现象会成为他们下次选择的一个参考,他们会认为酒吧人数太多、十分拥挤、喧闹,但是少数人可能会选择去酒吧,这时他们发现酒吧的人数并不多,然后便会在下一次叫上自己的朋友一起去酒吧,由此一来循环便正式开始了。 从心理学的角度来看,最初去酒吧的那些人可能互相不熟悉,但是由于经常去酒吧而且能够遇见对方,久而久之便会由陌生人变成朋友,那么在这种情况下,便会由零散的个体变成一个大的群体,而这个整体中又会分支出小团体,而且这些小团体中的人,有一部分会占据主导地位,另一部分人会处在服从地位。这就意味着团体中的每个人的决策都会受到他人的影响。

博弈定律7-蜈蚣博弈

蜈蚣博弈 的提出者是罗森塞尔,它指的是这样一个简单的博弈,即参与博弈的两个人,分别命名为A和B,提供给他们的策略只有建立“合作”,或者拒绝“合作”(或者称为背叛)这两种可供选择的策略。若我们令A先做出选择,然后再由B做出选择,再轮到A做出选择……由此循环往复。我们设定A与B之间的博弈次数是有限的,即100次。假设此次博弈双方的支付给定如下: 合作合作合作合作……合作合作 ABABAB(100,100) 合作合作合作合作……合作不合作 ABABAB(98,101) 那么,在此前提条件下,A与B又会做出何种决策呢? 其实,正是因为这个博弈的形状像极了蜈蚣,所以才被称为蜈蚣博弈。 通过这个策略选择图,我们能够发现蜈蚣博弈有一个极为特殊的地方:参与者A在进行决策时,他会考虑到此次决策的最后一次选择,即第100次选择;但是参与者B在进行决策时,会考虑第100次选择究竟是合作还是不合作,假设B选择合作那么他将获得100的收益,若是他选择不合作,则会带给他101的收益。 在这种情况下,即根据理性人的假定结果,B会选择不合作。但是从此次博弈的次数和顺序来看,是需要经过第99次选择,才是B进行第100次选择,若是A在第99次选择中,考虑到B有可能会选择不合作的情况,那么他的收益将会是98,而且小于B在选择合作时的收益,此时当博弈进行到第99次时,A的最优决策是选择不合作,因为这样的选择能够让他获得99的收益,要比选择合作时的收益高…… 按照这种决策的选择情况进行推断,可以得出若是在进行博弈的第一步时A便选择了不合作,那么A和B所获得的最终收益都是1,这样的选择远远小于A选择合作时的收益。

博弈定律6-猎鹿博弈

猎鹿博弈,最早出现在法国启蒙思想家卢梭的《论人类不平等的起源和基础》一书中,它又称为安全博弈、协调博弈,或者猎鹿模型。 猎鹿博弈源自一则故事,即在古代的一座村庄里,住着两个猎人。而这个村子里主要有两种猎物:鹿和兔子。假设一个猎人单独外出捕猎,只能捕到4只兔子;然而,如果两个猎人同时出动且合作就能捕到1只鹿。而站在填饱肚子的角度看,他所捕到的这4只兔子能够成为他4天的食物,但是1只鹿足以让他在10天内都不用外出捕猎。 由此一来,这两个猎人的行动策略就会产生两种博弈结局:第一种就是单独行动,不建立合作,那么每个人可以获得4只兔子;第二种是建立合作,共同外出捕鹿,则会获得1只鹿,保证两个猎人10天不用外出捕猎。因此,在这两种情况下便会出现两个纳什均衡点,即两个猎人单独行动,每个人获得4只兔子,并且每人能够吃饱4天;或者两个猎人建立合作,那么每个人可以吃饱10天。 显而易见,两个猎人建立合作获得的最终收益远远超过单独行动的利益,但是这便需要两个猎人在合作的过程中,个人的能力和付出是相等的。假设两个人中的任何一个人捕猎能力较强,那么他便会要求分得更多的利益,同时这会使另外一个猎人考虑到自身的利益,而不愿意参加合作。虽然我们都非常清楚合作双赢的目标,但是考虑到实际情况时,原因便十分明显了。若想在博弈中建立合作,便需要参与博弈的双方主动学会与对手建立良好的共赢关系,在保证自身利益的同时,也要考虑对方的利益。 简单概括一下猎鹿模型,当这两个猎人中的任何一个人有足够的信心确定对方一定会捕捉鹿时,那么最好的捕猎策略就是去捕捉鹿,在这种情形下没有任何理由去捕捉兔子。除非这个猎人没有足够的信心,不确定另一个人的做法。这就是信心博弈,但是两个猎人都会面临极大的信任危机。所以便会出现两个纳什均衡点,简单来说就是两种不同的结果,而这种结果无法用纳什均衡点进行衡量。 博弈定律1

博弈定律5-懦夫博弈

斗鸡博弈(ChickenGame)这个名词其实是一种翻译失误的产物,在美国口语中Chicken的释义代表了“懦夫”,因此,它应该是“ 懦夫博弈 ”,但是这种音译的失误并不影响我们对它的理解。 假设我们设定一个情景,即两个人狭路相逢。若是其中的一人想要主动行动,攻击对方,而另外一方则选择后退让路,在这种情况下,选择主动行动的一方便会获得胜利,即获得最大的收益。若是双方都选择退让,那么可以称为平局;若是自己一直主动出击,但是对方选择了退让,那么最后的获胜者就是自己,对方则成为失败的一方。还有一种情况就是,双方都选择前进,结果便是两败俱伤。相较这些不同的选择来看,最好的结果便是双方都选择退让,既不会两败俱伤,又不会让其中的某一方丢了颜面。 事实上,在这个博弈中,参与博弈的双方都是平等的主体,假设双方都选择主动行动,便相当于通知对方自身已经处在给对方最后的通牒,甚至可以说是相互威胁的状态。此博弈包含了两个纯策略的纳什均衡原理,即其中的一方选择主动前进,另一方则会后退;或者其中的一方选择后退,而另一方主动前进。只是在这两种决策中,我们不清楚哪一方会选择进或者退,简言之,双方的选择都是随机的,其中的所有选择背后的风险都是无法预料的。 其实,斗鸡博弈除了纯策略外,还包含混合策略均衡,即参与者的所有选择都是随机的,可能是进,也可能是退。但是,我们对于这类博弈更加关注它的纯策略均衡。任何一个博弈,若只有一个纳什均衡点,那么我们便能够轻易地预测出此博弈的结果,因为这个纳什均衡点就是已知的博弈的结果。反之,当一个博弈有多个纳什均衡点时,想要对博弈的结果做出预测,便需要我们了解其中的所有细节信息,诸如参与者究竟是哪一方选择了进,哪一方选择了退。根据这些额外的信息,我们才能对博弈结果做出判断。