博弈论案例
故事讲述了两个犯罪嫌疑人作案后被警察抓住,分别关押在不同的房间进行审讯。警察知道那两个人有罪,但他们缺乏足够的证据。警察告诉大家:如果两人都否认,各判一年;如果两人都坦白,各判八年;如果两个人有一个坦白,一个否认,坦白释放,否认判十年。所以,每个犯人都面临着两个选择:认罪或者否认。但不管搭档怎么选择,每个犯人最好的选择都是坦白:如果搭档否认,自己坦白,就释放,不坦白就判一年,坦白总比不坦白好;如果伴侣坦白,自己坦白,判八年,不坦白,判十年。坦白总比不坦白好。结果两名嫌疑人都选择了坦白,被判处有期徒刑八年。如果两人都否认,各判一年,显然是个不错的结果。但这种帕累托改进是做不到的,因为它不能满足人类的理性要求。囚徒困境反映的深刻问题是,人类的个体理性有时会导致集体的非理性——聪明的人类会被自己的聪明所困。
第二,旅行者的困境
两个旅行者从一个以生产精美瓷器花瓶而闻名的地方旅行回来。他们都买了花瓶。当他们取行李时,发现花瓶被打碎了,于是他们向航空公司索赔。航空公司知道花瓶的价格在80-90元左右浮动,但不知道两位乘客购买时的确切价格。于是,航空公司要求两名乘客写下花瓶的价格,100元以内。如果两个人写的一样,航空公司会认为他们说的是实话,按照他们写的金额赔偿;如果两个人写的不一样,航空公司会认定写的差的乘客说的是实话,原则上按这个低价赔偿。同时,航空公司将对说真话的奖励2元,说假话的罚款2元。
为了得到最大的赔偿,双方的最佳策略是写100元,这样双方都能得到100元。但是没有,A很聪明。他想:如果我写1元变成99元,B写100元,那么我就得到101元。为什么不呢?所以他准备写99元左右。但是B更聪明。他估摸着A要密谋他写99元,所以他要写98元。没想到,A更聪明。估计B会写98元骗他,所以他准备写97元...众所周知,下棋的时候,不是说要多“看”几步吗?“看”得越远,赢的几率就越大。再看两步,我比你强,再看三步,你看四步,我比你老练,再看五步。在花瓶索赔这件事上,如果两个人都是“完全理性”的,都能看透十几步甚至几十步,那么上面那场“聪明竞赛”的结果,最终会落到大家都只写一两元的地步。其实在完全理性的假设下,这个博弈唯一的纳什均衡就是两人都写0。
第三,竞争也是劫持。
费城西区有两家对立的商店——纽约廉价商店和美国廉价商店。他们紧挨着彼此。这两家店的老板是死敌。他们一直在进行无休止的价格战。即使是鹰眼贝蒂·瑞普女士也找不到任何缺陷。不信你问她。而且这种床单的价格低得离谱,只有6美元50美分。“当这样的手写通知出现在一家商店的橱窗里时,每个顾客都会习惯于等待另一家廉价商店的回复。果不其然,大约两个小时后,另一家商店的橱窗里出现了这张通知:“瑞皮女士需要一副近视眼镜,我的床单质量一流。只有5美元95美分”。价格战的日子就这样开始了。两家店的老板除了张贴告示,还经常站在店外对着对方大喊大叫,经常导致拳脚相加。最后一方老板在这场价格战中不打了,价格不再下跌。说那个人疯了,说明对方赢了。这个时候,每一个围观的,路过的,附近的,都会涌向中奖的便宜货店。抢购所有的床单和其他物品。在这一带,两家店的争吵最激烈,时间也最长,所以口碑很好。住在附近的每个人都从他们的奋斗中受益匪浅,买了各种“精致”的商品。突然有一天,一家商店的老板去世了。几天后,另一家店的老板声称要去外地做货,两家店都倒闭了。两家店都有了自己的新老板。他们各自对两家店的前老板的财产做了详细的调查。有一天,他们在检查的时候,发现两家店之间有一条秘密通道,在两家店楼上两位老板住的套房里发现了一扇连接两家的门。新老板很奇怪,后来他们才知道这两个死敌其实是兄弟。所有的咒骂,谩骂,威胁,人身攻击都是上演的,每一次价格战都是假的。不管谁赢,他最后都是用自己的把对方库存的商品全部卖给客户。多么精彩的骗局。
第四,酒吧游戏问题(bar problem)
酒吧博弈的问题是由美国人W.B. Arthur在1994期《美国经济评论》上发表的一篇题为《归纳论证与有限理性》的问题中提出的,随后他在1999期《科学》杂志上发表的一篇文章《复杂性与经济学》中对博弈进行了阐述。游戏是一群人,比如n = 100,决定每个周末是去酒吧还是呆在家里。酒吧的容量有限,假设60人。如果有人预测会有60多人去酒吧,他会决定去不去吗?.....每个参与者或决策者面对的只是之前去过酒吧的人数,只能根据之前的人数信息总结策略。这是一个典型的动态博弈问题。.....通过计算机模型实验,亚瑟得到了一个有趣的结果:不同的演员根据自己的感应行动,去酒吧的人数没有固定的规律。然而,一段时间后,去酒吧的平均人数总是倾向于60人。亚瑟说,预报员把自己组织成一个去或不去的人的平衡系统,或者形成一个生态稳定系统。.....这是酒吧的问题。
酒吧问题反映了这样一种社会现象。就像亚瑟教授说的,在很多行动中,我们要猜测别人的行动。然而,我们没有关于其他人的更多信息。我们只能通过分析过去的历史来预测未来。
五、枪手游戏
今天,我讲一个关于博弈论的经典故事。
三个互相仇视的枪手A、B、C准备打起来。a枪法最好,十发八中;第二枪法,十分之六;c是最差的神枪手,十中四。
先问第一个问题:如果三个人同时开枪,而每个人只开了一枪;第一轮枪战后谁的生还几率更大?
一般认为A是神枪手,生还几率较大。但合乎逻辑的结论是,C这个最差的神枪手活下来的机会最大。
我们来分析一下每个枪手的策略。
枪手A必须先射击射手B。因为B对A的威胁大于C对A的威胁,所以A应该先杀B,这是A的最佳策略..
同理,射手B的最佳策略是第一枪瞄准装甲。一旦B干掉A,B和C就会摊牌,B赢的概率自然大很多。
射手C的最佳策略是先射A。毕竟B的枪法比A差。C先杀A再对抗b,C的生存概率还是比较高的。
我们来计算一下上述情况下三个枪手的生存概率:
答:24% (40% X 60% = 24%)
B: 20% (100%-80% = 20%)。
C: 100%(没人拍C)
通过概率分析,我们发现,神枪手最差的C,生存几率最大,而神枪手比C好的A和B,生存几率要低很多。
但上面的例子隐含了一个假设,即甲、乙、丙三方都清楚自己对手的投篮命中率。但在现实生活中,因为信息不对称,比如枪手A伪装,枪手B和枪手C认为枪手A是最差的神枪手。在这种情况下,最终的幸存者一定是a,所以,无论是历史还是现实,那些奸诈有城府的男人,往往都能成为最后的赢家。这个例子对你的职业生活或者官场生涯有启发吗?
我们继续假设甲、乙、丙三方互不知道对方的枪法水平。在这种情况下,A被B射中,A被C射中,A被B射中,A不被B射中的概率分别为25%,根据贝叶斯定理计算A的存活率:
甲活率:365,438+0%([被B照射:25% x 40% = 65,438+00%]+[被C照射:25% x 60% = 65,438+05%]+[被B-C照射:25% X 40% X 60% = 6%]。
乙的活率:23%([甲出手:25% X 20% = 5%]+[丙出手:25% X 60% = 15%]+[甲出手:25%X20%X60% = 3%])。
C的存活率:17%([被A射中:25% X 20% = 5%]+[被B射中:25% X 40% = 10%]+[被A和B射中:25% X 20% X 40% = 2%])。
在枪手不知道对方命中率信息的情况下,命中率最高的枪手A生存几率最大,射击最差的枪手C生存几率最小。
我们再回到甲、乙、丙都知道对方命中率的情况下,分析第二轮枪战。
第一轮枪战后,C可能同时面对A,B,甚至A和B,除非两人都在第一轮死亡。虽然很有可能第一回合后C会赢(也就是A和B都会死),但是第二回合开始C肯定处于劣势,因为A和B的命中率都比C高。
这是枪手C. C的悲哀,无能的他虽然能暂时赢得第一轮枪战,但也能玩点花样。但是,如果甲乙双方在第一轮枪战中没有死亡,第二轮枪战之后,丙方生存的几率会低于甲乙双方..
第二轮枪战的生存概率大致计算如下:
(1)假设A和C战斗:A的存活率是60%,C的存活率是20%。
(2)假设B的存活率为60%,C的存活率为40%。
这似乎说明,能力差的人在竞争中耍花招能赢一时,但最后往往不能成功。现在我们用严格概率法计算两轮枪战后甲、乙、丙三方的生存概率。
(1)第一轮:
甲射乙,乙射甲,丙射甲..
A的存活率是24%(40% X 60%),B是20%(100%-80%),C是100%(没人拍C)。
(2)第二轮:
情况1: A活,B死(24% X 80% = 19.2%)
A射C,C射A——A的存活率是60%,C的存活率是20%。
案例二:活甲死亡(20% X 76% = 15.2%)。
B拍C,C拍B——B的活率是60%,C的活率是40%。
情况三:甲乙双方都活着(24% X 20% = 4.8%)
重复第一轮。
情况四:甲乙双方均死亡(76% X 80% = 60.8%)
枪战结束了。
指甲成活率为12.672%。
(19.2% X 60%)+(4.8% X 24%)= 12.672%
B的存活率为10.08%。
(15.2% X 60%)+(4.8% X 20%)= 10.08%
C的存活率为75.52%。
(19.2% X 20%)+(15.2% X 40%)+(4.8% X 100%)+(60.8% X 100%)= 75.52%
通过两轮枪战的详细概率计算,我们仍然发现,神枪手最差的C生还几率最大,而神枪手较好的A和B生还几率仍然远低于C。
对于这样的例子,有人会感叹“英雄创造历史,平庸孕育孩子。”
我们现在改变一下游戏规则,假设甲、乙、丙不同时射击,而是轮流射击。在这个例子中,我们发现C的机会大于他的实力。c不会被第一枪打死,下一轮可能有很大机会先开枪。
假设射击的顺序是A、B、C,A一枪打死B后(80%几率),轮到C射击,C有40%几率一枪打死A。即使B躲过了A的第一枪,轮到B开枪,B还是会瞄准枪法最好的A。就算B用这一枪干掉了A,下一轮还是轮到C出手。无论A还是B先出手,B在下一轮都有先出手的优势。
如果C先出手呢?
c可以先射击A。即使C打不中A,A的最佳策略仍然是向B开枪,然而,如果C打中A,B将在下一轮向C开枪。所以C的最佳策略是随机出手。只要C没有打中A或者B,他在下一轮射击中就会处于有利位置。
通过这个例子我们可以明白,人在游戏中能否取胜,不仅取决于自身的实力,还取决于玩家实力对比所形成的关系。
在上面的例子中,B和C实际上是一个联盟。如果先杀了A,他们生存的几率会增加。现在我们来判断一下B和C谁更容易背叛,谁更容易忠诚?
任何联盟的成员总会权衡利弊。一旦背叛的好处大于忠诚的好处,联盟就会破裂。在B和C的联盟中,B是最忠诚的。这不是因为B本身有更忠诚的品质,而是因为利益关系。只要A不死,B的枪肯定会对准A..但C就不是这样了,C不瞄准a乱开枪显然是反联盟的,这样一来B的处境会更危险。
合作可以对抗强敌。只有在B和C的配合下,才能先干掉A。如果乙方和丙方不和,乙方和丙方都不单独优于甲方,由甲方先后解决。
第六,聪明猪游戏
猪圈里有两头猪,一头大猪和一头小猪。猪圈的一侧有一个踏板。每踩一次踏板,就会有少量的食物落在猪圈另一侧远离踏板的喂食口。如果一只猪踩了踏板,另一只猪就有机会先吃掉掉在另一边的食物。猪一踩踏板,大猪刚好会在猪跑到食槽前把所有食物吃完;如果大猪踩了踏板,在小猪吃完掉下来的食物之前,还有机会跑到食槽,争夺剩下的另一半。
那么,两只猪会采取什么策略呢?答案是:小猪会选择“搭便车”策略,即在低谷期舒服地等待;大猪不知疲倦地在踏板和食槽之间跑来跑去,只为了一点剩菜。
这是什么原因呢?因为,小猪通过踩踏板什么也得不到,但不踩踏板却能吃到食物。对于小猪来说,不管大猪踩不踩踏板,不踩总是一个不错的选择。另一方面,大猪知道小猪不会踩油门。自己踩油门总比不踩好,所以他得自己来。
变化方案1:还原方案。喂食只有原来体重的一半。结果小猪和大猪都不蹬了。小猪会踩,大猪会把食物吃完;如果大猪踩上去,小猪也会把食物吃完。谁蹬就意味着给对方贡献食物,所以谁也不会有蹬的动力。
如果目的是让猪多蹬,这个游戏规则的设计显然是失败的。
变化方案二:增量方案。比以前多喂一倍。结果小猪和大猪都会蹬。谁想吃就蹬。反正对方不会一次吃完所有的食物。小猪和大猪相当于生活在一个物质相对丰富的“物欲横流”的社会,竞争意识不是很强。
对于游戏规则的设计者来说,这个规则的成本是相当高的(一次提供双份食物);而且因为竞争不强,让猪多蹬也没啥效果。
变化方案三:减量加移位方案。只喂原来重量的一半,但同时要把喂食口移到踏板附近。结果小猪和大猪都拼命蹬。等的人不会吃,努力的人会得到更多。每一次收获都只是花。
对于游戏设计师来说,这是最好的解决方案。成本不高,但收获最大。
很多人没看过“聪明猪游戏”的故事,但都在有意识地使用猪的策略。散户在股市里等着庄家上轿;等待产业市场出现有利可图的新产品,然后大规模复制游资牟取暴利;公司里不创造效益但分享成果的人,等等。比如公司的激励制度设计,奖励太强,而且还是持股和期权。公司的所有员工都成了百万富翁。且不说成本高,员工的积极性也不一定高。这相当于《聪明猪游戏》增量方案中描述的情况。但是,如果奖励力度不大,观众有分成(即使是不干活的“小猪”),曾经很努力的大猪们也就没有动力了——就像《聪明猪游戏》第一期缩减计划中描述的情况。最好的激励机制设计就好比换第三种方案——减员加换班。奖励不是人人共享,而是针对个人(如业务比例提成),既节约了成本(对公司而言),又杜绝了“搭便车”现象,可以实现有效激励。
就整个社会而言,自我需求大的群体往往是推动社会生产力的主力军。换句话说,要快速提高整个社会的生产力水平,需要有一个消费需求大的群体,并给予他们一定程度的奖励。第三种改变方案反映了这种情况,降低了饲养成本,现实中也可以等同于增加饲养奖励。