囚徒困境的生存机制
游戏里有两个人,手里有两张牌,分别是“合作”牌和“背叛”牌;游戏规则如下:
如果双方都打“合作”牌,双方各得300元;
如果双方都打“背叛”牌,双方都要被罚10;
当一方打“合作”牌,另一方打“背叛”牌时,对持“合作”牌的人罚款100元,持“背叛”牌的人计入500元;
为什么叫“囚徒困境”?理论上只要双方合作就能拿到300元,两者利益最大化。但问题是,双方其实都是独立的个体,无法沟通,而且就算能沟通,你怎么知道对方会不会骗你?
所以如果对方打“合作”牌,为了我的最大利益,我应该打“背叛”牌;如果对方打“背叛”牌,我也会打“背叛”牌,减少自己的损失;也就是说,在这样的博弈中,双方最终可能会玩“背叛”,面临双输的局面,这就是“囚徒困境”。
有没有办法走出这个“囚徒困境”?
面对一场决定胜负的比赛,我们可能很难做到这一点。但我们面对的是生活中的困难,而且会不止一场。和你玩小游戏的时候,和同学玩游戏的时候,和伙伴玩游戏的时候,我们总会遇到很多次应该选择“合作”还是“背叛”的时候。甚至我们的祖先最早就已经面临“合作”或“背叛”的多重选择。
面对多局重复,我们会面临不同的策略;罗伯特·阿克塞尔罗德在《合作的进化》中做了这样的论述。他用一个计算机程序输入不同的策略算法:有的策略是每局都选择合作,有的策略是每局都选择背叛;
然而,有些策略更复杂。比如我第一次选择合作,但只要遇到对方选择背叛,我就会“强烈报复”,以后全部背叛;比如我第一次选择合作,但下一局我的选择是“针锋相对”,和对手上一局一致;还有,只要我背叛,对方是合作博弈,那么我就会“内疚”,在下一个博弈中进行合作;
阿克塞尔罗德玩过两个游戏,匹配了60多种不同的策略,用电脑筛选出哪种策略得分最高。结果叫做“以牙还牙的坏牙”的策略是最高分的两倍,也就是我们前面说的。上一局你合作,下一局我合作,上一局你背叛,下一局我背叛。
这难道不符合我们现实生活中流行的“报恩报仇”的现象吗?
有人视合作为善,视背叛为恶。
如果这些善恶策略进入生存机制会怎样?于是阿克塞尔罗德将这些策略投入到第三场比赛中,这场比赛不是得分比赛,而是“生存”比赛,获胜的奖品是自己的复制品。经过1000代,这些策略的种类和数量逐渐稳定,一些“作弊者”和“愚者”策略逐渐灭绝。幸存的策略主要是“好”策略。
由此我们可以看出:
世界仍将转向“善”
善有善报,恶有恶报,这是世间的“理”,也是我们人类文化博弈流传下来的“优”策。
纯“善”(即只合作)不是一个优秀的策略
但上述竞争是建立在策略丰富均衡、初始条件一般的基础条件上的。其实世界是复杂的。
比如赢得每一次上诉的“以牙还牙”策略,如果环境以“纯恶”策略(每一次背叛)为主,那么“以牙还牙”策略就很难取得优势,第一局他会输得很惨(以牙还牙第一局是选择合作),但后面可以势均力敌。
被称为“傻子”的“纯善”(只合作)策略,在恶劣的环境下必然会死,但如果你搭上了存活率极高的“以牙还牙”策略的顺风车,这个傻子就会在1000代之后,用“善”的策略活得很好,这也是“阿甘”
所以“环境基础”对于一个策略的生存也是极其重要的,父母为孩子选择一个好的环境也是非常重要的。
当然,人类还没有简单到拥有不“善”也不“恶”的策略。人性复杂,不同的环境可能会激发出不同的策略。也许“善”的人类只是把“恶”放在了一个隐秘的角落。
但无论如何,人类至少总体上是“善”的,这是人类长期流传下来的优秀文化,或许是在“智人”时代。所以,我们还是需要坚持宣扬“爱”,宣扬“善”,惩罚“恶”。