囚徒困境的生存机制

有一个游戏叫“囚徒困境”

游戏里有两个人，手里有两张牌，分别是“合作”牌和“背叛”牌；游戏规则如下:

如果双方都打“合作”牌，双方各得300元；

如果双方都打“背叛”牌，双方都要被罚10；

当一方打“合作”牌，另一方打“背叛”牌时，对持“合作”牌的人罚款100元，持“背叛”牌的人计入500元；

为什么叫“囚徒困境”？理论上只要双方合作就能拿到300元，两者利益最大化。但问题是，双方其实都是独立的个体，无法沟通，而且就算能沟通，你怎么知道对方会不会骗你？

所以如果对方打“合作”牌，为了我的最大利益，我应该打“背叛”牌；如果对方打“背叛”牌，我也会打“背叛”牌，减少自己的损失；也就是说，在这样的博弈中，双方最终可能会玩“背叛”，面临双输的局面，这就是“囚徒困境”。

有没有办法走出这个“囚徒困境”？

面对一场决定胜负的比赛，我们可能很难做到这一点。但我们面对的是生活中的困难，而且会不止一场。和你玩小游戏的时候，和同学玩游戏的时候，和伙伴玩游戏的时候，我们总会遇到很多次应该选择“合作”还是“背叛”的时候。甚至我们的祖先最早就已经面临“合作”或“背叛”的多重选择。

面对多局重复，我们会面临不同的策略；罗伯特·阿克塞尔罗德在《合作的进化》中做了这样的论述。他用一个计算机程序输入不同的策略算法:有的策略是每局都选择合作，有的策略是每局都选择背叛；

然而，有些策略更复杂。比如我第一次选择合作，但只要遇到对方选择背叛，我就会“强烈报复”，以后全部背叛；比如我第一次选择合作，但下一局我的选择是“针锋相对”，和对手上一局一致；还有，只要我背叛，对方是合作博弈，那么我就会“内疚”，在下一个博弈中进行合作；

阿克塞尔罗德玩过两个游戏，匹配了60多种不同的策略，用电脑筛选出哪种策略得分最高。结果叫做“以牙还牙的坏牙”的策略是最高分的两倍，也就是我们前面说的。上一局你合作，下一局我合作，上一局你背叛，下一局我背叛。

这难道不符合我们现实生活中流行的“报恩报仇”的现象吗？

有人视合作为善，视背叛为恶。

如果这些善恶策略进入生存机制会怎样？于是阿克塞尔罗德将这些策略投入到第三场比赛中，这场比赛不是得分比赛，而是“生存”比赛，获胜的奖品是自己的复制品。经过1000代，这些策略的种类和数量逐渐稳定，一些“作弊者”和“愚者”策略逐渐灭绝。幸存的策略主要是“好”策略。

由此我们可以看出:

世界仍将转向“善”

善有善报，恶有恶报，这是世间的“理”，也是我们人类文化博弈流传下来的“优”策。

纯“善”(即只合作)不是一个优秀的策略

但上述竞争是建立在策略丰富均衡、初始条件一般的基础条件上的。其实世界是复杂的。

比如赢得每一次上诉的“以牙还牙”策略，如果环境以“纯恶”策略(每一次背叛)为主，那么“以牙还牙”策略就很难取得优势，第一局他会输得很惨(以牙还牙第一局是选择合作)，但后面可以势均力敌。

被称为“傻子”的“纯善”(只合作)策略，在恶劣的环境下必然会死，但如果你搭上了存活率极高的“以牙还牙”策略的顺风车，这个傻子就会在1000代之后，用“善”的策略活得很好，这也是“阿甘”

所以“环境基础”对于一个策略的生存也是极其重要的，父母为孩子选择一个好的环境也是非常重要的。

当然，人类还没有简单到拥有不“善”也不“恶”的策略。人性复杂，不同的环境可能会激发出不同的策略。也许“善”的人类只是把“恶”放在了一个隐秘的角落。

但无论如何，人类至少总体上是“善”的，这是人类长期流传下来的优秀文化，或许是在“智人”时代。所以，我们还是需要坚持宣扬“爱”，宣扬“善”，惩罚“恶”。