把钱分给五个海盗是简单的数理逻辑问题吗?
假设所有人在任何情况下都会遵守分配规则,即无论多少人会投票,被否决的提案都会被扔进大海。
那么这就是一个简单的非合作动态博弈话题。
逆方法很容易解决。
在只剩下4、5个小时的时候,4只能提出0,100的分配方案,5可以同意也可以不同意,这取决于4和5的人际关系,5的脾气性格等各种因素。
因为每个人都足够聪明,4可以预知自己的命运,如果放任不管,可以分为两种情况:
1.4号玩家可以保命。虽然他没有得到宝石,但他至少没有死。
2.4号玩家肯定会死,拿不到宝石也会死,收益不是0而是负的。
然后想象一下只剩下3,4,5的情况。3号玩家也知道5号的脾气,就是3号可以预见到自己的方案被否决,只剩下4号和5号的情况,所以3号争取4号或者5号中的一个同意他的方案显然要便宜很多。
因为只有4和5两种情况,3的策略会不一样(顺序同上)
1.玩家3至少获得1宝石,因为如果3提出100,0,0的方案,4不需要同意,5也不会同意,所以3至少会提出991,0的方案。
2.因为4有死亡的危险,3此时可以提出100,0,0的方案,4也会同意。
不妨依次往下推:
剩下2、3、4、5个玩家时(情况顺序同上)
1.玩家2最不建议的方案是97,0,2,1,4,5支持。
2.2号玩家提出至少98,0,1,1,得到4,5的支持。
最后是玩家1的方案策略。
1.玩家1提出至少97,0,1,0,2的策略来获得玩家3和5的支持。
2.玩家1至少提出97,0,1,2,0或97,0,1,0,2来讨好3号,得到4号或5号之一的支持。
总而言之,
1在不考虑违规的情况下,
2不考虑玩家是否冒着生命危险得到宝石,即玩家的风险可能性被消除,
3不考虑可能在比赛前甚至抽签前就已经结成联盟,
我们得到了一个动态博弈问题的完美子博弈纳什均衡解,在不考虑上述三种情况下是稳定有效的。
(2)
在(a)中最简单的基础上,我们只引入违反大家定下的规则的可能性。
前提是五个人实力相当,就是大家抢的话,谁都打不过,所以才有这个题目。如果一个海贼有过人的“实力”,他就会成为所谓的“老大”,所以没必要大家投票。这个前提假设(1)也适用,但不会有(2)中的影响。
因为实力相当,也就是多数人能打得过少数人,所以在五人、四人、三人面前,谁也不能违反既定规则。比如1的提议被否决,他拒绝被扔进海里企图违规,但四个人不会被允许。同样,四个人三个人的时候,也不存在大家都违规的可能。
只剩下两个人的时候,情况就不一样了。4号不是傻子,他有能力打,5号也不是傻子。他知道4号会试一试。在这种情况下,如果一场战斗决定了收益,那么伤害的负收益将不被计算在内。然后因为双方实力相当,预期收益都是50,不如双方不战而直接分享,各50。
这种情况是可能的,也很有可能发生,因为当游戏只剩下两个人的时候,既定的规则就变得像道德约束一样。我觉得海贼似乎不会因为这种道德约束而选择死亡或者不要宝石。
通过反向推理来推断,如(1)
3号玩家会选择49,565,438+0,0或者49,0,565,438+0的方案。
2号玩家会选择49,50,0,1或者49,50,1,0。
玩家1的方案如下:
97,0,0,1,2或97,0,0,2,1。
说实话,这种可能性更大,因为在游戏只剩下两个玩家的情况下,既定的规则会显得苍白无力,而海盗们都很“聪明”,能预见未来,所以这样的推演是没有问题的,只有考虑到有一个玩家可能“铤而走险”或者存在联盟的情况下,推导出来的解才会改变。
博弈论中有一个均衡的概念叫做“握手均衡”。我不确定(2)中得到的解是否归类为握手均衡,但也是一个相对稳定的解。
(3)
我们用“冒险”行为来讨论这个博弈问题。
“冒险”的定义是玩家愿意为了未来的利益而放弃眼前的利益,也就是风险收益比。
眼前的利益不仅仅局限于马上可以获得的宝石,还涉及到生命,所以相当复杂。
假设,一定要给出假设,否则无从下手。
假设:
1.五个人都是风险中性的。举个例子,比如1提出的方案是给5号50颗宝石,而由(2)分析得出,5号在还剩4颗和5颗的情况下也会得到50颗宝石,所以这两种情况下得到的50颗宝石没有区别。但是参与人5会选择什么呢?给出假设2。
2.当面对两个阶段相同的利益时,玩家会选择前一阶段的利益。也就是说,在上面的例子中,当1提出方案时,5号玩家会投赞成票。你为什么这样假设?这里“贬值”的概念被收窄了,但是从时间和机会成本的角度,或者说杀人对玩家的好处来说,早结束游戏,早拿到珠宝分发,对大家都是有利的,大家都可以有更多的时间潇洒。我们排除了喜欢浪费时间看杀人的“杀手”的存在。
这两个假设在(1)和(2)中没有应用,所以在(1)和(2)的分析中,号码前的玩家会试图用至少多一点的宝石来巴结和贿赂其他玩家,当这些假设存在时,玩家可以用同样的宝石贿赂其他玩家。
这两个假设不无道理。这时候我甚至有把它们运用到(1)和(2)的冲动。
3.假设每一个海盗都会“冒险”,也就是为了自己能获得的最大利益而让游戏继续下去,从而获得自己的最大利益。当这个最大利益出现时,“冒险”停止,无论它出现在哪一轮。
这个假设是一个关键的假设。在这三个假设下,我们将继续讨论基于(2)的问题。
当只剩下4,5的时候,每个人的收入是50。
因此,4和5的最大“冒险”收益估计为50。
3可以巴结4也可以贿赂5,假设概率各为0.5。
那么3会做什么呢?他的方案50,0,50或者50,50,0可以通过假设。
所以3最大的“冒险”收益也是50。
但是在剩下3、4、5的情况下,也就是在3中提出方案的时候,4和5的预期收益都是25,也就是4和5中只有一个能拿到50,另一个是0,所以4和5实际上并不能希望游戏走到这一步,但是一旦走到这一步,方案就通过了,不会再往下走。
在考虑第二个方案时,因为3、4、5会等待50的最大收益,所以为了保命,失去生命会产生负收益。他只能提出3、4、5中的两个各得50,有三种划分方式,我就不依次说了。2最大的“冒险”好处就是保命。
只要1的方案通过,2就可以提前保命,所以1只需要拿下3,4,5中的一个,给他50宝石自己留50,然后就可以认识了。
总结一下,大家把“冒险”发挥到极致的时候,玩家1有三种方案。
50,0,50,0,0或50,0,0,50,0或50,0,0,0,50。
可以清楚的看到,其实在这种情况下,大家都是非理性的。3,4,5的预期收益都是50的三分之一,但是当他们面对这样的方案时,就会被通过。
假设3略有变化,即假设每个人都不会“冒险”等待可能的最大收益,每个人的选择原则都是基于预期收益,分析如下。
4和5在最后一轮会对半分。
如果他去第三个提案,他会给4和5中的一个50,所以倒数第二轮4和5的预期收益都是25。
因为4,5怕3自己的收益是0,那么2的最佳方案是50,0,25,25。不会有其他情况。
当然,我希望我能提出自己的建议,但这实际上是不可能的。
1只要提出75,0,0,25,0或者75,0,0,25的方案,那么4和5肯定有一个同意,3个同意?如果他不同意,那就是浪费时间,而且他提出2中50,0,25,25的方案也拿不到宝石,所以1的方案就是:75,0,0,25,0或者75,0,0,0,25。
至于风险收益比和以生命为条件的博弈分析,情况比较复杂,这里就不讨论了,只取两种极端情况。至于假设,一定要仔细看。没有这个假设,对(3)的分析是站不住脚的。
(4)
最后,讨论的问题是“联盟问题”,这也是我最后想提的问题。这非常复杂。当任何多人游戏增加不确定的联盟可能性时,解就会变得不稳定。
我们只考虑所有联盟都是“稳定联盟”的情况,即联盟不会因为其他玩家或其他联盟的“小恩小惠”而瓦解。
有多少种稳定的联盟不会解体?
五个人组成一个联盟,这个联盟不存在。
四人结盟,五种。
三个人联盟,另外两个联盟,10种,另外两个不联盟,10种。
两人结盟,其他三人不结盟,10种;其他三人,2人结盟,30种。
65种?好像不多。
但联盟引发的“赃物分销权”归属问题,又会让问题复杂化。
三人四人联盟的分赃权归属是毫无疑问的。
当两组二人联盟存在时,就成为拉拢“破坏者”的关键,所以30*2=60。
当两个人结成联盟,其他三个人各自为战,情况就不简单了。
两人联盟只需要拉拢一个人,成功有三种情况。如果失败,其他三个人达成协议。虽然没有联盟,但是是另外一种,10*4=40。
所以实际上变成了125种,可能是错误的,不确定的。
说到可能的不稳定联盟,可能性往往是无穷无尽的。
也许高等数学知识能解决,但我不能。
这是我和楼主讨论后的一些分析,希望专家能给点意见!我们旨在将这个简单的游戏模型复杂化,并考虑更多的因素。