学会使用“混合策略”意味着什么?
所谓“混合策略”是相对于“纯策略”而言的。在博弈论中,“纯策略”是指参与者对一种策略有“明确”的选择——要么用,要么不用,除此之外别无他法。而“混合策略”就是策略师随机选择自己的策略。在现实生活中,采用混合策略的例子很多。
孩子们玩的“石头剪子布”游戏是一个众所周知的使用混合策略的例子。孩子玩游戏,总是在“石头”、“剪刀”、“布”之间权衡,而不是采取固定的策略。这是一个混合策略。对于这个博弈,如果一个玩家想得到最好的结果,他应该采取的混合策略(称为“均衡策略”)是,选择“石头”、“剪刀”和“布”的概率是相同的,都是1/3。否则,如果一方选择某个策略的概率高于其他策略,而这个规律被另一方总结出来,那么对手就会采取相应的应对策略,胜利的次数就会大大增加。
通过猜拳这个简单的游戏我们可以知道,参与游戏的人试图通过选择混合策略给对手制造不确定性,让对手无法预测自己的行动,从而使自己受益。如果参与游戏的人动作太有规律,那么他就会被对手打败。或者一旦他破坏了自己的随机策略,他就失败了。
很久以前,我看了一部由吴孟达和童星郝劭文主演的电影。故事我记不清了,但有一个情节给我留下了深刻的印象:吴孟达和郝劭文通过猜“剪刀石头布”决定了最后10元的归属。吴孟达的方法是:给郝劭文一枚硬币拿在手里,然后出拳。作为一个孩子,自然按照的期望做了一个“石头”(因为郝做石头只是为了保证手里的硬币不会丢失),自然通过做一个“布”赢了10元。为了防止郝的混合策略,吴采取了欺骗的方法。虽然方法不光彩,但结果很令人满意。在不让对手清楚了解自己的情况下采取混合策略是很常见的,比如打牌,击剑,足球,篮球。
我们都知道“田忌赛马”的故事:战国时期,齐威王和将军田忌赛马,每次都送来一匹同等级的马。在三场比赛中,齐威王的马都比田忌的好,所以他们都赢了。田忌的谋士、杰出的军事家孙膑发现,田忌的马虽然不如齐国的马,但比齐国的好,田忌的马比齐国的好。而且齐王的马每次都是按照上中下的顺序排列的。于是在接下来的比赛中,孙膑让田忌把马的出场顺序改为:下、上、中,但王琦的马出场顺序仍然是:上、中、下。结果田忌以2比1赢得比赛。
在这里,齐王的失败就在于他的纯策略:每打一场,马是一定的,这一点田忌和孙膑也都知道。如果齐王不这么做,而是采取混合策略,即在每一场比赛中随机选择马匹上场,那么孙膑的策略就很难施展,齐王也不一定会输。其实因为齐王的马一般都比田忌快,所以齐王赢田忌的可能性要大得多。只要计算一下就可以知道,如果齐王用混合策略,田忌只能用混合策略应对。这样每个人的马出场顺序就有6种可能,* * *有36种可能组合。如果齐王隐藏策略,不让田忌知道马出现的顺序,田忌获胜的概率只有1/6,而齐王获胜的概率是5/6。
在战争中,军事家实施混合策略,就是让敌人“知道”他可能采取的任何一种备选策略,而不让对方猜测他要采取哪种策略,也就是只让敌人“知道”他所选择策略的一种概率分布。战争中一方轰炸对方时,一般不会向对方透露具体的轰炸日期,因为如果被轰炸的一方知道对方的轰炸日期,就会采取措施应对空袭。一旦后者准备好了,轰炸机的目的就很难达到了。在“轰炸——被轰炸”的游戏中。轰炸一方的时间是随机的,反轰炸一方时刻准备着。这就是混合策略。
在国际政治生活中也有许多混合策略的例子。
比如美国正在和恐怖分子进行反恐战争,他们也在玩混合策略。恐怖分子想袭击美国,美国想阻止恐怖袭击。恐怖分子胜利果实的大小相当于被攻击方美国的损失。恐怖分子无法提前告诉美国他们将在何时、何地、如何袭击哪里的目标。如果美国政府事先被告知恐怖分子的计划,肯定会采取措施加以防范,恐怖袭击就很难得逞。
因此,恐怖分子采取混合策略:他们可以在任何时间、任何地点袭击美国。对于美国政府来说,他们的任何一个目标,无论是民用还是军用,都有可能成为恐怖袭击的目标,所以不可能放松对任何一个目标的防御。