会员书架
首页 > 游戏竞技 > 博弈最佳策略 > 第3部分

第3部分(第2/5 页)

目录
最新游戏竞技小说: 永劫:决赛替补开局爆杀绝代双骄重生之李氏仙路穿越:逆袭篮球之星我的精灵训练家模拟器姑娘使不得啊网游:开局霸占富豪榜!末世网游:开局唯一超神级天赋影视编辑器我叫佐助,从火影首富制霸诸天无敌装备修改器斗罗世界的巫师网游之暗黑风云诡雾求生:我能返回现实世界足坛称雄:我有系统称霸欧陆足坛极限伏天我来自惩罚世界梦幻世界天堂地狱网游之天地人间热刺之魂CSGO教练我想学白给

略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与人的最优(混合)策略选择。

小偷(1)

警察

袭击A地

袭击B地

巡逻A地

3,0

2,1

巡逻B地

1,2

3,0 对于这个例子,警察的一个更好的策略是,警察用掷骰子的方法决定去A地还是B地。假定警察规定掷到1—4点去A地,掷到5、6两点去B地,这样警察有2/3的机会去A地进行巡逻,1/3的机会去B地。

而小偷的最优选择是:以同样掷骰子的办法决定去A地还是去B地偷盗,如掷到1—4点去B地,掷到5、6两点去A地,那么,小偷有1/3的机会去A地,2/3的机会去B地。

此时警察与小偷所采取的便是混合策略。

假如按这种策略,我们看一下双方的收益。警察的期望得益是:7/3万大于2。警察按此办法比只巡逻A地的收益更高。

一旦警察采取混合策略,小偷也采取混合策略,其最优混合策略下的收益为2/3万元。小偷的收益比警察只巡逻A地的收益要低。

因为:当警察去A地巡逻时,小偷有1/3的机会去A地,2/3的机会去B地,此时警察去A地的得益为:万元;当警察去B地时,同样,小偷有1/3的机会去A地,2/3的机会去B地,此时警察A地的得益为:万元。

警察总的得益为:万元。

同理,我们可得小偷的总的得益为2/3万元。

这里我们“让”警察和小偷掷骰子以确定去A地还是去B地,目的是要去A地和去B地之间确定一个概率分布,他们当然可用其他方式来确定这个概率分布。

宰割博弈中警察与小偷所用的混合策略,如同小孩子之间玩“剪刀—石头—布”的游戏时所用的策略。在“剪刀—石头—布”这样的游戏中,不存在纯策略均衡,对每个小孩来说,自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略,哪怕是倾向性的策略。如果对方知道你出其中一个策略的可能性大,那么你在游戏中输的可能性就大。因此,每个小孩的最优混合策略是采取每个策略的可能性是1/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。

由此可见:纯策略是参与人一次性选取的,并且坚持他选取的策略;而混合策略是参与人在各种备选策略中采取随机选取的。在博弈中,参与人可以改变他的策略,而使得他的策略选取满足一定的概率分布。

若博弈是零和博弈,即若博弈参与人为两人,一方所得是另外一方的所失,或者若博弈是常和博弈,即若博弈参与人为两人,一方所得的增加等于另外一方的损失,此时,对于任何一个参与人而言,都不可能有纯策略的占优策略。博弈参与人采取混合策略是合适的,均衡为混合策略均衡。如在当前的“反恐”博弈中,由于力量的有限,反恐方往往“更多地”将力量放在重点区域,如人口密集的大城市,“一定程度地”关注不太危险的区域,如人口稀疏的农村。这就是混合策略。而恐怖分子同样在玩混合策略:对攻击对象的选择是随机的,对攻击方式的选择也是随机的。

在竞争性的博弈中,该采取混合策略而不采取混合策略将会带来失败。田忌赛马是人人熟悉的故事。齐王与田忌赛马,但齐王的马平均来说要比田忌的马要跑得快,但田忌采纳了孙膑的策略,田忌用下等马对齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马。田忌以三比二获胜,赢了齐王。赛马是零和博弈,齐王的失败在于他使用了纯策略;若齐王使用混合策

本章未完,点击下一页继续。

目录
我们成就梦想仙路云荒带点黑科技重返17岁剑殇情伤佛堂春色东京绅士物语
返回顶部