青帝小说

青帝小说>博弈的步骤 > 第3部分(第2页)

第3部分(第2页)

宰割博弈中警察与小偷所用的混合策略,如同小孩子之间玩“剪刀—石头—布”的游戏时所用的策略。在“剪刀—石头—布”这样的游戏中,不存在纯策略均衡,对每个小孩来说,自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略,哪怕是倾向性的策略。如果对方知道你出其中一个策略的可能性大,那么你在游戏中输的可能性就大。因此,每个小孩的最优混合策略是采取每个策略的可能性是13。在这样的博弈中,每个小孩各取三个策略的13是纳什均衡。

由此可见:纯策略是参与人一次性选取的,并且坚持他选取的策略;而混合策略是参与人在各种备选策略中采取随机选取的。在博弈中,参与人可以改变他的策略,而使得他的策略选取满足一定的概率分布。

若博弈是零和博弈,即若博弈参与人为两人,一方所得是另外一方的所失,或者若博弈是常和博弈,即若博弈参与人为两人,一方所得的增加等于另外一方的损失,此时,对于任何一个参与人而言,都不可能有纯策略的占优策略。博弈参与人采取混合策略是合适的,均衡为混合策略均衡。如在当前的“反恐”博弈中,由于力量的有限,反恐方往往“更多地”将力量放在重点区域,如人口密集的大城市,“一定程度地”关注不太危险的区域,如人口稀疏的农村。这就是混合策略。而恐怖分子同样在玩混合策略:对攻击对象的选择是随机的,对攻击方式的选择也是随机的。

在竞争性的博弈中,该采取混合策略而不采取混合策略将会带来失败。田忌赛马是人人熟悉的故事。齐王与田忌赛马,但齐王的马平均来说要比田忌的马要跑得快,但田忌采纳了孙膑的策略,田忌用下等马对齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马。田忌以三比二获胜,赢了齐王。赛马是零和博弈,齐王的失败在于他使用了纯策略;若齐王使用混合策略,即每次比赛用马采取随机策略,不让田忌预先知晓,那么田忌获胜的机会必定大大小于齐王获胜的机会,齐王不会发生必输的结局。因此,齐王的错误在于没有使用混合策略。txt电子书分享平台

小偷(2)

应当说明的是,田忌赛马是著名的中国古代博弈故事。但其田忌获胜的博弈结果则不是博弈论所能够给出的。博弈论假定了每个参与人都是绝顶聪明的(理性的),博弈论给出的是,田忌和齐王都应采取混合策略,此时有一个混合策略均衡。田忌赛马从反面印证了纳什均衡的含义:若某个参与人主动改变均衡策略,他的收益会降低。这里,主动改变均衡策略而收益降低的参与人是齐王。

5.《三国演义》中的空城计与信息不对称的博弈

如果我们用博弈论的眼光看《三国演义》,三国演义完全是一部记载着许多博弈案例的著作。当然,罗贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》,这个词就是“计”。计,即计策或策略也。用计,即用策略赢对方。用计算敌,不仅要自己选择恰当的计策,而且要算准对方要用的计策,这不就是博弈?现在让我们看《三国演义》中著名的空城计博弈。

诸葛亮误用马谡,致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只剩二千五百军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开城门,每一门用二十军士,扮作百姓,洒扫街道。而孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于城上敌楼前凭栏而坐,焚香操琴。司马懿自飞马上远远望之,见诸葛亮焚香操琴,笑容可掬。司马懿顿然怀疑其中有诈,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之”,我兵只有二千五百,若弃城而去,必为之所擒。

这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。

这里,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮是知道的,他们对博弈结构的了解是不对称的,诸葛亮拥有比司马懿更多的信息。这种信息的不对称完全是诸葛亮“制造出来的”。因此这是一个信息不对称的博弈。

在这里,孔明可以选择的策略是“弃城”或“守城”。无论孔明所选择的是“弃”还是“守”,只要司马懿明确知道在各种可能的情况下他自己的支付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿清楚地知道他自己的策略结果。孔明通过空城计,目的是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。

司马懿

孔明

进攻

后退

守城

被擒;大胜

逃脱;不胜不败

弃城

被擒;大胜

逃脱;不胜不败

在信息不充分的情况下,理性的博弈参与人不是使自己的支付或效用最大,而是使自己的“期望支付(或效用)”最大。比如:如果让你在“有50%的可能获得100元”与“有10%的可能获得200元”两者之间进行选择,你当然选前者,因为前者的“期望所得”为:50%×100=50元,而后者为:10%×200元=20元。理性的人是选择前者的。

在孔明—司马懿的博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用。即:司马懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。

司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可能如此镇定自若,焚香操琴。此时,司马懿觉得“退”比“进攻”更合理,或者说期望效用更大。于是后军变前军,前军变后军,后退而去。结果是诸葛亮得以逃脱。司马懿对局势的判断不是没有道理的,他对诸葛亮的判断是基于以前的认识,这就是“归纳法”,我们会在第七章中讨论归纳法在博弈中的作用及其局限。

空城计博弈是不完全信息博弈,我们说过《三国演义》是一本博弈实战教材,在该书中有完全信息博弈实例吗?当然,曹操与诸葛亮的华容道博弈就是一个完全信息博弈。

曹操亲领八十万大军进攻东吴,孙权和刘备联合破曹,曹军大败。曹操引兵而逃。经过一路厮杀,来到一处,军士报:前方有两条道路,请问丞相走哪条路?曹操问:哪条路近?军士说:大路稍平,却远五十余里。小路投华容道,却近五十多里。曹操令人上山观望,回报:小路山边有数处狼烟,大路并无动静。曹操叫走华容道。诸将问:烽烟起处必有军马,何故反走这条路?曹操说:岂不闻兵书有云:“实则虚之,虚则实之”。诸葛亮多谋,故使人于山僻放烟,使我军不敢从这条路走,他却伏兵于大路等着。吾已料定,偏不教中他计。诸将皆曰:丞相妙算,人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华容道等着曹操,于是关羽上演了一场“只为当初恩义重,放开金锁走蛟龙”的捉放曹的义举。逃过华容道大难,曹操只剩二十七骑!

在曹操与诸葛亮之间的这一华容道博弈中,曹操的策略是在走华容道还是走大路之间进行选择,而诸葛亮派关羽埋伏时,要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。

这个博弈如同猜硬币的游戏一样,是一个“零和博弈”5它没有纯策略纳什均衡点。双方对博弈有完全的信息,各种策略下的博弈支付是公共知识——我们下一章将说明什么是公共知识。但双方无法知道对方的策略选择,而只能进行猜测。曹操要选择走诸葛亮的军队不在的路,这是他的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。

已完结热门小说推荐

最新标签