现在的位置: 首页 > 综合 > 正文

《博弈论》的经典

2013年02月20日 ⁄ 综合 ⁄ 共 1241字 ⁄ 字号 评论关闭

一、强盗分金问题

        在一座座荒岛上  有5个强盗掘出了100块非常珍贵的金币他们商定了一个分配金币的规则。 首先抽签决定每个人的次序排列成强盗一至五 然后由强盗一先提出分配方案 经5 人表决  如多数人同意  方案就被通过  否则强盗一将被扔入大海喂鲨鱼  如果强盗一被扔入大海  就由强盗二接着提出分配方案  如多数人同意方案就被通过  否则强盗二也要被扔入大海  以下依次类推  假定每个强盗都足够聪明  都能做出理性的选择  那么  强盗一提出什么样的分配方案  能够使自己得到最大的收益      

        问题答案

 (97,0,1,2,0)或者(97,0,1,0,2)

        推理过程(逆向推理)

    从后向前推  如果强盗一、二、三都喂了鲨鱼  只剩强盗四和五的话  强盗五一定不同意强盗四的方案  让强盗四去喂鲨鱼  自己就可以独吞全部金币  所以  强盗四预见这一结局  不论怎样  惟有支持强盗三才能保命  强盗三知道强盗四的赞成票已在囊中  就会提出自己独得100 块的分配方案  对强盗四、五一毛不拔  即提出(100,0,0)的分配  不过  强盗二料到强盗三的方案  会提出(98,0,1,1)的分配  不给强盗三  给强盗四和五各1块金币  由于这一方案对强盗四和五来说比在强盗三分配时更有利  他俩将支持强盗二  不希望他出局  但是  强盗一比强盗二更占先机  只要他得到3票赞成  既可稳操胜券  他可以给强盗三1块金币  给强盗四或五2块金币  这肯定要比强盗二给的多  于是  除了他自己的1票之外  他还能得到强盗三以及强盗四或五的支持  即方案(97,0,1,2,0)或者(97,0,1,0,2)

 


 

二、 囚徒困境

      囚徒困境  讲的是两个嫌疑犯(A和B)作案后被警察抓住  隔离审讯  警方的政策是"坦白从宽  抗拒从严"  如果两人都坦白则各判8年  如果一人坦白另一人不坦白  坦白的放出去  不坦白的判10年  如果都不坦白则因证据不足各判1年
  在这个例子里  博弈的参加者就是两个嫌疑犯A和B  他们每个人都有两个策略即坦白和不坦白  判刑的年数就是他们的支付  可能出现的四种情况  A和B均坦白或均不坦白  A坦白B不坦白或者B坦白A不坦白  是博弈的结果  A和B均坦白是这个博弈的纳什均衡  这是因为  假定A选择坦白的话  B最好是选择坦白  因为B坦白判8年而抵赖却要判十年  假定A选择抵赖的话  B最好还是选择坦白  因为B坦白判不被判刑而抵赖确要被判刑10年  即是说  不管A坦白或抵赖  B的最佳选择都是坦白  反过来  同样地  不管B是坦白还是抵赖  A的最佳选择也是坦白  结果  两个人都选择了坦白  各判刑8年  在(坦白、坦白)这个组合中  A和B都不能通过单方面的改变行动增加自己的收益  于是谁也没有动力游离这个组合
      囚徒困境反映了个人理性和集体理性的矛盾  如果A和B都选择抵赖  各判刑1年  显然比都选择坦白各判刑8年好得多  当然  A和B可以在被警察抓到之前订立一个"攻守同盟"  但是这可能不会有用  没有人有积极性遵守这个协定

 

抱歉!评论已关闭.