现在的位置: 首页 > 综合 > 正文

软件随想录之囚徒的困境

2013年08月21日 ⁄ 综合 ⁄ 共 1048字 ⁄ 字号 评论关闭

      最近在读软件随想录这本书,关于书本身在这里就不多做介绍了,今天主要是想介绍一下书中所提及的囚徒的困境问题。

作者Joel在讲管理方法时讲了三种方法,分别是军事化管理法、经济利益驱动法及认同法,其中在讲军事化管理法时举了这样一个例子:士兵在军队中有几条要遵守的规矩。规矩一:如果发现周围有地雷,就要立刻停止不动;规矩二:遇到敌人袭击时,就要一边开枪,一边冲向敌人。

      好了,有一种情形就是当你们发现周围有地雷,这时有人开始朝你们射击,你们应该怎么做?这并不是一个假设中才存在的情况,标准的正确答案是,不要去想地雷,一边开枪,一边朝敌人冲过去。

      这是因为,如果静止不动,那么敌人会一个接一个地把你们打死,直到所有人死光。但是,如果你们发起冲锋,那么只有一部分人会触雷而死,两害相权取其轻,所以正确的做法是后者。

      问题在于,如果一个士兵有头脑,他就不会在这种情况下发起冲锋,每个士兵都有巨大的动机作弊,自己保持静止不动,让其他更加英勇无畏的士兵去冲锋,这就有点像囚徒的困境了。

      “囚徒的困境”是“博弈论”中的一个经典问题,它的经典形式是,警察抓住两个罪犯,但是证据不足。如果两个人都不认罪,就都将被拘留一年;如果一人认罪并检控对方(背叛),另一人不认罪,那么前者将被释放,后者将获得10年刑期;如果两人都认罪,将各获得5年刑期。

       囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

  若对方沉默、背叛会让我获释,所以会选择背叛。

  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。

  这让我想到最近正在研究的软件过程度量的问题,由于度量的目的是改进,所以度量指标必须要公开,然而,对于一个企业来说,当你引入新的度量考核策略时,会有两个阶段的发展,第一阶段,你实际上得到了你想要的东西,因为还没人想出作弊的方法。但是,到了第二阶段,你实际上让事情变得比原来更糟,因为每一个人都想出了如何将你度量的指标值最大化的对策,即使代价是毁掉公司,他们也在所不惜。

抱歉!评论已关闭.