发新话题
打印

【经典博弈论】囚徒困境

【经典博弈论】囚徒困境

今天开始,普及趣味博弈论!

最经典的:囚徒困境

A和B合伙抢了银行,被抓获。他们被关进分隔的牢房。检察官分别告诉他们:如果两人都不坦白,他们会因非法携带枪支的罪名各判刑1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判10年;如果两人都招供,则两人都会以抢劫罪名各判8年。故事的结果是什么呢?两个人都招供了。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
   
囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

现实的例子

上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:

政治学例子:军备竞赛

在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。

经济学例子:关税战

两个国家,在关税上可以有以两个选择:

提高关税,以保护自己的商品。(背叛)

与对方达成关税协定,降低关税以利各自商品流通。(合作)

当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)

商业例子:广告战

商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。

此二公司可以有二选择:

互相达成协议,减少广告的开支。(合作)

增加广告开支,设法提升广告的质量,压倒对方。(背叛)

若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。

自行车赛例子

自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文eloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。

与囚徒困境相关的各事件

异想

威廉·庞德斯通(William Poundstone)在他的著作中,以一新西兰的例子来说明囚徒困境。在新西兰,报亭即无管理员也不上锁,买报纸的人自行放下钱后拿走报纸。当然某些人可能取走报纸却不付钱(背叛),但由于大家认识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。这例子特别之处是新西兰人并没有被任何其他因素影响而能脱离囚徒困境。并没有任何人特别去注意报亭,人们守规则是为了避免共同背叛带来的恶果。这种避免囚徒困境的大家共同的推理或想法被称为“异想(magical thinking)”。
  
“认罪减刑”不可行

囚徒困境的结论是许多国家中认罪减刑(英文:plea bargain)被禁止的原因之一。囚徒困境带来的结论是:如果有二个罪犯,其中一人犯罪而另外一人是无辜的,犯罪者会为了减刑坦白一切甚至冤枉清白者(单独背叛)。最糟糕的情况是,如果他们二人都被判入狱,坦白的犯罪者刑期少,坚持无罪的冤枉者刑期反而更多。

公用品悲剧

现实的博弈参与者不只一方,会有多方参与的囚徒困境。加勒特·詹姆斯·哈丁(Garrett James Hardin)的公用品悲剧就是一例:“公用品悲剧是指凡是属于最多数人的公共财产常常是最少受人照顾的事物”,例如渔业,公海中的鱼是属于公共的,而在本身不滥捕其他人也滥捕的思想下,渔民会没有节制的大捞特捞,结果海洋生态破坏,渔民的生计也受影响(共同背叛的结果)。但是,多方囚徒困境的提法有待商榷,因为其总是可以被分解为一组组经典的二方囚徒困境。就是说只有二方的囚徒困境,没有多方的。所谓多方的囚徒困境只是由多个二方囚徒困境混杂在一起而形成的错觉。

引用 回复 TOP

觉得我们的生活里面还是要有一些策略,为了方便大家,决定只是介绍博弈论里面的经典模型,加上现实案例,培养大家的这种感觉。
孙子曰:不战而屈人之兵,善之善者也!
我们不必研究诡谋太多,但是要有策略意识,尤其现实生活中。另外大家要沟通。为什么世界变得这样呢,首先一个就是个人理性与集体理性之间存在矛盾。亚当斯密说个人理性最终会带来社会的利益最大化,但是在纳什均衡博弈中体现出来,真的很可怕。

引用 回复 TOP

同时预告一下,下期要讲的是“智猪博弈”,哈哈,猪猪们,等着!

引用 回复 TOP

其实呢,博弈论涉及很多的数列矩阵,但是嫌麻烦,而且主要是讲应用,所以不排列,贻笑大方之家,万望海涵!
学过一点对策论,也耳闻过一点,博弈论是与亚当斯密的理论有冲突的,就是个人理性会造成群体的不理性失衡,而不是像亚当斯密说的那样个人理性造成社会极大繁荣。
不是很明白纳什均衡,是不是就是每个人的最佳策略组合,但是显然这不是这个局的最佳方案。
而且那时候学习的时候的确是线性代数,一大堆数字。。。
无言独上西楼,看天下几多哀愁!
倚栏凭吊千古,思世间百千黄土!

引用 回复 TOP

发新话题
查看积分策略说明

快速回复主题

选项

[完成后可按 Ctrl+Enter 发布]  预览帖子  恢复数据  清空内容

Google
 
重点推荐:华人门户 | 华人论坛 | 美国新闻 | 美国旅游 | 美国签证 | 美国大学 | 美国移民 | 美国留学 | 美国公司 | 华人社区 | 美国文化 | 贸易论坛