囚徒困境,据说是博弈论中最棘手的难题,无人可破!

不过,这个世纪难题却被一个英国小伙用1句话给轻松破解了,并且豪取28万人民币的奖金。



01、什么是囚徒困境?

囚徒困境,是1950年美国兰德公司提出来的,并以故事的形式进行阐述:

两人因合伙盗窃杀人被逮捕,警方将他们两人分开进行审讯,并给了他们3个选择:

  • 1、如果两个人都抵赖,各判刑1年;
  • 2、如果两个人都坦白,各判刑8年;
  • 3、如果其中一人坦白,坦白者会被释放,抵赖者则会判刑10年。

很明显,两个囚徒都面临着两种选择:坦白或者抵赖。

由于两人处于隔离状态,并不知道同伙会如何选择,那么,他们就只能基于人性的自私,而去断定同伙肯定会去对其来说最有利的方式:坦白!

既然同伙坦白了,那么自己抵赖就会被判10年,太亏了。于是,他自己也会选择坦白——最坏也是8年,如果运气好,还可能直接释放。

这样一来,每个人都这样猜想对方,那么他们最终的结果就是都坦白,同时被判刑8年。



02、英国小伙破解囚徒困境的神操作!

囚徒困境充分利用了人性的自私,基本无法破解。

不过,《墨菲定律》一书中有一个经典案例,讲述了如何破解这个棘手的难题。

英国BBC公司曾经有个老牌奖游戏节目叫作《金球》,节目开始有四名选手参加,然后淘汰到只剩下两名选手来角逐一笔巨额奖金。角逐环节是这样的:

主持人给每个人两个球,其中一个写着“平分”,另一个写着“偷走”,两名选手需要从中选择一个球。根据两个人的选择,会出现三种情况:

  • 1、两个人都选择了“平分”,那就两个人平分全部大奖。
  • 2、如果一个人选择“平分”而另一个人选择“偷走”,那么选择“偷走”的人拿走全部奖金,选择“平分”的人出局。
  • 3、如果两个人都选择了“偷走”,那么两个人同时出局,一分钱都拿不到。

在做出各自的选择前,两个人可以互相商量,但是最后选择的时候必须单独选择。



这是一个典型的囚徒博弈游戏,相当于两个人在被捕前串供,但审讯时仍然隔离囚禁。

在这个规则之下,常常会出现这样的情况:

其中一人信誓旦旦地保证自己一定会选择“平分”, 同时让对方也选择“平分”,这样两个人就可以平分奖金。

但事实上,到最后选择时,他一定会选择“偷走”,而另外一个人不相信他,也会选择“偷走”,于是两人全部出局。

这个节目,将囚徒困境玩到了极致,一度没有任何选手成功拿走奖金。

直到,一个名叫尼克的小伙走了进来。



尼克在那期节目中运气不错,杀入了最后的角逐,当时的奖金金额是66885英镑,折合人民币57万。

尼克与自己的对手亚伯都很激动,亚伯与以往几期的选手一样,向尼克保证自己一定会选择“平分”,恳请尼克也选择“平分”。

然而,令亚伯没想到的是,尼克非常的强硬地表示自己一定会选择“偷走”!

听到这话,不仅亚伯懵逼了,就连主持人和观众都傻了。

这哥们儿,咋不按套路出牌呢?

而且,你TM这样直说选择“偷走”的话,别人还怎么跟你玩儿?

这不是同归于尽的打法吗?



不过,尼克又补充了一句,说道:“亚伯,我发誓,我一定会选择‘偷走’。不过,只要让我拿走这笔钱,我也一定会在节目结束后和你平分!”

亚伯当然不可能就这样信任陌生的尼克,气得大骂尼克无耻,但尼克就是丝毫不肯让步。

这样一来,亚伯就只剩下两种选择:

  • 选择“偷走”,两个人都拿不到钱;
  • 选择“平分”,尼克拿走全部奖金,但是有可能会在节目结束后与自己平分。

无奈之下,亚伯只能选择更好的选项——“平分”,至少还有可能拿到一半奖金。

而尼克的选择却出人意料,并没有像他之前强硬表示的那样选择“偷走”,而是同样选择了“平分”。因此,两人平分了奖金,各自赢走了相当于28万人民币的奖金。



03、囚徒困境的破解之法

由于囚徒困境是基于人性里最自私的一面而难以破解,因此有人曾经说自己找到了破解囚徒困境的方法,那就是学着信任别人。

很明显,这是一个伪命题!

正所谓害人之心不可有,防人之心不可无。

除却至亲之外,人们是很难完全相信他人的,更别说陌生人了。因此,“信任”这个方案根本就行不通。

而《墨菲定律》中给出了真正的破解之道,那就是反复博弈!



反复博弈是相对于单次博弈来讲的,也就是说要“囚徒”双方在一次博弈之后,还要继续发生别的关系,进行再一次的博弈。

就拿上面的案例来说吧,当场选择是“平分”或者“偷走”是单次博弈,彼此无法信任。但是,当尼克说出自己一定会选择“偷走”、同时承诺会在节目之后再分给亚伯时,双方就注定了将会继续发生关系,那么,亚伯就有了更理智的选择机会。

同样的,就囚徒困境里的那两个囚徒来说,他们若只是单次选择当然会自私的选择“坦白”。但是,如果他们身后都有更大的势力背景,担心会被对方势力报复的话,他们就不得不考虑将来的关系发展,不敢再自私的出卖对方,而同时选择“抵赖”,那么,他们就都只需要坐1年牢就够了,而这就有了最佳选择。



其实,日常生活中也有类似的场景——

比如你和同事由于某种原因要去揭发领导的错误,你们虽然约定好了,但其实已经陷入了囚徒困境——虽然你们很清楚一起去揭发肯定会得到最大的利益和最好的结果,但是,你们无法完全信任对方,于是就会犹豫,最终可能都不会去这样做。

这时,你们就需要引入“重复博弈”来确保这个约定能够生效,比如你们可以威胁对方,或者说如果有人背叛将会被供出来。

如此一来,你们就注定还要继续发生别的关系,眼前的囚徒困境自然而然就被破解了。

结语:

囚徒困境其实在日常生活中比比皆是,我们一定不能局限于当前,而应该将单次博弈扩展,如此才能得到彼此的绝对信任,达成最好的结果。

ad1 webp
ad2 webp
ad1 webp
ad2 webp