以下是几种经典的博弈论现象:
囚徒困境现象
两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。
这个时候如果你是囚犯,又无法信任对方,你会怎么选呢?
我们把它做成图表,就更容易看了:
由上可知,除非两人都选择沉默,达到对彼都最优的结果。否则其他情况都是自己坦白比沉默来的利益丰厚,而且对方也是面临这样的选择,因此,无论是是避免对自己最坏情况发生,还是博取最好的情况,两者都会选择背叛,最终结果是彼此服刑八年。相对于双方沉默换取的1年刑期,可谓大大的不智。
那么如何避免呢?而不是仅仅彼此指责,原来你是这样一个同伙儿。现实中的如果加上另外一些限制手段那就更好了,比如说两个囚犯有小弟,谁背叛了对方小弟就会砍死谁,那么这个额外的惩罚手段就会使得双方达成彼此宝贵的沉默。
自己也成为囚徒困境中的一方,想要不被背叛,那就增加对方沉默所得利益,背叛付出的代价吧。
“一报还一报原则”导向合作
一次囚徒博弈可能会造成双输的局面,但是如果是多次囚徒博弈,尤其是不限次的囚徒博弈,则不然。由于前次的抉择彼此双方都能知晓,那么第二次囚徒博弈之后,被背叛的方会选择报复,因此,为了避免报复,双方就会形成攻守同盟,达到帕累托最优。
当然前提是坚守“一报还一报”原则,沉默回报以沉默,背叛回报以背叛,只有如此,这个帕累托最优才会达成,如果没有奖惩制度,背叛无代价,同盟无奖赏,只会换来对方的背叛而已。
在这个次数不可预先知道的情况下,的确如此。但如果多次囚徒博弈的次数是限定的,依然有可能导向最坏结果。假如为三次,最后一次选择之后,无论什么选择都不会受到奖赏,遭到报复。博弈的情况又会回到单次博弈上,知道第三次注定要背叛之后,第二次博弈会率先背叛对方以报复之,同理,第一次的结果只能导向彼此背叛。因此,报复必须延续下去,任何一次背叛都有可能遭到背叛,才有可能让合作继续下去。
这也解释了为何人类有着极度利己精神,人类社会的合作能够达成。如何善用奖惩措施,引导每个人的利己心理向着最优结果,成了领导者考虑的问题。
智猪博弈
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。
大猪、小猪彼此之间博弈的成果,做成图表如下:
由图表可知,小猪等待的收益要高于行动的收益,小猪最好的策略就是去等待。这解释了为何现实中有些人即便什么都不做也能收获更多,作为领导者,除了设计制度避免员工当中智猪博弈情形诞生,在参与竞争过程当中,也应当尽量成为小猪,而非大猪。
“市场进入阻挠”博弈
上面两个例子多少有点离商业远,那么就来个产业经济学的经典例子——“市场进入阻挠”。假设一个领域已经有垄断者了,这个时候如果你想进入这个领域,和他竞争,是进还是不进呢?或者说如何以最小成本进入这个领域?
假设垄断者垄断的时候收益300亿,被你进入这个领域后,和你一起赚100亿,每人50亿。你进入这个领域成本是10亿元,同时,垄断者选择阻止则会损失300亿。
那么,是进入还是不进入呢?这里要涉及到纳什均衡概念,所谓纳什均衡,即同一时间内每个参与人的策略是对其他参与人策略的最优反应。垄断者由于选择阻止将利润损失殆尽,那么其就只会选择默认,你只需要进入即可,无需考虑垄断者会阻止而带来的损失。
以上是完全信息之下的纳什均衡,但在现实当中,这种完全信息几乎不可能存在,那么就需要考虑垄断者阻止带来的影响。
假设你现在知道垄断者阻止你可能会损失300亿,但这个不确定。你只知道垄断者有一定的概率会阻止你,这个概率为X,那么默认的概率就是1-X。
那么,你进入这一领域,可能获利为40(1-X)+(-10)X。只有当该X<0.8时,进入的收益才会大于不进入的收益。依据公式,你将得到最优决策。
现实商业活动和管理行为当中的决策当然更加复杂,也拥有更多不确定性,但将其还原为数字,得到最优解,将有助于获取己方利益最大化。