博弈论究竟是什么

博弈论不是“三十六计”

计谋和战略

《三十六计》里的计谋,本质上都是骗术——自己要做A,就让对手以为自己要做B;不希望对手做C,就吸引对手去做D。

诡计的三个问题
  1. 诡计都有巨大的风险。要想诡计成功,不但必须严密封锁信息,而且得假设对手是比较愚蠢的。
  2. 不能长期使用。
  3. 它们都是“零和游戏”

什么是理性

博弈论假设人是理性的,表现为三个要求:

  1. 你得知道你想要什么,并且对你想要的东西有一个明确的排序。
  2. 你的行动是在一定的规则之下,争取到你想要的东西。
  3. 你知道对手也是这么想的,而且对手也知道这些规则。

如果一个现象长期存在,那就有可能是博弈论的研究内容——博弈论称之为“均衡”。

博弈论的用处

博弈论能帮助我们理解长期存在的各种现象。如果你观察到社会上很多不合理的现象,而这些现象还长期存在,博弈论就会帮助你考察现象背后的博弈规则。

博弈论更重要的作用,是告诉我们如何改变不好的局面。

对个人来说,最基本的一点是你应该时刻提醒自己要理性。研究博弈论就像下棋,你要考虑自己的每个行动都是有后果的,要事先想好对方会有什么反应,然后你再怎么应对,然后对方再反应······一直到最后会是什么结果。

更深层的意识是,你应该先做一个“player”,有一点参与游戏的精神,你就有权在规则范围内采取对自己最有利的行动。你就是积极主动的,你就会平等对待对手——你就既不是一个浑浑噩噩整天根据别人设定做事的人,也不会有整个世界绕着自己转的错觉。

群鸦的盛宴

博弈论的三个基本概念:“帕累托最优”(Pareto Optimality)、“压倒性策略”(Dominant Strategy)和“纳什均衡”(Nash Equilibrium)。

为什么商家总扎堆

博弈论要求你必须考虑竞争对手会怎么做。

帕累托是一位意大利经济学家,帕累托改进的意思是这个改进能在不伤害任何一个人利益的同时,使至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地了,这个局面就叫帕累托最优。

只有稳定的局面才能长久存在。

囚徒困境

博弈论要求我们每次做判断都要考虑对方——不是考虑怎么对对方好,而是考虑对方会怎么做,然后你应该怎么应对。

压倒性策略,这个策略压倒其他一切策略,不管对手怎么做,这个策略对你来说都是最好的。

作为一个理性的人,如果博弈中有压倒性策略,就一定要选它。任何情况下都不要选择被压倒性策略。

纳什均衡:在这个策略组合里,没有任何一方愿意单方面改变自己的策略。

如果一个现象能够在社会中长期稳定地存在,它对参与的各方来说就一定是个纳什均衡。纳什均衡告诉我们评价一个局面不能只看它是不是对整体最好,它必须得让每个参与者都不愿意单方面改变才行。

理想青年喜欢帕累托最优,理性青年寻找纳什均衡。

秦朝人的游戏

理想青年一边赞美百家争鸣一边感叹背叛和杀戮,而理性的你知道此局无关文明和民主,只是一场权力的游戏。

以和为贵

博弈论研究的一般都是“非合作博弈”,参与者并不是心往一处想劲往一处使齐心合力办大事,每个人想的都是怎么让自己赢。博弈论的出发点虽然是非合作的,结果却可以达成合作。

博弈论研究的合作可不是要进行“思想道德教育”,去劝人行善,也不是让一个强权去管制人民,而是寻求能让人自愿合作的机制。

好的合作,一定是个纳什均衡。

聚焦点

聚焦点就是在众多可能的纳什均衡中最显眼的那一个,人们会自动在这一点上达成合作。聚焦点的作用是协调。

生活中的聚焦点

有些聚焦点是设计出来的。比如科技产品的“标准”这一聚焦点,就是设计出来的。对所有参与者最有利的局面,就是有标准。这个标准具体是什么其实并不那么重要,重要的是必须得有标准。

有些聚焦点属于历史路径依赖。比如度量衡,历史上用公制现在就用公制,历史上用英制现在就用英制,很难说哪个系统更科学。

有了聚焦点思维,我们就应该在没有聚焦点的时候主动提出一个聚焦点,促成合作。

聚焦点的最大价值就是它的存在本身。

聚焦点能发挥这么大的作用,还得有一个关键的前提,那就是各方没有根本的利益冲突。我们都希望能促成这次合作,我们需要解决的只是在哪里合作的问题。

谈判中的聚焦点

想要合作的人们需要聚焦点,只要你能找到借口,任何借口都可以是聚焦点。借口可以发挥很大作用的根本原因是大家本来就想促成这次合作。

事实上,即便上有一定的利益冲突,只要合作的愿望大于冲突,我们还是可以使用聚焦点。

实在不行······就抽签吧

如果各方都有强烈地合作愿望,而博弈存在多个纳什均衡,我们要做的就是找到聚焦点。聚焦点可以是生活习惯,可以是历史传承,可以是先下手为强,可以是政府指导,也可以是随便找到的什么借口,实在不行还可以抽签。

聚焦点和锚定效应有什么区别

聚焦点是双方越熟悉套路越容易达成合作。锚定效应是对方越不熟悉业务越可能有效。

不纵容,但要宽容

要想防止背叛,最直接的方法就是把单次博弈变成重复博弈。重复博弈之所以有效,是因为背叛者会受到惩罚,最直接的惩罚就是下次我也背叛你,让你得不到合作的好处。

美国往事

一群人要想合作,至少要满足以下两个条件中的一个

  1. 合作对自己有好处,人们本来就想合作。
  2. 不合作会受到惩罚。

有效的惩罚需要满足的条件

  1. 能发现背叛行为;
  2. 惩罚必须是可信的,对方知道一旦背叛就一定会受到惩罚;
  3. 惩罚的力度是足够的。

稳定和脆弱

利益和惩罚只是用作约束的硬条件。如果内部没有起码的信任,合作就是脆弱的。

很多帕累托最优的局面是不稳定的,所以不可能长久存在。纳什均衡之所以如此重要,就是因为它是一个稳定的局面。

以牙还牙真的好吗?

囚徒困境下收益最大的策略是以牙还牙的策略。

以牙还牙策略(Tit for Tat)

  1. 不管跟谁博弈,第一轮我都选择合作。
  2. 第一轮过后,我就复制对手上一轮的做法。

仔细分析一下以牙还牙的策略,有意思的一点在于它和任何一个对手博弈的时候,最多情况下是打成平手的,只会让从始至终选择背叛的对手比它多占一轮的便宜。可就是这样,最后算总账的时候,它的收益会超过其他人——因为它既不当冤大头,也不作死。

以牙还牙其实是一个脆弱的策略。这个策略对错误很不友好。

在真实世界中,以牙还牙并不是最好的策略,它还不够宽容。博弈论专家提出过一个改进版的以牙还牙:对方背叛我一次,我继续合作;对方连续背叛我两次,我再报复。研究表明,在有可能出错的博弈中,这个办法的效果比以牙还牙更好。

真实生活中别人可能犯无心的错,你也可能误判。中国人有句话叫“退一步海阔天空”,强人通常不喜欢这句话,但是其实这句话很有道理——宽容能避免脆弱。不过请注意,这句话的关键是“一步”。退一步是宽容,退两步就是纵容了。


博弈论究竟是什么
http://blog.chcaty.cn/2021/09/10/bo-yi-lun-jiu-jing-shi-shi-me/
作者
caty
发布于
2021年9月10日
许可协议