新国大傅强教授：一篇文章读懂博弈论精华

01 博弈论的由来

何为博弈论？

首先，我们来追根溯源，对博弈论做一个简单的介绍，什么是博弈论？Stanford的经济学家David Kreps对博弈论做过一个非常精准的概括，他说，博弈论是有关情境的知识。博弈论就其本质而言，是研究人的决策，我们无时无刻不面对决策。博弈论的基本前提在于，决策的正确与否，什么是最优选，并不仅仅依赖于自身的行动本身，更在于所处的情境。简而言之，我需要做什么，应该做什么，取决于你在和谁打交道，他们在做什么，会做什么。

2005年的诺贝尔经济学奖得主Robert Aumann曾经给博弈论下了一个简单但是非常精当的定义，他说，博弈论是互动的决策科学。所谓互动，就是指这个情境的参与者，他们的行动和决策会互相影响，所以我要做出最优的选择，必须要考虑对手的行动和反应，主体之间相互依存，相互影响。

所谓博弈二字，中文的原意指的就是棋局，下棋，就是一种在互动中进行决策的情境。我们经常讲人生如棋，这样的场景，其实无处不在，夫妻，亲子，企业竞争，大国外交，其实莫不如此。博弈论因此有非常丰富的应用场景。

己欲立而立人，己欲达而达人

博弈论带给我们的最大价值，是带来一种处事和思考的方式。你如何制定你的决策，不是依靠教条，重要的是去认识自己的对手，理解对方的行动逻辑，要希望达到自己的目的，希望实现自身利益的最大化，就要学会从别人的角度来考虑问题，也就是我们经常所说的，换位思考。一厢情愿可能处处碰壁，相反，在很多的时候，己欲立而立人，己欲达而达人。比如说，你要员工为你死心塌地干活，首先就要想清楚人家想要什么，这样才能有的放矢地提供激励。就像胡雪岩说过的一句话，前半夜想自己，后半夜想别人。

这样的一种思维方式，就是所谓的策略性思维。策略性思维并不是博弈论的发明，博弈论的贡献，就是以这样一种古老的智慧，对复杂的互动决策问题进行科学系统的分析和研究。

博弈论之父——冯诺伊曼

现代博弈论的鼻祖，被公认为冯诺伊曼。可能很多从事不同领域工作的朋友都听说过这个名字。冯诺依曼是匈牙利裔的犹太人，被广泛认为是有史以来最聪明的人。在1944年，冯诺依曼和摩根斯坦合作写了一本书，叫《博弈论与经济行为》，这本书被认为代表了现代博弈理论的兴起，所以冯诺依曼也是博弈论之父。

冯诺依曼对博弈论产生兴趣，他的灵感来自于他的一个业余爱好，就是打扑克。他非常喜欢打牌，而且打牌的时候非常喜欢算牌，但是很不幸，表现非常非常糟糕。后来有一天，他痛定思痛，概率不是打牌的全部，如何出牌不仅仅取决于算准牌面，更要读懂人心，实现对对手的洞察和操控，这就是我们所说的策略，于是开始从事对策略的研究。对于冯诺依曼而言，这项研究几乎就是一个茶余饭后的闲情逸致，但是博弈论在几十年以后改变了当代经济学的研究范式，而且在二战期间，他以博弈论为基础建立了战争分析模型，为盟军出谋划策，推演战局发展。二战之后，他又建立了美苏互动的模型，预测冷战的发展。但是，我需要告诉大家的是，博弈论起源于扑克，基于博弈论的模型让他能指点江山，预知天下兴亡，但是在牌桌上，他还是没能占到什么便宜。几十年以来，有很多数学家和计算机科学家希望借助基于博弈论模型的计算找到打牌的最佳策略，但是努力收效并不显著，并不能从职业赌徒身上占到便宜。

讲这个故事，我想要告诉大家两件事：

01 第一，我们要充分认识世界的复杂性；

02 第二，博弈论从技术角度，是数学的应用，但是博弈论来自于人的策略性思维。策略的智慧源远流长，根植于我们的DNA。比如这些职业赌客，他们没有正经地学习过博弈论，但是他们其实已经在实践复杂的策略判断，而博弈论的作用，就是对策略思维的智慧进行系统化，删繁就简，从复杂的现实中抽象出简单的模型，帮助我们把握决策问题的关键。

John Nash与纳什均衡

早期的博弈论是非常抽象的，对于绝大多数人是完全摸不到头脑的，很难广泛应用于具体的场景。我们要说的下一个人，就是John Nash，也就是美丽心灵《Beautiful Mind》这部电影的主人公原型。一个游戏，或者说一个互动的情境，最终会演变成一个什么样的结果，如果对此做出合理可靠的预测，用经济学的术语而言，什么样的结果可以构成一种均衡？John Nash给出了答案，他提出了一个概念，叫做纳什均衡，成为博弈论分析的基石，博弈论也因此被广泛应用，彻底改变了经济学和国际关系研究的方法论。

纳什均衡这个概念，帮助我们对一个博弈的结果做出可靠的预测，它告诉我们什么样的发展才具有稳定性，是一个均衡。

所谓纳什均衡，就是说，当局中的每一个行动主体，给定其他人策略，都已经不能通过单方面的策略改变而实现额外的收益。也就是说，每个人的策略选择都已经实现了自身利益的最大化，因此每个人都没有改变现状的积极性，这样的局面就在互动中实现了平衡。

02 静态博弈经典情景之一

囚徒困境

我们先来看一看著名的囚徒困境。有两个犯罪嫌疑人，A和B，涉嫌共同作案。警方怀疑他们作案，但是并没有确切的证据，所以最终的量刑要取决于供词。如果两个人都招供，会各判六年；如果两人都不招，没有足够证据，只能以请罪提控，各判一年了事。警方希望得到有利的供词，所以正确的做法，可能很多朋友知道，就是把两人分开关押，单独审讯。

警方可以对每一个人说，你有一个得到宽大处理的机会，如果你招供，你的同伴抵赖，恭喜你，你无罪释放，你的同伴从严处理，判十年；但是如果你讲义气，一旦你的同伙招供，那对不起，你就要把牢底坐穿了。

我们以这样一个矩阵，来表述这个情境。嫌犯甲，有上、下两个战略选项，招供或者抵赖。嫌犯乙，有左右两个选项，招供和抵赖，这个博弈，会有四个可能的策略组合或者结果，两人都招供，两人都抵赖，甲招供，乙抵赖，或者反过来，甲抵赖，乙招供。每格代表一个可能的结果，左边的数字，代表甲在这个策略组合之下获得的回报，右边数字代表嫌犯乙。比如说我们看这里，甲选择招供，乙选择抵赖，所以乙坐牢10年，甲可以无罪释放。

这样一个情境，最终的结果会是什么样的呢？我们先来看一看甲的权衡。他必须考虑乙可能的行动。甲会想，如果乙招供，那么自己没有理由死扛，最优选择一定也是招供；如果乙抵赖呢？甲是否应该与之统一战线？如果这样做，其结果自己会被判一年，如果选择招供，自己就可以全身而退，对于自己这显然有利，虽然这样坑了队友，是不是？

总结下来，在这个情境之中，对于甲而言，无论乙做什么，最优的选择，都应该是招供！甲会这样想问题，乙呢？乙所面对的权衡是一样的，甲会这么想，乙也会这样想，同时也会想到对方一定会招供。在这个情境里，招供是唯一的选择，这就做所谓的占优策略，就是不管对方怎么做，招供可以带来更高的回报。那么（招供，招供）这样的策略组合，我们看，就完全符合了纳什均衡的定义：给定其它参与人的策略，任何一个参与人不能通过单方面改变自己的行动获益，给定乙招供，招供是甲的最优策略；给定甲招供，招供也是乙的最优选择。我们就得到了这个博弈的唯一纳什均衡。

那么我请各位来思考一个问题。如果我们考虑两个人的总体利益，哪一个结果带来最高的回报？很显然，要最大化集体利益，应该是两人合作，坚决抵赖，这样的话警方也没有太好的办法。但是这样的结果不是一个均衡。囚徒困境，带给我们的这样的一种启示，个体与群体之间的矛盾。个体理性带来背叛的诱惑，个体的最优选择带来群体利益的损失，这就是所谓的囚徒困境。

千夫之诺诺

这样的场景其实在社会、在市场无处不在。我们来举几个例子。

大家可能听到过这样的故事，1956年苏共20大，赫鲁晓夫向大会代表作报告，系统批判斯大林，要求肃清个人崇拜的流毒。很多人都在心中质疑，你现在秋后算账，斯大林掌权的时候，你在干什么？所以有人从观众席递过来一张纸条，上面写着：当时你在哪里？赫鲁晓夫拿起纸条，念出了上面的内容，然后望向台下，喊道：这是谁写的，请你马上站起来。台下鸦雀无声，他又念了一遍，然后说：当时我就坐在你现在坐的那个位子上。我们看到，这也是囚徒困境的一种体现，一士之谔谔违背个体理性，千夫之诺诺才是纳什均衡。

为什么看不见的手会失灵？

亚当斯密在《国富论》中有这样一段经典描述：“当个人在追求他自己的私利的时候，市场看不见的手会导致最佳经济后果。我们的晚餐并不是来自于屠夫、啤酒酿造商或者点心师傅的善心，而是源于他们对自身利益的考虑。每个人只关心自己的安全、他自己的得益。他由一只看不见的手引导著，去提升他原先没有想过的另一目标。他通过追求自身的利益，结果也提升了社会的利益，比他一心要提升社会利益还要有效。”他告诉我们，受看不见的手的指引，个人的自利行为会带来互利，自由市场经济也因此变成了一种价值准则。但是博弈论在一定程度上，颠覆了亚当斯密以来的经济学道统，它告诉我们，个体理性与集体理性之间存在冲突，社会利益的损失，并不是由于个体决策的失误，恰恰相反，可能是个体理性的结果与反映。

旅行者困境

比如我们来看一看这样一个例子，叫做旅行者困境。两位旅行者从一个生产细瓷花瓶的地方归来，在当地购买的花瓶都在托运过程中摔坏了。航空公司需要赔偿，他们知道花瓶的价格应在八九十元左右，但不知道确切价格。怎么办呢？航空公司要求两位旅客各自在一百元以内写下花瓶价格，如果所报价格一致，以所报价格赔偿；如果不一致，以较低价格赔偿，并对报低价者奖励两元，以奖励其诚实，并对虚报者处以两元罚款。我们来思考一下，这个博弈的最终结果（纳什均衡）会是什么？

如果两个人都写100，就会是一个互利的结果，但这是一个均衡吗？假定我相信另外一个人会写100，我的最优选择不是100，我会想，我应该写99，这样我将获赔99，同时获得2元的奖励。但这是均衡吗？不是，因为我会这么想，我准备占他的便宜，我能想得到，他也能想到，他也会写99，给定他写99，我的最优选择应该是写98，这样最终我的实际获利就是100。但是这同样不是均衡，我知道这个道理，对方也可以，所以如果对方写98，我的最优就是97。这个故事最后如何收场呢？纳什均衡，只有一个，那就是都写0。如果另外一个人写0，我写任何的数字都不能得到赔偿，还要被罚款2元。航空公司一毛不拔，通过两个乘客的勾心斗角而坐收渔利，对于两个乘客这是最坏的结果，但其原因，并不是乘客的愚蠢，恰恰是他们拥有完全的个体理性。

这个故事略有夸张之处，它只是以一个极端的案例，说明个体利益的最大化往往结果事与愿违。我们看看现实中企业的价格战，互相压价倾销，明明知道会两败俱伤，还是欲罢不能。给定对手的价格，我稍微降一点价，损失一点单位利润，但是窃取了市场份额，但是一家企业这么想，其它企业同样不会坐以待毙，于是轮番降价，最后谁也奈何不了谁，利润拱手让给了消费者。

次贷危机，黑天鹅还是灰犀牛？

曾经有两本畅销书，一本叫《黑天鹅》，一本叫《灰犀牛》。黑天鹅指的是概率极低并不认为会发生但是会对市场带来深远影响的事件，比如次贷危机。而灰犀牛，指的是已知的风险，但是大家并不采取行动来防患于未然。这本书的开篇介绍了2001年阿根廷主权债券违约的事件，阿根廷面对经济灾难，债务难以为继，所以有识之士提出债务重组建议，债权人主动减记30%，实现软着陆，债券机构私下也都如此认为，但是不付诸行动，导致阿根廷违约，债权人损失70%。作者米歇尔沃克认为这是一种错误。

但是我们学过博弈论就会知道，这才是纳什均衡。给定其它债权人减记，阿根廷政府财务状况改善，那么我应该拒绝让步，其它债权人的牺牲，会让阿根廷政府有更大的财务空间来清偿对我的债务。如果其它债权人拒绝减记，那么阿根廷政府注定违约，我又为什么要做出牺牲？看似漠视风险的结果，其实恰恰是一种个体理性驱动的必然。

那么我们再来看看黑天鹅。在次贷危机之后，塔勒布的黑天鹅一时洛阳纸贵。但是次贷危机真的是不可知的黑天鹅吗？

次贷危机更像是灰犀牛，有很多经济学家和金融大鳄都曾经预测过崩盘的风险。花旗银行在次贷危机中损失惨重，但是花旗的前主席Chuck Prince早就公开预警，次贷市场的大规模崩盘可能波及其它证券市场，带来市场流动性的极度枯竭。甚至呼吁政府加强监管。但是，花旗无意撤出，他说，“流动性市场的深度前所未有。在某一时刻，流动性可能会转向流出市场，但是我不认为已经糟糕到了那个地步。”这是为什么？这同样是一种囚徒困境，给定其它机构仍然乐此不疲，如果撤出次贷市场，而危机没有发生，那就意味着机构的业绩下滑，个人声誉和收入都会受到损失；如果随大流，继续在次贷市场扎堆，即使危机发生，那也只不过犯了所有人都会犯的错误。我们看，我们看到的就是一个糟糕但是现实的均衡。Chuck Prince对此有一句名言，只要音乐响起，你就要跳进舞池。身在局中，身不由己。

03 静态博弈的经典情境之二

智猪博弈

我来介绍另外一个经典的博弈情境，这就是智猪博弈。猪圈中有一大一小两只猪。食槽在猪圈一侧，而另一侧则有一个控制饲料供应的踏板，必须要踩踏板，才有食物来，每踩一下踏板，将有十份饲料进槽，但是往返踏板与食槽需要消耗两份饲料所带来的热量。

每头猪需要选择是否要去踩踏板，如果小猪踩踏板，大猪先得到食物，大猪获得九份，小猪获得一份；如果大猪踩踏板，则小猪先得到食物，大猪获得六份，小猪获得四份。如果都去踩踏板，则同时得到食物，大猪可获得七份，小猪获得三份；如果都等待，则无食物。这个博弈最终的结果是什么呢？

我们来看一看，我们还是用2乘2的矩阵来表述这个博弈。大猪在上下之间做选择，踩踏板，或者等待。小猪在左右之间选，踩踏板或是等待。有四个可能的策略组合，在每格中，左边的数字代表相应的策略组合之下大猪的回报，右边的数字是小猪的回报。我们先来看一看，小猪应该怎么想。如果大猪去踩踏板，小猪应该等待，它不费事，还先得到食物，兵不血刃吃到4份；如果大猪等待呢？小猪如果去踩，花费了力气，等到跑回来，大猪已经吃了九份了，自己只吃到1份，还消耗了相当于两份饲料的热量，这是不是得不偿失？还不如自己也等待。

所以我们看到，无论大猪做什么，小猪都应该等待，这是它的占优策略。那么给定小猪一定会等待，大猪做什么？如果大猪也按兵不动，那就没得吃，如果大猪花点力气，虽然让小猪占了便宜，自己还是有得吃。所以智猪博弈有唯一的均衡结果，那就是大猪做贡献，小猪占便宜。

大家看，这个情境，和刚才的囚徒困境有所不同。在囚徒困境中，人人都想占便宜，个体理性带来集体的损失。在这个智猪博弈之中，虽然大猪小猪也心怀鬼胎，但是最终的结果，其实是皆大欢喜，实现了效率。

那么，这和囚徒困境的根本不同在哪里？

在这里，博弈的参与人，有大有小，是非对称的，大小不同，激励和行为也就不同。

欧佩克的减产博弈

我们来举一个例子，OPEC，或者OPEC+，是石油出产国的一个共谋机制，他们订立协议，限制产量，来支持石油价格。在理论上，这类操纵市场的共谋机制是非常难以维持的，还是那句话，个体是自利的。我们订好协议减产，我回去就要琢磨琢磨，我要不要遵守协议呢？给定别人都在减产，那么油价就会推高，那么我的最优选择，可能就是偷偷增产，单位利润增加，卖得还更多，这个诱惑必然存在，这个价格共谋可能就会瓦解。

那么OPEC+为什么可以长期存在呢？就是因为这里有沙特，以及俄罗斯这样的大户，我们从这张图中可以看到，就是沙特与俄罗斯承担了减产的主要责任。它们默许小国作弊，多生产一些，并不影响大局，自己的市场份额大，减产支持价格的大头还是落在自己手上；相反，如果沙特、俄罗斯也像科威特一样作弊，价格可能一泻千里，最后吃亏的还是自己。

要想富，谁来修路？

这样的情境，在现实生活中也同样非常普遍，比如说，我们来想一下。一个村里，有富人大户，也有升斗小民，现在说，咱们来集资修条路吧，修条路咱们就可以往城里卖土特产了。这个故事的结局，我相信大家都想得到，那就是富人出钱，穷人沾光，道理非常简单，修了路，富人从中获利更多，路修不起来，损失自然也更大。所以，我们看啊，在社会上要实现合作，避免囚徒困境，有一个可能的途径，就是找一个老大，来贡献公共资源。

大猪的无奈：

全球多边经济治理体系为何面对分崩离析？

比如基辛格就讲过，“几乎是某种自然定律，每一世纪似乎总会出现一个有实力、有意志、且有知识与道德动力，希图根据其自身的价值观来塑造整个国际体系的国家。”（亨利·基辛格，《大外交》）。20世纪50年代以来，这个大猪，就是美国，美国的一家独大，在很大程度上，有助于多边国际治理体系的稳定和效率。美国经济地位的相对下滑，和经济重心的多极化，也在一定程度上造成当今国际治理体系的举步维艰，带来了三个和尚没水喝的局面。

04 动态博弈

倒推法的思维方式

狭路相逢的三个抢手

我们下边再来介绍另外一种场景。有三位枪手狭路相逢，A有80%的命中率，B有70%的命中率，C有50%的命中率。如果三人同时开枪射击，请问谁的存活概率最高？是枪法最好的A吗？事实上，不是。我们来看一下三个人在第一轮射击中的目标选择。对于A而言，最好的选择是B，如果可以击中B，自己活下来，那么下一轮面对的就是C，这是一个更容易对付的对手。但是对B，他的目标一定是A，如果自己活下来，而A被击中，下一轮的对手就是C。那么对于C，这个问题很简单了，他的目标也是A，如果自己活下来，而A被击中，下一轮的对手就是B，这总会更容易一些。所以我们看，这一轮乱射之后，C100%可以存活，B活下来的概率是15%，那么A呢？B和C两个人都没有打中的概率，是15%。最强者存活概率是最低的，因为他是众矢之的。

如果我们把这个场景变个花样，让他们轮流开枪，假定C先动，B其次，A最后。那么对于C，最优的选择是什么？

在这个场景之下，参与人轮番出手，每个人都可以观察到对手过去的行动，这就与刚才我们所说的静态博弈有所不同了，行动有次序，这就是所谓的动态博弈，或者叫做序贯博弈。我们就必须采用一种新的分析思路。

其实我们下棋，就是一种动态博弈，双方交替进行。如何落子呢？我小时候下棋，长辈告诉我一句话，叫下棋要看三步，就是要有前瞻性，我权衡我的选择，我必须要预见，我走出一步棋，对手会如何反应，我必须把我自己代入对手的情境，预计对手对我所有可能的行动会做出的最优反应，再回到当下做出抉择，确保我的行动引导对手做出对自己最有利的应对。我们下棋是不是就是这样下的？

这样的思考方式，就是所谓的倒推法，即从动态博弈中的后动者出发，分析他在各种可能情境中的最优应对，再回到先动者，其选择要考虑后动者的应对，来寻找最佳的方案。

我们就用这样一种思维方式来考虑一下这个轮流射击的场景。三人中最后一位出手的是A，我们应用倒推法，如果他有机会出手，他的最优选择必定是向B开枪，因为B在未来给自己的威胁更大。那么我们回到B，如果B有机会出手，他的选择一定是A。那么我们回到C，这是第一位行动人，他预见到两位最强者会以各自作为目标，他的最优选择是什么呢？他必定要最大化B和A交火的机会，所以他最优的做法，就是朝天开枪。

三国夷陵之战：黄承彦为何救陆逊？

我讲两个大家熟悉的故事，都来自三国演义。第一个，是刘备伐吴，夷陵之战，火烧连营，蜀国几乎全军覆没，东吴的陆逊率军一路追击到鱼腹浦，被诸葛亮的八阵图困住，几乎要命丧其中，被诸葛亮的岳父黄承彦救出，陆逊率军班师。那我们就要问一个问题了，黄承彦为什么要救陆逊呢？我们来看一看这个选择是否是理性的。我们不要忘记这个博弈之中，还有一位参与人，就是魏国。救还是不救，需要考虑此后魏国的应对。蜀国此时已经是风中残烛。如果不救，吴国同样元气大伤。那么魏国必定挥师南下，两败俱伤的蜀吴没有还手之力。救下陆逊，就是帮助吴国保存实力。吴国不敢进一步紧逼，螳螂捕蝉，还有魏国黄雀在后；魏国的战略重心也必定转向吴国。救下吴国，其实最大化了蜀国的生存几率，在绝境中维护了三足鼎立的局面。

空城计：司马懿的博弈策略

另外一个故事，就是空城计。司马懿真的被诸葛亮的虚张声势唬住了吗？这是一种解释，我们还可以有另外一种解释。这个博弈中还有一个隐性的参与人，这就是魏明帝曹叡。那么对于司马懿而言，面对摆出空城计的诸葛亮，进还是退，必须考虑将来曹叡的反应。曹叡猜忌司马懿，为什么不对司马懿下手，就是需要司马懿对付诸葛亮的北伐。如果撤兵，诸葛亮将来卷土重来，曹叡还需要倚重自己；如果拿下诸葛亮，兔死狗烹，曹叡必定卸磨杀驴。两相权衡，退兵是司马懿最优的选择。

美铝经典案例

下面，我们用一个简单的市场进入的例子，来进一步介绍动态博弈和倒推法思维。

我们来考虑这样一个情境，这也是美铝的经典案例。一家企业A垄断市场，获利100。A面对潜在市场进入威胁，宣称如果有新进入者，一定会予以坚决反击，发动价格战，令其无利可图。

假定有一家企业B入场。如果A不予反击（价格战），两家平分市场，A获得50利润，而B则需要投资20的固定成本，因此获利30。如果A予以反击，则必须付出20投资扩大产能，增加产量，以压低价格，价格战结果为，A从市场获利60，而B获10，扣除20投资，A获得40，B遭遇10的损失。显然，如果A真的会如自己所承诺的这样发动价格战，B不可能进入？但是如果你是B呢？你会相信A的价格战威胁吗？你应该进入吗？

我们用博弈树来描述这个场景。这个博弈树始于一个节点，代表先动者，在这里谁是先动者呢？显然是企业B，先有B决定是否进入，才有A决定是否发动价格战。B有两个选择，就像树上的两个枝条，一个是进入，一个不进入，如果不进入，那么岁月静好，A继续享受垄断利润100。

那么如果进入呢？我们就来到了下一个结点，代表后动者，企业A的结点。A有两个选择，一个是不予反击，那么两家平分市场，A获得50，B扣除成本20后获得净利30。另一个选择，是投资20扩大产能发动价格战，那么它获利60，再扣除20成本，得到40，B企业遭遇损失。

那么我们就可以使用倒推法了，B企业必须考虑，A如果需要决策，是否会有积极性兑现承诺，发动价格战，如果发动价格战，获利是40，不发动价格战，平分市场，那获利50。我们看，价格战得不偿失，不如就算了。好了，我们知道A企业，会接纳市场中新的进入者，那么回到先动者B，它的最优选择是什么，考虑到A的反应，如果不进入，收益是0，如果进入，收益就是30，显然，它应该无视价格战的威胁。

我们用博弈树表述了这个情境，用倒推法做出了分析。

朝核谈判为何举步维艰？

因此我们也可以看到，朝鲜核谈判为何难以取得进展，无法实现互信，这就是博弈论中的所谓动态不一致性问题。谈判双方都没有积极性在对方履约之后兑现承诺。如果朝鲜不可逆转地销毁了核设施，还有什么必要继续为其提供所承诺的经济援助呢？反过来，当朝鲜获得了足够的经济补偿，最优的选择是在处置核设施上拖延怠工，虚与委蛇，保留筹码，继续讹诈。

如何让自己的承诺或威胁更加可信？

从这一点，我们延伸到另外一个重要的问题，就是如何让你的承诺或者威胁可信？

我们回到刚才的市场进入问题。我们看到，当A企业关于价格战的威胁并不可信。当B企业进入这个市场，A企业并无坚壁清野的决心，价格占除了压低利润之外，还需要投资扩大产能。有没有什么办法能让A企业的价格战威胁起到足够的威慑作用呢？我们来看一看，如果A企业不管有没有人进入，自己先把产能建起来，会发生什么？我们来看，它在这个情境之中的收益结构就变化了。如果B企业选择不进入，A企业继续享受垄断利润，它的收益变成了80，因为它已经投资扩张了产能；如果B企业进入，而A企业发动价格战，那么它的收益仍然是40，没有变化。但是我们来看，重要的是，如果B企业选择进入，而A企业选择绥靖，与对方平分市场，它的得益只有30，因为它已经投资了产能。那么如果B企业进入，A企业的最优应对是什么呢？显然，价格战在此情此景之下回报更高。B企业预见到，进入这个市场会迎来A企业的迎头痛击，它的最优策略，就是退避三舍。我们看，A企业通过投资产能，继续享有垄断利润。它的产能投资并未投入生产，是闲置产能，这个钱看似是白花了，但是它改变了博弈的收益结构，帮助A企业维护了垄断地位。从这个案例中，我们可以看到，为什么很多大企业手上储备着闲置产能，这其实是一种对潜在进入者的威慑，我的产能投资已经完成了，你要进来，我可以毫不费力地扩大生产压制价格，你进来，这个市场就是焦土。

通过这个例子，我们看到，如何让自己的承诺或者威胁更加可信，就是能够采取策略性行动，改变博弈的收益结构，让自己所承诺的行动成为相关情景之下的最优，履行承诺符合你的利益，承诺就具有可信度。

我们下边就举几个例子来说明具有这样效果的策略性行动。

如何让“血战到底”的威胁变得更加可信？

我们先来看一看一个经典的情境。一支军队镇守一座岛屿，岛屿上有一座桥联通大陆。数倍于己的敌人大军压境。指挥官希望吓退敌军，扬言岛寸土不让，要与入侵者血战到底。这个威胁是否可信呢？这是要大打折扣的，等到敌人发动进攻时，每个人都要掂量掂量，是否一定要搭上性命，还是从桥上撤退逃回大陆呢？到那时，与其以卵击石，不如保命。预见到守军的反应，对方就会发动进攻。那么指挥官如何才能有效地对来犯之敌施加威慑呢？我猜大家都知道答案，就是把桥烧掉，主动切断退路，如果敌人来犯，拚死反抗就是惟一的选择。敌人预见到这一点，是否还真的胆敢来犯，恐怕也要掂量掂量。

中国历史上，有破釜沉舟、背水一战的故事，古希腊的色诺芬抗击波斯、征服者威廉入侵英格兰、西班牙的科尔特斯征服墨西哥，都采用了类似的策略。这些历史经验告诉我们一个很重要的道理，很多时候，你的选择越多，你的处境就越不利，选择带来诱惑，诱惑会让你软弱，守住底线就会更难，你也就更容易被人牵着鼻子走。

宝丽来为何起诉柯达

主动切断退路，在商业中有一个经典案例。宝丽来这家公司，我们都知道，在很长的一段时期，宝丽来垄断了快速摄影市场。虽然积累了充足的财务资源，这家公司一直拒绝多元化，拒绝在其它领域投资。为什么有钱不去赚呢？这其实是宝丽来公司捍卫市场地位的宣言。在1976年，柯达公司企图进入快速摄影市场，宝丽来迅速做出回应，起诉柯达技术侵权。这场官司打了14年，柯达公司败诉，赔偿9亿美元，被迫撤出。宝丽来的创始人Edwin Land说，这是我们的灵魂所系，这是我们的人生的全部，但是对他们来说，这只是一个另外一个领域。我们要呆在我们的地盘，把它看住。我们来想想看，如果宝丽来也有多元化的投资组合，东边不亮西边亮，是否还有这样的决心和动力对抗竞争者呢？

商业议价博弈

最后，我们来看一个经典的议价问题。假设你是一个商家，不断有买家来找你做生意。每个买家都希望逼迫你压低价格，你如何才能让他们相信，你有你的定价原则，不会轻易降价呢？有一个经典的解决方案。就是你在进行销售的时候，销售合同中包括一个所谓的最惠国条款，客户可以得到最低价保障，如果你在未来销售中向其它人给予了更低的价格，那么客户可以回来，补足差价，甚至可以得到额外的赔偿。这个条款，看似对客户非常有利，但是事实是否如此呢？我们就来做一个简单的分析。

你的产品成本50，你定价500，有个客户来找你讨价还价，你说，我们没有必要浪费时间，我给你提供最惠国待遇，如果以后我的价格降低了，你再来找我，这个客户就会放心大胆地完成交易，交钱提货走人。第二个客户来，第三个客户来，照此办理。又来了一个新客户，一定要让你降价，他知道即使打个对折，你依然有暴利，何乐而不为呢？有了最惠国待遇的条款，你绝不敢轻易降价，你对这个客户降了价，就要对所有过去的客户给予补偿，吃进去的利润都要吐出来，多做这一笔生意得不偿失。所以你一定不会降价，这位客户知道你的销售包含了最惠国待遇条款，也会预计到你不会降价，自然也就不会再和你讨价还价。一个看似保护客户的条款，其实是薅羊毛的手段。

05 总结

我来做一个简单的总结。今天我们对博弈论的基本概况和策略性思维做了一个简单的介绍，我们通过囚徒困境、智猪博弈这样的经典场景，了解了静态博弈和纳什均衡的概念；我们又介绍了动态博弈的场景和倒推法的逻辑。虽然博弈论是技术性很强的学科，但是策略性思维的智慧在我们的生活中无处不在，其本质，就在于换位思考，从别人的角度去想问题，知己知彼，方能百战不殆。

希望我的介绍能给大家带来启发，对工作与生活带来帮助，产生对博弈论这一门学问的兴趣。

博弈论的智慧

考虑各方的动机，并纳入到自己的决策中

个体的理性决策未必会带来群体的最优结果

面对诸多可能性，不妨向前展望，倒后推导

选择太多未必是好事，减少选项可能有战略价值

作者介绍

傅强教授

新加坡国立大学商学院

策略与政策系

中文EMBA学术主任

傅强教授于1998年毕业于北京大学光华管理学院，并在美国印第安纳大学获得经济学博士学位，自2005年起执教于新加坡国立大学商学院，讲授管理经济学、宏观经济与国际金融等课程，被评为新国大商学院EMBA最佳教师，现任中文EMBA项目学术主任。

傅强教授曾两次当选新加坡最具影响力40岁以下商科教授，为众多金融机构与大型企业高管授课、咨询，或担任董事、监事等职务。傅强教授从事应用对策论的理论研究，曾担任德国巴伐利亚州财政部Max Planck公共税收与法律研究所、加拿大CIREQ经济研究所客座研究员。其学术论文广泛发表于诸如the American Economic Review, Theoretical Economics, Journal of Public Economics, Games and Economic Behavior等国际顶级学术期刊。

感谢授权转载

本文来自微信公众号新加坡国立大学EMBA，ID：NUS_EMBA

原标题：教授观点 | 傅强：博弈论的智慧与策略性思维精华总结（完整版）