书签分享收藏举报版权申诉 / 38

立即下载加入VIP,免费下载

当前位置：首页 > IT计算机 > 计算机硬件及网络 > 第七章博弈论高鸿业PPT文档格式.ppt

第七章博弈论高鸿业PPT文档格式.ppt

文档编号：352263
上传时间：2023-04-28
格式：PPT
页数：38
大小：337KB

《第七章博弈论高鸿业PPT文档格式.ppt》由会员分享，可在线阅读，更多相关《第七章博弈论高鸿业PPT文档格式.ppt（38页珍藏版）》请在冰点文库上搜索。

第七章博弈论高鸿业PPT文档格式.ppt

厂商利润最大化决策中的产量、价格等。

5,策略（strategies）又称战略，是指参与人选择其行为的规制，也就是指参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。

信息（information）是指参与人在博弈过程中的知识，特别是有关其他参与人（对手）的特征和行动的知识。

收益（payoff）又称支付，是指参与人从博弈中获得的利益水平，它是所有参与人策略或行为的函数，是每个参与人真正关心的东西，如消费者最终所获得的效用、厂商最终所获得的利润。

结果（outcome）是指博弈分析者感兴趣的要素集合。

均衡（equilibrium）是指所有参与人的最优策略或行动的组合。

这里的“均衡”是特指博弈中的均衡，一般称之谓“纳什均衡（Nashequilibrium）”。

6,三、博弈的分类,博弈的分类可以从三个角度进行。

首先，按照参与人的先后顺序进行分类，可以划分为静态博弈（staticgame）和动态博弈（dynamicgame）。

静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。

动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。

7,第二个角度是按照参与人对其他参与人的了解程度进行分类。

从这个角度，博弈可以划分为完全信息博弈和不完全信息博弈。

完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

不完全信息博弈：

如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确。

或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息。

8,第三个角度是按照参与人之间是否合作进行分类。

从这个角度，博弈可以划分为合作博弈和非合作博弈。

合作博弈是指参与人之间有着一个对各方具有约束力的协议，参与人在协议范围内进行的博弈。

反之，就是非合作博弈。

典型的合作博弈是寡头企业之间的串谋。

串谋是指企业之间通过公开或暗地里签订协议，对各自的价格或产量进行限制，以达到获取更多垄断利润的行为。

非合作博弈可以得到四种不同的类型：

完全信息静态博弈，完全信息动态博弈论，不完全信息静态博弈，不完全信息动态博弈。

9,表7博弈的分类及对应的均衡概念,10,一、完全信息静态博弈：

纳什均衡纳什均衡是著名博弈论专家纳什（JohnNash）对博弈论的重要贡献之一。

纳什在1950年1951年的两篇重要论文中，在一般意义上给定了非合作博弈及其均衡解，并证明了解的存在性。

正是纳什的这一贡献奠定了非合作博弈论的理论基础。

纳什所定义的均衡称之谓“纳什均衡”。

（一）占优策略均衡占优策略（dominantstrategies）是指这样一种特殊的博弈：

某一参与人的策略可能并不依赖于其他参与人的策略选择。

换句话说，无论其他参与人如何选择自己的策略，该参与人的最优策略选择是惟一的。

以博弈论中最为著名的囚犯困境（prisonersdilemma）为例,62完全信息静态博弈,11,表72囚犯困境的收益矩阵,供认囚犯不供认,，,囚犯供认不供认,12,在博弈中，如果所有参与人都有占优策略存在，可以证明，博弈将在所有参与人的占优策略的基础上达到均衡，这种均衡称为占优策略均衡。

上面提到的囚犯困境中的“供认，供认”就是占优策略均衡解。

占优战略均衡的条件：

要求所有的参与人都是理性的，并不要求每个参与人知道其他参与人也是理性的类似问题在许多情况下都会出现，如寡头竞争、军备竞赛、团队生产中的劳动供给、公共产品的供给等等。

13,占优策略均衡,例：

卡特尔组织的博弈乙合作不合作合作10，106，12甲不合作12，68，8,14,囚犯困境反映了一个深刻问题，这就是个人理性与团体理性的冲突。

市场机制这只“看不见的手”，在人人追求自身利益最大化的基础上可以达到全社会资源的最优配置。

囚犯困境对此提出了新的挑战。

15,

（二）重复剔除的占优策略均衡,在绝大多数博弈中，占优策略均衡是不存在的。

智猪博弈（boxedpigs）是博弈论中的另一个著名的例子。

表7智猪博弈的收益矩阵小猪按按钮等待按按钮3，12，4大猪等待7，-10，0,16,17,在这个博弈中，不论大猪场选择什么策略，小猪的占优策略均为等待。

而对大猪来说，它的选择就不是如此简单了。

大猪场的最优策略必须依赖于小猪的选择。

如果小猪选择等待，大猪的最优策略是按按钮；

如果小猪选择按按钮，大猪的最优策略显然是等待。

在这个博弈中，只有小猪有占优策略，而大猪没有占优策略。

18,这个博弈的均衡解是什么呢？

这个博弈的均衡解是大猪选择按按钮，小猪选择等待，这时，大猪和小猪的净收益水平分别为个单位和个单位。

这是一个“多劳不多得，少劳不少得”的均衡。

19,求解智猪博弈均衡的方法,首先找出某一个参与者的严格劣战略，将其剔除掉，然后构造新博弈，继续剔除新博弈中某一参与人的严格劣战略；

重复进行这一过程，直到剩下唯一的参与人战略组合为止，这一唯一剩下的参与人战略组合就是这个博弈的均衡解，称为“重复剔除的占优战略均衡”严格劣战略是指无论其他参与者选择什么战略，某一参与人可能采取的对自己不利的战略,20,重复剔除的占优战略均衡的要求条件,不仅要求参与者都是理性的，而且要求每个参与者都知道所有的其他参与人也是理性的,21,智猪博弈的例子在现实中确有很多。

例如，在股份公司中股东都要进行监督，但是大小股东从监督中获得的收益不同。

在监督成本相同相同的情况下，大股东收益大于小股东。

因此，小股东往往不会象大股东那样去监督经理人员，而大股东也明确无误地知道小股东会选择不监督（这是小股东的占优策略），大股东明知道小股东要搭大股东的便车，但是大股东别无选择。

大股东选择监督经理的责任、独自承担监督成本是在小股东占优选择的前提下必须选择的最优策略。

这样一来，与智猪博弈一样，从每股的净收益来看，小股东要大于大股东。

22,（三）纳什均衡,纳什均衡是指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。

纳什均衡是完全信息静态博弈解的一般情况。

23,四、占优策略均衡与纳什均衡比较,占优策略均衡要求任何一个参与人对于其他参与人的任何策略选择来说，其最优的策略都是唯一的。

纳什均衡只要求任何一个参与人在其他参与人的策略选择给定的条件下，其选择的策略是最优的。

占优策略均衡一定是纳什均衡，但纳什均衡不一定就是占优策略均衡。

24,构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略。

也就是说，没有一种策略严格优于纳什均衡策略（注意：

其逆定理不一定成立），许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈，却存在纳什均衡。

25,女方看足球逛商店男方看足球3，1，逛商店0，01，3,表7性别战的收益矩阵,26,纳什均衡,例：

斗鸡博弈B进退进-3，-32，0A退0，20，0,27,在这个博弈中剔除两个严格劣策略以后，剩下的新博弈中，无法剔除严格劣策略。

因此是一个纳什均衡。

这里有两个解，即男女双方一起去看足球赛和一起去逛商店。

除非有进一步的信息，如男方或女方具有优先选择权，否则，我们无法确定男女双方在上述博弈中会作出什么样的选择。

28,完全信息静态博弈：

纳什均衡,囚徒困境的几个事例：

价格大战两个寡头企业选择产量公共产品的供给军备竞赛做广告围观时踮脚尖应试教育污染。

1968年，格雷特哈丁成功地将“囚徒的困境”与资源耗竭结合起来,揭示了生态环境问题与囚徒困境的相似之处。

贸易自由与壁垒，地方保护主义,29,三、纳什均衡与寡头垄断市场,古诺模型与纳什均衡用QA、QB分别表示厂商A和厂商B的产量；

CA（QA）和CB（QB）表示两者的成本函数；

PP（QAQB）表示需求函数的逆函数，其中P是价格。

厂商A和厂商B的利润函数分别为：

30,对每个厂商的利润函数求一阶偏导数并令其等于零，整理可得：

反应函数意味着每个厂商的最优策略（产量）是另一个厂商的策略（产量）的函数，两个反应函数的交叉点（即两个方程的解）就是纳什均衡：

31,第三节完全信息动态博弈,当一个人行动在前，而一个人行动在后时，后者自然会根据前者的选择进行策略的调整，前者也能理性地预期到这一点，并考虑这一影响。

此时，就进入了动态博弈的分析。

32,一、重复博弈,重复博弈：

是指同样结构的博弈重复多次。

如果博弈只是进行了一次，参与人只会关心一次性支付；

但如果博弈重复进行，参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。

重复博弈的基本思想在重复博弈理论背后的主要思想是：

如果每个囚徒都相信做出“抵赖”的选择在长期内得到的利益将超过他短期内的损失，那么博弈被重复进行时，他们共同想要的结果（抵赖，抵赖）将会出现。

33,影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。

重复次数的重要性来自于参与人在短期利益和长期利益之间的权衡，本节只讨论重复博弈的次数,34,重复博弈次数无限冷酷战略：

它意味着任何一个参与人的一次性不合作将触发永远的不合作，在这种情况下，重复博弈的所有参与人慑于冷酷战略的严重后果，有积极性维持合作,35,博弈次数有限时的情况：

重复博弈阶段有唯一的纳什均衡时，n次重复博弈的纳什均衡结果，是阶段博弈的纳什均衡结果重复n次，也即是说，每个阶段出现的都是一次性博弈的均衡结果,36,连锁店悖论假设同样的市场有20个（可以理解企业A有20个连锁店），企业B每次只能进入一个市场（连锁店），这就成为了20次重复博弈。

在这个博弈中，企业A选择“不合作”的唯一原因是这一选择能够起到威慑作用，使企业B不敢进入。

然而，结果会是这样吗？

在有限次（这里是20次）重复博弈中，“不合作”是不可置信的。

设想前19个市场已被企业B进入，企业B下一步要进入第20个市场。

因为这是最后一个市场，对于企业A而言，这与第一次博弈没什么区别，选择“合作”是最优策略，企业B自然选择进入。

37,四、动态博弈的战略行动1、首先行动优势指博弈中首先做出战略选择并采取相应行动的参与人可以获得较多的利益2、确实可行的威胁承诺：

参与人为改变博弈结果而采取的措施博弈的参与人通过采取措施改变自己的支付函数，从而使自己的威胁显得可信,38,进入者进入不进入抵制800，6001300，900在位者不抵制900，12001300，900,进入者进入不进入抵制800，6001300，900在位者不抵制700，12001300，900,