微观经济第十章博弈论初步.pptx
- 文档编号:18703233
- 上传时间:2023-10-11
- 格式:PPTX
- 页数:90
- 大小:1.44MB
微观经济第十章博弈论初步.pptx
《微观经济第十章博弈论初步.pptx》由会员分享,可在线阅读,更多相关《微观经济第十章博弈论初步.pptx(90页珍藏版)》请在冰点文库上搜索。
,第十章博弈论初步,第一节博弈论和策略行为,第二节同时博弈:
纯策略均衡,第三节同时博弈:
混合策略博弈,第四节序贯博弈,博弈论gametheory,在传统经济理论中,经济主体做出决策时,不考虑自己的选择(决策)对其他人的影响,也不考虑其他人对自己的影响。
然而,在现实经济生活中,经济主体之间的行为是相互作用、相互影响的。
博弈论gametheory,博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。
博弈的三个基本要素,参与人(局中人,players):
可以是自然人,也可以是企业、国家,还可能是甚至是若干个国家组成的集团(OPEC,欧盟)。
策略(strategies):
局中人的行动规则,它指定局中人在每种情况下应如何行动,至少有两个可供选择的策略,“相机行动方案”。
如“人不犯我,我不犯人;人若犯我,我必犯人”就是一种策略:
“犯”与“不犯”就是两种不同的行动,策略则规定了什么时候选择“犯”还是“不犯”。
支付(payoffs)局中人得到的效用(或期望效用),局中人真正关心的东西。
博弈的类型,根据参与人的数量:
二人博弈和多人博弈根据参与人的支付情况:
零和博弈和非零和博弈参与人的支付总和为0时,零和博弈,这意味着参与人的利益在博弈是相互冲突的。
根据参与人拥有的策略的数量的多少:
有限博弈和无限博弈根据参与人在实施策略上是否有时间的先后(参与人在决策时是否已经知道了其他参与人的决策):
同时博弈和序贯博弈;静态博弈(staticgame)和动态博弈(dynamicgame)。
同时博弈:
石头、剪刀、布。
序贯博弈:
下棋、打麻将。
一、例子:
寡头博弈,囚徒困境prisonersdilemma两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一个供认或两个人都供认,即使两个人都不供认,也可判他们犯盗窃物品的轻罪。
囚徒被分离审查,不允许他们之间互通信息,并交代政策如下:
如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判2年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪及抗拒从严而被重判5年。
二、支付矩阵payoffstable,囚徒甲,囚徒乙,参与人,策略,支付,寡头的囚徒困境,厂商甲,厂商乙,厂商甲,厂商乙,三、条件策略和条件策略组合,把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。
把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。
在乙厂商选择合作的条件下:
条件策略:
不合作条件策略组合:
不合作,合作,在乙厂商选择不合作的条件下:
条件策略:
不合作条件策略组合:
不合作,不合作,四、纳什均衡(非合作均衡),1、博弈均衡的概念当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。
博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。
四、纳什均衡,2、纳什均衡的概念指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
“单独改变策略”是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。
其他人也同时改变策略的情况不在考虑之列。
“不会得到好处”是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情况:
或者支付减少,或者支付不变。
五、寻找纳什均衡的方法条件策略下划线法,先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均衡(就是找到在两个数字之下都划线的单元格即可,与这些单元格相对应的策略组合就是所要求的均衡策略组合)。
五、寻找纳什均衡的方法条件策略下划线法,第一步:
分解矩阵,第二步:
在甲的支付矩阵中,找出每列的最大者。
第三步:
在乙的支付矩阵中,找出每行的最大者。
五、寻找纳什均衡的方法条件策略下划线法,第四步:
合并矩阵,第五步:
找出两个数字下均有下划线的组合。
五、寻找纳什均衡的方法条件策略下划线法,在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略的动机。
六、纳什均衡的存在性、唯一性和最优性,1、存在性:
在同时博弈中,(纯策略的)纳什均衡可能存在,也可能不存在。
没有纳什均衡的同时博弈,厂商甲,厂商乙,六、纳什均衡的存在性、唯一性和最优性,2、唯一性:
在纳什均衡存在的情况下,可能唯一,也可能不唯一。
存在多重纳什均衡的同时博弈,厂商甲,厂商乙,六、纳什均衡的存在性、唯一性和最优性,3、最优性:
如果纳什均衡存在,可能是最优的,也可能不是最优的。
存在多重纳什均衡的同时博弈,厂商甲,厂商乙,七、二人同时博弈的一般理论,二人同时博弈的一般模型,A,B,A,B,类型1中:
A在策略上是“无差异”的,可以选择策略1,也可能选择策略2,结果完全相同。
A,B,类型2、3、4、5中:
A在某一策略上具有不严格的绝对优势它选择策略1所得到的支付不会小于策略2。
A,B,类型2、3、4、5中:
A在某一策略上具有不严格的绝对优势它选择策略1所得到的支付不会小于策略2。
A,B,类型2、3、4、5中:
A在某一策略上具有不严格的绝对优势它选择策略1所得到的支付不会小于策略2。
A,B,类型6、7中:
A在某一策略上具有严格的绝对优势它选择策略1所得到的支付总大于策略2。
A,B,类型6、7中:
A在某一策略上具有严格的绝对优势它选择策略1所得到的支付总大于策略2。
A,B,类型6、7中:
A在某一策略上具有严格的绝对优势它选择策略1所得到的支付总大于策略2。
A,B,类型8、9中:
A在某一策略上不存在绝对优势,A按“列”,划线法B按“行”,A的支付矩阵有9种可能,B的支付矩阵也有9种可能,因此,整个博弈(亦即A与B两人合在一起)的支付矩阵总共就有99=81种可能。
全部的纳什均衡可分为五种类型,分别有四个均衡(包括1种情况)、三个均衡(包括12种情况)、两个均衡(包括38种情况)、一个均衡(包括28种情况)、零个均衡(包括2种情况)。
一、不存在纯策略均衡时的混合策略均衡,即使纯策略的纳什均衡不存在,相应的混合策略均衡却总会存在。
1、混合策略第一,“确定性”选择在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是“确定”的,即某参与人在选择某个策略的时候,他不能再同时选择其他的策略,此时相应的条件策略也是“确定”的;最后,当参与人的条件策略是“确定”的时候,最终的博弈均衡(如果有的话)也是“确定”的。
第二,“混合性”选择在现实生活中,人们对策略的选择常常并不像前面所说的那样“非此即彼”,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。
没有纳什均衡的同时博弈,厂商甲,厂商乙,第三,“混合”策略的概念把甲厂商和乙厂商原来的策略叫做“纯”策略,把赋予这些纯策略的概率向量叫做“混合”策略。
没有纳什均衡的同时博弈,厂商甲,厂商乙,2、混合策略组合参与人的混合策略组合是一个概率向量组合,其中,每一个概率向量是相应参与人的一个混合策略。
3、期望支付在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。
不过,由于现在每个参与人都是以一定的概率来选择其纯策略的,故相应的支付也就成了所谓的“期望支付”,即支付的期望值。
4、条件混合策略利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略)。
上式含义:
甲厂商在乙厂商选择某个既定的q1时所选择的使E甲达到最大的p1。
上式含义:
乙厂商在甲厂商选择某个既定的p1时所选择的使E乙达到最大的q1。
5、混合策略纳什均衡参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进一步来确定混合策略的纳什均衡。
二、存在纯策略均衡时的混合策略均衡,求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况,而且也适用于纯策略纳什均衡存在的情况。
在后面这种情况下,纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均衡之中。
存在纯策略纳什均衡的混合策略模型,厂商甲,厂商乙,三、混合策略博弈的一般理论,1、模型,A,B,混合策略博弈的一般模型,2、混合策略和混合策略组合,A的混合策略:
B的混合策略:
A与B的混合策略组合:
3、期望支付运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。
A的期望支付:
B的期望支付:
4、A的条件混合策略,5、B的条件混合策略,q1,p1,O,b11=b12,b21=b22,1,1,q1,p1,O,b11=b12,b21b22,1,1,q1,p1,O,b11=b12,b21b22,1,1,q1,p1,O,b11b12,b21=b22,1,1,q1,p1,O,b11b12,b21=b22,1,1,q1,p1,O,b11b12,b21b22,1,1,q1,p1,O,b11b12,b21b22,1,1,q1,p1,O,b11b12,b21b22,1,1,p*,q1,p1,O,b11b22,1,1,p*,6、纳什均衡,单位平面,6、纳什均衡,三条线段,6、纳什均衡,两条线段,6、纳什均衡,一条线段,6、纳什均衡,三个点,6、纳什均衡,两个点,6、纳什均衡,一个点,一、例子:
竞争者垄断者博弈,1、两个参与者:
竞争者和垄断者。
2、两个参与者的决策顺序及其策略:
竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根据竞争者的行动决定对其“容忍”还是“抵抗”。
竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗两个策略。
因此,总共有四个策略组合。
每一策略组合中,第一项是先行动者即竞争者的策略,第二项是后行动者即垄断者的策略。
二、博弈树gametree,起点,中间决策点,终点,第一个数字是先行动者的支付,第二个数字是后行动者的支付。
三、纳什均衡,1、序贯博弈中的纳什均衡在竞争者垄断者博弈中,第一个终点,即旁边标有支付组合(1,4)所代表的策略组合(进入,容忍)是一个纳什均衡。
因为在该策略组合上,没有哪个参与人愿意单独改变自己的策略。
三、纳什均衡,2、序贯博弈中的纳什均衡可能不止一个情侣博弈battleofsex:
有一对热恋中的情侣,吕布和貂蝉,两人平时上班都很忙,没时间见面,难得周六晚上能在一起过。
两人就想:
这么一个美好的夜晚该怎么度过呢?
这个吕布是个足球迷,正好周六晚上要直播一场他最喜欢的意大利队的足球赛。
而貂蝉是个芭蕾迷,恰巧这晚上世界著名的俄罗斯芭蕾舞蹈团要进行最后一场巡回演出。
看足球赛还是看芭蕾呢?
2、序贯博弈中的纳什均衡可能不止一个假如两人决定一起看足球,对于吕布来说幸福感是2。
而貂蝉对足球一窍不通,但是因为能和吕布在一起,晚上一起看球的幸福感是1。
如果两人一起去看芭蕾演出,对于貂蝉来说幸福感是2,可是吕布偏偏对芭蕾不太感兴趣,和貂蝉在一起看芭蕾对他来说幸福感只有1。
现在两人正处于如胶似漆的热恋阶段,双方对在一起的每一刻都非常珍惜。
所以,一旦分开,若吕布单独去看球、貂蝉单独去看芭蕾,幸福感为(0,0);若吕布单独看芭蕾,貂蝉单独去看球,幸福感为(-1,-1)。
2、序贯博弈中的纳什均衡可能不止一个,四、纳什均衡的精炼:
逆向归纳法backwardinduction,1、逆向归纳法的两个步骤第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。
这个最简博弈,就是原博弈的解。
四、纳什均衡的精炼:
逆向归纳法,2、逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也是逆向归纳策略3、先动优势:
first-moveradvantage先行动者的得益大于后行动者的得益。
比如,男方先动,逆向归纳的结果就是对男方更加有利的纳什均衡(足球,足球);如果情侣博弈改为女方先行动,则逆向归纳的结果就是对女方更加有利的纳什均衡(芭蕾,芭蕾)。
情侣博弈:
女方先动,四、纳什均衡的精炼:
逆向归纳法,4、序贯博弈与同时博弈的一个重要区别当博弈是“同时”的时候,如果出现多重纳什均衡,常常无法确定最终实现的是哪一个纳什均衡,但是,当博弈是“序贯”的时候,即使纳什均衡是多重的,往往能够从中确定一个最终的均衡。
这是因为,与同时博弈相比,序贯博弈提供了更多的信息关于参与人决策秩序的信息。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 微观经济 第十 博弈论 初步
![提示](https://static.bingdoc.com/images/bang_tan.gif)