《博弈论基本知识模型与教学教程》第02章Nash均衡第02节重复剔除劣战略行为.docx
- 文档编号:13239547
- 上传时间:2023-06-12
- 格式:DOCX
- 页数:11
- 大小:94.89KB
《博弈论基本知识模型与教学教程》第02章Nash均衡第02节重复剔除劣战略行为.docx
《《博弈论基本知识模型与教学教程》第02章Nash均衡第02节重复剔除劣战略行为.docx》由会员分享,可在线阅读,更多相关《《博弈论基本知识模型与教学教程》第02章Nash均衡第02节重复剔除劣战略行为.docx(11页珍藏版)》请在冰点文库上搜索。
《博弈论基本知识模型与教学教程》第02章Nash均衡第02节重复剔除劣战略行为
《博弈论:
原理、模型与教程》
第一部分完全信息静态博弈
第2章Nash均衡
「
第2.1节占优行为
第2.2节重复剔除劣战略行为
第2.3节Nash均衡
2.2重复剔除劣战略行为
(已精细订正!
)
I
1、定义2-3
I
【例2-3】
【例2-4]
I
【例2-5]
I
2、定义2-4
I
在“囚徒困境”中,“坦白”是小偷的占优战略,也就是说,相对于战略“抵赖”,“坦白”在任何情况下都是小偷的最优选择。
因此,小偷只会选择战略“坦白”。
444
反过来也可以这么理解:
相对于战略“坦白”,小偷选择“抵赖”所得到的支付都要小于选择“坦白”所的得到的。
既然选择“抵赖”的所得总是小于选择“坦白”的所得,小偷当然就不会选择“抵赖”:
这也就相当于小偷将战略“抵赖”从自己的选择中剔除掉了。
考察更一般的n人博弈情形。
在n人博弈中,如果存在参与人i的占优战略Si,那么他在博弈中的战略选择问题就很简单:
选择占优战略si。
4*4
但在大多数博弈问题中,参与人的占优战略并不存在。
虽然不存在占优战略,但在某些博弈问题中,参与人i在对自己的战略进行比较时,可能会发现这样的情形:
存在两个战略Si和Si(Si,SiSi),Si虽然不是占优战略,但与Si相比,自己在任何情况下选择Si的所得都要大于选择Si的所得。
在这种情况下,理性参与人i的选择又有什么样的特点呢?
虽然不能确定参与人i最终会选择什么样的战略,但可以肯定的是,理性参与人i绝对不会选择战略Si。
因为参与人i选
择战略Si,还不如直接选择战略Si(因为参与人i在任何情况下选择
Si的所得都要大于选择Si的所得)。
定义2-3在n人博弈中,如对于参与人i,存在战略Si,SiSi,对
n
Sij1Sj,有
ji
Ui(S,Si)Ui(Si,Si)
则称战略Si为参与人i的劣战略,或者说战略Si相对于战略Si占优
在博弈中,如果战略Si是参与人i劣战略,那么参与人i肯定不会选择战略Si。
这也是相当于参与人i将战略Si从自己的战略集Si剔除掉,直接从战略集S{Si}中选择自己的战略。
参与人的这种选择行为称之为剔除劣战略行为。
剔除劣行为也是理性参与人选择行为的基本特征之一。
考察战略式博弈G
;S|,,Si,,Sn;Ui,,Ui,,Un.。
如果战略Si是
参与人i的劣战略,那么参与人i将只会从战略集Si{Si}中选择自己
的战略。
令SiSi{s},构造一个新的战略式博弈
G(;S,,S,,Sn;q,M,,Un)。
此时,对战略式博弈G的求解问题就可以转换为对G的求解。
【例2-3]考察图2-4中的战略式博弈,其中参与人1有两个战
略ai和a2,参与人2有三个战略bi,b?
和b3
参与人2
图2-4战略式博弈
从图2-4中可以看出:
战略b2相对于战略ba占优,也就是说ba是参与人2的劣战略。
因此,对图2-4中博弈问题的求解就可以转换为对图2-5中博弈的求解。
图2-5战略式博弈
遵循上面的求解思路,如果在新构造出来的战略式博弈G中,存在参与人j的某个劣战略Sj,那么又可以构造出一个新的战略式博弈G,其中参与人j的战略集为SjSj{Sj}。
此时,对战略式博弈G的求解问题就可以转换为对G的求解。
而参与人的这种不断剔除劣战略的行为称为重复剔除劣战略行为。
【例2-4]考察图2-6中的战略式博弈,其中参与人1有三个博弈一一ai,a2和a3,参与人2有三个战略bi,b?
和b3
参与人2
a1
b1
b2
1,
0
1,1:
j.
参与人1a2
3,
2
2,11
1
2,0t
LL
a3
2,
1
1,,3;
11
1
3,;2:
■
一L;
图2-6战略式博弈
从图2-6中可以看出:
战略b3是参与人2的劣战略。
因此,对图
2-6中博弈问题的求解就可以转换为对图2-7中博弈的求解
图2-7战略式博弈
从图2-7中又可以看出:
战略as是参与人1的劣战略。
因此,
对图2-7中博弈问题的求解就可以转换为对图2-8中博弈的求解。
也就是对图2-6中原博弈问题的求解就可以转换为对图2-8中博弈的求解。
ai
参与人1
a2
图2-8战略式博弈
如果以上重复剔除劣战略的过程可以不断进行下去,直到新构造
出来的博弈中每个参与人都只有一个战略,那么由所有的参与人剩下的唯一战略所构成的战略组合就是原博弈问题的解,称之为“重复剔除的占优均衡”。
此时,也称原博弈问题是“重复剔除劣战略可解的”。
略ai、a2和a3,参与人2有二个战略bi,b?
和b3
图2-9战略式博弈
从图2-9中可以看出:
战略bs是参与人2的劣战略。
因此,对图
2-9中博弈问题的求解就可以转换为对图2-10中博弈的求解
从图2-10中又可以看出:
战略a3是参与人1的劣战略。
因此,
对图2-10中博弈问题的求解就可以转换为对图2-11中博弈的求解
参与人1
图2-10战略式博弈
参与人2
1——1
a1
■
1■
参与人1
:
3,:
3:
1
a2
1
22;
■■
1|R
图2-11战略式博弈
从图2-11中又可以看出:
战略d是参与人2的劣战略。
因此,
对图2-11中博弈问题的求解就可以转换为对图2-12中博弈的求解
参与人2
b2
ai
参与人1
a2
图2-12战略式博弈
在图2-12中,参与人2只有一个战略b2,参与人1选择战略ai,因此原博弈问题的解为战略组合(34)。
而⑻心)就是所谓的重复剔除的占优均衡。
在某些博弈问题中,参与人i在对自己的战略进行比较时,还可能会发现这样的情形:
存在两个战略$和Si(勺,sSj,与s相比,虽然选择Si的所得并不一定总是大于选择S的所得,但自己在任何情况下选择S的所得都不会比选择Si的所得小,而且在某些情况下选择S的所得严格大于选择S的所得。
显然,在这种情况下,理性的参与人i将战略S从自己的选择中剔除掉也是有道理的。
与定义2-3
中所定义的劣战略相仿,称战略Si、为参与人i的弱劣战略。
定义2-4在n人博弈中,如果对于参与人i,存在战略S,SiS对
n
Sij1Sj,有
ji
Ui(si,si)Uj(Si,si)
n且sij1Sj,使得
ji
ui(Si,Si)ui(Si,Si)
则称战略s为参与人i的弱劣战略,或者说战略s相对于战略si弱占
优。
有时为了表述方便,也将定义2-3所定义的劣战略称为严格劣战略,而将弱劣战略和严格劣战略统称为劣战略。
与重复剔除严格劣战略的思路一样,也可以采用重复剔除弱劣战略的方法来求解博弈问题。
但需要注意的是,在重复剔除的过程中,如果每次可以剔除的劣战略(包括严格劣战略和弱劣战略)不只一个,那么各个劣战略剔除的顺序不同,得到的博弈结果就有可能不同。
除非每次剔除的都是严格列战略。
下面通过一个例子来说明这个问题。
(重点!
)
考察图2-13中的战略式博弈。
在图2-13中,b2和ba是参与人
2的劣战略。
参与人2
bi
b2
ba
ai
a,a
a,i
i,2
参与人ia2
i,i
2,0
2,0
aa
a,4
i,a
a,2
图2-13战略式博弈
如果首先剔除劣战略ba,那么在新博弈中,战略aa成为弱劣战略,如果再剔除aa,则博弈的结果为战略组合G,bJ;如果首先剔除劣战略b2,那么在新博弈中,战略ai成为弱劣战略,如果再剔除ai,贝y博弈的结果为战略组合(aa,bi)。
造成博弈结果不同的原因在于:
在原博弈中,4和aa原本互不占优,但是如果先剔除ba,则ai相对于aa弱占优,aa就可能因此被剔除掉;如果先剔除掉b2,则aa相对于ai弱占优,ai就可能因此被剔除掉。
因此,当b2和ba的剔除顺序不同时,参与人i保留下来的战略就可能不同。
但是,如果只允许剔除严格劣战略,那么无论是先剔除b2还是
b3,得到的博弈结果都是战略组合佝上)和(a3,b)
为了进一步说明问题,考察图2-14中战略式博弈,图2-14中博弈与图2-13中博弈的不同之处仅在于战略组合(q,bj下参与人1的支付不同。
a1a2a3
b1
参与人2
b2
b3
4,3
3,1
1,2
参与人1
1,1
2,0
2,0
3,4
1,3
3,2
图2-14战略式博弈
在图2-14中,印和a3也是互不占优。
但是,在剔除劣战略t>2和b3的过程中,无论是先剔除b2还是b3,只会出现a1相对于a3占优的情形,而不会出现a3相对于a1占优或弱占优的情形。
因此,无论剔除劣战略的顺序如何,博弈的结果都是战略组合@彷)。
前面一再提到博弈分析是在假设博弈问题的结构和参与人完全理性为共同知识的前提下进行的,现在分析如果没有这样的假设,所得到的博弈问题的解——占优战略均衡和重复剔除的占优均衡是否存在。
当参与人理性时,如果参与人的占优战略,那么无论其他参与人是否理性或者是否知道他是理性的,他都会选择占优战略。
因此,如果博弈中存在占优战略均衡且所有的参与人都理性,那么博弈的结果就是占优战略均衡。
也就是说,不需要完全理性为共同知识就可确保占优战略均衡为博弈的结果。
但是,必须清楚:
存在占优战略均衡的博弈绝对只是博弈问题中的极少数,在大多数情况下占优战略均衡是不存在的。
更重要的是,如果仅仅假设参与人是理性的,就会发现及时博弈问题是“重复剔除劣战略可解的”,也无法保证博弈的结果就是重复剔除的占优均衡,这是因为:
在重复剔除过程的每一步中,如果只假设参与人理性,那么只能确保参与人将其劣战略剔除掉;而如果其他参与人不知道他是理性的,就不能确保其他参与人知道他已将劣战略剔除掉。
在这种情况下,就不能讲原博弈问题转换为新的博弈问题,也就是说,虽然剔除劣战略行为是理性参与人选择行为的基本特征,但如果仅仅假设参与人理性是不能确保重复剔除的。
在例2-3中,如果参与人1不知道参与人2的理性的,他就不知道自己面临的博弈问题已由图2-4中的战略式博弈转换为图2-5中的博弈。
同样,如果参与人2不知道参与人1知道自己是理性的,图2-4中的战略式博弈也不能转换为图2-5中的博弈。
在例2-4中,要确保图2-6的中博弈转换为图2-8中的博弈,就必须要求每个参与人都知道博弈问题转换的每一步(即每一次剔除劣战略),而且还要知道其他参与人知道博弈问题转换的每一步。
具体讲就是:
(1)参与人2是理性;
(2)参与人1知道到参与人2理性,参与人2知道参与人1知道到参与人2理性;
(3)参与人1是理性,参与人2知道到参与人1理性,参与人1知道参与人2知道到参与人1理性。
而在例2-5中,对参与人理性假设的要求就更为复杂,除了例2-4中所要求的以上3点外,对理性还有进一步的要求。
所以,随着博弈中参与人人数的增加及参与人战略空间的增大,重复剔除的过程就会越来越复杂,对理性假设的要求也就越来越高。
因此,为了确保博弈分析的顺利进行,一般都假设参与人完全理
性为共同知识。
基于同样的理由,也假设博弈问题的结构(包括参与人的支付)
为共同知识。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论基本知识模型与教学教程 博弈论 基本知识 模型 教学 教程 02 Nash 均衡 重复 剔除 战略 行为