Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx
- 文档编号:11855595
- 上传时间:2023-06-03
- 格式:PPTX
- 页数:115
- 大小:978.99KB
Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx
《Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx》由会员分享,可在线阅读,更多相关《Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx(115页珍藏版)》请在冰点文库上搜索。
高级计量经济学及Stata应用第八讲动态面板与非线性面板,陈强山东大学经济学院,2021-08-12,2,陈强计量及Stata应用(c)2013,2021-08-12,2,陈强计量及Stata应用(c)2014,动态面板,有些经济理论认为,由于惯性或部分调整,个体的当前行为取决于过去行为,比如资本存量的调整。
如果在面板模型中,解释变量包含了被解释变量的滞后值,则称之为“动态面板数据”(DynamicPanelData,简记DPD)。
对于动态面板,即使FE也不一致,例:
其离差形式为:
其中,,,,由于中包含的信息,而后者与相关,故FE不一致,称为“动态面板偏差”(dynamicpanelbias)。
2021-08-12,3,陈强计量及Stata应用(c)2014,一般的动态面板模型,先作一阶差分以消去个体效应:
但依然与相关,因此,为内生变量,需要寻找适当的工具变量才能得到一致估计。
2021-08-12,4,陈强计量及Stata应用(c)2014,2021-08-12,5,陈强计量及Stata应用(c)2014,Anderson-Hsiao估计量,AndersonandHsiao(1981)提出使用的工具变量,然后进行2SLS估计。
作为,显然,二者相关,满足相关性。
如果不存在自相关(对此假设须进行检验),则与不相关,满足外生性。
差分GMM,根据同样的逻辑,更高阶的滞后变量也是有效工具变量,而Anderson-Hsiao估计量未加以利用,故不是最有效率的。
ArellanoandBond(1991)使用所有可能的滞后变量作为工具变量(显然工具变量个数多于内生变量个数),进行GMM估计。
这就是“差分GMM”(DifferenceGMM)(因为是对差分后的方程进行GMM估计)。
2021-08-12,6,陈强计量及Stata应用(c)2014,2021-08-12,7,陈强计量及Stata应用(c)2014,差分GMM的缺点,如果T很大,则会有很多工具变量,容易出现弱工具变量(weakinstruments)问题(通常滞后越多期则相关性越弱),产生偏差。
解决方法是在使用Stata命令xtabond时,限制最多使用q阶滞后变量作为工具变量,但文献中对于如何选择工具变量个数并无明确指南。
差分GMM的缺点(续),如果仅为前定变量而非严格外生,则经过差分后,,就可能与,导致内生性。
可使用,相关,作为IV。
不随时间变化的变量被消掉了,故差分GMM无法估计的系数。
2021-08-12,8,陈强计量及Stata应用(c)2014,水平GMM,ArellanoandBover(1995)重新回到了差分之前的水平方程(levelequation),并使用作为的工具变量。
显然,二者是相关的。
且如果,无自相关,则;但,须假设与个体效应不相关,才能保证这些工具变量与水平方程的复合扰动项不相关。
此假设意味着经济离稳态均衡不远。
2021-08-12,9,陈强计量及Stata应用(c)2014,系统GMM,BlundellandBond(1998)把差分GMM与水平GMM结合在一起,将差分方程与水平方程作为一个方程系统进行GMM估计,称为“系统GMM”(SystemGMM)。
系统GMM的优点是可提高估计效率,且可估计不随时间变化的变量的系数(系统GMM包含对水平方程的估计)。
但必须额外地假定与无关;否则,不能使用系统GMM。
在水平方程中,如果也包括内生变量,则同样可用其滞后值作为工具变量。
2021-08-12,10,陈强计量及Stata应用(c)2014,2021-08-12,11,陈强计量及Stata应用(c)2014,差分GMM的Stata命令,xtabonddepvarindepvars,lags(p)maxldep(q)twostepvce(robust)pre(varlist)endogenous(varlist)inst(varlist)“depvar”为被解释变量,“indepvars”为解释变量。
“lags(p)”表示使用被解释变量的p阶滞后值作为解释变量,默认p=1;“maxldep(q)”表示最多使用q阶被解释变量的滞后值作为工具变量,默认使用所有可能的滞后值。
选择项“twostep”表示使用GMM,默认2SLS;“pre(varlist)”,“endogenous(varlist)”,“inst(varlist)”分别指定前定变量、内生变量与额外的工具变量。
“vce(robust)”表示使用稳健标准误,允许存在异方差,且针对两步GMM估计进行调整,Stata称为“WC-RobustStandardError”(Windmeijer,2005;WC表示“Windmeijerbias-corrected”),2021-08-12,12,陈强计量及Stata应用(c)2014,实例:
美国工人的工资决定,以数据集mus08psidextract.dta为例。
该面板数据集包含595名美国工人1976-1982年有关工资的以下变量(n=595,T=7的短面板):
lwage(工资对数),ed(教育年限),exp(工龄),exp2(工龄平方),wks(weeksworked,工作周数),occ(是否蓝领工人),ind(是否在制造业工作),ms(婚否),south(是否在美国南方),smsa(是否住大城市),union(是否由工会合同确定工资),fem(是否女性),blk(是否黑人)。
待估计模型,以差分GMM估计以下动态面板模型:
其中,occ,south,smsa,ind为外生解释变量,wks及其一阶滞后为前定解释变量,而ms,union为内生解释变量。
2021-08-12,13,陈强计量及Stata应用(c)2014,2021-08-12,14,陈强计量及Stata应用(c)2014,差分GMM估计,usemus08psidextract.dta,clearxtabondlwageoccsouthsmsaind,lags
(2)maxldep(3)pre(wks,lag(1,2)endogenous(ms,lag(0,2)endogenous(union,lag(0,2)twostepvce(robust)选择项“lags
(2)”表示解释变量中包含被解释变量的一阶与二阶滞后;“maxldep(3)”表示最多使用被解释变量的三个滞后值作为工具变量;选择项“pre(wks,lag(1,2)”表示变量wks及其一阶滞后L.wks为前定解释变量,而使用其两个更高阶滞后值(即二阶与三阶)为工具变量;选择项“endogenous(ms,lag(0,2)”指定变量ms为内生解释变量(其中的“0”表示内生解释变量不包含ms的任何滞后),而最多使用其两个更高阶滞后值(即二阶与三阶)为工具变量。
2021-08-12,15,陈强计量及Stata应用(c)2014,扰动项的自相关检验,差分GMM成立的前提是,扰动项不存在自相关。
即使原假设“扰动项无自相关”成立,“扰动项的一阶差分”(first-differencederrors)仍将存在一阶自相关,因为但扰动项的差分将不存在二阶或更高阶的自相关。
为此,可以通过检验扰动项的差分是否存在一阶与二阶自相关,来检验原假设。
2021-08-12,16,陈强计量及Stata应用(c)2014,扰动项的自相关检验(续),estatabond,结果显示,扰动项的差分存在一阶自相关,但不存在二阶自相关,故接受原假设。
2021-08-12,17,陈强计量及Stata应用(c)2014,过度识别检验,此差分GMM使用了40个工具变量,须进行过度识别检验。
重新运行“xtabond”命令,但略去选择项“vce(robust)”。
quietlyxtabondlwageoccsouthsmsaind,lags
(2)maxldep(3)pre(wks,lag(1,2)endogenous(ms,lag(0,2)endogenous(union,lag(0,2)twostepestatsargan,2021-08-12,18,陈强计量及Stata应用(c)2014,2021-08-12,19,陈强计量及Stata应用(c)2014,系统GMM估计,xtdpdsyslwageoccsouthsmsaind,lags
(2)maxldep(3)pre(wks,lag(1,2)endogenous(ms,lag(0,2)endogenous(union,lag(0,2)twostepvce(robust)结果参见下页。
系统GMM的系数估计值与差分GMM很接近,但前者的标准误比后者更小。
也许因为使用了更多的工具变量(共60个),系统GMM估计得更准确些。
2021-08-12,20,陈强计量及Stata应用(c)2014,系统GMM的扰动项自相关检验,estatabond,可在5%的显著性水平上拒绝“扰动项差分的二阶自相关系数为0的假设”,故可拒绝“扰动项无自相关”的原假设。
我们怀疑系统GMM是否适用。
2021-08-12,21,陈强计量及Stata应用(c)2014,系统GMM的过度识别检验,quietlyxtdpdsyslwageoccsouthsmsaind,lags
(2)maxldep(3)pre(wks,lag(1,2)endogenous(ms,lag(0,2)endogenous(union,lag(0,2)twostepestatsargan,强烈拒绝原假设,2021-08-12,22,陈强计量及Stata应用(c)2014,2021-08-12,23,陈强计量及Stata应用(c)2014,改进的系统GMM估计,对于此数据集,虽然系统GMM可能更有效率,但成立前提不满足;也可能模型设定不当。
为解决自相关,在解释变量中引入被解释变量的三阶滞后;为改善工具变量有效性,对于内生解释变量ms,union仅使用一个更高阶滞后值(即二阶滞后)为工具变量,但最多使用被解释变量的五个滞后值作为工具变量,重新进行系统GMM估计与检验:
xtdpdsyslwageoccsouthsmsaind,lags(3)maxldep(5)pre(wks,lag(1,2)endogenous(ms,lag(0,1)endogenous(union,lag(0,1)twostepvce(robust),2021-08-12,24,陈强计量及Stata应用(c)2014,扰动项自相关检验,estatabond,可接受扰动项无自相关的原假设。
2021-08-12,25,陈强计量及Stata应用(c)2014,过度识别检验,quietlyxtdpdsyslwageoccsouthsmsaind,lags(3)maxldep(5)pre(wks,lag(1,2)endogenous(ms,lag(0,1)endogenous(union,lag(0,1)twostepestatsargan,可在5%水平上接受“所有工具变量都有效”的原假设。
2021-08-12,26,陈强计量及Stata应用(c)2014,2021-08-12,27,陈强计量及Stata应用(c)2014,非线性面板,对于面板数据,如果被解释变量为虚拟变量、计数变量、受限变量等,则为非线性面板。
非线性面板一般不适用线性面板的方法。
主要包括:
面板二值选择模型、面板计数模型、面板Tobit,2021-08-12,28,陈强计量及Stata应用(c)2014,面板二值选择模型,对于面板数据,如果被解释变量为虚拟变量,则称为“面板二值选择模型”(binarychoicemodelforpaneldata)。
对于二值选择行为,通常通过一个“潜变量”(latentvariable)来概括该行为的净收益(收益减去成本)。
如果净收益大于0,则选择做;否则,选择不做。
面板二值模型的设定,假设净收益为为不可观测的潜变量,为个体效应,而解释变量不含常数项。
个体选择规则为,2021-08-12,29,陈强计量及Stata应用(c)2014,面板Probit与面板Logit,与Probit/Logit模型的推导类似:
如果扰动项服从标准正态,则为面板Probit;如果服从逻辑分布,则为面板Logit。
2021-08-12,30,陈强计量及Stata应用(c)2014,混合回归,面板二值模型的主要估计方法包括混合回归、随机效应估计与固定效应估计。
如果,则为混合回归(pooledprobit或pooledlogit),可作为截面数据处理(无个体效应),使用截面数据的相关Stata命令即可。
由于同一个体不同时期的扰动项可能存在自相关,故应使用以面板为聚类的聚类稳健标准误(cluster-robuststandarderror)。
2021-08-12,31,陈强计量及Stata应用(c)2014,2021-08-12,32,陈强计量及Stata应用(c)2014,混合回归的Stata命令,probityx1x2x3,vce(clusterid)(混合probit回归)logityx1x2x3,vce(clusterid)(混合logit回归)id为用来确定面板单位的变量。
面板二值模型的个体效应,更一般地,允许个体效应的存在,即不同个体拥有不同的。
如果与所有解释变量均不相关,称为“随机效应模型”(RandomEffectsModel,简记RE)。
如果与某解释变量相关,称为“固定效应模型”(FixedEffectsModel,简记FE)。
对于线性面板的随机效应模型,一般使用GLS。
但非线性面板不便使用GLS,故进行MLE估计。
2021-08-12,33,陈强计量及Stata应用(c)2014,随机效应的MLE估计,假设,记其密度函数为。
以Logit为例。
给定,个体i的条件分布为,但不可观测。
将联合密度分解,然后积掉,2021-08-12,34,陈强计量及Stata应用(c)2014,随机效应的MLE估计(续),最大化此似然函数即得到“随机效应Logit估计量”(RandomEffectLogit)。
如将逻辑分布改为正态分布,则为“随机效应Probit估计量”(RandomEffectProbit)。
2021-08-12,35,陈强计量及Stata应用(c)2014,2021-08-12,36,陈强计量及Stata应用(c)2014,MLE的数值计算,上式积分无解析解,ButlerandMoffitt(1982)提出“Gauss-Hermitequadrature”进行数值积分(numericalintegration)。
Stata默认在12点上进行“adaptiveGauss-Hermitequadrature”计算。
Stata提供命令quadchk检验计算精度(取决于点数),即使用其他计算点数,比较结果的稳定性。
如结果不稳健,应增加点数,直至稳定。
随机效应模型的缺点,在进行随机效应估计时,已将积分积掉,故得不到对个体效应的估计。
因此,无法预测的发生概率或计算解释变量对的边际效应。
解决方法之一是假设=0。
2021-08-12,37,陈强计量及Stata应用(c)2014,对个体随机效应的检验,同一个体不同时期扰动项之间的协方差:
同一个体不同时期扰动项之间的自相关系数:
越大,则复合扰动项中个体效应部分越重要。
如果,则不存在个体随机效应,应选择混合回归。
对此可进行LR检验。
2021-08-12,38,陈强计量及Stata应用(c)2014,面板二值模型随机效应的Stata命令,xtprobityx1x2x3(默认为随机效应probit)xtlogityx1x2x3(默认为随机效应logit)输出结果包含对原假设“”的LR检验结果(Stata记为rho)。
如拒绝原假设,则采用随机效应模型;反之,支持混合回归。
2021-08-12,39,陈强计量及Stata应用(c)2014,面板二值模型的固定效应估计,其中,个体效应与解释变量相关。
对于线性面板,一般通过组内变换或一阶差分消去固定效应。
但这些变换对非线性面板不起作用即使加入个体虚拟变量(LSDV法),仍得不到一致估计,因为当时,待估计的个体效应的个数随之增加,称为“伴生参数”(incidentalparameters)。
2021-08-12,40,陈强计量及Stata应用(c)2014,如何解决伴生参数问题,对于固定效应的面板Probit模型,目前尚无法解决此伴生参数问题。
对于固定效应的面板Logit模型,可找到的“充分统计量”(sufficientstatistic),在给定此充分统计量的条件下进行“条件最大似然估计”(conditionalMLE)。
2021-08-12,41,陈强计量及Stata应用(c)2014,充分统计量的概念,考虑总体参数与统计量W。
如果统计量W包含了样本中所有可用来估计的信息,则称W为参数的充分统计量。
给定W之后,任何根据样本计算的其他统计量都不可能提供关于的额外信息。
样本数据在给定充分统计量W后的条件分布将不再依赖于(这正是充分统计量的严格定义)。
2021-08-12,42,陈强计量及Stata应用(c)2014,个体效应的充分统计量,对于Logit模型,Chamberlain(1980)使用作为的充分统计量,并最大化在给定情况下的条件似然函数。
以两期模型为例,即T=2。
对于个体i,只有三种可能情形,即0,1,或2。
必然有,故,对数似然函数为0,对样本似然函数无贡献,等于损失了这些观测值。
2021-08-12,43,陈强计量及Stata应用(c)2014,2021-08-12,44,陈强计量及Stata应用(c)2014,条件最大似然估计,
(2)。
必有。
同样道理,这些观测值不包含任何有助于估计的信息。
(3),。
或者,或者,分别计算条件概率:
2021-08-12,45,陈强计量及Stata应用(c)2014,条件最大似然估计(续),2021-08-12,46,陈强计量及Stata应用(c)2014,条件最大似然估计(续2),分子与分母的,被同时消去;逻辑分布的方便。
2021-08-12,47,陈强计量及Stata应用(c)2014,固定效应模型的缺点,无法估计不随时间变化变量的系数将损失所有或的观测值,导致样本容量减少。
使用条件MLE时消去,故无法估计个体效应。
解决方法之一是假设=0。
2021-08-12,48,陈强计量及Stata应用(c)2014,个体固定效应的检验,可使用豪斯曼检验,在固定效应与混合回归之间选择。
原假设为不存在个体固定效应。
如原假设成立,则固定效应与混合回归都一致,但混合回归更有效率(固定效应模型未充分利用的信息,且可能损失样本容量)。
如果原假设不成立,则固定效应一致,混合回归不一致。
如果二者的系数估计值相差较大,则应拒绝原假设。
在固定效应与随机效应之间选择,也可进行豪斯曼检验。
2021-08-12,49,陈强计量及Stata应用(c)2014,固定效应面板Logit的Stata命令,xtlogityx1x2x3,fe选择项“fe”表示固定效应,默认为随机效应。
2021-08-12,50,陈强计量及Stata应用(c)2014,例:
中国北方农民起义,Chen(2013)以数据集uprising.dta研究中国北方农民起义的决定因素,横截面为王朝(dyn),时间为年(year)。
被解释变量:
uprising(是否发生农民起义)解释变量:
age(王朝年龄),pop(人口),temp(气温),sfamine(是否发生严重饥荒),sfamine1(sfamine一阶滞后),sfamine2(sfamine二阶滞后),sfamine3(sfamine三阶滞后),relief(有否政府救济),relief1(relief一阶滞后),relief2(relief的二阶滞后),relief3(relief的三阶滞后)。
2021-08-12,51,陈强计量及Stata应用(c)2014,固定效应面板Logit,useuprising.dta,clearxtlogituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3,fenologestimatesstoreFE,2021-08-12,52,陈强计量及Stata应用(c)2014,2021-08-12,53,陈强计量及Stata应用(c)2014,解释,有一个朝代(共43年观测值)从未发生农民起义,在估计固定效应模型被去掉。
为第二个朝代(dyn=2),曹魏。
变量age,pop,temp的系数至少在5%水平上显著为正,这意味着王朝后期更易发生起义;人口压力越大,起义概率越高;气温越高,越易发生起义。
变量sfamine(严重饥荒)的当期系数在1%水平上显著为正,前三阶滞后的系数在10%水平上显著为正,严重饥荒显著地增加农民起义的发生概率。
变量relief(政府救灾)的各期系数至少在5%水平上显著为负,意味着政府救灾有助于缓解农民起义。
2021-08-12,54,陈强计量及Stata应用(c)2014,混合回归Logit,为保持与固定效应的样本一致,在混合回归中也去掉了“dyn=2”的那个朝代。
logituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3ifdyn=2,vce(clusterdyn)nolog,2021-08-12,55,陈强计量及Stata应用(c)2014,2021-08-12,56,陈强计量及Stata应用(c)2014,豪斯曼检验,为在固定效应与混合回归之间进行选择,进行豪斯曼检验。
但豪斯曼检验不允许混合回归使用选择项“vce(clusterdyn)”,故重新进行混合回归quietlylogituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3ifdyn=2,nologestimatesstorePOOLEDhausmanFEPOOLED,豪斯曼检验结果,强烈拒绝混合回归的原假设,应使用固定效应模型。
2021-08-12,57,陈强计量及Stata应用(c)2014,2021-08-12,58,陈强计量及Stata应用(c)2014,随机效应面板Logit,xtlogituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3ifdyn=2,renologestimatesstoreRE结果见下页,2021-08-12,59,陈强计量及Stata应用(c)2014,2021-08-12,60,陈强计量及Stata应用(c)2014,解释,LR检验强烈拒绝原假设“效应模型,不宜进行混合回归。
”,应使用面板随机,随机效应面板Logit的计算使用数值积分。
下面使用命令quadchk检验此数值积分的稳健性。
quadchk,noout选择项“noout”表示不显示重估模型的结果。
结果见下页:
所有系数的相对差距均小于,故数值积分结果值得信赖。
2021-08-12,61,陈强计量及Stata应用(c)2014
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Lecture Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件 高级 计量 经济学 Stata 应用 课件
![提示](https://static.bingdoc.com/images/bang_tan.gif)
链接地址:https://www.bingdoc.com/p-11855595.html