书签分享收藏举报版权申诉 / 115

立即下载加入VIP,免费下载

当前位置：首页 > 自然科学 > 物理 > Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx

Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx

文档编号：11855595
上传时间：2023-06-03
格式：PPTX
页数：115
大小：978.99KB

《Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx》由会员分享，可在线阅读，更多相关《Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx（115页珍藏版）》请在冰点文库上搜索。

Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx

高级计量经济学及Stata应用第八讲动态面板与非线性面板,陈强山东大学经济学院,2021-08-12,2,陈强计量及Stata应用（c）2013,2021-08-12,2,陈强计量及Stata应用（c）2014,动态面板,有些经济理论认为，由于惯性或部分调整，个体的当前行为取决于过去行为，比如资本存量的调整。

如果在面板模型中，解释变量包含了被解释变量的滞后值，则称之为“动态面板数据”（DynamicPanelData，简记DPD）。

对于动态面板，即使FE也不一致,例：

其离差形式为：

其中，,，,由于中包含的信息，而后者与相关，故FE不一致，称为“动态面板偏差”（dynamicpanelbias）。

2021-08-12,3,陈强计量及Stata应用（c）2014,一般的动态面板模型,先作一阶差分以消去个体效应：

但依然与相关，因此，为内生变量，需要寻找适当的工具变量才能得到一致估计。

2021-08-12,4,陈强计量及Stata应用（c）2014,2021-08-12,5,陈强计量及Stata应用（c）2014,Anderson-Hsiao估计量,AndersonandHsiao（1981）提出使用的工具变量，然后进行2SLS估计。

作为,显然，二者相关，满足相关性。

如果不存在自相关（对此假设须进行检验），则与不相关，满足外生性。

差分GMM,根据同样的逻辑，更高阶的滞后变量也是有效工具变量，而Anderson-Hsiao估计量未加以利用，故不是最有效率的。

ArellanoandBond（1991）使用所有可能的滞后变量作为工具变量（显然工具变量个数多于内生变量个数），进行GMM估计。

这就是“差分GMM”（DifferenceGMM）（因为是对差分后的方程进行GMM估计）。

2021-08-12,6,陈强计量及Stata应用（c）2014,2021-08-12,7,陈强计量及Stata应用（c）2014,差分GMM的缺点,如果T很大，则会有很多工具变量，容易出现弱工具变量（weakinstruments）问题（通常滞后越多期则相关性越弱），产生偏差。

解决方法是在使用Stata命令xtabond时，限制最多使用q阶滞后变量作为工具变量，但文献中对于如何选择工具变量个数并无明确指南。

差分GMM的缺点（续）,如果仅为前定变量而非严格外生，则经过差分后，,就可能与,导致内生性。

可使用,相关，作为IV。

不随时间变化的变量被消掉了，故差分GMM无法估计的系数。

2021-08-12,8,陈强计量及Stata应用（c）2014,水平GMM,ArellanoandBover（1995）重新回到了差分之前的水平方程（levelequation），并使用作为的工具变量。

显然，二者是相关的。

且如果,无自相关，则；但,须假设与个体效应不相关，才能保证这些工具变量与水平方程的复合扰动项不相关。

此假设意味着经济离稳态均衡不远。

2021-08-12,9,陈强计量及Stata应用（c）2014,系统GMM,BlundellandBond（1998）把差分GMM与水平GMM结合在一起，将差分方程与水平方程作为一个方程系统进行GMM估计，称为“系统GMM”（SystemGMM）。

系统GMM的优点是可提高估计效率，且可估计不随时间变化的变量的系数（系统GMM包含对水平方程的估计）。

但必须额外地假定与无关；否则，不能使用系统GMM。

在水平方程中，如果也包括内生变量，则同样可用其滞后值作为工具变量。

2021-08-12,10,陈强计量及Stata应用（c）2014,2021-08-12,11,陈强计量及Stata应用（c）2014,差分GMM的Stata命令,xtabonddepvarindepvars,lags（p）maxldep（q）twostepvce（robust）pre（varlist）endogenous（varlist）inst（varlist）“depvar”为被解释变量，“indepvars”为解释变量。

“lags（p）”表示使用被解释变量的p阶滞后值作为解释变量，默认p=1；“maxldep（q）”表示最多使用q阶被解释变量的滞后值作为工具变量，默认使用所有可能的滞后值。

选择项“twostep”表示使用GMM，默认2SLS；“pre（varlist）”，“endogenous（varlist）”，“inst（varlist）”分别指定前定变量、内生变量与额外的工具变量。

“vce（robust）”表示使用稳健标准误，允许存在异方差，且针对两步GMM估计进行调整，Stata称为“WC-RobustStandardError”（Windmeijer,2005；WC表示“Windmeijerbias-corrected”）,2021-08-12,12,陈强计量及Stata应用（c）2014,实例：

美国工人的工资决定,以数据集mus08psidextract.dta为例。

该面板数据集包含595名美国工人1976-1982年有关工资的以下变量（n=595，T=7的短面板）：

lwage（工资对数），ed（教育年限），exp（工龄），exp2（工龄平方），wks（weeksworked，工作周数），occ（是否蓝领工人），ind（是否在制造业工作），ms（婚否），south（是否在美国南方），smsa（是否住大城市），union（是否由工会合同确定工资），fem（是否女性），blk（是否黑人）。

待估计模型,以差分GMM估计以下动态面板模型：

其中，occ,south,smsa,ind为外生解释变量，wks及其一阶滞后为前定解释变量，而ms,union为内生解释变量。

2021-08-12,13,陈强计量及Stata应用（c）2014,2021-08-12,14,陈强计量及Stata应用（c）2014,差分GMM估计,usemus08psidextract.dta,clearxtabondlwageoccsouthsmsaind,lags

（2）maxldep（3）pre（wks,lag（1,2）endogenous（ms,lag（0,2）endogenous（union,lag（0,2）twostepvce（robust）选择项“lags

（2）”表示解释变量中包含被解释变量的一阶与二阶滞后；“maxldep（3）”表示最多使用被解释变量的三个滞后值作为工具变量；选择项“pre（wks,lag（1,2）”表示变量wks及其一阶滞后L.wks为前定解释变量，而使用其两个更高阶滞后值（即二阶与三阶）为工具变量；选择项“endogenous（ms,lag（0,2）”指定变量ms为内生解释变量（其中的“0”表示内生解释变量不包含ms的任何滞后），而最多使用其两个更高阶滞后值（即二阶与三阶）为工具变量。

2021-08-12,15,陈强计量及Stata应用（c）2014,扰动项的自相关检验,差分GMM成立的前提是，扰动项不存在自相关。

即使原假设“扰动项无自相关”成立，“扰动项的一阶差分”（first-differencederrors）仍将存在一阶自相关，因为但扰动项的差分将不存在二阶或更高阶的自相关。

为此，可以通过检验扰动项的差分是否存在一阶与二阶自相关，来检验原假设。

2021-08-12,16,陈强计量及Stata应用（c）2014,扰动项的自相关检验（续）,estatabond,结果显示，扰动项的差分存在一阶自相关，但不存在二阶自相关，故接受原假设。

2021-08-12,17,陈强计量及Stata应用（c）2014,过度识别检验,此差分GMM使用了40个工具变量，须进行过度识别检验。

重新运行“xtabond”命令，但略去选择项“vce（robust）”。

quietlyxtabondlwageoccsouthsmsaind,lags

（2）maxldep（3）pre（wks,lag（1,2）endogenous（ms,lag（0,2）endogenous（union,lag（0,2）twostepestatsargan,2021-08-12,18,陈强计量及Stata应用（c）2014,2021-08-12,19,陈强计量及Stata应用（c）2014,系统GMM估计,xtdpdsyslwageoccsouthsmsaind,lags

（2）maxldep（3）pre（wks,lag（1,2）endogenous（ms,lag（0,2）endogenous（union,lag（0,2）twostepvce（robust）结果参见下页。

系统GMM的系数估计值与差分GMM很接近，但前者的标准误比后者更小。

也许因为使用了更多的工具变量（共60个），系统GMM估计得更准确些。

2021-08-12,20,陈强计量及Stata应用（c）2014,系统GMM的扰动项自相关检验,estatabond,可在5%的显著性水平上拒绝“扰动项差分的二阶自相关系数为0的假设”，故可拒绝“扰动项无自相关”的原假设。

我们怀疑系统GMM是否适用。

2021-08-12,21,陈强计量及Stata应用（c）2014,系统GMM的过度识别检验,quietlyxtdpdsyslwageoccsouthsmsaind,lags

（2）maxldep（3）pre（wks,lag（1,2）endogenous（ms,lag（0,2）endogenous（union,lag（0,2）twostepestatsargan,强烈拒绝原假设,2021-08-12,22,陈强计量及Stata应用（c）2014,2021-08-12,23,陈强计量及Stata应用（c）2014,改进的系统GMM估计,对于此数据集，虽然系统GMM可能更有效率，但成立前提不满足；也可能模型设定不当。

为解决自相关，在解释变量中引入被解释变量的三阶滞后；为改善工具变量有效性，对于内生解释变量ms,union仅使用一个更高阶滞后值（即二阶滞后）为工具变量，但最多使用被解释变量的五个滞后值作为工具变量，重新进行系统GMM估计与检验：

xtdpdsyslwageoccsouthsmsaind,lags（3）maxldep（5）pre（wks,lag（1,2）endogenous（ms,lag（0,1）endogenous（union,lag（0,1）twostepvce（robust）,2021-08-12,24,陈强计量及Stata应用（c）2014,扰动项自相关检验,estatabond,可接受扰动项无自相关的原假设。

2021-08-12,25,陈强计量及Stata应用（c）2014,过度识别检验,quietlyxtdpdsyslwageoccsouthsmsaind,lags（3）maxldep（5）pre（wks,lag（1,2）endogenous（ms,lag（0,1）endogenous（union,lag（0,1）twostepestatsargan,可在5%水平上接受“所有工具变量都有效”的原假设。

2021-08-12,26,陈强计量及Stata应用（c）2014,2021-08-12,27,陈强计量及Stata应用（c）2014,非线性面板,对于面板数据，如果被解释变量为虚拟变量、计数变量、受限变量等，则为非线性面板。

非线性面板一般不适用线性面板的方法。

主要包括：

面板二值选择模型、面板计数模型、面板Tobit,2021-08-12,28,陈强计量及Stata应用（c）2014,面板二值选择模型,对于面板数据，如果被解释变量为虚拟变量，则称为“面板二值选择模型”（binarychoicemodelforpaneldata）。

对于二值选择行为，通常通过一个“潜变量”（latentvariable）来概括该行为的净收益（收益减去成本）。

如果净收益大于0，则选择做；否则，选择不做。

面板二值模型的设定,假设净收益为为不可观测的潜变量，为个体效应，而解释变量不含常数项。

个体选择规则为,2021-08-12,29,陈强计量及Stata应用（c）2014,面板Probit与面板Logit,与Probit/Logit模型的推导类似：

如果扰动项服从标准正态，则为面板Probit；如果服从逻辑分布，则为面板Logit。

2021-08-12,30,陈强计量及Stata应用（c）2014,混合回归,面板二值模型的主要估计方法包括混合回归、随机效应估计与固定效应估计。

如果，则为混合回归（pooledprobit或pooledlogit），可作为截面数据处理（无个体效应），使用截面数据的相关Stata命令即可。

由于同一个体不同时期的扰动项可能存在自相关，故应使用以面板为聚类的聚类稳健标准误（cluster-robuststandarderror）。

2021-08-12,31,陈强计量及Stata应用（c）2014,2021-08-12,32,陈强计量及Stata应用（c）2014,混合回归的Stata命令,probityx1x2x3,vce（clusterid）（混合probit回归）logityx1x2x3,vce（clusterid）（混合logit回归）id为用来确定面板单位的变量。

面板二值模型的个体效应,更一般地，允许个体效应的存在，即不同个体拥有不同的。

如果与所有解释变量均不相关，称为“随机效应模型”（RandomEffectsModel，简记RE）。

如果与某解释变量相关，称为“固定效应模型”（FixedEffectsModel，简记FE）。

对于线性面板的随机效应模型，一般使用GLS。

但非线性面板不便使用GLS，故进行MLE估计。

2021-08-12,33,陈强计量及Stata应用（c）2014,随机效应的MLE估计,假设，记其密度函数为。

以Logit为例。

给定，个体i的条件分布为,但不可观测。

将联合密度分解，然后积掉,2021-08-12,34,陈强计量及Stata应用（c）2014,随机效应的MLE估计（续）,最大化此似然函数即得到“随机效应Logit估计量”（RandomEffectLogit）。

如将逻辑分布改为正态分布，则为“随机效应Probit估计量”（RandomEffectProbit）。

2021-08-12,35,陈强计量及Stata应用（c）2014,2021-08-12,36,陈强计量及Stata应用（c）2014,MLE的数值计算,上式积分无解析解，ButlerandMoffitt（1982）提出“Gauss-Hermitequadrature”进行数值积分（numericalintegration）。

Stata默认在12点上进行“adaptiveGauss-Hermitequadrature”计算。

Stata提供命令quadchk检验计算精度（取决于点数），即使用其他计算点数，比较结果的稳定性。

如结果不稳健，应增加点数，直至稳定。

随机效应模型的缺点,在进行随机效应估计时，已将积分积掉，故得不到对个体效应的估计。

因此，无法预测的发生概率或计算解释变量对的边际效应。

解决方法之一是假设=0。

2021-08-12,37,陈强计量及Stata应用（c）2014,对个体随机效应的检验,同一个体不同时期扰动项之间的协方差：

同一个体不同时期扰动项之间的自相关系数：

越大，则复合扰动项中个体效应部分越重要。

如果，则不存在个体随机效应，应选择混合回归。

对此可进行LR检验。

2021-08-12,38,陈强计量及Stata应用（c）2014,面板二值模型随机效应的Stata命令,xtprobityx1x2x3（默认为随机效应probit）xtlogityx1x2x3（默认为随机效应logit）输出结果包含对原假设“”的LR检验结果（Stata记为rho）。

如拒绝原假设，则采用随机效应模型；反之，支持混合回归。

2021-08-12,39,陈强计量及Stata应用（c）2014,面板二值模型的固定效应估计,其中，个体效应与解释变量相关。

对于线性面板，一般通过组内变换或一阶差分消去固定效应。

但这些变换对非线性面板不起作用即使加入个体虚拟变量（LSDV法），仍得不到一致估计，因为当时，待估计的个体效应的个数随之增加，称为“伴生参数”（incidentalparameters）。

2021-08-12,40,陈强计量及Stata应用（c）2014,如何解决伴生参数问题,对于固定效应的面板Probit模型，目前尚无法解决此伴生参数问题。

对于固定效应的面板Logit模型，可找到的“充分统计量”（sufficientstatistic），在给定此充分统计量的条件下进行“条件最大似然估计”（conditionalMLE）。

2021-08-12,41,陈强计量及Stata应用（c）2014,充分统计量的概念,考虑总体参数与统计量W。

如果统计量W包含了样本中所有可用来估计的信息，则称W为参数的充分统计量。

给定W之后，任何根据样本计算的其他统计量都不可能提供关于的额外信息。

样本数据在给定充分统计量W后的条件分布将不再依赖于（这正是充分统计量的严格定义）。

2021-08-12,42,陈强计量及Stata应用（c）2014,个体效应的充分统计量,对于Logit模型，Chamberlain（1980）使用作为的充分统计量，并最大化在给定情况下的条件似然函数。

以两期模型为例，即T=2。

对于个体i，只有三种可能情形，即0，1，或2。

必然有，故，对数似然函数为0，对样本似然函数无贡献，等于损失了这些观测值。

2021-08-12,43,陈强计量及Stata应用（c）2014,2021-08-12,44,陈强计量及Stata应用（c）2014,条件最大似然估计,

（2）。

必有。

同样道理，这些观测值不包含任何有助于估计的信息。

（3）,。

或者，或者，分别计算条件概率：

2021-08-12,45,陈强计量及Stata应用（c）2014,条件最大似然估计（续）,2021-08-12,46,陈强计量及Stata应用（c）2014,条件最大似然估计（续2）,分子与分母的,被同时消去；逻辑分布的方便。

2021-08-12,47,陈强计量及Stata应用（c）2014,固定效应模型的缺点,无法估计不随时间变化变量的系数将损失所有或的观测值，导致样本容量减少。

使用条件MLE时消去，故无法估计个体效应。

解决方法之一是假设=0。

2021-08-12,48,陈强计量及Stata应用（c）2014,个体固定效应的检验,可使用豪斯曼检验，在固定效应与混合回归之间选择。

原假设为不存在个体固定效应。

如原假设成立，则固定效应与混合回归都一致，但混合回归更有效率（固定效应模型未充分利用的信息，且可能损失样本容量）。

如果原假设不成立，则固定效应一致，混合回归不一致。

如果二者的系数估计值相差较大，则应拒绝原假设。

在固定效应与随机效应之间选择，也可进行豪斯曼检验。

2021-08-12,49,陈强计量及Stata应用（c）2014,固定效应面板Logit的Stata命令,xtlogityx1x2x3,fe选择项“fe”表示固定效应，默认为随机效应。

2021-08-12,50,陈强计量及Stata应用（c）2014,例：

中国北方农民起义,Chen（2013）以数据集uprising.dta研究中国北方农民起义的决定因素，横截面为王朝（dyn），时间为年（year）。

被解释变量：

uprising（是否发生农民起义）解释变量：

age（王朝年龄），pop（人口），temp（气温），sfamine（是否发生严重饥荒）,sfamine1（sfamine一阶滞后）,sfamine2（sfamine二阶滞后）,sfamine3（sfamine三阶滞后）,relief（有否政府救济）,relief1（relief一阶滞后）,relief2（relief的二阶滞后）,relief3（relief的三阶滞后）。

2021-08-12,51,陈强计量及Stata应用（c）2014,固定效应面板Logit,useuprising.dta,clearxtlogituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3,fenologestimatesstoreFE,2021-08-12,52,陈强计量及Stata应用（c）2014,2021-08-12,53,陈强计量及Stata应用（c）2014,解释,有一个朝代（共43年观测值）从未发生农民起义，在估计固定效应模型被去掉。

为第二个朝代（dyn=2），曹魏。

变量age,pop,temp的系数至少在5%水平上显著为正，这意味着王朝后期更易发生起义；人口压力越大，起义概率越高；气温越高，越易发生起义。

变量sfamine（严重饥荒）的当期系数在1%水平上显著为正，前三阶滞后的系数在10%水平上显著为正，严重饥荒显著地增加农民起义的发生概率。

变量relief（政府救灾）的各期系数至少在5%水平上显著为负，意味着政府救灾有助于缓解农民起义。

2021-08-12,54,陈强计量及Stata应用（c）2014,混合回归Logit,为保持与固定效应的样本一致，在混合回归中也去掉了“dyn=2”的那个朝代。

logituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3ifdyn=2,vce（clusterdyn）nolog,2021-08-12,55,陈强计量及Stata应用（c）2014,2021-08-12,56,陈强计量及Stata应用（c）2014,豪斯曼检验,为在固定效应与混合回归之间进行选择，进行豪斯曼检验。

但豪斯曼检验不允许混合回归使用选择项“vce（clusterdyn）”，故重新进行混合回归quietlylogituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3ifdyn=2,nologestimatesstorePOOLEDhausmanFEPOOLED,豪斯曼检验结果,强烈拒绝混合回归的原假设，应使用固定效应模型。

2021-08-12,57,陈强计量及Stata应用（c）2014,2021-08-12,58,陈强计量及Stata应用（c）2014,随机效应面板Logit,xtlogituprisingagepoptempsfaminesfamine1sfamine2sfamine3reliefrelief1relief2relief3ifdyn=2,renologestimatesstoreRE结果见下页,2021-08-12,59,陈强计量及Stata应用（c）2014,2021-08-12,60,陈强计量及Stata应用（c）2014,解释,LR检验强烈拒绝原假设“效应模型，不宜进行混合回归。

”，应使用面板随机,随机效应面板Logit的计算使用数值积分。

下面使用命令quadchk检验此数值积分的稳健性。

quadchk,noout选择项“noout”表示不显示重估模型的结果。

结果见下页：

所有系数的相对差距均小于，故数值积分结果值得信赖。

2021-08-12,61,陈强计量及Stata应用（c）2014

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: Lecture Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件高级计量经济学 Stata 应用课件

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx
链接地址：https://www.bingdoc.com/p-11855595.html

Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件.pptx

热门标签