基于主成分分析的我国GDP影响因素实证分析.docx
- 文档编号:10742702
- 上传时间:2023-05-27
- 格式:DOCX
- 页数:19
- 大小:33.77KB
基于主成分分析的我国GDP影响因素实证分析.docx
《基于主成分分析的我国GDP影响因素实证分析.docx》由会员分享,可在线阅读,更多相关《基于主成分分析的我国GDP影响因素实证分析.docx(19页珍藏版)》请在冰点文库上搜索。
基于主成分分析的我国GDP影响因素实证分析
提纲
1.引言
2.计量模型
2.1确定模型的解释变量
2.2主成分分析
2.2.1选择主成分分析方法的缘由
2.2.2确定模型的数学形式
2.2.3对GDP影响因素的主成分分析过程
2.3参数估计及检验
2.3.1拟合回归模型
2.3.2回归检验法检验序列相关
2.3.3异方差性检验
2.3.4修正后模型
2.41989—2002年中国GDP贡献率和影响因素分析
3.结论和政策建议
摘要:
本文利用主成分分析的方法,从国民经济核算支出法的角度,对影响我国国内生产总值的七个因素建立计量模型,并进行实证分析。
通过一系列统计分析和检验方法,拟合出比较优良的GDP模型,得出1989—2002年间我国经济增长的情况。
由此来分析所选取的这七个变量对GDP的贡献情况,结合当前我国宏观经济形势,找出目前经济发展存在的问题,从而找出相应的对策。
关键词:
GDP计量分析主成分分析影响因素
Abstract:
Themethodthatthistextutilizesmaincompositiontoanalyze,intermsofexpenditureapproachofthenationalbusinessaccounting,setupthemodelofmeasuringtosevenfactorswhichinfluencethegrossdomesticproductofourcountry,andcarryonrealexampleanalysis.Throughaseriesofstatisticalanalysisandmethodofinspection,fitoutfinerGDPmodel,drawthesituationoftheeconomicgrowthofourcountryamong1989-2002.ComesevenvariablesituationofcontributinginGDPthesechosentoanalyses,combinethepresentmacroeconomicsituationofourcountry,findouttheexistingproblemofeconomicdevelopmentatpresent,thusfindoutthecorrespondingcountermeasure.
Keywords:
GDPEconometricAnalysisPrincipalComponentAnalysis
Influencefactor
基于主成分分析的我国GDP影响因素实证分析
作者:
赖 艳 指导老师:
刘小瑜
1.引言
改革开放以来,中国经济取得了令全世界震惊的巨大成就,持续25年年均增长率超过9%,经济总规模已经稳居世界第6位。
2003年中国经济增长率更是高达9.1%,比国际组织预测的全球主要国家的经济增速高两倍左右。
因此,许多专家学者指出,我国目前的经济形势是上世纪90年代中期以来最好的。
[①]由此可见,GDP作为现代国民经济核算体系的核心指标,它的总量可以反映一个国家和地区的经济发展及人民的生活水平,其结构可反映社会生产与使用,投资与消费之间的比例关系及宏观经济效益,对于经济研究、经济管理都具有十分重要的意义。
尤其从1985年我国开始正式统计GDP后,它就越来越受到人们的关注。
GDP的核算中有许多因素在起着作用,为此,本文拟从定量研究的角度出发,通过主成分分析的方法对国内生产总值GDP的影响因素作计量模型的实证分析,以期分析各影响因素对经济增长的贡献情况,结合我国当前的宏观经济形势,对国家宏观经济政策提出一点自己的看法。
2.计量模型
2.1确定模型的解释变量
核算GDP有生产法,收入法和支出法三种方法,其中支出法是从社会产品最终使用去向的角度来核算GDP的,即积累、消费与出口。
GDP=总投资+总消费+净出口,而本文选择影响GDP的因素(解释变量)正是基于最终使用的角度考虑的。
这是因为支出法的核算对象具有完整的实物形态,各因素的统计资料比较易于收集。
本文将GDP模型的解释变量确定为税收(SS),社会消费品零售总额(XFP),全国固定资产投资(TZ),从业人口数(RK),教育投资(JY),实际利用外资额(WZ),进出口总额(JCK)7个变量。
之所以选择以上因素作为解释变量,是因为:
税收是国家财政收入的主要来源对经济总量的积累有重要作用。
社会消费品零售总额从实物形态上反映了社会总消费的规模,对GDP有决定性影响。
固定资产投资包括基本建设,更新改造,房地产投资及城乡各种固定资产投资等,在总投资中占很大比重,对GDP影响较大。
实际利用外资额反映一个国家的对外开放程度,扩大利用外资的规模仍然是加快我国经济发展和体制变革的重要因素,同时通过利用外资能够有效地带动我国产业结构的调整优化。
[②]因此实际利用外资对于GDP增长的作用可见一斑。
进出口总额的规模对GDP的大小有很重要的影响。
而国家财政性的教育投资经费关系到对人力资本的培养,对GDP有创造性的贡献。
另外,经济活动以人为本,劳动力是生产发展中最活跃的因素,是重要的生产资源,从业人口数也是促进经济增长的生力军。
2.2主成分分析
2.2.1选择主成分分析方法的缘由
对于以上所选取的因素(解释变量),从定性方面探讨无法确定其重要程度,显然也很难确定哪一个是主要因素,哪一个是次要因素。
由于它们之间有切实的内在联系,在一定程度上反映的信息有所重叠。
只凭经验或单纯的定性分析,会有主观性和任意性。
由于各因素的相互关联和相互依赖,不适合建立一般的逐步回归模型,而宜采用主成分分析的方法。
主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标,来替代原来的指标。
通常数学上的处理就是将原来P个指标做线形组合,作为新的综合指标。
通过这样简化结构,消除变量之间的多重共线性。
找出影响GDP的一个或少数几个综合指标,使综合指标为原来变量的线形组合。
选取的第一个线形组合,我们要求它的方差是最大的,这样它所包含的信息就越多,将它称作第一主成分。
如果第一主成分不足以代表原来P个指标的信息,即第一主成分的累积贡献率没有达到85%以上,那么就再考虑选取第二主成分。
依次类推可以选出第三、第四……第k个主成分。
这些主成分之间互不相关,且它们的方差依次递减。
这样,选出的综合指标不仅保留了原始变量的主要信息,彼此之间又不相关,比原始变量具有更优越的性质。
用筛选出的主要因素构造回归系数,要比一般回归模型精度更高。
2.2.2确定模型的数学形式
将著名的柯布—道格拉斯Cobb-Dauglas生产函数推广建立GDP模型。
本文中构建的GDP模型,正是将劳动和资本细化分解为七个影响经济增长的主要因素,即:
、
(2.1)为了计算的方便,对式(2.1)两边取对数使之线形化,即:
(2.2)
2.2.3对GDP影响因素的主成分分析过程
样本数据如下:
表2.11989—2002年中国GDP及其影响因素
year
GDP
SS
XFP
TZ
RK
JY
WZ
JCK
1989
16909.20
2727.40
8101.40
4410.40
55329.00
5294327.10
100.59
4156.00
1990
17625.43
2821.86
8050.53
4517.00
64749.00
6577836.30
102.89
5560.10
1991
19232.27
2990.17
9106.00
5594.50
65491.00
7315028.20
115.54
7225.80
1992
21935.25
3296.91
10332.42
8080.10
66152.00
8670490.50
192.02
9119.60
1993
24812.62
4255.30
10864.95
13072.30
66808.00
10599374.40
389.60
11271.00
1994
27945.33
5126.88
13106.12
17042.10
67455.00
14887812.60
432.13
20381.90
1995
30461.47
6038.04
17608.88
20019.30
68065.00
18779501.10
481.33
23499.90
1996
33432.26
6909.82
22875.44
22913.50
68950.00
22623393.50
548.04
24133.80
1997
36303.40
8234.04
26555.35
24941.10
69820.00
25317325.70
644.08
26967.20
1998
39137.17
9262.80
29387.60
28406.20
70637.00
29490592.00
585.57
26849.70
1999
41946.03
10682.58
31576.77
29854.70
71394.00
33490416.40
526.59
29896.20
2000
45471.11
12581.51
34016.53
32917.70
72085.00
38490805.80
593.56
39273.20
2001
48653.65
15301.38
37333.86
37213.50
73025.00
46376626.20
496.72
42183.60
2002
52691.91
17636.45
40951.45
43499.90
73740.00
57213764.50
550.11
51378.20
资料来源:
《中国统计年鉴2003》,以1989年价格推算。
利用SAS软件对上述影响GDP的7个因素的对数化形式进行主成分分析:
dataly;
inputyear$GDPSSXFPTZRKJYWZJCK;
LnGDP=LOG(GDP);
LnSS=LOG(SS);
LnXFP=LOG(XFP);
LnTZ=LOG(TZ);
LnRK=LOG(RK);
LnJY=LOG(JY);
LnWZ=LOG(WZ);
LnJCK=LOG(JCK);
Cards;
;
run;
procprincompout=prinly;
varLnSSLnXFPLnTZLnRKLnJYLnWZLnJCK;
run;
PrincipalComponentAnalysis
表2.2CorrelationMatrix
LNSS
LNXFP
LNTZ
LNRK
LNJY
LNWZ
LNJCK
LNSS
1.0000
0.9858
0.9594
0.8376
0.9933
0.8382
0.9602
LNXFP
0.9858
1.0000
0.9581
0.8317
0.9887
0.8547
0.9549
LNTZ
0.9594
0.9581
1.0000
0.8646
0.9777
0.9536
0.9891
LNRK
0.8376
0.8317
0.8646
1.0000
0.8755
0.8016
0.8957
LNJY
0.9933
0.9887
0.9777
0.8755
1.0000
0.8760
0.9821
LNWZ
0.8382
0.8547
0.9536
0.8016
0.8760
1.0000
0.9257
LNJCK
0.9602
0.9549
0.9891
0.8957
0.9821
0.9257
1.0000
表2.3EigenvaluesoftheCorrelationMatrix
Eigenvalue
Difference
Proportion
Cumulative
PRIN1
6.52326
6.29530
0.931894
0.93189
PRIN2
0.22796
0.01408
0.032566
0.96446
PRIN3
0.21388
0.19104
0.030554
0.99501
PRIN4
0.02284
0.01311
0.003263
0.99828
PRIN5
0.00973
0.00791
0.001390
0.99967
PRIN6
0.00182
0.00132
0.000260
0.99993
PRIN7
0.00050
0.000072
1.00000
表2.4Eigenvectors
PRIN1
PRIN2
PRIN3
PRIN4
PRIN5
PRIN6
PRIN7
LNSS
0.381537
-.425175
0.145705
-.173564
0.608146
0.428397
0.262558
LNXFP
0.381469
-.406220
0.069480
0.673982
-.416320
-.046126
0.234387
LNTZ
0.388626
0.019606
-.239131
-.178630
0.235207
-.802309
0.245910
LNRK
0.353290
0.640194
0.654830
0.158992
0.093781
-.001103
0.049607
LNJY
0.388271
-.240235
0.115388
-.090283
-.015738
-.103740
-.871239
LNWZ
0.362058
0.427957
-.687660
0.267296
0.129116
0.333141
-.117426
LNJCK
0.388879
0.055847
-.042012
-.615499
-.613026
0.221141
0.200865
从以上的主成分分析运行结果可以看出,第一个特征根的累积贡献率达到了93.19%,这说明第一个主成分代表了原来七个因素93.19%的信息,则第一主成分与原来变量之间的线形组合为:
Pirnt1=0.382LnSS+0.381LnXFP+0.389LnTZ+0.353LnRK+0.388LnJY+0.362LnWZ+0.389LnJCK(2.3)
2.3参数估计及检验
2.3.1拟合回归模型
我们使用Eviews3.0来建立Print1和LnGDP之间的线形方程,假设为:
LnGDP=C+aPrint1
=C+0.382LnSS+0.381LnXFP+0.389LnTZ+0.353LnRK+0.388LnJY+0.362LnWZ+0.389LnJCK(2.4)
表2.5
DependentVariable:
LNGDP
Method:
LeastSquares
Date:
05/25/04Time:
14:
07
Sample:
19892002
Includedobservations:
14
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
4.011427
0.200795
19.97773
0.0000
PRINT1
0.232190
0.007370
31.50622
0.0000
R-squared
0.988055
Meandependentvar
10.32711
AdjustedR-squared
0.987060
S.D.dependentvar
0.382213
S.E.ofregression
0.043478
Akaikeinfocriterion
-3.301551
Sumsquaredresid
0.022684
Schwarzcriterion
-3.210257
Loglikelihood
25.11086
F-statistic
992.6418
Durbin-Watsonstat
1.294216
Prob(F-statistic)
0.000000
由表2.5的运行结果可以看出,该计量模型的拟合优度相当高,R2达到0.988。
各变量均通过a=5%的t值检验,即变量都是显著的。
但D.W统计量仅为1.29,不能判断变量之间是否存在序列相关性。
因此,我们运用回归检验法对其进行序列相关性的检验。
2.3.2回归检验法检验序列相关
将ER作为被解释变量,ER(-1)作为解释变量,样本数据如表2.6:
表2.6
obs
LNGDP
LNGDP1
ER
ER(-1)
1989
9.735613
——
——
——
1990
9.828112
——
——
——
1991
9.981272
9.986215
-0.00494
——
1992
10.1901
10.19312
-0.00302
-0.00494
1993
10.4526
10.45617
-0.00357
-0.00302
1994
10.75277
10.73572
0.017048
-0.00357
1995
10.97641
10.98355
-0.00714
0.017048
1996
11.12556
11.12362
0.001944
-0.00714
1997
11.21805
11.22008
-0.00203
0.001944
1998
11.26888
11.2703
-0.00142
-0.00203
1999
11.3153
11.30548
0.009816
-0.00142
2000
11.40164
11.38545
0.016189
0.009816
2001
11.48571
11.4831
0.002604
0.016189
2002
11.55972
11.58519
-0.02547
0.002604
表2.7回归检验法检验序列相关
DependentVariable:
ER
Method:
LeastSquares
Date:
05/27/04Time:
13:
45
Sample(adjusted):
19902002
Includedobservations:
13afteradjustingendpoints
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-1.69e-05
0.00161827
-0.01041416
0.991877
ER(-1)
-0.5349753
0.25479878
-2.09959937
0.059641
R-squared
0.2860998
Meandependentvar
1.315e-08
AdjustedR-squared
0.2211998
S.D.dependentvar
0.006611
S.E.ofregression
0.0058347
Akaikeinfocriterion
-7.309344
Sumsquaredresid
0.0003744
Schwarzcriterion
-7.222428
Loglikelihood
49.510736
F-statistic
4.408317
Durbin-Watsonstat
1.9798784
Prob(F-statistic)
0.059641
运用OLS进行参数估计,得如下方程:
et=-1.69e-05-0.5349753et(-1)(2.5)
(-0.01041416)(-2.09959937)
R2=0.2860998F=4.408317
显然,该方程的拟合度很低,总体显著性极差,方程变量的显著性也极差。
这说明原模型不存在一阶自相关。
依次对二阶序列相关进行类似检验,结果相同。
说明模型不存在序列相关。
2.3.3 异方差性检验
其次,采用戈里瑟方法对模型进行异方差的检验,运用OLS模拟得如下回归方程:
et‘=0.0226560-0.0006880Print1
(0.99652160)(-0.82462920)
R2=0.0536287F=0.680013(2.6)
表2.8异方差的戈里瑟检验
DependentVariable:
ER1
Method:
LeastSquares
Date:
05/27/04Time:
13:
48
Sample:
19892002
Includedobservations:
14
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
0.0226560
0.02273514
0.99652160
0.338667
PRINT1
-0.0006880
0.00083443
-0.82462920
0.425670
R-squared
0.0536287
Meandependentvar
0.003939
AdjustedR-squared
-0.0252355
S.D.dependentvar
0.004861
S.E.ofregression
0.0049228
Akaikeinfocriterion
-7.658294
Sumsquaredresid
0.0002908
Schwarzcriterion
-7.567000
Loglikelihood
55.608064
F-statistic
0.680013
Durbin-Watsonstat
1.6141489
Prob(F-statistic)
0.425670
由于方程的拟合度很低,造成方程的相对误差较大,因此认为模型不存在异方差性。
2.3.4修正后模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 成分 分析 我国 GDP 影响 因素 实证
![提示](https://static.bingdoc.com/images/bang_tan.gif)