EViews计量经济学实验报告多重共线性的诊断与修正.docx
- 文档编号:15576140
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:19
- 大小:51.50KB
EViews计量经济学实验报告多重共线性的诊断与修正.docx
《EViews计量经济学实验报告多重共线性的诊断与修正.docx》由会员分享,可在线阅读,更多相关《EViews计量经济学实验报告多重共线性的诊断与修正.docx(19页珍藏版)》请在冰点文库上搜索。
EViews计量经济学实验报告多重共线性的诊断与修正
时间地点
实验题目多重共线性的诊断与修正
一、实验目的与要求:
要求目的:
1、对多元线性回归模型的多重共线性的诊断;
2、对多元线性回归模型的多重共线性的修正。
二、实验内容
根据书上第四章引子"农业的发展反而会减少财政收入”,1978—2007年的财政收入,农业增加值,工业增加值,建筑
业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。
三、实验过程:
(实践过程、实践所有参数与指标、理论依据说明等)
(一)模型设定及其估计
经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。
研究“农业的发展反而会减少财政收入”这个问题。
设定如下形式的计量经济模型:
Yi='-!
+-2X2+3X3+'4X4+-5X5+■6X6+一:
7X7+叫
其中,Yi为财政收入CS/亿元;X2为农业增加值NZ/亿元;X3为工业增加值GZ/亿元;X4为建筑业增加值JZZ/亿元;
X5为总人口TPOP万人;
X6为最终消费CUM亿兀;X为受灾面积SZM千公顷。
图1:
1978
〜2007年财政收入及其影响因素数据
年份
财政收入
CS/亿元
农业增加值
NZ/亿元
工业增加
值GZ/亿
元
建筑业
增加值
JZZ/亿
元
总人口
TPOP万
人
最终消费
CUM亿元
受灾面积SZM/
千公顷
1978
1132.3
1027.5
1607
138.2
96259
2239.1
50790
1979
1146.4
1270.2
1769.7
143.8
97542
2633.7
39370
1980
1159.9
1371.6
1996.5
195.5
98705
3007.9
44526
1981
1175.8
1559.5
2048.4
207.1
100072
3361.5
39790
1982
1212.3
1777.4
2162.3
220.7
101654
3714.8
33130
1983
1367
1978.4
2375.6
270.6
103008
4126.4
34710
1984
1642.9
2316.1
2789
316.7
104357
4846.3
31890
1985
2004.8
2564.4
3448.7
417.9
105851
5986.3
44365
1986
2122
2788.7
3967
525.7
107507
6821.8
47140
1987
2199.4
3233
4585.8
665.8
109300
7804.6
42090
1988
2357.2
3865.4
5777.2
810
111026
9839.5
50870
1989
2664.9
4265.9
6484
794
112704
11164.2
46991
1990
2937.1
5062
6858
859.4
114333
12090.5
38474
1991
3149.48
5342.2
8087.1
1015.1
115823
14091.9
55472
1992
3483.37
5866.6
10284.5
1415
117171
17203.3
51333
1993
4348.95
6963.8
14188
2266.5
118517
21899.9
48829
1994
5218.1
9572.7
19480.7
2964.7
119850
29242.2
55043
1995
6242.2
12135.8
24950.6
3728.8
121121
36748.2
45821
1996
7407.99
14015.4
29447.6
4387.4
122389
43919.5
46989
1997
8651.14
14441.9
32921.4
4621.6
123626
48140.6
53429
1998
9875.95
14817.6
34018.4
4985.8
124761
51588.2
50145
1999
11444.08
14770
35861.5
5172.1
125786
55636.9
49981
2000
13395.23
14944.7
40036
5522.3
126743
61516
54688
2001
16386.04
15781.3
43580.6
5931.7
127627
66878.3
52215
2002
18903.64
16537
47431.3
6465.5
128453
71691.2
47119
2003
21715.25
17381.7
54945.5
7490.8
129227
77449.5
54506
2004
26396.47
21412.7
65210
8694.3
129988
87032.9
37106
2005
31649.29
22420
76912.9
10133.8
130756
96918.1
38818
2006
38760.2
24040
91310.9
11851.1
131448
110595.3
41091
2007
51321.78
28095
107367.2
14014.1
132129
128444.6
48992
X
2
X3
X4、X5
X6、x7等数据,采用这些数据对模型进行
(二)诊断多重共线性
.xIs
1、双击“Eviews”,进入主页。
输入数据:
点击主菜单中的File/Open/EVWorkfile—Excel—多重共线性的数据
2、在EV主页界面的窗口,输入“lsycx2x3x4x5x6x7”,按“Enter”.出现OLS回归结果,图2:
图2:
OLS回归结果
DependentVariable:
Y
Method:
LeastSquares
Date:
10/12/10Time:
17:
07
Sample:
19782007
Ineludedobservations:
30
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-6646.694
6454.156
-1.029832
0.3138
X2
-0.970688
0.330409
-2.937841
0.0074
X3
1.084654
0.228521
4.746397
0.0001
X4
-2.763928
2.076994
-1.330735
0.1963
X5
0.077613
0.067974
1.141808
0.2653
X6
-0.047119
0.081509
-0.578084
0.5688
X7
0.007580
0.035039
0.216329
0.8306
R-squared
0.994565
Meandependentvar
10049.04
AdjustedR-squared
0.993147
S.D.dependentvar
12585.51
S.E.ofregression
1041.849
Akaikeinfocriterion
16.93634
Sumsquaredresid
24965329
Schwarzcriterion
17.26329
Loglikelihood
-247.0452
F-statistic
701.4747
Durbin-Watsonstat
2.167410
Prob(F-statistic)
0.000000
由此可见,该模型的可决系数为0.995,修正的可决系数为0.993,模型拟和很好,F统计量为701.47,模型拟和很好,回归方程整体上显著。
但是当a=0.05时,口2(n—k)=t0.025(23)=2.069,不仅X4、X5X6、X7的系数t检验不显著,而且X2、X4、X6系数的符号与预期相反,这表明很可能存在严重的多重共线性。
(即除了农业增加值x2、工业增加值X3夕卜,其他因素对
财政收入的影响都不显著,且农业增加值X2、建筑业增加值X4、最终消费X6的回归系数还是负数,这说明很可能
存在严重的多重共线性。
)
3、计算各解释变量的相关系数:
—OK,出
在Workfile窗口,选择X2、X3、X4、X5、X6、X7数据,点击"Quick”一GroupStatistics—Correlations
现相关系数矩阵,如图3:
图3:
相关系数矩阵
X2
X3
X4
X5
X6
X7
0.9729806145
0.9826606234
0.9279784294
0.9889626197
0.2261999658
X2
1
6147
99789
06745
24667
72465
0.9729806145
0.9985218083
0.8439002065
0.9926412367
0.1294437103
X3
6147
1
93188
68758
11784
36215
0.9826606234
0.9985218083
0.8641521359
0.9960568434
0.1546457184
X4
99789
93188
1
28051
41596
04353
0.9279784294
0.8439002065
0.8641521359
0.8888480555
0.3877672648
X5
06745
68758
28051
1
46979
08787
0.9889626197
0.9926412367
0.9960568434
0.8888480555
0.1851728808
X6
24667
11784
41596
46979
1
51582
0.2261999658
0.1294437103
0.1546457184
0.3877672648
0.1851728808
X7
72465
36215
04353
08787
51582
1
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,特别是农业增加值X2、工业增加值X3、建筑业增
加值X4、最终消费之间X6,相关系数都在0.8以上。
这表明模型存在着多重共线性。
(三)修正多重共线性
1、采用逐步回归法,去检验和解决多重共线性问题。
分别作Y对X2、X3、X4、X5、X6X7的一元回归,结果如下图
4:
在EV主页界面的窗口,输入“lsycx2”,“回车键”。
DependentVariable:
Y
Method:
LeastSquares
Date:
10/12/10Time:
17:
49
Sample:
19782007
Ineludedobservations:
30
R-squared
0.846034
Meandependentvar
10049.04
AdjustedR-squared
0.840536
S.D.dependentvar
12585.51
S.E.ofregression
5025.770
Akaikeinfocriterion
19.94689
Sumsquaredresid
7.07E+08
Schwarzcriterion
20.04030
Loglikelihood
-297.2033
F-statistic
153.8588
Durbin-Watsonstat
0.166951
Prob(F-statistic)
0.000000
依次如上推出X3X4、X5X6、X7的一元回归。
综上所述,结果如下图4:
图4.一元回归估计结果
变量
X2
X3
X4
X5
X6
X7
参数估计值
1.454186
0.426817
3.186851
0.829789
0.330354
0.111530
t统计量
12.40398
28.90168
22.67733
6.206025
18.12895
0.320338
2
R
0.846034
0.967567
0.948364
0.579041
0.921494
0.003651
—2
R
0.840536
0.966408
0.946520
0.564006
0.918690
-0.031932
2
2、其中,加入X3的R最大,以X3为基础,顺次加入其他变量逐步回归。
结果如下图5:
DependentVariable:
Y
Method:
LeastSquares
Date:
10/13/10Time:
01:
27
Sample:
19782007
Includedobservations:
30
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
1976.086
388.24135.089841
0.0000
X2
-1.105339
0.105222-10.50486
0.0000
X3
0.721989
0.02887925.00056
0.0000
R-squared
0.993624
Meandependentvar
10049.04
AdjustedR-squared
0.993152
S.D.dependentvar
12585.51
S.E.ofregression
1041.474
Akaikeinfocriterion
16.82930
Sumsquaredresid
29286057
Schwarzcriterion
16.96942
Loglikelihood
-249.4395
F-statistic
2103.946
Durbin-Watsonstat
1.662637
Prob(F-statistic)
0.000000
依照上面,在顺次加入X4X5、X6、X7,进行逐步回归。
综合结果如下图5:
图5.加入新变量的回归结果
(一)
变量
X2
X3
X4
X5
X6
X7
一2
R
X3,X2
-1.105339
0.721989
0.993152
(-10.50486)
(25.00056)
X3,X4
1.65227
-9.255748
0.990547
(11.46367)
(-8.514941)
X3,X5
0.514796
-0.261997
0.98301
(26.29703)
(-5.325453)
X3,X6
0.910503
-0.386459
0.985025
(11.18199)
(-5.984236)
X3,X7
0.430639
-0.125579
0.970053
(30.62427)
(-2.099504)
2
经比较,新加入X2的方程R=0.993152,改进最大,但是X2得系数为负,这显然不符题意。
在X3的基础上分别加入其他变量后发现,X2,X4,X5,X6,X7的系数都为负,与预期估计违背。
因
此这些变量都会引起严重的多重共线性,全部剔除,只保留X3。
修正的回归结果为:
DependentVariable:
Y
Method:
LeastSquares
Date:
10/12/10Time:
17:
50
Sample:
19782007
Includedobservations:
30
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-1075.289
570.5337-1.884708
0.0699
X3
0.426817
0.01476828.90168
0.0000
R-squared
0.967567
Meandependentvar
10049.04
AdjustedR-squared
0.966408
S.D.dependentvar
12585.51
S.E.ofregression
2306.678
Akaikeinfocriterion
18.38935
Sumsquaredresid
1.49E+08
Schwarzcriterion
18.48276
Loglikelihood
-273.8402
F-statistic
835.3074
Durbin-Watsonstat
0.292531
Prob(F-statistic)
0.000000
Y?
=-1075.289+0.426817X3
(-1.884708)(28.90168)
四、实践结果报告:
为研究“农业的发展反而会减少财政收入”的问题,根据1978—2007年的财政收入,农业增加值,工业增加值,建筑
业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。
最后修正的回归结果为:
Y?
=-1075.289+0.426817X3
(-1.884708)(28.90168)
2
R=0.967567
—2
R=0.966408F=835.3074
这说明在其他因素不变的情况下,工业增加值每增加1亿元,财政收入平均增加0.426817亿元。
可决系数为0.967567,较高,说明模型拟合优度高;F值为835.3074,说明整个方程显著;斜率系数的t值28.90168,
大于t统计量,t检验显著,符合题意。
逐步回归后的结果虽然实现了减轻多重共线性的目的,但反映农业增加值,建筑业增加值的X2,X3等也一并从模型中
剔除出去了,可能会带来设定偏误,这是在使用逐步回归时需要注意的问题。
附加:
1、分别作YX寸X2、X3X4、X5X6、X7的一元回归,结果如下:
Isycx2
DependentVariable:
Y
Method:
LeastSquares
Date:
10/12/10Time:
17:
49
Sample:
19782007
Includedobservations:
30
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-4086.544
1463.091-2.793090
0.0093
X2
1.454186
0.11723512.40398
0.0000
R-squared
0.846034
Meandependentvar
10049.04
AdjustedR-squared
0.840536
S.D.dependentvar
12585.51
S.E.ofregression
5025.770
Akaikeinfocriterion
19.94689
Sumsquaredresid
7.07E+08
Schwarzcriterion
20.04030
Loglikelihood
-297.2033
F-statistic
153.8588
Durbin-Watsonstat
0.166951
Prob(F-statistic)
0.000000
Isycx3
DependentVariable:
Y
Method:
LeastSquares
Date:
10/12/10Time:
17:
50
Sample:
19782007
Includedobservations:
30
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-1075.289
570.5337-1.884708
0.0699
X3
0.426817
0.01476828.90168
0.0000
R-squared
0.967567
Meandependentvar
10049.04
AdjustedR-squared
0.966408
S.D.dependentvar
12585.51
S.E.ofregression
2306.678
Akaikeinfocriterion
18.38935
Sumsquaredresid
1.49E+08
Schwarzcriterion
18.48276
Loglikelihood
-273.8402
F-statistic
835.3074
Durbin-Watsonstat
0.292531
Prob(F-statistic)
0.000000
lsycx4
DependentVariable:
Y
Method:
LeastSquares
Date:
10/12/10Time:
17:
50
Sample:
19782007
Includedobservations:
30
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-1235.177
727.9896-1.696695
0.1008
X4
3.186851
0.14053022.67733
0.0000
R-squared
0.948364
Meandependentvar
10049.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EViews 计量 经济学 实验 报告 多重 线性 诊断 修正
![提示](https://static.bingdoc.com/images/bang_tan.gif)