多元线性回归分析(Eviews论文)Word文档格式.doc
- 文档编号:3832503
- 上传时间:2023-05-02
- 格式:DOC
- 页数:23
- 大小:1.15MB
多元线性回归分析(Eviews论文)Word文档格式.doc
《多元线性回归分析(Eviews论文)Word文档格式.doc》由会员分享,可在线阅读,更多相关《多元线性回归分析(Eviews论文)Word文档格式.doc(23页珍藏版)》请在冰点文库上搜索。
第1章题目叙述
理论上认为影响成品钢材的需求量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。
为此,收集了我国成品钢材的需求量,选择与其相关的八个因素:
原油产量、生铁产量、原煤产量、发电量、铁路货运量、固定资产投资额、居民消费、政府消费作为影响变量,1980——1998年的有关数据如下表。
本题旨在通过建立这些经济变量的线性模型来说明影响成品钢材需求量的原因。
数据来源:
易丹辉.数据分析与EViews应用.中国人民大学出版社.2008(教材第85页)。
原始数据(中国统计年鉴):
年份
成品钢材(万吨)
原油(万吨)
生铁(万吨)
原煤(亿吨)
发电量(亿千瓦时)
铁路货运量(万吨)
固定资产投资额(亿元)
居民消费(亿元)
1980
2716.2
10595
3802.4
6.2
3006.2
111279
910.9
2317.1
1981
2670.1
10122
3416.6
3092.7
107673
961
2604.1
1982
2902
10212
3551
6.66
3277
113495
1230.4
2867.9
1983
3072
10607
3738
7.15
3514
118784
1430.1
3182.5
1984
3372
11461.3
4001
7.89
3770
124074
1832.9
3674.5
1985
3693
12489.5
4384
8.72
4107
130709
2543.2
4589
1986
4058
13068.8
5064
8.94
4495
135635
3120.6
5175
1987
4356
13414
5503
9.28
4973
140653
3791.7
5961.2
1988
4689
13704.6
5704
9.8
5452
144948
4753.8
7633.1
1989
4859
13764.1
5820
10.54
5848
151489
4410.4
8523.5
1990
5153
13830.6
6238
10.8
6212
150681
4517
9113.2
1991
5638
14009.2
6765
10.87
6775
152893
5594.5
10315.9
1992
6697
14209.7
7589
11.16
7539
157627
8080.1
12459.8
1993
7716
14523.7
8739
11.51
8395
162663
13072.3
15682.4
1994
8482
14608.2
9741
12.4
9281
163093
17042.1
20809.8
1995
8979.8
15004.94
10529.27
13.61
10070.3
165885
20019.3
26944.5
1996
9338.02
15733.39
10722.5
13.97
10813.1
168803
22974
32152.3
1997
9978.93
16074.14
11511.41
13.73
11355.53
169734
22913.5
34854.6
说明:
由于数据是经过人工录入的,经反复对照没有发现错误,因此就采用了此数据做回归模型。
但是也不能排除在录入过程中会出现一些小的错误,所以回归模型仅满足上表数据。
第2章问题假设
为了问题的简洁明了,现对题目中的变量给出以下假设:
中国成品钢材的需求量为(万吨)、原油产量(万吨)、生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)作为影响变量,而且本题收集的数据均为定量变量,其符号和经济意义如下表:
变量
符号
代表意义
中国成品钢材的需求量为(万吨)
成品钢材需求总量
原油产量(万吨)
原油工业发展水平
生铁产量(万吨)
生铁工业发展水平
原煤产量(亿吨)
原煤工业发展水平
发电技术水平
运输产业水平
固定资产支出水平
居民支出水平
政府消费(亿元)
政府支出水平
第3章问题分析
在上述问题中,中国成品钢材的需求量(万吨)的影响因素不只是原油产量(万吨),还有生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)等,这样因变量就与多个自变量有关。
因此,我们就可以采用多元线性回归进行问题的分析。
多元线性回归模型的基本形式:
设随机变量与一般变量的理论线性回归模型为:
其中,是个未知参数,称为回归常数,称为回归系数。
称为被解释变量(因变量),而是个可以精确测量并可控制的一般变量,称为解释变量(自变量)。
是随机误差,与一元线性回归一样,对随机误差项我们常假定
称
为理论回归方程。
第4章数据的预处理
4.1曲线统计图
分析:
从曲线统计图上我们可以大致的来看,变量和因变量在1980年到1986年的增长速度都相对平稳没有明显的增势;
从1986年到1993年,个变量开始缓慢增长;
从1993年到1998年,增长的幅度开始加大了。
的曲线近似为一条水平的直线,这两个变量分别表示原油和原煤的量,可能受到资源和政策的限制,因而增长的速度非常缓慢。
从图中可以明显看到随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。
4.2散点统计图
分析:
从散点统计图上我们可以细致的来看,变量(铁路运货量)的变化最为明显,还可以清楚的看到1981年,1991年,1998年,因为一些特殊事件而导致的铁路运输量降低。
与在1980年到1986年的增长速度都相对平稳没有明显的增势,从1986年到1993年,个变量开始缓慢增长;
但是(原油)与(原煤)的产量却始终保持相对平稳的增长趋势,而却增长速度非常的缓慢,这可能是受到了资源的限制和国家政策的影响。
从散点图中可以很明显的看到各年的真是数据,还可以看出随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。
4.3样本的相关系数
从样本的相关系数表来看,各变量的相关系数都在0.9以上,说明自变量与因变量有高度的线性相关性,适合做与8个自变量的多元线性回归。
(说明:
本表格是由EViews软件计算得出,但由于不能导出,所以通过保存成图片后经WPS截图工具截得。
)
第5章回归模型的建立
将原始数据导入到Eviews6.0(破解版)的数据框中,然后用Eviews软件做线性回归分析如下:
在Eviews主窗口菜单单击Quick/EstimateEquation,弹出方程估计窗口,再在弹出的窗口清单内填入以下回归方程的书写形式。
整形式:
y=c
(1)+c
(2)*x1+c(3)*x2+c(4)*x3+c(5)*x4+c(6)*x5+c(7)*x6+c(8)*x7+c(9)*x8
简化形式:
ycx1x2x3x4x5x6x7x8
这里我们采用简化形式执行后得到输出结果为:
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-381.4846
912.1465
-0.418227
0.6846
X1
0.121818
0.107424
1.133993
0.2833
X2
0.124884
0.187062
0.667607
0.5195
X3
-149.1537
121.3537
-1.229083
0.2472
X4
0.653366
0.276937
2.359260
0.0400
X5
0.003058
0.023349
0.130959
0.8984
X6
0.081378
0.042124
1.931870
0.0822
X7
-0.120128
0.046747
-2.569723
0.0279
X8
0.393966
0.239413
1.645552
0.1309
R-squared
0.999009
Meandependentvar
5742.518
AdjustedR-squared
0.998215
S.D.dependentvar
2679.609
S.E.ofregression
113.1993
Akaikeinfocriterion
12.60169
Sumsquaredresid
128140.8
Schwarzcriterion
13.04906
Loglikelihood
-110.7161
Hannan-Quinncriter.
12.67740
F-statistic
1259.526
Durbin-Watsonstat
2.245475
Prob(F-statistic)
0.000000
从模型汇总表中可以看出,决定系数,由决定系数看回归模型高度显著。
又由,P值=0.000000,回归模型通过了F检验,表明8个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000000。
说明整体上对有高度显著的线性影响。
表中第二列是我们的回归方程参数估计值,由此可以得到对8个自变量的线性回归方程为:
从回归方程中可以看到,对成品钢材需求量起正影响,对成品钢材需求量起负影响。
从实际社会生活来看,原煤生产水平和居民的消费水平提高,都会促进成品钢材的需求量,应该和成品钢材的需求量成正相关,这与定性分析的结果不一致。
为此,我们对它进行更深层次的分析。
第6章回归模型的检验
6.1F检验
1259.526
分析:
从表中结果可以看出,Prob(F-statistic)即相伴概率P值,由,P值=0.000000<
0.05,可知此回归方程拒绝零假设,即做出8个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000000,回归方程通过了F检验。
6.2T检验
t-Statistic
Prob.
分析:
通过看上面的T检验表可以发现,在显著性水平时,只有的Prob(收尾概率)小于0.05,通过了显著性检验。
6.3T检验分析
为了尽可能的保留合理变量,我们就针对逐个变量给以T检验分析,逐步剔除不合理的变量,使回归模型更完善。
因此我们首先剔除Prob最大的变量,再做回归分析的T检验如下:
Std.Error
Prob.
-274.5262
387.5811
-0.708307
0.4935
0.132601
0.065838
2.014055
0.0691
0.120529
0.175666
0.686125
0.5068
-137.5335
79.00025
-1.740925
0.1096
0.677570
0.196814
3.442693
0.0055
0.082361
0.039555
2.082205
0.0615
-0.123567
0.036909
-3.347908
0.0065
0.387785
0.223983
1.731314
0.1113
分析:
剔除后,在显著性水平时,有的Prob(收尾概率)小于0.05,通过了显著性检验。
此时我们发现,剔除了后,通过T检验的变量增多了,这是一个很好的结果。
因此我们再剔除Prob最大的变量,再做回归分析的T检验如下:
-279.1420
378.8809
-0.736754
0.4754
0.153961
0.056719
2.714474
0.0188
-151.0344
74.80430
-2.019061
0.0664
0.772202
0.137273
5.625307
0.0001
0.099512
0.029972
3.320207
0.0061
-0.134592
0.032486
-4.143096
0.0014
0.402994
0.217913
1.849332
0.0892
此时我们发现,剔除了后,通过T检验的变量又增多了一个。
-108.8183
400.2650
-0.271866
0.7900
0.149526
0.061718
2.422751
0.0307
-248.8000
57.63980
-4.316463
0.0008
0.977544
0.087907
11.12020
0.0000
0.126790
0.028416
4.462005
0.0006
-0.084069
0.019143
-4.391499
0.0007
0.998669
Meandependentvar
0.998157
S.D.dependentvar
115.0260
Akaikeinfocriterion
12.58028
-113.5127
Hannan-Quinncriter.
12.63076
1951.080
Durbin-Watsonstat
1.886506
剔除后,在显著性水平时,剩余变量的Prob(收尾概率)都小于0.05,全部通过了显著性T检验。
以做回归分析的输出表来看,决定系数,由决定系数看回归模型仍然具有高度的显著性。
表中第二列是我们的回归方程参数估计值,由此可以得到对5个自变量的线性回归方程为:
从回归方程中可以看到,对成品钢材需求量起正影响,对成品钢材需求量起负影响。
此时回归方程虽然通过了F,T检验,但是增加了不合理变量所占回归方程的比重,这也是不合社会实际的。
6.4Chow断点检验
该检验的思想是对每个子样本单独拟合方程来观察估计方程是否有显著差异。
零假设是两个子样本拟合的方程无显著差异。
ChowBreakpointTest:
1990
EquationSample:
19801998
7992.972
Prob.F(9,1)
0.0087
Loglikelihoodratio
212.4876
Prob.Chi-Square(9)
WaldStatistic
71936.75
从检验表中可以看出,由于,检验量的收尾概率分别是0.0087,0.0000,0.0000
,所以回归模型接受原假设,说明模型参数有超样本特性,回归方程没有显著差异,回归模型具有稳定性。
6.5Chow预测检验
该检验的思想,Chow预测检验先对包含前个观测值的子样本建立模型,然后用这个模型对后个观测值的自变量进行预测,若实际值与预测值有很大变动,就可以怀疑这两个子样本估计关系的稳定性。
ChowForecastTest:
Forecastfrom1990to1998
从Chow预测检验表中可以看出,检验量的收尾概率分别为0.0087,0.0000,说明回归模型的预测值和实际值没有很大的波动,所以就可以认为回归模型是稳定的。
第7章违背模型基本假设的情况
7.1异方差性的检验
7.1.1残差图示检验
我们分别以回归标准化残差和因变量y来绘制残差图分析模型是否存在异方差。
从残差的散点图上我们可以看出,回归的标准化残差随因变量y的表变化并没有明显的规律性分布,残差图上的点都是随机散布的,无任何规律,因此我们可以初步判定回归模型不存在异方差。
7.1.2怀特(White)检验
怀特检验,是把作为因变量,原先的自变量和自变量的平方项作为新自变量建立线性回归模型,通过这个模型的拟合情况来检验是否有异方差性,检验的零假设是残差不存在异方差性。
怀特检验的统计量是,是样本观测量,是辅助回归的拟合优度。
本题的怀特检验如下:
HeteroskedasticityTest:
White
1.958884
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 分析 Eviews 论文