基于因子分析和聚类分析对全国地区的经济发展水平的评估.docx
- 文档编号:17607261
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:19
- 大小:140.31KB
基于因子分析和聚类分析对全国地区的经济发展水平的评估.docx
《基于因子分析和聚类分析对全国地区的经济发展水平的评估.docx》由会员分享,可在线阅读,更多相关《基于因子分析和聚类分析对全国地区的经济发展水平的评估.docx(19页珍藏版)》请在冰点文库上搜索。
基于因子分析和聚类分析对全国地区的经济发展水平的评估
基于因子分析和聚类分析对
全国地区的经济发展水平的评估
学院:
理学院
专业:
统计学
学号:
姓名:
指导老师:
2013年4月25日
摘要
中国正处于经济发展的时期,但仍有部分经济发展速度过慢的地区,为了提出相关政策对这些地区的经济发展水平进行改善,通过因子分析,聚类分析对全国所有地区的经济发展水平,进行分类,针对属于不同类的地区实行不同的相关经济政策。
为国家制定相关政策提供了数据依据。
关键字:
城市经济发展水平;因子分析;聚类分析;分类;
引言:
全国经济发展是由各地区的经济发展一起带动起来的,因此各地的经济发展水平的速度是与国家的发展水平成正比的,而对于全国各地区经济发展水平研究的比较少,通过经验以及一些试验可以知道经济发展水平基本与人均进出口总额,人均财政收入,各个产业的发展,环境保护,教育支出,废物处理比率,人均日生活用水量,各地区人均GDP,地区生产总值,地区生产总指数,居民消费总指数这些数据有关,使用spss对这些数据进行因子分析与聚类分析。
也即是在因子分析的基础上进行聚类量化的评估。
找出这些地区的发展水平差距所在。
1因子分析的基本思想
1.1因子分析的基本出发点
将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差),这些综合指标之间没有相关性。
1.2因子变量的特点
(1)这些综合指标称为因子变量,是原变量的重造;
(2)个数远远少于原变量个数,但可反映原变量的绝大部分方差;
(3)不相关性;
(4)可命名解释性。
1.3因子分析的基本步骤
(1)确认待分析的原始变量是否适合作因子分析;
(2)构造因子变量;
(3)利用旋转方法使因子变量具有可解释性;
(4)计算每个样本的因子变量得分。
1.4因子分析的数学模型
数学模型(xi为标准化的原始变量;Fi为因子变量;k
也可以矩阵的形式表示为:
X=AF+ε
2、因子分析实验过程
首先将数据导入spss中,进行DimensionReduction中的Factor进行分析,选取所有需要分析的变量即是经济发展水平基本与人均进出口总额,人均财政收入,各个产业的发展,环境保护,教育支出,废物处理比率,人均日生活用水量,各地区人均GDP,地区生产总值,地区生产总指数,居民消费总指数进入Variables窗口。
在Descriptives对话框中选中statistics框架中的UnivariateDescrpitives,CorrelationMatrix框架中选择Significance来进行显著性的检验如表一所示
表1相关矩阵显著性检验
CorrelationMatrixa
居民消费总指数
地区生产总值(亿元)
地区生产总指数
各地区人均GDP(元)
人均日生活用水量(升)
污水排放量(吨)
财政性教育经费支出(万元)
空气质量达到及好于二级的天数(天)
第一产业人均(元)
第二产业人均(元)
第三产业人均(元)
人均财政收入(元)
人均进出口总额(美元)
Correlation
居民消费总指数
1.000
-.296
-.129
-.273
.234
-.232
-.298
-.348
.279
-.356
-.356
-.322
-.203
地区生产总值(亿元)
-.296
1.000
-.451
.402
.123
.956
.949
.048
.076
.500
.500
.056
.290
地区生产总指数
-.129
-.451
1.000
-.405
-.287
-.432
-.439
.051
.124
-.373
-.373
-.391
-.627
各地区人均GDP(元)
-.273
.402
-.405
1.000
-.041
.261
.302
-.042
-.325
.922
.922
.630
.825
人均日生活用水量(升)
.234
.123
-.287
-.041
1.000
.269
.081
.264
.150
-.122
-.122
.137
.168
污水排放量(吨)
-.232
.956
-.432
.261
.269
1.000
.931
.135
.107
.364
.364
-.013
.220
财政性教育经费支出(万元)
-.298
.949
-.439
.302
.081
.931
1.000
-.009
.022
.383
.383
.000
.279
空气质量达到及好于二级的天数(天)
-.348
.048
.051
-.042
.264
.135
-.009
1.000
.292
-.008
-.008
.068
-.072
第一产业人均(元)
.279
.076
.124
-.325
.150
.107
.022
.292
1.000
-.327
-.327
-.497
-.519
第二产业人均(元)
-.356
.500
-.373
.922
-.122
.364
.383
-.008
-.327
1.000
1.000
.635
.703
第三产业人均(元)
-.356
.500
-.373
.922
-.122
.364
.383
-.008
-.327
1.000
1.000
.635
.703
人均财政收入(元)
-.322
.056
-.391
.630
.137
-.013
.000
.068
-.497
.635
.635
1.000
.790
人均进出口总额(美元)
-.203
.290
-.627
.825
.168
.220
.279
-.072
-.519
.703
.703
.790
1.000
a.Thismatrixisnotpositivedefinite.
由表一我们可以知道原是变量之间的相关性较强,适合使用因子分析进行分析。
对于因子分析我们可以考虑对因子分析进行旋转,然后进行研究,所以这里我们对因子分析中的需要选择Roation对话框中,对其进行Varimax旋转得出的结果如下图所示(图1),也会得到旋转后的因子载荷矩阵(表2):
图1旋转后的因子分析图
表2因子旋转后的载荷矩阵
由该矩阵我们可以得到人均进出口总额=0.889*fac1+0.136*fac2+0.270*fac3-0.066fac4同理我们可以得到其他原始变量与主成分1,主成分2,主成分3,主成分4的关系式。
主成分得分后,用新得到的4个主成分得分后,因子得分系数矩阵如表3所示。
我们得到一个新的矩阵表2所示,到这一步因子分析完成了,用4个主成分变量来代表开始的13个原始变量,消除了指标之间的相关性,有减少了变量之间的维数。
表3因子得分系数矩阵
Component
1
2
3
4
居民消费总指数
-.075
.011
.455
-.266
地区生产总值(亿元)
.127
.262
-.075
-.100
地区生产总指数
-.111
-.062
-.378
.059
各地区人均GDP(元)
.161
-.110
-.007
-.008
人均日生活用水量(升)
.012
.114
.450
.349
污水排放量(吨)
.110
.296
-.016
-.033
财政性教育经费支出(万元)
.115
.267
-.077
-.151
空气质量达到及好于二级的天数(天)
.003
.086
-.110
.661
第一产业人均(元)
-.070
.218
.029
.146
第二产业人均(元)
.166
-.079
-.101
-.018
第三产业人均(元)
.166
-.079
-.101
-.018
人均财政收入(元)
.122
-.204
.112
.217
人均进出口总额(美元)
.153
-.131
.198
.036
通过因子得分系数矩阵我们得到到4个主成分的得分。
即是fac1,fac2,fac3,fac4这几个主成份,在通过计算我们计算出综合得分如表4所示,计算综合得分公式为:
F=(34.961*fac1+26.106*fac2+12.158*fac3+10.967*fac4)/
84.192
计算后得出如下表(表5)所示:
表5中国各省经济发展水平的主成份及综合得分
地区
F1
F2
F3
F4
F
北京
1.97112
-0.22536
0.99014
-1.8934
0.644984
天津
2.24939
-0.7969
-2.13699
0.81389
0.484388
河北
-0.38324
0.69853
-0.31376
-0.6691
-0.07501
山西
0.15715
-0.3879
-1.42718
-0.52886
-0.33001
内蒙古
0.03346
-0.12788
-1.15779
0.50576
-0.12707
辽宁
0.18984
0.4691
-0.86041
0.38242
0.149854
吉林
-0.32887
-0.3692
-0.94451
0.76656
-0.28759
黑龙江
-0.31884
-0.21161
-0.24676
-0.73025
-0.32877
上海
3.76346
-0.63334
1.1719
0.52135
1.603554
江苏
0.55167
2.16286
0.48732
-0.02975
0.966237
浙江
0.70517
1.33379
0.57253
-0.07173
0.779739
安徽
-0.60316
0.04143
-0.16963
-0.62616
-0.34368
福建
0.02878
0.21045
0.36849
1.23549
0.291358
江西
-0.46268
-0.3089
0.08098
0.74935
-0.17861
山东
-0.02705
1.95579
-0.91621
0.07576
0.472775
河南
-0.60455
1.07339
-0.68705
-0.68211
-0.10628
湖北
-0.66457
0.19306
0.56611
-0.46017
-0.19429
湖南
-0.74054
0.25908
0.62285
0.48082
-0.0746
广东
0.23508
2.67431
1.24597
0.75552
1.205207
广西
-0.81134
-0.21465
1.63593
0.37591
-0.11826
海南
-0.97121
-1.0097
2.39934
0.89812
-0.25291
重庆
-0.27118
-0.65166
-1.08539
0.40124
-0.41915
四川
-0.86251
0.54903
-0.2303
0.30865
-0.18097
贵州
-0.59739
-0.86092
-0.84971
0.86341
-0.52526
云南
-0.63385
-0.31182
-0.98684
1.47566
-0.31018
西藏
-0.09141
-1.63685
0.97273
1.84989
-0.16407
陕西
-0.23981
-0.36371
-0.3223
-0.72298
-0.35308
甘肃
-0.4182
-0.68463
-0.3907
-2.59827
-0.78083
青海
-0.25995
-1.23831
0.6611
-0.83725
-0.50551
宁夏
-0.20232
-1.1946
0.74944
-0.89857
-0.46326
新疆
-0.39247
-0.39286
0.20071
-1.7112
-0.47871
对表5中的数据进行聚类分析,也就是说在因子分析的基础上对数据进行聚类量化,将表5的数据导入spss中进行聚类的分析因为这里的分析要求较高所以这里选用系统聚类,下面将运用系统聚类方法对因子分析中产生新的4个变量进行30个省域城市循环经济发展水平聚类,并按7类进行划分,此次聚类采用新的4个变量作为自变量,地区为因变量,在选择聚类的类数时,我们选择了分为7类,因为7是系数图一个拐点(图4)以便得到的结果,聚类图(图3)如下所示:
图3系统聚类图
图4聚合系数图
由这两个图我们可以知道每个类中包含的样品。
可得到如下的结果:
第一类:
上海作为中国的沿海城市,也是一个国际的大都市经济发展快速这是必须的第二类:
北京做为我国的首都,对于经济发展仍然是较快,但因为地理位置不如人意,所以经济发展就比上海差点。
第三类:
天津是国家的工业基地,经济发展速度也很快。
第四类:
山东,广东,浙江,江苏这四个城市是国家的几个重要的经济基地所以其发展速度也应当是快速的。
第五类:
广西,海南,西藏发展就开始缓慢了,而作为第七类:
新疆,甘肃,宁夏,青海就是中国经济发展水平较慢的地方了,这些地方的地理位置对于经济来说是薄弱的。
其他为第六类这些城市在发展水平也比较慢,但附近有很多发展较快的城市所以也促使这些城市发展加快。
3、结论
本文通过因子分析找出了不相关线性变换将各因素重新组合,剔除了多重共线性的影响,从而找到重要因素,避免主观随意性。
在此基础上用聚类分析把城市经济发展水平相似区域归在一类,既可以发现共性,又可以区分差异,由于满足完备性而不会丢失信息。
本文结果是在因子分析基础上用聚类方法得到的。
可以看出共性,即聚类结果和各地区的城市经济发展水平的排序有一定关系排名129三个城市在经济发展水平中处于较高的地位。
由此可见聚类分析适合于不同地区城市经济发展水平问题的研究,且因子分析基础上的聚类结果剔除了指标间相互影响,其精确度明显提高。
而且可以发现因子分析和聚类分析起到了一个互相补充的效果。
通过定量分析可知,河北省各个地区的区域经济发展水平存在明显差异,可划分为发达地区、较高发达地区、中等发达地区和欠发达地区4个层次,各地区间经济发展差距较大。
区域经济发展具有不平衡的规律,在一定时期内,地区间存在一定的区域差异是正常的,但是如果差距过大,不重视地区协调发展,则会出现两极分化,不利于地区经济的持续健康稳定发展。
为实现河北省经济的持续健康发展,必须逐步缩小区域经济发展水平之间的差距,充分发挥各个区域的优势,实现地区经济的协调发展。
(1)完善区域协调发展的政策体系,明确政策导向。
重视欠发达地区的经济发展,采取一定政策措施,如加大对不发达地区的基础设施建设的资金投入等。
把推进基本公共服务均等化作为区域协调的政策导向,在改善欠发达地区居民基本生活条件的同时,为招商引资创造良好的环境。
(2)发挥区域优势,发展特色经济。
由于各地在资源禀赋等方面各不相同,可以根据各个地区的特点,发挥优势,发展特色产业,加强区域之间的分工与合作。
如唐山、邯郸等地煤、铁等矿产资源丰富,则有发展煤炭、钢铁产业的优势,而承德、张家口等地区矿产资源缺乏,但是地处广阔的坝上草原,可以发展生态畜牧业和旅游,通过发展特色产业等以增强区域自身的竞争力。
(3)把体现效率的市场机制与体现公平的政府干预机制两者结合起来调节经济的发展。
加强区域规划,促进各区域、各部门规划的协调,充分发挥规划对区域发展的引领作用。
区域经济协调发展并不等同于完全均衡发展,本着“效率优先,兼顾公平”的原则,优先发展一些地区,然后以这些地区为龙头带动其他地区的发展。
参考文献
[1]黄贤金.区域循环经济发展评价[M].北京:
社会科学文献出版社,2006:
181183.
[2]何晓群.多元统计分析[M].北京:
中国人民大学出版社
[3]曹光辉,齐建国.循环经济的技术经济范式与政策研究[J].数量经济技术经济研究,2006,23(5):
l12121.
[4]贾凤亭,梁晓俐.地区经济发展水平的统计分析[J].辽宁工程技术大学学报,2002,
[5]中国财政厅.中国统计年鉴(2011)[M].中国:
中国年鉴社,2011.
附表:
地区
居民消费总指数
地区生产总值(亿元)
地区生产总指数
各地区人均GDP(元)
人均日生活用水量(升)
污水排放量(吨)
财政性教育经费支出(万元)
北京
105.6359
16251.93
108.1
80394
172.62
145469
5136580
天津
104.8515
11307.28
116.4
86496
128.8
67146.94
2270774
河北
105.6961
24515.76
111.3
33719
124.45
278551.3
5647497
山西
105.2129
11237.55
113
30802
111.42
116132
3529544
内蒙古
105.5809
14359.88
114.3
56666
94.48
100389
3584765
辽宁
105.1655
22226.7
112.2
50349
126.16
232247
4834720
吉林
105.2457
10568.83
113.8
37870
113.33
116162.4
2747077
黑龙江
105.829
12582
112.3
32637
128.02
150661
3183150
上海
105.1772
19195.69
108.2
82560
183.57
214155.1
4407376
江苏
105.3297
49110.27
111
61022
212.26
592773.8
9234608
浙江
105.3834
32318.85
109
58791
196.3
420133.9
7336561
安徽
105.5625
15300.65
113.5
25395
168.99
243265.2
4488332
福建
105.2632
17560.18
112.3
47433
188.18
316177.5
3913350
江西
105.2493
11702.82
112.5
25988
174.79
194431.6
3175331
山东
105.0202
45361.85
110.9
46976
129.79
443331
8029725
河南
105.6275
26931.03
111.9
28716
108.59
378784.8
6800265
湖北
105.7593
19632.26
113.8
34233
213.18
293063.5
3838175
湖南
105.5279
19669.56
112.8
29893
203.16
278811.4
4585048
广东
105.321
53210.28
110
50500
241.38
785586.5
10440230
广西
105.9048
11720.87
112.3
25449
241.94
222438.9
3990786
海南
106.0657
2522.66
112
29012
249.2
35725.15
1133239
重庆
105.3026
10011.37
116.4
34705
145.43
131449.8
2893208
四川
105.3399
21026.68
115
26147
191.71
279852
6816497
贵州
105.1467
5701.84
115
16117
142.79
77927.2
3139157
云南
104.855
8893.12
113.7
19038
124.89
147523.1
4480463
西藏
104.9942
605.83
112.7
20152
228.1
4634.581
641638.4
陕西
105.7033
12512.3
113.9
33197
163.25
121814.7
3766663
甘肃
105.8674
5020.37
112.5
19628
146.46
59231.69
2648616
青海
106.1384
1670.44
113.5
28827
196.98
21291.52
985919.2
宁夏
106.3382
2102.21
112.1
32692
163.14
39432.37
843802.4
新疆
105.9492
6610.05
112
30257
160.06
83328.54
3256626
地区
空气质量达到及好于二级的天数(天)
第一产业人均(元)
第二产业人均(元)
第三产业人均(元)
人均财政收入(元)
人均进出口总额(美元)
北京
286
665.5457
15888.79
1.59E+08
10839.53
16030.2
天津
320
1042.347
32492.09
3.25E+08
12670.59
6848.545
河北
320
2911.146
12558.91
1.26E+08
1351.552
549.6995
山西
308
886.7781
12505.92
1.25E+08
2192.612
421.8716
内蒙古
347
3757.167
17692.75
1.77E+08
2690.969
370.0559
辽宁
332
3017.381
17409.29
1.74E+08
3142.758
1678.795
吉林
345
3352.963
11209.33
1.12E+08
1546.452
487.9535
黑龙江
317
2847.32
11414.12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 因子分析 聚类分析 全国 地区 经济发展 水平 评估