全国地区经济发展水平的聚类和实例判别分析Word格式.docx
- 文档编号:8336333
- 上传时间:2023-05-11
- 格式:DOCX
- 页数:21
- 大小:203.46KB
全国地区经济发展水平的聚类和实例判别分析Word格式.docx
《全国地区经济发展水平的聚类和实例判别分析Word格式.docx》由会员分享,可在线阅读,更多相关《全国地区经济发展水平的聚类和实例判别分析Word格式.docx(21页珍藏版)》请在冰点文库上搜索。
128.85
3987.84
3405.16
15149
2430.8
4446.57
43937
河北
3899.7263
24581
2207.34
8959.83
6068.31
7193
5764.9
10476.50
27774
山西
1599.6490
21522
477.59
3993.80
2886.92
6854
2809.0
4509.56
28066
内蒙古
1142.4670
40282
929.60
5114.00
3696.65
9668
2855.3
7143.84
30486
辽宁
2189.9600
35239
1414.90
7906.34
5891.25
10848
5812.6
11605.12
30523
吉林
1184.7065
26595
980.57
3541.92
2756.26
8410
2957.3
5958.95
25943
黑龙江
1687.4677
22447
1154.33
4060.72
3371.95
7737
3401.8
4695.74
24805
上海
929.2393
78989
113.82
6001.78
8930.85
29572
5173.2
4618.91
58336
江苏
4536.1304
44744
2261.86
18566.37
13629.07
11993
11484.1
14266.80
35217
浙江
3825.1840
44641
1163.08
11908.49
9918.78
15790
8622.3
7454.33
36553
安徽
3689.7458
16408
1495.45
4905.22
3662.15
6829
3527.8
7945.50
28723
福建
2168.8523
33840
1182.74
6005.30
5048.49
10950
4481.0
5548.61
28366
江西
2244.1462
17335
1098.66
3919.45
2637.07
6229
2484.4
6008.12
24165
山东
5449.7660
35894
3226.64
18901.83
11768.18
10494
12363.0
15439.10
29398
河南
5948.7810
20597
2769.05
11010.50
5700.91
6607
6746.4
11454.89
26906
湖北
3024.4758
22677
1795.90
6038.08
5127.12
7791
5928.4
7183.67
26547
湖南
3907.7007
20428
1969.69
5687.19
5402.81
7929
4913.7
6880.00
26534
广东
5643.3420
41166
2010.27
19419.70
18052.59
15291
14891.8
10230.05
36469
广西
2862.6294
16045
1458.49
3381.54
2919.13
6893
2790.7
4689.88
27322
海南
431.4476
19254
462.19
443.43
748.59
6695
537.5
942.68
24790
重庆
1878.4823
22920
606.80
3448.77
2474.44
8308
2479.0
4855.11
30499
四川
4945.2270
17339
2240.61
6711.87
5198.80
6863
5758.7
9090.09
28149
贵州
2341.1072
10309
550.27
1476.62
1885.79
5044
1247.3
2049.83
27437
云南
2730.2048
13539
1067.60
2582.53
2519.62
5926
2051.1
4117.51
26163
西藏
169.0721
15295
63.88
136.63
240.85
4060
156.6
327.64
45347
陕西
1919.4801
21688
789.64
4236.42
3143.74
7069
2699.7
5888.37
29566
甘肃
1406.6191
12872
497.05
1527.24
1363.27
5284
1183.0
2076.36
26743
青海
285.5393
19454
107.40
575.33
398.54
6495
300.5
689.09
32481
宁夏
328.5056
21777
127.25
662.32
563.74
7858
339.3
964.16
32916
新疆
829.1711
19942
759.74
1929.59
1587.72
5990
1177.5
2434.15
27617
注:
北京、河北、山东、贵州、重庆五省、直辖市、自治区不参与聚类分析,将作为实例数据进行判别分析,检验聚类结果。
2.2聚类分析
2.2.1聚类分析步骤
将国内26个省、直辖市、自治区的9项指标数据输入SPSS,做聚类分析,具体步骤为:
选择Analyze→Classify→HierarchicalCluster,进行系统聚类分析(HierarchicalClusterAnalysis),引入的变量是X1至X9。
采取对样品(个案)进行聚类,即Q型聚类分析(对研究对象本身分类)。
其中Statistics:
Singlesolution,NO.为3;
Plot:
Dendrogram;
聚类方法使用平均联结(组之间)(类间平均链锁法),距离测量技术选择Euclidean距离平方(即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类),Save:
NO.ofcluster为3,得出以下计算结果。
2.2.2聚类结果
表2案例处理汇总a
案例
有效
缺失
总计
N
百分比
26
100.0
.0
a.平均联结(组之间)
表2中分别为有效个案、缺失个案和个案总数的个数和百分数。
脚注显示聚类时采用的聚类方法为Between-groupslinkage平均联结(组之间)。
表3聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
1
2
22
4561345.303
8
14
15
7208462.908
9
3
24
25
7557591.086
18
4
17
20
10401374.973
7
5
14755902.798
13
6
10
19
15241795.236
12
19539029.141
19617723.925
29888533.870
11
23
31656913.717
40601907.875
49453303.579
49653173.012
62992431.751
21
65271276.798
16
74739070.114
83256074.767
94536493.094
1.171E8
1.583E8
3.922E8
5.099E8
7.271E8
1.110E9
3.206E9
表3所列各项的意义如下:
“阶”指聚类步骤号;
“群集组合”指在某步中合并的个案;
“系数”指距离或相似系数;
“首次出现阶群集”指新生成聚类;
“下一阶”指对应步骤生成的新类将在第几步与其它个案或新类合并。
表4群类结果
3群集
1:
天津
2:
山西
3:
内蒙古
4:
辽宁
5:
吉林
6:
黑龙江
7:
上海
8:
江苏
9:
浙江
10:
安徽
11:
福建
12:
江西
13:
河南
14:
湖北
15:
湖南
16:
广东
17:
广西
18:
海南
19:
四川
20:
云南
21:
西藏
22:
陕西
23:
甘肃
24:
青海
25:
宁夏
26:
新疆
上表4给出了各成员的所属的类别:
第一类:
天津、上海;
第二类:
山西、辽宁、安徽、福建、河南、湖北、四川、内蒙古、吉林、黑龙江、江西、广西、海南、湖南、云南、西藏、陕西、甘肃、青海、宁夏、新疆;
第三类:
江苏、浙江、广东。
图1聚类分析树状图
图1清晰地表示了聚类的全过程。
根据聚类分析的原理:
聚类是一个将数据划分为若干簇或类的过程,并使得同一簇内的数据对象具有较高的相似度,而不同簇中的数据对象具有较低的相似度.相似度则由基于数据对象描述属性的取值来确定,通常就是各对象之间的距离。
从图中可以看出在起初各步中,难以看出有哪些聚类形成,但在最后一步,聚类合并时距离明显加大,线条很长,所以聚类终止。
2.3判别分析
2.3.1判别分析步骤
选择SPSS→Analyze→Classify→DiscriminantAnalysis,定义分类结果为指标变量X10,采用自变量全进入模型来进行判别分析,由于在聚类分析中将全国各省、直辖市的经济类型分为四类,因此其取值范围为1~3。
2.3.2判别分析结果
表5分析案例处理摘要
未加权案例
83.9
排除的
缺失或越界组代码
16.1
至少一个缺失判别变量
缺失或越界组代码还有至少一个缺失判别变量
合计
31
表5对回代判别结果进行了总结评价,有5个待预测量。
表6组统计量
AverageLinkage(BetweenGroups)
均值
标准差
有效的N(列表状态)
未加权的
已加权的
就业人员(万人)
718.248250
298.3864044
2.000
人均地区生产总值(元)
70781.500000
11607.1578132
第一产业生产总值(亿元)
121.335000
10.6278149
第二产业生产总值(亿元)
4994.810000
1424.0706309
第三产业生产总值(亿元)
6168.005000
3907.2528697
各地区全体居民消费水平(元)
22360.500000
10198.6011051
社会消费品零售总额(亿元)
3802.000000
1939.1696367
城镇固定资产投资亿元
4532.738850
121.8639848
城镇单位就业人员平均工资(元)
51136.500000
10181.6305423
2128.373719
1545.9652923
21.000
21646.412381
7078.1262117
1087.730000
711.9441109
4017.591429
2723.4946252
3088.837143
1822.0839775
7285.000000
1666.1717499
2995.823810
2011.5339398
5245.424490
3277.6681067
28674.190476
4482.0182465
4668.218800
916.2478580
3.000
43517.000000
2036.6769503
1811.736667
575.6656889
16631.520000
4112.4569673
13866.813333
4072.1134192
14358.000000
2063.2908181
11666.066667
3138.7085662
10650.393667
3425.6345426
36079.666667
748.2708957
2312.961577
1697.1939853
26.000
27949.563846
15969.3812438
1096.931154
754.6754964
5548.215385
4909.3033456
4569.308846
4124.5644347
9260.769231
5181.4148285
4058.250000
3474.8261923
5814.252808
3569.8244732
31256.538462
7763.5238197
表7组均值的均等性的检验
Wilks的Lambda
F
df1
df2
Sig.
.688
5.207
.014
.180
52.533
.000
.759
3.661
.042
.306
26.117
.270
31.093
.250
34.430
.346
21.754
.748
3.872
.036
.336
22.708
2.3.3典型判别式函数摘要
表8特征值表
函数
特征值
方差的%
累积%
正则相关性
11.228a
64.9
.958
6.078a
35.1
.927
a.分析中使用了前2个典型判别式函数。
表9.Wilks'
Lambda值表
函数检验
卡方
df
1到2
.012
84.753
.141
37.183
表10.标准化典型判别式函数系数表
2.226
1.235
1.787
1.438
-1.472
.674
.585
-3.218
.646
.460
-.931
-.534
-.509
-.113
-1.305
.676
.158
.287
表11典型判别式函数系数
.002
.001
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全国 地区 经济发展 水平 实例 判别分析
![提示](https://static.bingdoc.com/images/bang_tan.gif)