多元统计分析课程论文.docx
- 文档编号:12924367
- 上传时间:2023-06-09
- 格式:DOCX
- 页数:22
- 大小:266.35KB
多元统计分析课程论文.docx
《多元统计分析课程论文.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程论文.docx(22页珍藏版)》请在冰点文库上搜索。
多元统计分析课程论文
多元统计分析课程论文
四川理工学院
《多元统计分析课程设计》报告
题目:
中国国有控股工业行业的经济效益评价
学生:
雷鹏程何君李西京
曾学成白俊明
专业:
统计学
指导教师:
柏宏斌
四川理工学院理学院
二零一四年十二月
中国国有控股工业行业的经济效益评价
摘要
本文主要研究了中国国有控股工业行业的经济效益,对反映行业经济效益的总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率等五个经济指标进行主成分分析,提取反映行业盈利能力和市场能力的两个综合指标。
然后通过因子分析法分析反映经济效益的各指标的内部结构,表明行业经济效益主要由盈利能力和市场能力两个公因子决定。
根据各行业在盈利能力上的得分和市场能力上的得分将工业行业分为五类,并对各行业经济效益进行综合评价。
然后用聚类分析对综合评价结果进行验证,表明综合评价较为客观合理。
最后,本文给出相应的政策建议。
关键字:
主成分分析、因子分析、聚类分析。
一、引言
改革开放以来,工业始终是我国经济发展的主要支柱。
作为社会主义国家,我国国有及国有控股工业行业掌控着国家工业发展命脉,对国民经济、社会协调发展具有巨大推动作用。
因此,考核工业行业的经济效益,对挖掘重点行业和弱势行业,提高整个国有工业企业的经济效益等具有重大的现实意义。
企业或行业的经济效益由众多因素来刻画,目前反映行业经济效益主要有总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率等五个经济指标。
这些众多指标虽然能从多方面对行业的经济效益进行全面考察,但也在一定程度增加了分析问题的复杂性。
在损失少量信息的前提下,设计一个或少数几个综合指标,并用较少的综合指标对工业经济效益进行分析评价,能够简化问题。
此外,挖掘出反映经济效益的众多指标的内在基本结构,有助于指出各行业经济效益的主要决定因素及瓶颈,也有助于对各行业经济效益进行综合评价。
二、文献综述
大量国内文献从灰色系统理论、多元统计分析方法、层次分析法、模糊综合评判法、数据包络分析法等理论与方法,考察了中国各行业、企业或地区经济效益的研究与综合评价。
华中生、梁梁等用模糊聚类方法与数据包络分析分类法考察了合肥工业行业的经济状况,将各工业行业按经济效益的状况分为高、较高、一般、较差和差等五类[1](华中生、梁梁,1995)。
王树岭等人利用TOPSIS模型,对吉林省轻工业17个主要行业的经济效益进行了综合评价与排序,确定出相应的优势行业(王树岭等,1999)。
本文以2008年国有及国有控股的主要工业行业为研究对象,通过主成分分析和因子分析法,再次对各工业行业的经济效益进行分析与评价,并结合聚类分析法来验证综合评价的结果。
三、数据来源
反映经济效益的指标较多,不同文献中选取的指标不尽相同。
本文采用国家统计局最新公布的五个指标:
总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率,分别记为
至
。
总资产贡献率(
)反映企业全部资产的获利能力。
资产负债率(
)既反映企业经营风险的大小,
4.2因子分析的基本理论
设有n个样品,每个样品观测p个指标,这些p个指标之间有较强的相关性。
为了方便研究,并消除由观测量纲的差异及数量级不同所造成的影响,将样本的观测数据进行标准化处理,使标准化的变量均值为0,方差为1。
为方便,把原始变量及标准后的变量向量均用
表示,用
…,
(m
如果:
(1)
是可观测随机变量,且均值向量
,协方差矩阵
=
,且协方差矩阵
与相关阵
相等;
(2)
(m
,协方差矩阵
即向量
的各分量是相互独立的;
(3)
与
相互独立,且
,
的协方差矩阵
是对角方阵:
=
即
的各分量之间也是相互独立的,则模型:
称为因子模型,模型的矩阵形式为:
其中
称为因子载荷矩阵,而在因子模型中,公共因子的个数少于原始变量的个数,且公共因子是不可观测的隐变量,载荷矩阵
不可逆,因而不能直接求得公共因子用原始变量表示的精确线性组合。
解决该问题的一种方法是用建立回归思想求出线性组合系数的估计值,即建立如下以公共因子为因变量、原始变量为自变量的回归方程:
j=1,2,…,m
此处因为原始变量与公共因子变量均为标准化量,因此回归方程中没有常数项。
在最小二乘意义下,可以得到
估计值:
式中,
为因子载荷矩阵;
原始变量的相关阵;
为原始变量向量。
这样,在得到一组样本值之后,就可以带入上面的关系式求出公共因子的估计得分,从而用少数的公共因子去描述原始变量的数据结构,用公共因子得分去描述原始变量的取值,在估计出公共因子得分后,可以利用因子得分去进行进一步分析,如样本点的聚类分析,当因子数m较少时,还可以方便地把各样本点在图上表示出来,直观地描述样本分布情况,从而便于把研究工作引向深入。
五、模型的求解与检验
5.1工业行业经济效益的综合指标确定
由主成分模型的基本原理可得,利用SPSS(19.0)软件对中国国有工业行业的经济效益指标进行主成分分析得到下表1、2:
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
RotationSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
2.683
53.669
53.669
2.683
53.669
53.669
2.443
48.868
48.868
2
1.184
23.685
77.354
1.184
23.685
77.354
1.039
20.773
69.641
3
.630
12.593
89.948
.630
12.593
89.948
1.015
20.307
89.948
4
.376
7.527
97.475
5
.126
2.525
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
表1解释总方差表
RotatedComponentMatrixa
Component
1
2
3
总资产贡献率X1(%)
.946
.037
-.071
资产负债率X2(%)
-.847
.085
.159
流动资产周转次数X3(次/年)
.050
.976
-.172
成本费用利润率X4(%)
.892
.211
-.154
产品销售率X5(%)
-.180
-.183
.965
表2旋转过后的主成分矩阵
由上表可得,我们选取的5个经济效益指标被提取出了3个主成分,提取的3个主成分集中了5个原始量信息的89.948%。
能够很好的反映5个经济效益指标。
故三个公因子表示为:
其中
为原始变量的相应标准化变量。
第一主成分对原始变量的贡献率为48.868%,第二主成分的贡献率为20.773%,第三个主成分对原始变量的贡献率为20.307%,其累计贡献率为89.948%,结果表明前三个个主成分提取了原始变量的绝大部分信息。
由上可知,第一主成分中
、
和
的系数绝对值较大,第二主成分中
的系数绝对值较大,第三个成分中
的系数绝对值较大。
因此,第一主成分主要由总资产贡献率、资产负债率和工业成本费用利润率组成,第二主成分主要由流动资产周转次数和产品销售率组成。
因此,第一个公因子主要由“总资产贡献率”、“资产负债率”、“成本费用利用率”组成,该三个指标主要反映一个行业的盈利能力,所以第一个综合指标可以表示为“盈利能力”,第二个公因子可得主要反映行业的运行能力,第二个综合指标可以表示为“行业运行能力”,第三个综合指标可以表示为“市场能力”。
我们把5个影响行业的经济效益的自变量最终用3个综合指标进行表示,接下来我们利用这三个综合指标对每个行业进行综合评价。
5.2基于因子分析的经济效益的综合评价
利用SPSS(19.0)软件对中国国有工业行业的经济效益指标进行因子分析得到每个行业的经济效益的最终评分,得到下表KMO和球形Bartlett检验结果:
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.684
Bartlett'sTestofSphericity
Approx.Chi-Square
83.527
df
10
Sig.
.000
表3KMO和Bartlett检验
首先巴特利特球度检验表明:
巴特利特球度统计量值为83.527,显著性水平少于0.001,即拒绝相关系数矩阵是一个单位阵的原假设。
KMO统计量为0.684,表明简单相关系数平方和远大于偏相关系数平方和,比较适合做因子分析。
为了能够计算出各行业的因子得分,我们需要将公共因子表示成原始变量的线性组合。
公共因子对原始变量基于最小二乘法的最优线性估计为:
(2)
其中A为利用“最大方差法”旋转后的因子载荷矩阵,R为样本相关系数矩阵,Z为标准化原始指标向量。
按照
(2)式,估计出三个个公因子的因子得分表达式为:
(3)
各行业经济效益的综合指标得分:
Soccer=48.868/89.948*
+20.713/89.948*
+20.307/89.948*
(4)
按照计算的综合指标得分公式,算出了如下的最终综合评价得分表:
工业行业
市场能力
行业运行能力
市场能力
总得分(Socer)
石油和天然气开采业
3.236607235
2.847904035
-1.108505919
2.165869204
烟草制品业
3.880133782
-0.717990556
0.901856626
2.145834953
其他采矿业
-0.338689942
-0.579550749
5.196880028
0.85541574
黑色金属矿采选业
1.316706228
-0.193679604
-0.314525192
0.599617895
饮料制造业
1.065204838
-0.490670943
0.334416574
0.540898295
有色金属矿采选业
0.75126425
0.017802797
0.332781047
0.48739698
家具制造业
0.148761641
0.686908302
0.60489476
0.376022012
石油加工、炼焦及核燃料加工业
-1.172712509
3.653872124
0.64946868
0.35334339
电力、热力的生产和供应业
-0.613913966
2.047988334
0.579219838
0.270204243
煤炭开采和洗选业
0.23870068
0.092835057
0.157490512
0.186679496
皮革、毛皮、羽毛(绒)及其制品业
0.736082724
-0.979664216
-0.040708374
0.164469036
印刷业和记录媒介的复制
0.625904514
-0.573691999
-0.201940684
0.161966785
金属制品业
-0.158097758
0.174626471
0.255548042
0.012129325
黑色金属冶炼及压延加工业
-0.470867275
0.692757683
0.34212949
-0.018589219
有色金属冶炼及压延加工业
-0.271800514
0.398164094
0.020683685
-0.051043505
非金属矿采选业
0.210968339
-0.322698036
-0.495336648
-0.071737079
交通运输设备制造业
-0.201924849
-0.201634849
0.352617116
-0.076662388
医药制造业
0.442582731
-0.830304619
-0.633719878
-0.094373799
燃气生产和供应业
-0.247087587
0.066344551
-0.006052878
-0.120285239
化学原料及化学制品制造业
-0.308839193
0.261045862
-0.073210663
-0.124030961
文教体育用品制造业
-0.04804615
-0.705842803
0.285857441
-0.124577364
仪器仪表、文化、办公机械制造业
0.225149559
-1.011153889
-0.207111795
-0.157956934
农副食品加工业
-0.603618243
0.868965399
-0.304020917
-0.195894859
食品制造业
-0.470377259
0.295955823
-0.184548633
-0.228867064
塑料制品业
-0.345529774
-0.257512914
0.002260768
-0.246684255
非金属矿物制品业
-0.297512988
-0.223117102
-0.209806691
-0.260530759
电气机械及器材制造业
-0.321579234
-0.487846883
-0.086675011
-0.306944977
纺织服装、鞋、帽制造业
-0.382512265
-0.510371126
0.078181656
-0.308032573
橡胶制品业
-0.89425254
0.314437643
0.188327868
-0.370704695
废弃资源和废旧材料回收加工业
-0.465437405
0.796076505
-1.419027766
-0.389383808
化学纤维制造业
-0.664949631
-0.253473642
-0.213264699
-0.467947401
通信设备、计算机及其他电子设备制造业
-0.41880571
-0.713185265
-0.428322213
-0.488939544
工艺品及其他制造业
-0.781779398
-0.180031692
-0.189109901
-0.509005745
通用设备制造业
-0.587485138
-0.663378194
-0.224067297
-0.522965642
纺织业
-0.788943911
-0.29145315
-0.142298644
-0.528062057
造纸及纸制品业
-0.440990493
-0.520960211
-0.964197908
-0.577580344
专用设备制造业
-0.633569735
-0.680842747
-0.766897175
-0.674587685
水的生产和供应业
-0.32667013
-1.472493298
-0.782511578
-0.694204227
木材加工及木、竹、草等制品业
-0.622072925
-0.354136195
-1.286753666
-0.710255232
表4工业行业的因子得分及综合得分
根据上述公式
(2)、(3)和(4),计算出工业主要行业的因子得分及排名(由高到低进行排列)见上表4所示,其中可知石油和天然气开采业、烟草制品业和黑色金属矿采选业等行业的经济效益最高;而其他采矿业、橡胶制品业和纺织业等行业的经济效益最低。
根据上表4,我们可以对39个工业行业的盈利能力、行业的运行能力及市场能力进行分类
5.3行业的聚类分析
我们已经对各工业行业进行了综合评价,为了验证评价的客观性和可靠性,本文采用聚类分析加以验证,其主要思想和依据:
如果经济效益高的行业自然会成为一类,经济效益差的行业会成为一类,如果聚类分析能够验证这个结论,则说明我们的综合评价具有一定的可靠性。
本文用欧式距离来度量样本之间的距离,用瓦尔德法测度来类与类之间的距离,将39个行业分为四类:
第一类:
石油和天然气开采业、烟草制造业。
第二类:
黑色金属矿采选业、有色金属矿采选业、非金属矿采选业、饮料制造业、皮革毛皮羽毛(绒)及其制品业。
第三类:
印刷业和记录媒介的复制、文教体育用品制造业、医药制造业、仪器仪表及文化与办公用机械制造业、水的生产和供应业。
第四类为其它行业。
结合表4中行业的综合经济效益可知:
聚类分析中第一类为经济效益最好的两个行业,第二类中除水的生产和供应业和文教体育用品制造业的综合排名较后,分别为26和30名,而它们在盈利能力的排名分别是13名和14名。
仪器仪表及文化与办公用机械制造业排在第13名,其它行业的经济效益均排在前十名。
即聚类分析中的第二类为经济效益较好的行业,第三类为经济效益较差的行业。
因此,聚类分析基本验证了基于因子分析的综合评价模型,说明表4中所示的综合评价比较合理。
图1聚类树状图
六问题的思考及政策建议
6.1问题思考
一个企业或行业的经济效益由众多因素来刻画,目前反映行业经济效益主要有总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率等五个经济指标。
这些众多指标虽然能从多方面对行业的经济效益进行全面考察,但也在一定程度增加了分析问题的复杂性。
在损失少量信息的前提下,设计一个或少数几个综合指标,并用较少的综合指标对工业经济效益进行分析评价,能够简化问题。
此外,挖掘出反映经济效益的众多指标的内在基本结构,有助于指出各行业经济效益的主要决定因素及瓶颈,也有助于对各行业经济效益进行综合评价。
所以如何对一个企业的经济效益的评价对当下的企业和全国的经济增长有着直接的作用,如何去发展一个企业的经济也是至关重要的,对当下企业的经济效益有一定的益处。
6.2政策建议
本文以2008年中国国有及国有控股行业进行较为深入的分析与研究,据此提出以下几点建议:
一.在我国国有及国有控股工业行业中,各行业的经济效益及其潜在的优势和劣势不尽相同。
政府部门在扶持行业的发展时,应该同时考虑现阶段行业的优势和劣势,做到强者更强,弱者不弱。
二.尽管分析表明,行业经济效益的主要因子是行业的盈利能力(占比53.65%),但政府部门在决定支持行业的发展时不能只着重行业的盈利能力。
比如烟草制造品业的市场盈利能力为全行业最高,但其市场能力为全行业倒数第二。
要想尽快提高工业行业的经济效益,应该首先重点扶持盈利能力和市场能力均较高的行业,如石油和天然气开采业、黑色金属矿采选业、非金属矿采选业等。
三.合理引导各行业的投资,不能只将投资挤向盈利能力较高的行业,而要适度考虑到市场能力较强的行业。
七参考文献
[1]华中生,梁梁.地区工业行业经济状况的综合评价与分析[J].管理工程学报1995,6.
[2]王树岭等.吉林省轻工业行业经济效益综合评价[J].吉林工业大学学报自然科学版,1999,1.
[3]何晓群.多元统计分析[M].北京:
中国人民大学出版社,2004
[4]林秀梅.多元统计方法[M].长春:
吉林人民出版社,1996
[5]张文彤,董伟.SPSS统计分析高级教程(第二版)[M].北京:
高等教育出版社,2013.3
附录
表1:
2008年国有及国有控股工业行业主要经济效益指标的原始数据
行业
序号
总资产贡献率X1(%)
资产负债率X2(%)
流动资产周转次数X3(次/年)
成本费用利润率X4(%)
产品销售率X5(%)
煤炭开采和洗选业
1
16.29
61.04
1.92
17.31
98.2
石油和天然气开采业
2
49.47
39.06
4.65
83.47
89.16
黑色金属矿采选业
3
19.71
40.69
1.9
32.19
96.26
有色金属矿采选业
4
17.85
47.53
2.03
17.2
98.88
非金属矿采选业
5
13.12
52.51
1.79
11.54
96.26
其他采矿业
6
0.63
74.37
0.37
0.51
118.57
农副食品加工业
7
8.95
65.54
2.8
2.66
96.5
食品制造业
8
8.78
63.2
2.25
3.08
97.33
饮料制造业
9
21.43
42.61
1.61
17.67
99.07
烟草制品业
10
70
23.35
1.49
41.94
98.94
纺织业
11
4.27
67.87
1.61
0.2
98.1
纺织服装、鞋、帽制造业
12
8.29
64.65
1.37
5.67
98.82
皮革、毛皮、羽毛(绒)及其制品业
13
16.67
43.22
1.22
11.92
98.27
木材加工及木、竹、草等制品业
14
8.25
64.04
1.77
3.32
93.61
家具制造业
15
15.72
58
2.55
9.22
99.67
造纸及纸制品业
16
6.53
59.82
1.6
5.06
94.99
印刷业和记录媒介的复制
17
12.9
41.57
1.66
11.98
97.56
文教体育用品制造业
18
5.37
50.58
1.38
2.71
99.94
石油加工、炼焦及核燃料加工业
19
-6.97
58.88
5.54
-7.64
99.15
化学原料及化学制品制造业
20
6.2
55.47
2.32
1.99
97.92
医药制造业
21
13.43
46.89
1.39
12.68
96.05
化学纤维制造业
22
0.48
56.34
1.87
-4.72
98.08
橡胶制品业
23
6
73.32
2.07
0.57
98.86
塑料制品业
24
9.66
64.5
1.63
6.33
98.3
非金属矿物制品业
25
9
61.52
1.74
6.49
97.51
黑色金属冶炼及压延加工业
26
7.25
62.22
2.58
1.69
99.15
有色金属冶炼及压延加工业
27
9.12
58.34
2.39
3.42
98.03
金属制品业
28
10.79
58.77
2.12
4.61
98.97
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 课程 论文