SPSS关于我国保险业的统计分析.docx
- 文档编号:18259524
- 上传时间:2023-08-14
- 格式:DOCX
- 页数:35
- 大小:82.49KB
SPSS关于我国保险业的统计分析.docx
《SPSS关于我国保险业的统计分析.docx》由会员分享,可在线阅读,更多相关《SPSS关于我国保险业的统计分析.docx(35页珍藏版)》请在冰点文库上搜索。
SPSS关于我国保险业的统计分析
SPSS关于我国保险业的统计分析
成绩评定表
学生姓名
王柳
班级学号
1309050109
专业
应用统计学
课程设计题目
我国各保险业基本情况的统计分析
评
语
组长签字:
成绩
日期
20年月日
课程设计任务书
学院
理学院
专业
应用统计学
学生姓名
王柳
班级学号
1309050109
课程设计题目
我国各保险业基本情况的统计分析
1保险业分析
1.1保险业分析的研究背景
进入21世纪以来,我国保险业持续快速发展,保险机构个数和保险业从业人数不断增加。
无论是保险机构个数还是保险业从业人数都呈现出持续快速的增长趋势。
伴随着保险机构和从业人员的不断增加,保险业的保费收入也持续增长,使得我国保险业呈现出良好的发展态势。
不管是财产保险公司,还是人寿保险公司,其保费收入都在不断增长。
在这种大背景下对我国目前的保险业进行研究,不论是对于促进我国保险业又好又快地发展,还是对于充分发挥保险业对于发展国民经济和改善居民生活的作用,都有着极为重要的意义。
1.2保险业分析的研究方法
按照我国目前保险业的惯例,对于财产保险公司,可以用5个变量来描述其保险业务情况:
保费收入、储金、赔案件数、赔款支出、未决赔款。
其中保费收入又按保险的特点分为企业财产保险费用收入、机动车辆保险保费收入、货物运输保险保费收入、责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入等9个部分;赔款支出也按保险的特点分为企业财产保险费用支出、机动车辆保险保费支出、货物运输保险保费支出、责任保险保费支出、信用保证保险保费支出、农业保险保费支出、短期健康保险保费支出、意外伤害保险保费支出、其他保险保费支出等9个组成部分,所以在进行分析研究的时候,考虑的关于保险业务的变量也与这些叙述相吻合。
采用的数据分析方法主要有回归分析、因子分析、聚类分析。
基本思路是:
首先采用回归分析研究保费收入、储金、赔案件数、赔款支出、未决赔款、公司总人数、人员构成等变量之间的关系;然后使用因子分析对构成保费收入和赔款支出的各个变量提取因子;最后使用聚类分析依照人员构成特点、保费收入、赔款支出等变量对各财产保险公司进行聚类。
2课题设计
2.1数据来源
本次研究的数据来自于各保险公司人员结构情况.2014.《中国保险年鉴》、各财产保险公司业务统计.2014.《中国保险年鉴》。
2.2数据导入
由于本课题中数据量过大,只截取其中的一部分,完整数据请参照数据来源。
保险机构
保费收入合计
企业财产保险保费收入
机动车辆保险保费收入
货物运输保险保费收入
责任保险保费收入
…
信用保证保险保费收入
人保财险
88428.82
8867.30
62091.02
2978.79
3611.04
…
243.25
国寿财险
789.19
71.81
639.66
8.93
28.70
…
.17
大地
10028.40
576.32
7669.14
171.47
243.11
…
22.93
太平财险
5483.00
809.00
3280.00
201.00
498.00
…
61.00
中国信保
3413.55
278.60
2686.61
115.99
79.60
…
-12.42
阳光产险
3240.77
.00
.00
.00
.00
…
3240.77
中华联合
4153.46
279.14
3338.96
71.77
74.44
…
.78
太保产险
18342.07
670.32
14752.22
149.45
307.59
…
.09
平安产险
23433.04
2796.61
16474.97
895.06
518.25
…
-87.06
华泰财险
21449.53
2346.25
15165.45
641.81
615.76
…
88.56
天安保险
2563.63
237.88
1245.99
196.24
138.67
…
2.02
大众
7371.40
350.03
6556.86
85.37
118.04
…
.00
华安
1280.15
157.99
944.64
44.83
22.39
…
4.57
永安
11301.90
50.95
619.97
10.49
11.89
…
-7.60
永诚
5533.49
228.32
4766.02
36.67
113.34
…
16.31
安信农险
1505.61
438.94
838.29
11.76
37.74
…
.20
…
…
…
…
…
…
...
…
安邦财险
276.62
22.35
33.41
.25
2.45
…
.00
3数据分析过程
3.1回归分析
1、以“保费收入合计”为因变量进行线性回归
操作步骤如下:
(1)选择分析/回归/线性命令
(2)选择进行简单线性回归分析的变量。
在“线性回归”对话框的左侧列表框中选中“保费收入合计”选入“因变量”列表框,选中“男”“女”“博士”“硕士”“学士”“大专”“中专以下”“高级”“中级”“初级”“三十五岁以下”“三十六岁到四十五岁”“四十六岁以上”进入“自变量”列表框,最后在“自变量”下方的“方法”下拉表中采用“逐步”法进行回归。
(3)其他设置使用系统默认值即可。
(4)设置完毕后,单机“确定”按钮,得到输出结果。
2.以“赔款支出合计”为因变量进行线性回归
操作步骤如下:
(1)选择分析/回归/线性命令
(2)选择进行简单线性回归分析的变量。
在“线性回归”对话框的左侧列表框中选中“赔款支出合计”选入“因变量”列表框,选中“男”“女”“博士”“硕士”“学士”“大专”“中专以下”“高级”“中级”“初级”“三十五岁以下”“三十六岁到四十五岁”“四十六岁以上”进入“自变量”列表框,最后在“自变量”下方的“方法”下拉表中采用“逐步”法进行回归。
(3)其他设置使用系统默认值即可。
(4)设置完毕后,单机“确定”按钮,得到输出结果。
3.2因子分析
1.使用构成保费收入的各个变量提取公因子
操作步骤如下:
(1)选择分析/降维/因子分析命令
(2)选择进行因子分析的变量。
在“因子分析”对话框的左侧列表框中选择“企业财产保险费用收入”“机动车辆保险保费收入”“货物运输保险保费收入”“责任保险保费收入”“信用保证保险保费收入”“农业保险保费收入”“短期健康保险驳费收入”“意外伤害保险保费收入”“其他保险保费收入”选入“变量”列表框。
(3)选择输出系数相关矩阵。
单击“因子分析”对话框的“描述”按钮,在“相关矩阵”选项组中选中“KMO和Bartlett的球形度检验”,单击“继续”按钮返回“因子分析”对话框(4)设置对提取公因子的要求及相关输出内容。
单击“因子分析”对话框的“抽取”按钮,在“输出”选项组中选中“碎石图”,单击“继续”按钮返回“因子分析”对话框。
(5)设置因子旋转方法。
单击“因子分析”对话框中“旋转”按钮,在“方法”选项组中选中“最大方差法”。
(6)设置有关因子得分的选项。
单击“因子分析”对话框中“得分”按钮,在本对话框中选中“保存为变量”“显示因子得分系数矩阵”然后单击“继续”按钮返回“因子分析”对话框。
(7)其他设置使用系统默认值即可。
(4)设置完毕后,单机“确定”按钮,得到输出结果。
2.对构成赔款支出的各个变量提取公因子
操作步骤如下:
(1)选择分析/降维/因子分析命令
(2)选择进行因子分析的变量。
在“因子分析”对话框的左侧列表框中选择“企业财产保险费用”“机动车辆保险保费支出”“货物运输保险保费支出”“责任保险保费支出”“信用保证保险保费支出”“农业保险保费支出”“短期健康保险驳费支出”“意外伤害保险保费支出”“其他保险保费支出”选入“变量”列表框。
(3)选择输出系数相关矩阵。
单击“因子分析”对话框的“描述”按钮,在“相关矩阵”选项组中选中“KMO和Bartlett的球形度检验”,单击“继续”按钮返回“因子分析”对话框(4)设置对提取公因子的要求及相关输出内容。
单击“因子分析”对话框的“抽取”按钮,在“输出”选项组中选中“碎石图”,单击“继续”按钮返回“因子分析”对话框。
(5)设置因子旋转方法。
单击“因子分析”对话框中“旋转”按钮,在“方法”选项组中选中“最大方差法”。
(6)设置有关因子得分的选项。
单击“因子分析”对话框中“得分”按钮,在本对话框中选中“保存为变量”“显示因子得分系数矩阵”然后单击“继续”按钮返回“因子分析”对话框。
(7)其他设置使用系统默认值即可。
(4)设置完毕后,单机“确定”按钮,得到输出结果。
3.3聚类分析
1.使用构成保费收入的各个变量对各个保险公司进行聚类
操作步骤如下:
(1)选择分析/聚类/分类/K均值聚类命令
(2)选择进行聚类分析的变量。
在“K均值聚类分析”对话框的左侧列表框中选中“保险机构”选入“个案标记依据”列表框,选择“企业财产保险费用收入”“机动车辆保险保费收入”“货物运输保险保费收入”“责任保险保费收入”“信用保证保险保费收入”“农业保险保费收入”“短期健康保险驳费收入”“意外伤害保险保费收入”“其他保险保费收入”选入“变量”列表框。
在编辑框“聚类数”中,输入聚类分析的类别数4,其他选择默认值(3)设置输出及缺失值处理方法。
单击“K均值聚类分析”对话框的“选项”按钮,在“统计量”复选框选中全部三个复选框,在“缺失值”选项组中选中默认值即可。
设置完毕后,单击“继续”按钮返回“K均值聚类分析”对话框(3)其他设置使用系统默认值即可。
(4)设置完毕后,单机“确定”按钮,得到输出结果。
2.使用构成赔款支出的各个变量对各个财险公司进行聚类
操作步骤如下:
(1)选择分析/聚类/分类/K均值聚类命令
(2)选择进行聚类分析的变量。
在“K均值聚类分析”对话框的左侧列表框中选中“保险机构”选入“个案标记依据”列表框,选择“企业财产保险费用支出”“机动车辆保险保费支出”“货物运输保险保费支出”“责任保险保费支出”“信用保证保险保费支出”“农业保险保费支出”“短期健康保险驳费支出”“意外伤害保险保费支出”“其他保险保费支出”选入“变量”列表框。
在编辑框“聚类数”中,输入聚类分析的类别数4,其他选择默认值(3)设置输出及缺失值处理方法。
单击“K均值聚类分析”对话框的“选项”按钮,在“统计量”复选框选中全部三个复选框,在“缺失值”选项组中选中默认值即可。
设置完毕后,单击“继续”按钮返回“K均值聚类分析”对话框(3)其他设置使用系统默认值即可。
(4)设置完毕后,单机“确定”按钮,得到输出结果。
4保险业分析结论
4.1回归分析结果
1、以“保费收入合计”为因变量进行线性回归分析
表4.1.1变量的输入或移去情况
变量的输入或者移去情况
模型
變數已輸入
變數已移除
方法
1
四十六岁以上
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
2
中专以下
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
3
女
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
4
男
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
5
硕士
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
6
四十六岁以上
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
7
博士
.
逐步(准则:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
a.因变量:
保费收入合计
表4.1.1给出了变量进入回归模型或退出模型的情况。
本题采用逐步法,所以显示的是依次进入模型的变量以及进入与剔除的判别准则。
表4.1.2模型摘要
模型摘要
模型
R
R平方
調整後R平方
標準偏斜度錯誤
1
.985a
.970
.970
2493.52168
2
.989b
.977
.976
2219.71513
3
.993c
.986
.985
1780.08295
4
.994d
.988
.986
1668.02401
5
.995e
.990
.989
1497.81841
6
.996f
.992
.990
1408.25778
7
.996g
.993
.991
1338.51340
表4.1.2给出了随着变量进入依次形成的7个模型的拟合情况。
可以发现7个模型修正的可决系数(调整的R方)在依次递增,而且都在0.97以上,所以,模型的拟合情况非常好。
表4.1.3方差分析表
方差分析表
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
8165998655.013
1
8165998655.013
1313.358
.000b
殘差
248706015.590
40
6217650.390
總計
8414704670.603
41
2
迴歸
8222546394.723
2
4111273197.361
834.415
.000c
殘差
192158275.880
39
4927135.279
總計
8414704670.603
41
3
迴歸
8294294249.055
3
2764764749.685
872.525
.000d
殘差
120410421.548
38
3168695.304
總計
8414704670.603
41
4
迴歸
8311759419.494
4
2077939854.873
746.841
.000e
殘差
102945251.110
37
2782304.084
總計
8414704670.603
41
5
迴歸
8333940110.514
5
1666788022.103
742.954
.000f
殘差
80764560.090
36
2243460.002
總計
8414704670.603
41
6
迴歸
8345293021.890
6
1390882170.315
701.336
.000g
殘差
69411648.713
35
1983189.963
總計
8414704670.603
41
7
迴歸
8353789654.712
7
1193398522.102
666.101
.000h
殘差
60915015.892
34
1791618.114
總計
8414704670.603
41
a.應變數:
保费收入合计
b.預測值:
(常數),中级
c.預測值:
(常數),中级,高级
d.預測值:
(常數),中级,高级,大专
e.預測值:
(常數),中级,高级,大专,三十六岁到四十五岁
f.預測值:
(常數),中级,高级,大专,三十六岁到四十五岁,中专以下
g.預測值:
(常數),中级,高级,大专,三十六岁到四十五岁,中专以下,博士
h.預測值:
(常數),中级,高级,大专,三十六岁到四十五岁,中专以下,博士,四十六岁以上
表4.1.3给出了随着变量的进入依此形成的7个模型的方差分析结果。
可以发现p值一直为0.000,模型的整体极为显著。
表4.1.4系数
系数
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
749.905
404.906
1.852
.071
中级
5.391
.149
.985
36.240
.000
2
(常數)
996.009
367.692
2.709
.010
中级
7.301
.579
1.334
12.604
.000
高级
-17.812
5.258
-.359
-3.388
.002
3
(常數)
500.422
312.720
1.600
.118
中级
8.063
.491
1.474
16.410
.000
高级
-33.364
5.335
-.672
-6.254
.000
大专
.492
.103
.203
4.758
.000
4
(常數)
578.575
294.690
1.963
.057
中级
11.144
1.313
2.036
8.488
.000
高级
-48.988
7.992
-.986
-6.129
.000
大专
1.526
.424
.628
3.601
.001
三十六岁到四十五岁
-1.905
.760
-.641
-2.505
.017
7
(常數)
299.011
256.893
1.164
.253
中级
12.364
2.269
2.259
5.449
.000
高级
-48.063
9.662
-.968
-4.974
.000
大专
2.713
.432
1.116
6.284
.000
三十六岁到四十五岁
-6.253
1.240
-2.104
-5.041
.000
中专以下
1.466
.439
.352
3.338
.002
博士
146.304
60.505
.111
2.418
.021
四十六岁以上
2.145
.985
.405
2.178
.036
a.應變數\:
保费收入合计
表4.1.4给出了随着变量的进入依次形成的7个模型的自变量系数。
因为本表太大,所以删去了中间的一部分,这不影响最后的结果。
可以发现只有第7个模型的各个自变量系数是非常显著的。
综上所述:
1.最终模型的表达式(即第7个模型):
保费收入合计=12.364*中级-48.063*高级+2.713*大专-6.253*三十六岁到四十五岁+1.466*中专以下+146.304*博士+2.145
2.最终模型的拟合度很好,修正决定系数接近1.
3.模型整体显著,p值为0.000
4.在最终模型中,各自变量系数的显著性p值都小于0.05,显著。
5.经过以上多重线性回归分析可以发现,我国保险公司的总保费收入水平与公司职员的性别并无显著关系,与公司职员年龄、职称、文化水平有一定的显著关系。
其中中级职称或者大专、中专以下、博士学历或者四十六岁以上的职员对公司的总保费收入具有拉动效应,尤其是博士学历的职员,每增加一个单位会带来对应保费收入的140多倍的增加;高级职称或者三十六岁到四十五岁的职员对公司的总保费收入具有拖后效应。
2.以“赔款支出合计”为因变量进行线性回归分析
表4.1.5变量的输入或移去情况
变量的输入或者移去情况
模型
變數已輸入
變數已移除
方法
1
中级
.
逐步(準則:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
2
中专以下
.
逐步(準則:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
3
博士
.
逐步(準則:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
4
初级
.
逐步(準則:
F-to-enter的機率<=.050,F-to-remove的機率>=.100)。
a.因变量:
赔款支出合计
表4.1.5给出了变量进入回归模型或退出模型的情况。
本题采用逐步法,所以显示的是依次进入模型的变量以及进入与剔除的判别准则。
表4.1.6模型摘要
模型摘要
模型
R
R平方
調整後R平方
標準偏斜度錯誤
1
.985a
.971
.970
1303.02930
2
.990b
.980
.979
1081.73595
3
.996c
.992
.991
696.68101
4
.997d
.994
.993
608.45217
a.預測值:
(常數),中级
b.預測值:
(常數),中级,中专以下
c.預測值:
(常數),中级,中专以下,博士
d.預測值:
(常數),中级,中专以下,博士,初级
表4.1.6给出了随着变量进入依次形成的4个模型的拟合情况。
可以发现4个模型修正的可决系数(调整的R方)在依次递增,而且都在0.97以上,所以,模型的拟合情况非常好。
表4.1.7方差分析表
方差分析表
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
2261542996.568
1
2261542996.568
1331.976
.000b
殘差
67915414.156
40
1697885.354
總計
2329458410.724
41
2
迴歸
2283822457.087
2
1141911228.543
975.865
.000c
殘差
45635953.637
39
1170152.657
總計
2329458410.724
41
3
迴歸
2311014562.411
3
770338187.470
1587.134
.000d
殘差
18443848.313
38
485364.429
總計
2329458410.724
41
4
迴歸
2315760491.044
4
578940122.761
1563.798
.000e
殘差
13697919.680
37
370214.045
總計
2329458410.724
41
a.應變數:
赔款支出合计
b.預測值:
(常數),中级
c.預測值:
(常數),中级,中专以下
d.預測值:
(常數),中级,中专以下,博士
e.預測值:
(常數),中级,中专以下,博士,初级
表4.1.7给出了随着变量的进入依此形成的4个模型的方差分析结果。
可以发现p值一直为0.000,模型的整体极为显著。
表4.1.8方差分析表
系数
模型
非標準化係數
標準化係數
T
顯著
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 关于 我国 保险业 统计分析