SPSS期末考察5doc唐刚勇.docx
- 文档编号:1162966
- 上传时间:2023-04-30
- 格式:DOCX
- 页数:22
- 大小:170.33KB
SPSS期末考察5doc唐刚勇.docx
《SPSS期末考察5doc唐刚勇.docx》由会员分享,可在线阅读,更多相关《SPSS期末考察5doc唐刚勇.docx(22页珍藏版)》请在冰点文库上搜索。
SPSS期末考察5doc唐刚勇
SPSS期末考查作业
姓名:
唐刚勇班级:
08广告班
学号:
200802020028教师:
黄丽娜
一、描述性统计
1、
分析说明:
本科学历的占全体职工的25%;专科学历的占全体职工的25%;高中学历的占全体职工的31.2%;初中学历的占全体职工的18.8%;因此从表中得出职工的学历以高中学历居多,专科和本科生学历人数持平,而初中学历的职工人数则相对较少。
从以上柱状图可以看出,柱状图表中的职工职称情况,其中持有助理工程师的人数最多,同时拥有工程师职称的人数也较多,持有高级工程师证的人与无技术职称的人员数保持平衡。
2、频数
频率
百分比
有效百分比
累积百分比
有效
824.00
3
18.8
18.8
18.8
827.00
1
6.3
6.3
25.0
848.00
1
6.3
6.3
31.3
859.00
1
6.3
6.3
37.5
866.00
1
6.3
6.3
43.8
887.00
2
12.5
12.5
56.3
889.00
1
6.3
6.3
62.5
938.00
1
6.3
6.3
68.8
984.00
1
6.3
6.3
75.0
989.00
1
6.3
6.3
81.3
1014.00
2
12.5
12.5
93.8
1044.00
1
6.3
6.3
100.0
统计量
基本工资
N
有效
16
缺失
0
均值
907.3750
中值
887.0000
众数
824.00
标准差
77.86131
全距
220.00
极小值
824.00
极大值
1044.00
和
14518.00
从上图可以看出,该表中有3个人的工资是824,即其频数是3,而887、1014出现的次数都是2,这表明在四个人的工资中每两个人的工资分别是887与1014,而其他的人的工资频数都只出现一次。
同时从上图中还可以看出该表中他们工资的平均值是907.3750,即他们工资的平均水平是907.3750.而他们的工资标准差是77.86131,说明他们的工资离散程度并不是很大,相对比较接近集中。
他们工资的中位数是887.0000,说明表明他们工资的平均水平在887左右,而众数是824,表明着在这16个人当中有三个人的工资是824,即工资相同的人数有三个。
极差为220,表明他们的工资中最高的一个人的工资与最低的一个人的工资差值是220.。
3、
案例处理摘要
性别
案例
有效
缺失
合计
N
百分比
N
百分比
N
百分比
薪水
女
216
100.0%
0
.0%
216
100.0%
男
258
100.0%
0
.0%
258
100.0%
描述
性别
统计量
标准误
薪水
女
均值
$26,031.92
$514.258
均值的95%置信区间
下限
$25,018.29
上限
$27,045.55
5%修整均值
$25,248.30
中值
$24,300.00
方差
5.712E7
标准差
$7,558.021
极小值
$15,750
极大值
$58,125
范围
$42,375
四分位距
$7,013
偏度
1.863
.166
峰度
4.641
.330
男
均值
$41,441.78
$1,213.968
均值的95%置信区间
下限
$39,051.19
上限
$43,832.37
5%修整均值
$39,445.87
中值
$32,850.00
方差
3.802E8
标准差
$19,499.214
极小值
$19,650
极大值
$135,000
范围
$115,350
四分位距
$22,675
偏度
1.639
.152
峰度
2.780
.302
茎叶图
薪水Stem-and-LeafPlotforgender=女
FrequencyStem&Leaf
2.001.55
16.001.6666666666777777
14.001.88889999999999
31.002.0000000000000111111111111111111
35.002.22222222222222222222233333333333333
38.002.44444444444444444444444444555555555555
22.002.6666666666677777777777
17.002.88888899999999999
7.003.0001111
8.003.22233333
8.003.44444555
5.003.66777
2.003.88
11.00Extremes(>=40800)
Stemwidth:
10000
Eachleaf:
1case(s)
薪水Stem-and-LeafPlotforgender=男
FrequencyStem&Leaf
1.001.9
18.002.111122222223344444
64.002.5555555555566666666666666667777777777777777788888888888999999999
60.003.000000000000000000000000000001111111111111122233333333344444
22.003.5555555566667778889999
16.004.0000000012223334
11.004.55556677889
9.005.001122344
10.005.5555667899
8.006.00001112
14.006.55566666788889
6.007.000233
5.007.55888
4.008.0123
10.00Extremes(>=86250)
Stemwidth:
10000
Eachleaf:
1case(s)
可看出:
女职员的薪水大多集中在$20~$26之间,男职员的薪水较集中在$21~$35之间,男性工资水平明显高于女性。
从上图可以看出在女性茎叶图中女性工资集中在2.0---2.9之间,其中有38人拿2.4-万的工资,有35人拿2.2万的工资,而在男性茎叶图中,可以看出男性工资主要集中在2.1---6.55万之间,其中有64人的工资在2.56万左右,有60人的工资在3.00万左右,是不符合正态分布的,而从薪水标准QQ图中也可以看出他的分布是不符合正态分布检验的。
而从上面的箱图中,可以看出第29这个个案比较离散,与其他的数据相比,它明显高出别的个案很多,所以可以将其作为一个奇异值来做估算。
二、多项式
4、交叉表
VAR00001
交叉表
计数
性别
合计
男
女
VAR00001
康佳
3
1
4
长虹
2
3
5
西湖
1
4
5
tcl
3
0
3
东芝
1
1
2
创维
1
0
1
合计
11
9
20
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
6.869a
5
.231
似然比
8.520
5
.130
线性和线性组合
.258
1
.612
有效案例中的N
20
a.12单元格(100.0%)的期望计数少于5。
最小期望计数为.45。
VAR00002
交叉表
计数
性别
合计
男
女
VAR00002
康佳
2
1
3
长虹
1
2
3
西湖
5
1
6
tcl
2
1
3
东芝
1
1
2
创维
0
3
3
合计
11
9
20
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
6.532a
5
.258
似然比
7.889
5
.162
线性和线性组合
1.786
1
.181
有效案例中的N
20
a.12单元格(100.0%)的期望计数少于5。
最小期望计数为.90。
VAR00003
交叉表
计数
性别
合计
男
女
VAR00003
康佳
2
2
4
长虹
1
0
1
西湖
3
2
5
tcl
3
4
7
东芝
0
1
1
创维
2
0
2
合计
11
9
20
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
4.185a
5
.523
似然比
5.690
5
.338
线性和线性组合
.043
1
.837
有效案例中的N
20
a.12单元格(100.0%)的期望计数少于5。
最小期望计数为.45。
从图中可以看出VAR00001中长虹西湖两个品牌比较受欢迎,VAR00002
中西湖比较受欢迎,VAR00003中则是tcl和西湖这两个品牌比较受欢迎。
因此由于相伴概率为0.539大于显著性水平0.05,那么应接受零假设,认为行列变量之间彼此不存在明显的相关。
三、T检验
5、
T检验
单个样本统计量
N
均值
标准差
均值的标准误
身高
30
160.630
7.5853
1.3849
单个样本检验
检验值=160
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
身高
.455
29
.653
.6300
-2.202
3.462
从上面可以得出样本均值为160.630,在显著性水平为0.05下建立T统计量,t=0.445,p值(sig)为0.653,明显大于0.05,则接受原假设,样本均值与该城市平均身高无显著差异。
6、
组统计量
性别
N
均值
标准差
均值的标准误
身高
男
15
162.667
8.2778
2.1373
女
15
158.593
6.4631
1.6688
独立样本检验
方差方程的Levene检验
均值方程的t检验
差分的95%置信区间
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
下限
上限
身高
假设方差相等
1.586
.218
1.502
28
.144
4.0733
2.7116
-1.4812
9.6279
假设方差不相等
1.502
26.444
.145
4.0733
2.7116
-1.4960
9.6426
从上图中可以看出,因为sig为.0218大于0.05,说明男女生身高的方差满足齐次性,所以可以用T统计量进行检验。
而t=1.520,P值为0.144>0.05,因而原假设成立,即男女生的平均身高无显著差异。
7、
成对样本统计量
均值
N
标准差
均值的标准误
对1
数学1
72.94
18
20.157
4.751
数学2
84.78
18
10.339
2.437
对2
化学1
81.83
18
15.240
3.592
化学2
89.44
18
8.183
1.929
成对样本相关系数
N
相关系数
Sig.
对1
数学1&数学2
18
-.077
.761
对2
化学1&化学2
18
.434
.072
成对样本检验
成对差分
t
df
Sig.(双侧)
差分的95%置信区间
均值
标准差
均值的标准误
下限
上限
对1
数学1-数学2
-11.833
23.352
5.504
-23.446
-.221
-2.150
17
.046
对2
化学1-化学2
-7.611
13.823
3.258
-14.485
-.737
-2.336
17
.032
从上图中可以看出,该班学生在参加暑假班之前的数学成绩均值为72.94参加补习后的数学成绩均值为84.78,该班化学成绩在参加补习之前的均值为81.83,在参加后的成绩均值为89.44,而数学成绩的sig等于0.046小于0.05,化学成绩的sig等于0.032也小于0.05,所以都拒绝原假设,所以说明该班在补习后的数学与化学的学生成绩是有别于补习之前的成绩的,该班的数学化学成绩在补习后明显高于补习之前的成绩。
四、方差分析
8、
方差齐性检验
销售额
Levene统计量
df1
df2
显著性
.765
3
140
.515
ANOVA
销售额
平方和
df
均方
F
显著性
组间
(组合)
5866.083
3
1955.361
13.483
.000
线性项
对比
2101.250
1
2101.250
14.489
.000
偏差
3764.833
2
1882.417
12.980
.000
组内
20303.222
140
145.023
总数
26169.306
143
均值相等性的键壮性检验
销售额
统计量a
df1
df2
显著性
Brown-Forsythe
13.483
3
132.825
.000
a.渐近F分布。
从上面可以得出Leven’s统计量对应的P(P=0.515)值大于0.05所以得到各种广告形式对应的销售额满足方差齐次性德结论。
由单因素方差分析结果表得出F统计量的值为13.483,对应的P值为0小于0.05,拒绝原假设,即认为各种广告形式对销售额的影响并不完全相同,即各种广告形式对销售额有影响。
多重比较
因变量:
销售额
(I)广告形式
(J)广告形式
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
LSD
报纸
广播
2.33333
2.83846
.412
-3.2784
7.9451
宣传品
16.66667*
2.83846
.000
11.0549
22.2784
体验
6.61111*
2.83846
.021
.9993
12.2229
广播
报纸
-2.33333
2.83846
.412
-7.9451
3.2784
宣传品
14.33333*
2.83846
.000
8.7216
19.9451
体验
4.27778
2.83846
.134
-1.3340
9.8896
宣传品
报纸
-16.66667*
2.83846
.000
-22.2784
-11.0549
广播
-14.33333*
2.83846
.000
-19.9451
-8.7216
体验
-10.05556*
2.83846
.001
-15.6673
-4.4438
体验
报纸
-6.61111*
2.83846
.021
-12.2229
-.9993
广播
-4.27778
2.83846
.134
-9.8896
1.3340
宣传品
10.05556*
2.83846
.001
4.4438
15.6673
*.均值差的显著性水平为0.05。
同类子集
销售额
广告形式
N
alpha=0.05的子集
1
2
Student-Newman-Keulsa
宣传品
36
56.5556
体验
36
66.6111
广播
36
70.8889
报纸
36
73.2222
显著性
1.000
.055
将显示同类子集中的组均值。
a.将使用调和均值样本大小=36.000。
从以上图表中我们可以看到,报纸和宣传品的均值差为16.66667,报纸与广播的均值差为2.3333,报纸与体验的均值差为6.61111;而广播与宣传品的均值差是14.3333,广播与报纸的均值差是-2.3333,广播与体验的均值差是4.27778,因此从以上的对比可以得出在这四种广告形式中报纸和广播的广告形式比其他几种广告形式更好,同时相比宣传品与体验来说更容易带来更高的销售额。
9、
研究者已经获得不同促销方式以及是否开展售后服务两种情况下的商品的销售额。
试用多因素方差分析,不同促销方式和是否展开售后服务对商品销售额有无显著性影响。
同时要求进行控制变量的多重检验,且输出相应的线图。
(表7)
主体间因子
值标签
N
售后服务
0
无
12
1
有
12
促销方式
0
无
8
1
被动促销
8
2
主动促销
8
主体间效应的检验
因变量:
销售额
源
III型平方和
df
均方
F
Sig.
校正模型
1111.292a
3
370.431
17.752
.000
截距
20358.375
1
20358.375
975.641
.000
service
532.042
1
532.042
25.497
.000
promot
579.250
2
289.625
13.880
.000
误差
417.333
20
20.867
总计
21887.000
24
校正的总计
1528.625
23
a.R方=.727(调整R方=.686)
从上图看到在Sig都为0的情况下,促销方式和是否开展售后服务对销售额都是没有营销的,但是从线性表可以看出,在两种方式共同的作用下,对销售额是有显著影响的
五、相关分析
10、
输入/移去的变量a
模型
输入的变量
移去的变量
方法
1
投入高级职称的人年数
.
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概率>=.100)。
a.因变量:
课题总数
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.944a
.892
.888
280.1098
a.预测变量:
(常量),投入高级职称的人年数。
b.因变量:
课题总数
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.880E7
1
1.880E7
239.626
.000a
残差
2275384.112
29
78461.521
总计
2.108E7
30
a.预测变量:
(常量),投入高级职称的人年数。
b.因变量:
课题总数
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-24.523
81.093
-.302
.764
投入高级职称的人年数
.951
.061
.944
15.480
.000
a.因变量:
课题总数
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
-1.695
3530.114
960.000
791.6528
31
残差
-586.1221
817.3984
.0000
275.4018
31
标准预测值
-1.215
3.247
.000
1.000
31
标准残差
-2.092
2.918
.000
.983
31
a.因变量:
课题总数
从以上可以得出,在从sig为零时,那么原假设成立,同时从以上几个图表来看,不呈正太分布,可以知道立项课题数与投入的具有高级职称的人年数之间不存在较强的线性关系
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 期末 考察 doc 刚勇