SPSS统计软件期末作业Word文档格式.docx
- 文档编号:5660962
- 上传时间:2023-05-05
- 格式:DOCX
- 页数:23
- 大小:956.83KB
SPSS统计软件期末作业Word文档格式.docx
《SPSS统计软件期末作业Word文档格式.docx》由会员分享,可在线阅读,更多相关《SPSS统计软件期末作业Word文档格式.docx(23页珍藏版)》请在冰点文库上搜索。
38
111
20
169
期望的计数
户口中的%
22.5%
65.7%
11.8%
100.0%
未来收入情况中的%
73.1%
77.6%
51.3%
72.2%
总数的%
16.2%
47.4%
8.5%
农村户口
14
32
19
65
21.5%
49.2%
29.2%
26.9%
22.4%
48.7%
27.8%
6.0%
13.7%
8.1%
52
143
39
234
22.2%
61.1%
16.7%
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
a
2
.005
似然比
.007
线性和线性组合
1
.043
有效案例中的N
a.0单元格(0.0%)的期望计数少于5。
最小期望计数为10.83。
因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势〞持不同的态度。
3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比拟。
由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。
转换→重新编码为不同变量→选择存〔取〕款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。
最后点击确定。
再分析→描述统计→频率→变量:
存款金额分组,图表选择直方图,选择显示正态曲线。
最后输出以下图表:
存款金额分组
频率
百分比
有效百分比
累积百分比
有效
85
77
12
23
49
246
进行数据拆分,并计算不同年龄段储户的一次存款金额的四分位数,并通过四分位数比拟分布上的差异。
步骤:
数据→拆分文件→分组方式:
年龄→确定。
分析→描述统计→频率→统计量→四分位数前打勾→确定。
输出如以下图表:
统计量
20岁以下
N
缺失
百分位数
25
50
75
.
20~35岁
133
35~50岁
78
50岁以上
33
分析储户一次存款金额的分布,并对不同年龄段的储户进行比拟。
存款在500以下所占百分比最大,有34.6%,其次是500-1000的人数。
而存款在5000以上的也有19.9%,说明存款数额悬殊较大。
从输出图表中看出20-35年龄段的储户最多,其次是35-50岁年龄段,这两局部的人群存款意识比拟强,20岁以下的储户只有2人,人数特别少,因为这一年龄段的人群大局部是学生,而50岁以上的老人可能更愿意把钱藏在家里而不是拿到银行去存。
第5题:
方差分析2
:
(1)给出SPSS数据集的格式(列举前4个样本即可);
(2)浓度对收率有无显著影响,并进行多重比拟检验(只选用第1个检验指标);
(3)浓度、温度以及它们间的交互作用对收率有无显著影响。
本道题重点考察我们对于在SPSS应用过程中对于方差分析的应用情况。
先将这组数据输入SPSS,然后进行两个方面的计算:
单因素方差分析和多因素方差分析。
利用SPSS的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。
多重比拟检验的方法:
LSD方法适用于各总体方差相等的情况,特点是比拟灵敏;
Tukey方法和S-N-K方法适用于各水平下观测变量个数相等的情况;
Scheffe方法比Tukey方法不灵敏。
分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据
分析-比拟均值-单因素ANOVA-因变量列表:
收率,因子列表:
浓度-确定。
单因素方差分析
收率
平方和
均方
F
显著性
组间
.041
组内
21
总数
显著性=0.41小于0.05说明拒绝原假设〔浓度对收益无显著影响〕,证明浓度对收益有显著影响。
分析-比拟均值-单因素ANOVA-两两比拟:
LSD-选项:
描述性-确定
输出:
描述
均值
标准差
标准误
均值的95%置信区间
极小值
极大值
下限
上限
8
.52610
.64780
3
24
.49262
多重比拟
因变量:
收率
LSD
(I)浓度
(J)浓度
均值差(I-J)
95%置信区间
*
.032
.2438
.909
.025
.12500
.3688
*.均值差的显著性水平为0.05。
上面有星号的说明有显著差异,即根据LCD算法,浓度1与浓度2具有显著差异,浓度3与浓度2有显著性差异,浓度1与浓度3差异性较小。
分析-一般线性模型-单变量-因变量:
收率,固定因子:
浓度、温度,-模型选择全因子-确定。
主体间因子
浓度
温度
6
4
主体间效应的检验
收率
源
III型平方和
Sig.
校正模型
11
.391
截距
.000
A
.074
B
.917
.462
A*B
.607
.721
误差
总计
校正的总计
a.R方=.519〔调整R方=.077〕
结果说明,只有因子A〔浓度〕是显著的,即浓度不同将对收率产生显著影响,而温度及交互作用的影响都不显著,这说明要提高收率必须把浓度控制好。
方差分析可以很好的去区分两个事物之间存在联系的紧密性。
通过数据,我们可以分辨出浓度的影响更加显著,从而做出调整。
第11题:
曲线回归3
根据收集的1981年至2000年的数据,分析教育支出受年人均可支配收入的影响。
〔提示:
首先绘制两者的散点图。
再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。
〕
思路:
此题主要考察曲线回归的内容,先绘制两者散点图,再用二次、立方、复合、幂函数模型,进行分析。
图形→旧对话框→散点/点状→简单分布→Y轴:
教育支出,X轴:
年人均可支配收入→确定。
得到散点图如下:
分析→回归→曲线估计→因变量:
教育支出,自变量:
年人均可支配收入,个案标签:
年份,模型二次项、立方、幂、复合前打勾→确定。
得到以以下图表:
模型汇总和参数估计值
教育支出
方程
模型汇总
参数估计值
R方
df1
df2
常数
b1
b2
b3
二次
.963
三次
.964
7
复合
.985
9
幂
.946
自变量为年人均可支配收入。
在二次、三次、复合、幂函数的模型中复合函数的R方是最大、最接近1的。
所以应用复合函数来表示年人均可支配收入与教育支出的函数关系。
根据函数图象看出,教育支出是随年人均可支配收入增长而增长的,说明随着人们可支配收入增加,对教育的关注更多,投入更多。
第12题:
聚类分析1
9个学生的数学、物理、化学、语文、历史、英语的成绩如下表。
要求做K-Means聚类分析,分成3类,初始类中心点由SPSS自行确定。
此题考察K聚类〔快速聚类〕的内容,根据题目只要指定聚类数目K和确定K个初始类中心即可。
先把表格数据输入数据编辑器中。
分析→分类→K-均值聚类→变量中把数学、物理、化学、语文、历史、英语选进,聚类数为3→选项→初始聚类中心和ANOVA表前打勾→确定。
初始聚类中心
聚类
数学
83
67
物理
61
100
63
化学
72
79
语文
84
41
历史
81
英语
57
迭代历史记录a
迭代
聚类中心内的更改
a.由于聚类中心内没有改动或改动较小而到达收敛。
任何中心的最大绝对坐标更改为.000。
当前迭代为2。
初始中心间的最小距离为39.724。
最终聚类中心
74
70
68
92
71
64
60
69
56
ANOVA
.234
.017
.926
.446
.022
.009
.031
F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差异。
观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。
每个聚类中的案例数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 统计 软件 期末 作业