统计分析软件SPSS详细教程.docx
- 文档编号:4829974
- 上传时间:2023-05-07
- 格式:DOCX
- 页数:41
- 大小:5.31MB
统计分析软件SPSS详细教程.docx
《统计分析软件SPSS详细教程.docx》由会员分享,可在线阅读,更多相关《统计分析软件SPSS详细教程.docx(41页珍藏版)》请在冰点文库上搜索。
统计分析软件SPSS详细教程
统计分析软件&SPSS成立数据
数据加工作图
中随机取值:
=randbetween(55,99)
中新建数据,一列40个,正态散布随机数:
先在40那里随意输入一个数表示选择40个可用的,然后按一下操作步骤:
3.排序:
个案排秩
4.数据选取:
数据-选择个案-若是条件知足:
计算新变量:
5.频次分析:
分析-统计描述-频率
还原:
个案-全数
6.加权:
还原
7.画图:
11.08画图解答&描述性分析:
1.课后题:
长条图
2.描述性统计分析:
(1)频数分析:
(2)描述性分析:
描述性统计分析没有图形功能,也不能生成频数表,但描述性分析能够将原始数据转换成标准化得分
,并以变量形式存入数据文件中,以便后续分析时应用。
操作:
分析—描述性分析:
然后对结果进行挑选,去掉异样值,就取得标准化的数据:
任何形态的数据通过Z标准化处置以后就会是正态散布的<—错误!
标准化是等比例缩放的,可不能改变数据的原始散布状态,
(3)探讨分析:
(查验是不是是正态散布:
茎叶图、箱图)
实例:
操作:
(4)交叉列联表(探讨定类型的变量间的相关性):
【纯数值的变量用回归分析,名义变量用交叉分析】操作:
实例:
四格表卡方查验:
(查验某个持续变量的散布是不是与某种理论散布一致,如是不是符合正态散布)
例子:
第1步成立数据文建:
第2步:
对数据进行预处置;(给数据加权)
第3步进行卡方查验:
第4步结果分析
P=<,那么在5%显著性水平下拒绝原假设,不同有显著性意义,即药物加化疗与单用药物医治癌症的疗效有显著性不同。
如何选sig值:
期望值确实是T是理论频数N是样本数量(合计)
对应:
1)选第一个:
2)选
3)选
配对卡方查验:
第1步成立数据文建:
第2步对数据进行加权处置
第3步进行配对卡方查验
结果分析:
第七章非参数查验
利用情形:
在整体散布未知的情形下用非参数查验,散布已知用参数查验。
1.单样本的非参数查验
(1)卡方查验
分析步骤
Ø第1步提出零假设:
卡方查验的零假设H0是“整体服从某种理论散布”,其对立假设H1是“整体不服从某种理论散布”。
Ø第2步选择查验统计量:
卡方散布选择的是Pearson卡方统计量。
已证明,当n充分大时,它近似地服从自由度为k-1的卡方散布。
Ø第3步计算查验统计量的观测值和概率p值。
Ø第4步给出显著性水平,作出决策。
实例:
某公司质检负责人欲了解企业一年内显现的次品数是不是均匀散布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内显现的次品数是不是均匀散布在一周的五个工作日中?
()
工作日
1
2
3
4
5
次品数
25
15
8
16
26
第1步分析:
由于考虑的是次品是不是服从均匀散布的问题,考虑用卡方查验。
第2步数据的组织:
数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“number”,输入数据并保留。
第3步加权设置:
将变量“number”概念为权变量。
第4步进行卡方查验:
Ø第5步要紧结果及分析
左表是频数散布情形表,第二列为实际观看值显现次数,第三列为理论上天天应显现的次数,第四列为残差
右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=<。
说明应拒绝每一个工作日显现的次品率相等的原假设。
即次品数显现是不均匀的。
(2)二项散布查验
【例7-2】某地某一时期内诞生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。
问那个地址诞生婴儿的性别比例与通常的男女性比例(整体概率约为)是不是不同?
第1步分析:
由于性别分为男与女两种状态,故应用二项散布查验。
第2步数据的组织:
数据分成两列,其变量名为“性别”,“频数”。
输入数据并保留。
进行加权处置。
第3步进行二项散布查验:
第4步要紧结果及分析
从上表可知,相伴概率Sig.=>,因此没有理由拒绝零假设。
这说明此地新生儿男女比例与通常的男女比例相同。
2.两独立样本的非参数查验
【例7-3】某公司希望了解两种品牌汽油A和B每加仑的行驶里程是不是有区别,表是两种品牌汽油每加仑的行驶里程数,在显著性水平=下,判定两个品牌间是不是存在显著性不同?
A
B
33
第1步分析:
由于是两种品牌的汽油,能够以为是两个独立样本,但行驶里程数全然不明白服从何种散布,可用两独立样本的非参数查验进行分析。
第2步数据组织:
由于独立样本的非参数查验所查验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。
第3步进行独立样本的非参数查验
双尾查验的相伴概率为,大于,说明两种汽油无显著性不同。
两个相伴概率都大于显著性水平,因此应同意零假设,以为两种汽油之间无显著性不同。
Kolmogorov-SmirnovZ值为,相伴概率值为,大于显著性水平,因此应同意两种汽油之间无显著性不同的原假设;
依照游程查验计算的Z统计量为,对应在单尾显著性概率为,大于显著性水平,因此应同意两种汽油之间无显著性不同的原假设。
从以上四种查验方式所取得的结果是相同的,即两种汽油之间无显著性不同。
3.多独立样本的非参数查验
4.两相关样本的非参数查验
某企业提出了一项新工艺,为了查验新工艺是不是能降低单位本钱,随机抽取16个工人别离用新旧工艺生产产品,测得单位本钱资料如下表,请在显著性水平下查验是不是新工艺降低了本钱?
new
25
12
14
22
21
17
22
16
17
18
19
24
22
15
22
23
old
18
17
16
19
24
19
28
18
22
24
22
30
25
20
24
21
第1步
分析:
由于是同一批工人和同一批机械,其前后的本钱是相关的,同时也不知数据的散布情形,故应用两相关样本的非参数查验。
第2步数据组织:
数据分成两列,第一列为新工艺的本钱,第二列为旧工艺的本钱。
第3步两相关样本的非参数查验:
设置如以下图
Z统计量为,相伴概率为,小于显著水平,故应拒绝原假设,即以为两样本不是来自于同一整体,说明有不同,新工艺可省本钱。
结果分析:
Z统计量为,相伴概率为,小于显著水平,故应拒绝原假设,即以为两样本不是来自于同一整体,说明有不同,新工艺可省本钱。
其相伴概率为,小于,说明新工艺与旧工艺有显著性不同,这与Wilxocon查验结果是一致的。
5.多相关样本的非参数查验
某文艺晚会有5个节目,共有5个评委参与打分,其数据如下表。
问这5个评委的判定标准是不是一致。
节目1
节目2
节目3
节目4
节目5
评委1
9
评委2
10
评委3
评委4
评委5
第1步
分析:
由于5个评委打分是别离针对同一个节目,因此数据之间具有相关性,同时不明白数据所服从的散布,能够采纳多相关样本的非参数查验。
第2步数据组织:
由于是分析的评委之间的评判标准是不是一致,故应将每一个评委所打的分各分成一列。
第3步多相关样本的非参数查验:
结果分析:
卡方值为,自由度为4,相伴概率为>,故应以为5个评委打分是一致的。
卡方值为,自由度为4,相伴概率为>,也应以为5个评委的打分具有一致性,这与Friedman查验具有一致性。
非参数查验与卡方查验比较:
卡方查验是数据整体是服从什么样的散布(都是频次的方式呈现出来的)
非参数查验是整体散布情形未知
第五章均值查验与T查验
参数查验必需说明,他是服从某种散布的
实例:
进程(均值查验)(与非参查验比较)非参查验中的二项式查验,可是只能是两个变量。
第1步数据组织;
依照表生成SPSS数据文件,建3个变量:
“sex”、“edu”、“num”,数据文件的部份数据
如图5-3所示。
3、实例分析
第2步打开主对话框;
选择分析→比较均值→均值,打开同图5-1一样的均值进程主对话框。
第3步确信要进行均值比较的变量;
在图5-1的对话框中,从左侧的候选变量列表框当选择“人口数量(num)”变量,移入“因变量列表”文本框中,表示对该变量进行均值比较分析。
第4步确信分组变量;
分组变量能够有几层,选择“性别(sex)”变量作为第一层分组变量,将其移入“自变量列表”文本框中。
第5步确信输出的统计量;
单击图5-1上的选项…按钮,弹出如下图的子对话框,选择方差和eta复选框,进行方差分析,单击继续按钮,返回主对话框。
结果分析:
此表是性别的单因素方差分析。
表中的Sig.值远大于,说明不同性别受教育的人口数量没有显著性不同。
人口数量与性别的相关性气宇表。
现在的Eta和Eta方取值都很小,说明性别和受教育的人口数量的相关性很差,这也和单因素方差分析表的结论是一致的。
4.单样本T查验(它是对整体均值的假设查验)
【例5-2】某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量别离为:
495,502,508,496,505,499,503,498,505,500。
假设数据整体呈正态散布,请查验生产线的工作情形。
第1步数据组织;
第一成立SPSS数据文件,只需成立一个变量“Weight”,录入相应的数据即可。
第2步打开主对话框;
选择分析→比较均值→单样本T查验,打开同图5-3一样的单样本T查验主对话框。
第3步确信要进行T查验的变量;
在图5-3所示的对话框中,选择“Weight”变量作为查验变量,移入“查验变量”框中。
第4步输入要查验的值;
在图5-4的对话框中的“查验值”中输入要查验的值,本例应输入500。
单样本T查验结果表,第一行的TestValue为查验参数值500,即用于比较的整体均值,下面从左至右依次为查验统计量(t)、自由度(df)、双尾检测概率P值(Sig.(2-tailed))、样本均值与和查验值的差(MeanDifference)、均值差的95%置信区间(95%ConfidenceIntervaloftheDifference)。
当置信水平为95%时,显著性水平为,从表中能够看出,双尾检测概率P值为,大于,故零假设成立,也确实是说抽样袋装食盐的重量与500克无显著性不同,有理由相信生产线工作状态正常。
5.两独立样本T查验
【例5-3】为比较两种不同品种的玉米的产量,别离统计了8个地域的单位面积产量,具体数据见表。
假定样本服从正态散布,且两组样本彼此独立,试比较在置信度为95%的情形下,两种玉米产量是不是有显著性不同。
第1步数据组织;
依照表,SPSS数据文件中成立两个变量,别离为“品种”、“产量”,变量“品种”的变量值标签为:
a-品种A,b-品种B,录入数据即可。
第2步打开主对话框;
选择分析→比较均值→独立样本T查验,打开同图5-4一样的两独立样本T查验主对话框。
第3步确信要进行T查验的变量;
在图5-4所示的对话框中,选择“产量”变量作为查验变量,移入“查验变量”框中。
第4步确信分组变量;
选择变量“品种”作为分组变量,将其移入图5-4中的“分组变量”文本框中,并概念分组的变量值:
Group1—1,Group2—2。
结果分析:
第一做2个样本方差的齐性查验。
上图中sig.=>,因此以为2个样本方差不存在不同,能够依照P=取值。
在显著性水平为的情形下,T统计量的概率p值大于,故不该拒绝零假设,,即以为两样本的均值是相等的,在本例中,不能以为两种玉米品种的产量有显著性不同。
6.两配对样本T查验
3、实例分析
【例5-4】以下是某大学跆拳道选手15人的平稳训练的数据,统计实验前、后平稳训练成绩是不是有不同。
训练前:
86,77,59,79,90,68,85,94,66,72,75,72,69,85,88
训练后:
78,81,76,92,88,76,93,87,62,84,87,95,88,87,80
第1步数据组织;
第一成立SPSS数据文件,成立两个变量:
“训练前”、“训练后”,录入相应数据。
第2步打开主对话框;
选择分析→比较均值→配对样本T查验,打开同图5-5一样的配对样本T查验主对话框。
第3步确信配对分析的变量;
将变量“训练前”和“训练后”添加到“成对变量”框中,作为第一对分析的配对变量。
两配对样本T查验的简单相关关系及其查验结果。
表中第3列为训练前和训练两样本的相关系数,第4列是相关系数的查验p值。
从表中能够看出,在显著性水平为时,训练前后的概率p值为,大于,同意零假设,能够以为训练前后的成绩没有明显的线性关系。
由于概率p值为,小于,拒绝零假设,能够以为训练前后对成绩有显著成效。
第六章方差分析
单因素方差分析:
用四种饲料喂猪,共19头分为四组,每一组用一种饲料。
一段时刻后称重,猪体重增加数据如下表所示,比较四种饲料对猪体重增加的作用有无不同。
饲料A
饲料B
饲料C
饲料D
第1步分析:
由于考虑的是一个操纵变量(饲料)对一个观测变量(猪体重)的阻碍,而且是4种饲料,因此不适宜用独立样本T查验(仅适用两组数据),应采纳单因素方差分析。
第2步数据的组织:
数据分成两列,一列是猪的体重,变量名为“weight”,另一变量是饲料品种(变量值别离为1,2,3,4),变量名为“fodder”,输入数据并保留。
第3步方差相等的齐性查验:
由于方差分析的前提是各个水平下(那个地址是不同的饲料folder阻碍下的体重weight)的整体服从正态散布,且各组方差具有齐性。
其中正态散布的要求并非是很严格,但关于方差相等的要求是比较严格的,因此必需对方差相等的前提进行查验。
方差齐性查验的方式:
打开分析——比较均值——单因素ANOVA——选项,在“方差同质性查验”前打钩就能够够了。
方差齐性查验的方式:
方差齐性查验的H0假设是:
方差相等。
从上表可看出相伴概率Sig.=>()说明应该同意H0假设(即方差相等)。
故下面就用方差相等的查验方式。
上表是几种饲料方差分析的结果,组间(BetweenGroups)平方和(SumofSquares)为,自由度(df)为3,均方为;组内(WithinGroups)平方和为,自由度为15,均方为;F统计量为。
由于组间比较的相伴概率Sig.(p值)=<,故应拒绝H0假设(四种饲料喂猪成效无显著不同),说明四种饲料对养猪的成效有显著性不同。
从整个表反映出来四种饲料彼此之间均存在显著性不同,从成效来看是第4种最好,第二是第3种,第1种最差。
多因素方差分析:
研究一个班三组不同性别的同窗(别离同意了三种不同的教学方式)在数学成绩上是不是有显著不同,数据如下表。
姓名
数学
组别
性别
姓名
数学
组别
性别
张青华
99
0
m
郭晓艳
99
2
m
王洁云
88
0
f
李福利
70
2
f
吴凌风
99
0
m
罗帆
89
2
m
刘行
89
0
m
宋丽君
55
1
f
马萌
94
0
f
辛瑞晶
50
1
m
单玲玲
90
0
m
王滢滢
67
1
f
罗超波
79
2
m
蔡春江
67
1
m
尹珣
56
2
f
武佳琪
56
1
f
张敏
89
2
m
陈雪吟
56
1
m
第1步分析:
需要研究不同教学方式和不同性别对数学成绩的阻碍。
这是一个多因素(双因素)方差分析问题。
第2步数据组织:
如上表的变量名组织成4列数据。
第3步变量设置:
方差齐性查验
第4步设置方差齐性查验:
由于方差分析要求不同组别数据方差相等,故应进行方差齐性查验,选中“选项”中的“方差齐性查验”,显著性水平设为默许值。
第5步设置操纵变量的多重比较分析:
第6步选择成立多因素方差分析的模型种类:
打开“模型”对话框,本例用默许的“全因子”模型。
此项为系统默许的模型类型。
该项选择成立全模型。
全模型包括所有因素变量的主效应和所有的交互效应。
例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。
结果分析:
表示了各操纵因素的个案数,即分组描述情形。
是进行方差齐性查验的结果,能够看出方差无显著不同。
在全因子模式下,取得了2个因子的各自主效应和二者的交互效应的显著度。
那个地址只看交互效应的显著度为<,说明在不同性别和组别的组合上存在对成绩的附加阻碍。
不同教学方式的比较,由于在前面查验方差具有齐性,故那个地址仅看LSD部份。
再来单独分析2个因素中,在操纵了一个因素的阻碍后,另一个因素是不是有显著性阻碍。
只需在模型选择中进行修改
能够看到:
在操纵了组别因素的阻碍后,性别因素主效应的显著度P=>,因此性别因素单独作用下对成绩没有显著性阻碍。
相反,组别因素单独作用下对成绩具有显著性阻碍。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 软件 SPSS 详细 教程