SPSS实验报告.docx
- 文档编号:11906051
- 上传时间:2023-06-03
- 格式:DOCX
- 页数:35
- 大小:1.24MB
SPSS实验报告.docx
《SPSS实验报告.docx》由会员分享,可在线阅读,更多相关《SPSS实验报告.docx(35页珍藏版)》请在冰点文库上搜索。
SPSS实验报告
第六章方差分析
一实验目的
1.理解方差分析的概念、原理及作用;
2.掌握用SPSS进行单因素、双因素及协方差分析的方法;
3.结合参考资料了解方差分析的其它方法及作用。
二方差分析的原理
方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个:
(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作wSS,组内自由度wdf;
(2)实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差的总平方和表示,记作bSS,组间自由度bdf。
三实验过程
1.某农场为了比较4种不同品种的小麦产量的差异,选择土壤条件基本相同的土地,分成16块,将每一个品种在4块试验田上试种,测得小表亩产量(kg)的数据如表6.17所示(数据文件为data6-4.sav),试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。
(数据来源:
《SPSS实用统计分析》郝黎仁,中国水利水电出版社)
表6.17小麦产量的实测数据
品种
A1
A2
A3
A4
产量
277.5
244.2
249.2
273
276.4
249.5
244.2
240.9
271
236.8
252.8
257.4
272.4
239
251.4
266.5
实验步骤:
第1步分析:
由于有一个因素(小麦),而且是4种饲料。
故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;
第2步数据的组织:
分成两列,一列是试验田的产量(output),另一列是小麦品种(breed)(A、B、C、D);
第3步方差相等的齐性检验:
由于方差分析的前提是各个水平下(这里是不同品种的小麦产量)的总体服从方差相等的正态分布。
其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。
因此必须对方差相等的前提进行检验。
从SPSS的数据管理窗口中选择analyze—comparemeans—One-WayANOVA,将小麦产量(output)选入dependentlist框中,将品种(breed)选入factor框中,点开Options,选中Homogeneityofvariancetest(方差齐性检验),点开posthocmultiplecomparisons,将significancelevel的值在两次实验时分别设置为0.01和0.05。
如下图所示:
实验结果及分析:
在0.05的显著性水平下
不同小麦的等齐性检验:
方差齐性检验的H0假设是方差相等,从上表可看出Sig.=0.046>0.05,说明应该接受H0假设。
几种小麦的方差检验结果(如下):
组间平方和为2263.482,自由度(df)为3,均方为754.494;组内平方和为744.715,自由度为12,均方为62.060,;F统计量为12.518。
由于组间比较的相伴概率Sig(P值)=0.001<0.05,故应拒绝H0假设(四种小麦的产量无显著性差异),说明四种小麦的产量有显著性差异。
在0.01的显著水平下:
在等齐性检验中Sig.=0.46>0.01,所以接受H0假设(四种小麦产量无显著性差异),组间比较的相伴概率Sig(P值)=0.001<0.01,故应拒绝H0假设(四种小麦的产量无显著性差异),说明四种小麦的产量有显著性差异。
因此,在显著性水平0.05和0.01下,四种不同小麦的产量有显著性差异
2.某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表6.18(单位:
千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。
在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?
(数据来源:
《统计学(第三版)》,M.R.斯皮格尔,科学出版社)
表6.18四种轮胎的寿命数据
A
33
38
36
40
31
35
B
32
40
42
38
30
34
C
31
37
35
33
34
30
D
29
34
32
30
33
31
实验步骤:
第1步分析:
由于有一个因素(轮胎),而且是4种饲料。
故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;
第2步数据的组织:
分成两列,一列是轮胎(tyre),另一列是里程(mileage);
第3步:
方差相等的齐性检验:
由于方差分析的前提是各个水平下(这里是不同类型轮胎的寿命)的总体服从方差相等的正态分布。
其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。
因此必须对方差相等的前提进行检验。
从SPSS的数据管理窗口中选择analyze—comparemeans—One-WayANOVA,将轮胎(tyre)选入dependentlist框中,将里程(mileage)选入factor框中,点开Options,选中Homogeneityofvariancetest(方差齐性检验),点开posthocmultiplecomparisons,将significancelevel的值设置为0.05。
实验结果及分析:
从上面两个表可以看出:
方差齐性检验的H0假设是方差相等,从上表可看出Sig.=0.50>0.05,说明应该接受H0假设。
组间平方和为77.500,自由度(df)为3,均方为25.833;组内平方和为216.333,自由度为20,均方为10.817;2.388。
由于组间比较的相伴概率Sig(P值)=0.99>0.05,故应接受H0假设(四种轮胎的寿命无显著性差异),说明四种轮胎的寿命无显著性差异。
如果想进一步了解空间是哪种和其他组有显著性的均值差别(即哪种轮胎更好),就需要在多个样本均值间进行两两比较。
单击PostHoc按钮,打开击PostHoc按钮,打开One-WayANOVA:
PostHocMultipleComparisions对话框,如图所示。
在其中可以选择一种或几种比较分析的方法。
输出结果为:
从上面分析我们可以看出,B型轮胎相比于A、C、D、要好,D型轮胎的寿命最短。
3.某超市将同一种商品做3种不同的包装(A)并摆放在3个不同的货架区(B)进行销售试验,随机抽取3天的销售量作为样本,具体资料见表6.20。
要求检验:
在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。
(数据来源:
《应用统计学》耿修林,科学出版社;数据文件:
data6-7.sav)
表6.20销售样本资料
B1
B2
B3
A1
5,6,4
6,8,7
4,3,5
A2
7,8,8
5,5,6
3,6,4
A3
3,2,4
6,6,5
8,9,6
实验步骤:
第1步分析:
需要研究不同教学方法和不同性别对数学成绩的影响。
这是一个多因素(双因素)方差分析问题。
第2步按Analyze|GeneralLinearModel|Univariate的步骤打开Univariate对话框。
并将“销量”
变量移入DependentVariable框中,将“包装”和“摆放位置”移入FixedFactor(s)中,如图:
第3步单击Options,由于方差分析的前提上方差相等,故应进行方差齐性检验,选中
“Homogeneitytests”;
第4步。
打开Univariate:
PostHocMultipleComparisonsforObservedMeans对话框,在其中选出需要进行比较分析的对话框,这里选“组别”,再选择一种方差相等时的检验模型和不相等时的检验模型;
第5步选择建立多因素方差分析的模型种类。
打开Model对话框,本例用默认的Fullfactorial模型。
这种模型将观察变量总的变异平方和分解为多个控制变量对观察变量的独立部分、多个控制变量交互作用部分以及随机变量影响部分。
第6步以图形方式展示交互效果。
如果各因素间无交互效果,则各个水平对应的图形应近于平行,否则相交。
点开Plots,选择两个变量之交互作用,如图:
第7步对控制变量各个水平上的观察变量的差异进行对比检验。
选择Contrasts对话框,对两种因素均进行对比分析,方法用Simple方法,并以最后一个水平的观察变量均值为标准。
(选择Contrasts方式后需单击Change进行确认)
第8步运行结果及分析。
实验结果及分析:
分组描述:
方差齐性检验结果:
是对销量进行方差齐性检验的结果,可以看出方差无显著差异,应用前面的LSD方法的结果如下:
多因素方差分析及交互检验:
该表是进行多因素方差分析的主要部分,由于指定建立饱和模型,因此总的离差平方和分为3个部分:
多个控制变量对观察量的独立作用、交互作用及随机变量的影响。
关于多个控制变量的独立作用部分。
不同包装贡献离差平方和为0.963,均方0.481不同
摆放位置贡献离差平方和为3.185,均方为1.593,这说明摆放位置比包装影响大。
从相伴概率来看,都小于0.05,说明两者均有影响。
关于多个控制变量的交互作用部分,这里组别与性别的交互作用的离差平方和为
61.259,均方为15.315,F值与相伴概率为14.259和0.000。
表明它们的交互作用对观察结果造成了显著影响。
Error部分是随机变量影响部分。
上图是包装变量的均值比较结果,可以看第1,2组与第3组比较的均值差异均显著。
下图是摆放位置变量的均值比较结果,可以看第1,2组与第3组比较的均值差异均显著。
4.研究杨树一年生长量与施用氮肥和钾肥的关系。
为了研究这种关系,一共进行了18个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表6.21,请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。
(数据来源:
《生物数学模型的统计学基础》李勇,科学出版社;数据文件:
data6-8.sav)
表6.21杨树栽培试验数据
序号
氮肥量
钾肥量
树苗初高
生长量
序号
氮肥量
钾肥量
树苗初高
生长量
1
少
0
4.5
1.85
10
多
0
6.5
2.15
2
少
0
6
2
11
多
0
6
1.99
3
少
0
4
1.6
12
多
0
6.5
2.06
4
少
12.5
6.5
2
13
多
12.5
4
1.93
5
少
12.5
7
2.04
14
多
12.5
6
2.1
6
少
12.5
5
1.91
15
多
12.5
5.5
2.15
7
少
25
7
2.4
16
多
25
5
4.2
8
少
25
5
4.25
17
多
25
6
2.3
9
少
25
5
2.1
18
多
25
5.5
4.25
实验步骤:
第1步分析:
入学成绩肯定会对最后成绩有所影响,这里着重分析不同教学方法的影响,就应该将生长量的影响去除。
就应该用到协方差分析。
第2步按以下步骤analyze|generallinearmodel|univariate,将树苗初高为协变量,并按以下设置:
第3步其它设置与多因素方差分析大同小异。
实验结果及分析:
可以看出氮肥量和初始高度的影响是不显著的,而钾肥量的影响是显著的。
第八章相关分析
一实验目的
1.理解相关分析的概念、原理及在统计中的作用;
2.掌握用SPSS进行两个变量间的相关分析;
3.掌握用SPSS进行偏相关分析;
4.掌握用SPSS进行距离分析。
二相关分析的基本概念及原理
1、基本概念
人们在实践中发现,变量之间关系分为两种类型:
函数关系和相关关系。
函数关系是变量间的一咱确定性关系。
但是,在实际问题中,变量间的关系往往并不是那么简单,也就是说,变量之间有着密切关系,但又不能由一个(或几个)变量的值确定另一个变量的值,这种变量之间的关系是不确定性关系,称为相关关系。
其特点是:
一个变量的取值不能由另一个变量唯一确定,即当自变量x取某个值时,因变量y的值可能会有多个。
这种关系不确定的变量显然不能用函数形式予以描述,但也不是杂乱无章、无规律可循的。
2基本数学原理
为了准确度量两个变量之间关系的密切程度,用相关系数来度量。
对两个变量之间线性相关程度的度量称为简单相关系数。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若根据样本数据计算的,称为样本相关系数,记为r。
r>0,正相关,表明自变量和因变量呈相同方向变化;r<0,负相关;
r的绝对值愈接近1,表示x,y愈接近线性相关。
当|r|=1时,y的取值完全依赖于x,两者为函数关系,是完全的线性关系;r的绝对值愈接近0,表示x,y愈没有线性相关关系。
当r=0,表示两个变量之间不存在线性相关系。
当0 |r|>=0.8,视为高度相关;0.5<=|r|<0.8,视为中度相关;|r|<0.3视为不相关。 偏相关系数的检验: 在利用本研究总体的特性时,由于抽样误差的存在,样本中控制了其他变量的影响,两个变量间偏相关系数不为0,不能说明总体中这两个变量间的偏相关系数不是0,因此必须进行检验。 检验的零假设: 总体中两个变量间的偏相关系数为0。 三实验过程 3.K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。 (数据来源: 《统计软件SPSS系列应用实践篇》苏金明,电子工业出版社;数据文件: data8-5.sav) 表8.16K.K.Smith所调查的长度资料 花瓣长 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35 花枝长 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13 花萼长 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16 实验步骤: 第1步分析: 分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题; 第2步数据组织: 将三个变量分别定义为花瓣、花枝和花萼; 第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置: 实验结果及分析: 运行结果中给出了3个变量两两之间的Pearson相关系数(PearsonCorrelation)、双侧显著情况检验概率(Sig.(2-tailed))和数据组数(N)。 脚注内容显示相关分析结果在0.01的水平上显著。 另外,从表中可以看出,花瓣长和花枝长的数据具有很强的相关性。 而双侧检验的显著性概率均小于0.05,因此否定零假设(零假设是变量之间不具有相关性),认为相关系数不为零,变量之间具有相关性。 4.试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表8.17所示。 (数据来源: 《数据统计与管理》1990年第5期,中国商场统计研究会主办;数据文件: data8-6.sav) 表8.171962-1988年安徽省国民收入数据表 年份 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 国民收入(亿元) 34.61 35.67 39.52 47.32 54.14 50.86 49.69 51.61 65.06 72.57 77.72 83.57 82 87.44 存款余额(亿元) 0.59 0.71 0.85 1 1.22 1.14 1.32 1.28 1.35 1.6 1.87 4.2 2.55 2.61 年份 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 国民收入(亿元) 95.63 97.23 103.81 116.29 127.87 150.29 161.47 180.2 221.17 271.81 310.53 357.86 444.78 存款余额(亿元) 2.74 3.13 3.91 5.75 8.76 12.19 16.36 20.95 28.32 38.43 55.43 74.2 89.83 实验步骤: 第1步分析: 由于对不同年份的国民收入和存款余额均是定序数据,故考虑二元定序变量的相关性进行分析; 第2步数据组织: 将三个变量分别定义为年份、国民收入、存款余额; 第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置;运行即可。 实验结果及分析: 从实验结果的上半部分可以看出两个变量的Kendall相关系数为0.972>0,双尾检验的相伴概率为0.000<0.05,应拒绝两变量不相关的原假设,说明两变量具有显著的正相关性;从下半部分可以看出,两变量的Spearman相关系数为0.995>0,同时双尾检测的相伴概率值Sig.=0.000<0.05,也说明了两变量呈显著的正相关。 从表的脚注也可以看出双尾检测下两变量在0.01水平上具有显著的正相关性。 5.某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在0.05的显著性水平下具有相关性。 (数据来源: 《应用统计学: 数据统计方法、数据获取与SPSS应用》马庆国,科学出版社;数据文件: data8-7.sav) 表8.1810名运动员的100米及跳高名次 百米名次 1 2 3 4 5 6 7 8 9 10 跳高名次 4 3 1 5 2 7 10 8 9 6 实验步骤: 第1步分析: 考虑是百米名次和跳高名次的相关性问题,应用二元变量的相关性进行分析; 第2步数据组织: 将两个变量分成两列,分别定义为百米名次、跳高名次; 第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话BivariateCorrelations,将“百米名次”和“跳高名次”两变量移入variables框中,选择person相关系数;在testofsignificance中选择单尾检验;单击再单击Options按钮,打开BivaiateCorrelations: Option对话框,选择Statistics方框内的两个复选框,如下图: 实验结果及分析: 描述性统计表: 上表是对两种名次的描述性结果,百米名次的均值为5.50,标准差为3.028;跳高名次的均值为5.50,标准差为3.028,;记录数共10条。 相关分析结果表: 从表中可以看出,相关系数为0.697>0,说明呈正相关,而相伴概率值Sig.=0.13>0.05,因此应接受零假设(H0: 两个变量之间不具相关性),即说明百米名次不受跳高名称的显著性影响。 6.某公司太阳镜销售情况如表8.19所示,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为0.05)。 (数据来源: 《SPSSforWindows统计分析(第3版)》卢纹岱,电子工业出版社;数据文件: data8-8.sav) 表8.19某公司销售太阳镜的数据 月份 1 2 3 4 5 6 7 8 9 10 11 12 销量 75 90 148 183 242 263 278 318 256 200 140 80 价格 6.8 6.5 6 3.5 3 2.9 2.6 2.1 3.1 3.6 4.2 4.2 广告费用 2 5 6 7 22 25 28 30 22 18 10 2 日照时间 2.4 4 4.2 6.8 8 8.4 10.4 11.5 9.6 6.1 3.4 2 实验步骤: 第1步分析: 这3个因素彼此均有影响,分析时应对销售量与另外三个因素分别求偏相关, 在销售量与一个因素的相关时控制其他因素的影响,然后比较相关系数,按3个因素对太阳镜销售量的影响的大小排序。 第2步定义变量: 月份、销量、价格、广告费用、日照时间。 第3步按Analyze|Correlate|Partial顺序启动偏相关分析的主对话框,指定分析变量和控制变量,第一次分析变量为销量与价格的偏相关系数,其余为控制变量。 在主对话框中使用系统默认的双尾检验,显示实际的显著性概率。 实验结果及分析: 从上图可以看出,广告费用和价格为控制变量,日照时间和销量关系密切,相关系数为0.886,双尾检测的相伴概率为0.001,明显小于显著水平0.05.故应该拒绝零假设,说明太阳镜的销量与日照时间存在显著的相关性。 同理可知,销量与广告费用关系密切,与价格不存在显著的相关性。 如下图: 7.某动物产下3个幼仔,现分别对3个幼仔的长、体重、四肢总长、头重进行测量,试就这几个测量数据而言,用距离分析法分析3个幼仔的相似性,数据如表8.20所示。 (数据文件为: data8-9.sav) 表8.20三个幼仔的数据指标 序号 长 体重 四肢总长 头重 1 50 215 100 11 2 51 220 110 12 3 52 220 112 12 实验步骤: 第1步分析: 这是一个求个案间的相关性(相似性)问题。 第2步按Analyze|Correlate|Distances打开Distance对话框,并选BetweenCases(个案之间)和 Similarities(相似性),如图7-2所示,其它不作任何设置,运行。 实验结果及分析: 从Pearson相关系数可看出,3个幼仔极相似,特别是第2个和第3个。 第九章回归分析 一实验目的 1.理解回归分析的概念、原理及在统计中的作用; 2.掌握用SPSS进行线性回归、曲线回归的方法; 3.根据线性回归、曲线回归等方法探索其它回
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 实验 报告
![提示](https://static.bingdoc.com/images/bang_tan.gif)