书签分享收藏举报版权申诉 / 35

立即下载加入VIP,免费下载

当前位置：首页 > 经管营销 > 经济市场 > SPSS实验报告.docx

SPSS实验报告.docx

文档编号：11906051
上传时间：2023-06-03
格式：DOCX
页数：35
大小：1.24MB

SPSS实验报告.docx

《SPSS实验报告.docx》由会员分享，可在线阅读，更多相关《SPSS实验报告.docx（35页珍藏版）》请在冰点文库上搜索。

SPSS实验报告.docx

SPSS实验报告

第六章方差分析

一实验目的

1．理解方差分析的概念、原理及作用;

2．掌握用SPSS进行单因素、双因素及协方差分析的方法;

3．结合参考资料了解方差分析的其它方法及作用。

二方差分析的原理

方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个：

（1）随机误差，如测量误差造成的差异或个体间的差异，称为组内差异，用变量在各组的均值与该组内变量值之偏差平方和的总和表示，记作wSS，组内自由度wdf;

（2）实验条件，即不同的处理造成的差异，称为组间差异。

用变量在各组的均值与总均值之偏差的总平方和表示，记作bSS，组间自由度bdf。

三实验过程

1.某农场为了比较4种不同品种的小麦产量的差异，选择土壤条件基本相同的土地，分成16块，将每一个品种在4块试验田上试种，测得小表亩产量（kg）的数据如表6.17所示（数据文件为data6-4.sav），试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。

（数据来源：

《SPSS实用统计分析》郝黎仁，中国水利水电出版社）

表6.17小麦产量的实测数据

品种

A1

A2

A3

A4

产量

277.5

244.2

249.2

273

276.4

249.5

244.2

240.9

271

236.8

252.8

257.4

272.4

239

251.4

266.5

实验步骤：

第1步分析：

由于有一个因素（小麦），而且是4种饲料。

故不能用独立样本T检验（仅适用两组数据），这里可用单因素方差分析；

第2步数据的组织：

分成两列，一列是试验田的产量（output），另一列是小麦品种（breed）（A、B、C、D）；

第3步方差相等的齐性检验：

由于方差分析的前提是各个水平下（这里是不同品种的小麦产量）的总体服从方差相等的正态分布。

其中正态分布的要求并不是很严格，但对于方差相等的要求是比较严格的。

因此必须对方差相等的前提进行检验。

从SPSS的数据管理窗口中选择analyze—comparemeans—One-WayANOVA，将小麦产量（output）选入dependentlist框中，将品种（breed）选入factor框中，点开Options，选中Homogeneityofvariancetest（方差齐性检验），点开posthocmultiplecomparisons，将significancelevel的值在两次实验时分别设置为0.01和0.05。

如下图所示：

实验结果及分析：

在0.05的显著性水平下

不同小麦的等齐性检验：

方差齐性检验的H0假设是方差相等，从上表可看出Sig.=0.046>0.05，说明应该接受H0假设。

几种小麦的方差检验结果（如下）：

组间平方和为2263.482，自由度（df）为3，均方为754.494；组内平方和为744.715，自由度为12，均方为62.060,；F统计量为12.518。

由于组间比较的相伴概率Sig（P值）=0.001<0.05，故应拒绝H0假设（四种小麦的产量无显著性差异），说明四种小麦的产量有显著性差异。

在0.01的显著水平下：

在等齐性检验中Sig.=0.46>0.01,所以接受H0假设（四种小麦产量无显著性差异），组间比较的相伴概率Sig（P值）=0.001<0.01,故应拒绝H0假设（四种小麦的产量无显著性差异），说明四种小麦的产量有显著性差异。

因此，在显著性水平0.05和0.01下，四种不同小麦的产量有显著性差异

2.某公司希望检测四种类型的轮胎A，B，C，D的寿命（由行驶的里程数决定），见表6.18（单位：

千英里）（数据文件为data6-5.sav），其中每种轮胎应用在随机选择的6辆汽车上。

在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异？

（数据来源：

《统计学（第三版）》，M.R.斯皮格尔，科学出版社）

表6.18四种轮胎的寿命数据

A

33

38

36

40

31

35

B

32

40

42

38

30

34

C

31

37

35

33

34

30

D

29

34

32

30

33

31

实验步骤：

第1步分析：

由于有一个因素（轮胎），而且是4种饲料。

故不能用独立样本T检验（仅适用两组数据），这里可用单因素方差分析；

第2步数据的组织：

分成两列，一列是轮胎（tyre），另一列是里程（mileage）；

第3步：

方差相等的齐性检验：

由于方差分析的前提是各个水平下（这里是不同类型轮胎的寿命）的总体服从方差相等的正态分布。

其中正态分布的要求并不是很严格，但对于方差相等的要求是比较严格的。

因此必须对方差相等的前提进行检验。

从SPSS的数据管理窗口中选择analyze—comparemeans—One-WayANOVA，将轮胎（tyre）选入dependentlist框中，将里程（mileage）选入factor框中，点开Options，选中Homogeneityofvariancetest（方差齐性检验），点开posthocmultiplecomparisons，将significancelevel的值设置为0.05。

实验结果及分析：

从上面两个表可以看出：

方差齐性检验的H0假设是方差相等，从上表可看出Sig.=0.50>0.05，说明应该接受H0假设。

组间平方和为77.500，自由度（df）为3，均方为25.833；组内平方和为216.333，自由度为20，均方为10.817；2.388。

由于组间比较的相伴概率Sig（P值）=0.99>0.05，故应接受H0假设（四种轮胎的寿命无显著性差异），说明四种轮胎的寿命无显著性差异。

如果想进一步了解空间是哪种和其他组有显著性的均值差别（即哪种轮胎更好），就需要在多个样本均值间进行两两比较。

单击PostHoc按钮，打开击PostHoc按钮，打开One-WayANOVA:

PostHocMultipleComparisions对话框，如图所示。

在其中可以选择一种或几种比较分析的方法。

输出结果为：

从上面分析我们可以看出，B型轮胎相比于A、C、D、要好，D型轮胎的寿命最短。

3.某超市将同一种商品做3种不同的包装（A）并摆放在3个不同的货架区（B）进行销售试验，随机抽取3天的销售量作为样本，具体资料见表6.20。

要求检验：

在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。

（数据来源：

《应用统计学》耿修林，科学出版社；数据文件：

data6-7.sav）

表6.20销售样本资料

B1

B2

B3

A1

5,6,4

6,8,7

4,3,5

A2

7,8,8

5,5,6

3,6,4

A3

3,2,4

6,6,5

8,9,6

实验步骤：

第1步分析：

需要研究不同教学方法和不同性别对数学成绩的影响。

这是一个多因素（双因素）方差分析问题。

第2步按Analyze|GeneralLinearModel|Univariate的步骤打开Univariate对话框。

并将“销量”

变量移入DependentVariable框中，将“包装”和“摆放位置”移入FixedFactor（s）中，如图：

第3步单击Options，由于方差分析的前提上方差相等，故应进行方差齐性检验，选中

“Homogeneitytests”；

第4步。

打开Univariate:

PostHocMultipleComparisonsforObservedMeans对话框，在其中选出需要进行比较分析的对话框，这里选“组别”，再选择一种方差相等时的检验模型和不相等时的检验模型；

第5步选择建立多因素方差分析的模型种类。

打开Model对话框，本例用默认的Fullfactorial模型。

这种模型将观察变量总的变异平方和分解为多个控制变量对观察变量的独立部分、多个控制变量交互作用部分以及随机变量影响部分。

第6步以图形方式展示交互效果。

如果各因素间无交互效果，则各个水平对应的图形应近于平行，否则相交。

点开Plots,选择两个变量之交互作用，如图：

第7步对控制变量各个水平上的观察变量的差异进行对比检验。

选择Contrasts对话框，对两种因素均进行对比分析，方法用Simple方法，并以最后一个水平的观察变量均值为标准。

（选择Contrasts方式后需单击Change进行确认）

第8步运行结果及分析。

实验结果及分析：

分组描述：

方差齐性检验结果：

是对销量进行方差齐性检验的结果，可以看出方差无显著差异，应用前面的LSD方法的结果如下：

多因素方差分析及交互检验：

该表是进行多因素方差分析的主要部分，由于指定建立饱和模型，因此总的离差平方和分为3个部分：

多个控制变量对观察量的独立作用、交互作用及随机变量的影响。

关于多个控制变量的独立作用部分。

不同包装贡献离差平方和为0.963，均方0.481不同

摆放位置贡献离差平方和为3.185，均方为1.593，这说明摆放位置比包装影响大。

从相伴概率来看，都小于0.05，说明两者均有影响。

关于多个控制变量的交互作用部分，这里组别与性别的交互作用的离差平方和为

61.259，均方为15.315，F值与相伴概率为14.259和0.000。

表明它们的交互作用对观察结果造成了显著影响。

Error部分是随机变量影响部分。

上图是包装变量的均值比较结果，可以看第1，2组与第3组比较的均值差异均显著。

下图是摆放位置变量的均值比较结果，可以看第1，2组与第3组比较的均值差异均显著。

4.研究杨树一年生长量与施用氮肥和钾肥的关系。

为了研究这种关系，一共进行了18个样地的栽培实验，测定杨树苗的一年生长量、初始高度、全部实验条件（包括氮肥量和钾肥量）及实验结果（杨树苗的生长量）数据如表6.21，请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。

（数据来源：

《生物数学模型的统计学基础》李勇，科学出版社；数据文件：

data6-8.sav）

表6.21杨树栽培试验数据

序号

氮肥量

钾肥量

树苗初高

生长量

序号

氮肥量

钾肥量

树苗初高

生长量

1

少

0

4.5

1.85

10

多

0

6.5

2.15

2

少

0

6

2

11

多

0

6

1.99

3

少

0

4

1.6

12

多

0

6.5

2.06

4

少

12.5

6.5

2

13

多

12.5

4

1.93

5

少

12.5

7

2.04

14

多

12.5

6

2.1

6

少

12.5

5

1.91

15

多

12.5

5.5

2.15

7

少

25

7

2.4

16

多

25

5

4.2

8

少

25

5

4.25

17

多

25

6

2.3

9

少

25

5

2.1

18

多

25

5.5

4.25

实验步骤：

第1步分析：

入学成绩肯定会对最后成绩有所影响，这里着重分析不同教学方法的影响，就应该将生长量的影响去除。

就应该用到协方差分析。

第2步按以下步骤analyze|generallinearmodel|univariate，将树苗初高为协变量，并按以下设置：

第3步其它设置与多因素方差分析大同小异。

实验结果及分析：

可以看出氮肥量和初始高度的影响是不显著的，而钾肥量的影响是显著的。

第八章相关分析

一实验目的

1．理解相关分析的概念、原理及在统计中的作用;

2．掌握用SPSS进行两个变量间的相关分析;

3．掌握用SPSS进行偏相关分析;

4．掌握用SPSS进行距离分析。

二相关分析的基本概念及原理

1、基本概念

人们在实践中发现，变量之间关系分为两种类型：

函数关系和相关关系。

函数关系是变量间的一咱确定性关系。

但是，在实际问题中，变量间的关系往往并不是那么简单，也就是说，变量之间有着密切关系，但又不能由一个（或几个）变量的值确定另一个变量的值，这种变量之间的关系是不确定性关系，称为相关关系。

其特点是：

一个变量的取值不能由另一个变量唯一确定，即当自变量x取某个值时，因变量y的值可能会有多个。

这种关系不确定的变量显然不能用函数形式予以描述，但也不是杂乱无章、无规律可循的。

2基本数学原理

为了准确度量两个变量之间关系的密切程度，用相关系数来度量。

对两个变量之间线性相关程度的度量称为简单相关系数。

若相关系数是根据总体全部数据计算的，称为总体相关系数，记为ρ;若根据样本数据计算的，称为样本相关系数，记为r。

r>0，正相关，表明自变量和因变量呈相同方向变化;r<0,负相关;

r的绝对值愈接近1，表示x,y愈接近线性相关。

当|r|=1时，y的取值完全依赖于x，两者为函数关系，是完全的线性关系;r的绝对值愈接近0，表示x,y愈没有线性相关关系。

当r=0,表示两个变量之间不存在线性相关系。

当0

|r|>=0.8,视为高度相关;0.5<=|r|<0.8，视为中度相关;|r|<0.3视为不相关。

偏相关系数的检验：

在利用本研究总体的特性时，由于抽样误差的存在，样本中控制了其他变量的影响，两个变量间偏相关系数不为0，不能说明总体中这两个变量间的偏相关系数不是0，因此必须进行检验。

检验的零假设：

总体中两个变量间的偏相关系数为0。

三实验过程

3．K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据，要求对以上3组数据两两之间进行相关分析，以0.05的显著性水平检验相关系数的显著性。

（数据来源：

《统计软件SPSS系列应用实践篇》苏金明，电子工业出版社；数据文件：

data8-5.sav）

表8.16K.K.Smith所调查的长度资料

花瓣长

49

44

32

42

32

53

36

39

37

45

41

48

45

39

40

34

37

35

花枝长

27

24

12

22

13

29

14

20

16

21

22

25

23

18

20

15

20

13

花萼长

19

16

12

17

10

19

15

14

15

21

14

22

15

14

15

16

实验步骤：

第1步分析：

分析三组数据的两两之间的相关性，而且给出的是具体的数值，这是一个二元相关性问题；

第2步数据组织：

将三个变量分别定义为花瓣、花枝和花萼；

第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置：

实验结果及分析：

运行结果中给出了3个变量两两之间的Pearson相关系数（PearsonCorrelation）、双侧显著情况检验概率（Sig.（2-tailed））和数据组数（N）。

脚注内容显示相关分析结果在0.01的水平上显著。

另外，从表中可以看出，花瓣长和花枝长的数据具有很强的相关性。

而双侧检验的显著性概率均小于0.05，因此否定零假设（零假设是变量之间不具有相关性），认为相关系数不为零，变量之间具有相关性。

4.试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性，数据如表8.17所示。

（数据来源：

《数据统计与管理》1990年第5期，中国商场统计研究会主办；数据文件：

data8-6.sav）

表8.171962-1988年安徽省国民收入数据表

年份

1962

1963

1964

1965

1966

1967

1968

1969

1970

1971

1972

1973

1974

1975

国民收入（亿元）

34.61

35.67

39.52

47.32

54.14

50.86

49.69

51.61

65.06

72.57

77.72

83.57

82

87.44

存款余额（亿元）

0.59

0.71

0.85

1

1.22

1.14

1.32

1.28

1.35

1.6

1.87

4.2

2.55

2.61

年份

1976

1977

1978

1979

1980

1981

1982

1983

1984

1985

1986

1987

1988

国民收入（亿元）

95.63

97.23

103.81

116.29

127.87

150.29

161.47

180.2

221.17

271.81

310.53

357.86

444.78

存款余额（亿元）

2.74

3.13

3.91

5.75

8.76

12.19

16.36

20.95

28.32

38.43

55.43

74.2

89.83

实验步骤：

第1步分析：

由于对不同年份的国民收入和存款余额均是定序数据，故考虑二元定序变量的相关性进行分析；

第2步数据组织：

将三个变量分别定义为年份、国民收入、存款余额;

第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations并作如下图所作的设置；运行即可。

实验结果及分析：

从实验结果的上半部分可以看出两个变量的Kendall相关系数为0.972>0，双尾检验的相伴概率为0.000<0.05，应拒绝两变量不相关的原假设，说明两变量具有显著的正相关性；从下半部分可以看出，两变量的Spearman相关系数为0.995>0，同时双尾检测的相伴概率值Sig.=0.000<0.05，也说明了两变量呈显著的正相关。

从表的脚注也可以看出双尾检测下两变量在0.01水平上具有显著的正相关性。

5.某高校抽样得到10名短跑运动员，测出100米的名次和跳高的名次如表8.18，问这两个名次是否在0.05的显著性水平下具有相关性。

（数据来源：

《应用统计学：

数据统计方法、数据获取与SPSS应用》马庆国，科学出版社；数据文件：

data8-7.sav）

表8.1810名运动员的100米及跳高名次

百米名次

1

2

3

4

5

6

7

8

9

10

跳高名次

4

3

1

5

2

7

10

8

9

6

实验步骤：

第1步分析：

考虑是百米名次和跳高名次的相关性问题，应用二元变量的相关性进行分析；

第2步数据组织：

将两个变量分成两列，分别定义为百米名次、跳高名次；

第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话BivariateCorrelations，将“百米名次”和“跳高名次”两变量移入variables框中，选择person相关系数；在testofsignificance中选择单尾检验；单击再单击Options按钮，打开BivaiateCorrelations:

Option对话框，选择Statistics方框内的两个复选框，如下图：

实验结果及分析：

描述性统计表：

上表是对两种名次的描述性结果，百米名次的均值为5.50，标准差为3.028；跳高名次的均值为5.50，标准差为3.028,；记录数共10条。