描述性分析Word文件下载.docx
- 文档编号:6511472
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:12
- 大小:154KB
描述性分析Word文件下载.docx
《描述性分析Word文件下载.docx》由会员分享,可在线阅读,更多相关《描述性分析Word文件下载.docx(12页珍藏版)》请在冰点文库上搜索。
Type栏:
⊙UseExpressionaslabel:
数字型变量
○String字符型变量,Width:
8字符宽度。
NumericExpression:
数学表达式输入
使用键盘或利用系统提供的计算面板输入数学表达式。
也可以将Functions(函数)框里的函数选入表达式中。
系统提供了70多种函数,它包括算术函数,统计函数,分布函数,日期函数,缺失值函数和字符函数。
If…定义条件
⊙Includeallcases:
包括所有记录。
○Includeifcasessatisfiescondition:
符合条件的记录。
选中此项后,条件输入框激活,在此框中输入
变量的逻辑表达式。
SPSS算术函数
函数
说明
示例(x=3.6,y=2)
ABS(x)
绝对值函数
ABS(y-x)→1.6
ARTAN(x)
反正切函数,得弧度值
ARTAN(y)→1.11
ARSIN(x)
反正弦函数,得弧度值
ARSIN(x/4)→1.12
COS(x)
余弦函数(弧度单位)
COS(y)→0.47
EXP(x)
以e为底的指数函数
EXP(y)→7.39
LG10(x)
以10为底的对数函数
LG10(y*100)→2.3
LN(x)
以e为底的对数函数
LN(y)→0.69
MOD(x)
取余函数
MOD(x,y)→1.6
RND(x)
四舍五入后去正
RND(x)→4
SIN(x)
正弦函数(弧度单位)
SIN(y)→0.909
SQRT(x)
平方根函数
SQRT(y)→1.41
TRUNC(x)
取整函数
TRUNC(x)→3
注:
x可以是变量、常量,也可以是函数。
2.2自动重新赋值(AutomaticRecode)
有的时候,我们需要重新把数值变量或字符变量按它本身的数值大小转换成为从1开始的顺序整数,并存放在新变量对应的记录中。
首先,打开数据文据文件(DATA3-1.SAV),将数据调入工作区。
然后,从菜单选择“Transform-AutomaticRecode”命令,弹出连续型变量转换为分类变量对话框,如下图:
操作步骤:
1)从左边数据变量栏里把变量选入到右边的“Variable->
NewName”框中。
2)在“NewName:
”输入新变量名称后,点击[AddNewName]按钮加入到“Variable->
3)在“RecodeStartingfrom”设置赋值顺序,有以下两种顺序:
⊙Lowestvalue:
按从小到大顺序,赋值为1开始的顺序整数。
○Highestvalus:
按从大到小顺序,赋值为1开始的顺序整数。
4)单击[OK]按钮,执行转换。
2列联表分析(Crosstabs)
列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。
SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。
其中卡方检验是分析列联表资料常用的假设检验方法。
例子:
山东烟台地区病虫测报站预测一代玉米螟卵高峰期。
预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);
预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。
数据如下表。
山东烟台历年观测数据分级表()
年份
59
60
61
62
63
64
65
66
67
69
70
71
72
73
74
75
76
77
y
1
3
2
x1
x2
x3
x4
摘自《农业病虫统计测报》131页。
1)输入分析数据
在数据编辑器窗口打开“data1-3.sav”数据文件。
数据文件中变量格式如下:
2)调用分析过程
在菜单选中“Analyze-Descriptive-Crosstabs”命令,弹出列联表分析对话框,如下图
3)设置分析变量
选择行变量:
将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:
”行变量框中。
选择列变量:
将“玉米螟卵高峰发生期[y]”变量选入“Columns:
”列变量框中。
4)输出条形图和频数分布表
Displayclusteredbarcharts:
选中显示复式条形图。
Suppresstable:
选中则不输出多维频数分布表。
。
5)统计量输出
点击“Statistics”按钮,弹出统计分析对话框(如下图)。
Chi-Square:
卡方检验。
选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验
(ContinuityCorrection)及Fisher精确概率检验(Fisher’sExacttest)的结果。
Correlations:
选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。
Nominal:
两分类变量的关联度(Association)测量
ContingencyCoefficient:
列联系数,其值越大关联性越强。
PhiandCramer’sV:
Cramer列联系数,其值越大关联性越强。
Lambda:
减少预测误差率,1表示预测效果最好,0表示预测效果最差。
UncertaintyCoefficient:
不定系数
Ordinal:
两有序分类变量(等级变量)的关联度测量
Gamma:
关联度,+1表示完全正关联,-1表示负关联,0表示无联。
Somers’d:
列联度,其取值范围和意义同上。
Kendall’stau-b:
NominalbyInterval:
一个定性变量和一个定量变量的关联度
Eta:
关联度统计量。
Kappa:
吻合度系数,其取值-1至+1,其值越大吻合程度越高。
Risk:
危险度分析。
McNemar:
配对计数资料的卡方检验。
Cochran’sandMantel-Haenszelstatistics:
检验在协变量存在下,两个二分类变量是否独立。
6)设置列联表的显示
单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。
Counts:
频数
Observed:
观测频数。
Expected:
期望频数。
Percentages:
百分比
Row:
占本行的百分比。
Column:
占本列的百分比。
Total:
占全部的百分比。
Residuals:
残差分析
Unstandardized:
非标准化残差分析。
Standardized:
标准化残差分析。
Adj.Standardized:
调整的标准化残差分析。
NonintegerWeights:
⊙Roundcellcounts:
临近列计算。
○Truncatecellcounts:
○RoundcaseWeights临近记录度量
○TruncatecaseWeights
○Noadjustments:
不调整。
7)设置输出格式
单击Format按钮,弹出列联表输出格式对话框(如下图)。
RowOrder:
⊙Ascending:
行变量从小到大升序排列。
○Descending:
行变量从大到小降序排列。
8)设置检验
单击“Exact”按钮,弹出精确检验对话框(如下图)。
⊙Asymptoticonly近似的,系统设置。
○MonteCarlo
Confidencelevel:
99%置信度,系统默认99%。
Numberofsamples:
10000样本数量,系统默认10000。
○Exact
Timelimitpertest:
5minutes限时检验时间,系统默认值5分钟。
9)提交执行
设置完成后,在列联表分析对话框中,点击OK按钮,计算结果输出在结果窗口中。
10)结果与分析
在结果窗口中查看计算结果,主要输出内容如下。
五月气温*玉米螟卵高峰发生期
Crosstab
玉米螟卵高峰发生期
Total
6月20日前
6月21-25日
6月25日以后
五月气温
16.5以下
Count(频数)
ExpectedCount(期望值)
2.7
2.0
1.3
6
6.0
16.6-17.8
17.8以上
5
Total
ExpectedCount
8
8.0
4
4.0
18
18.0
Chi-SquareTests
Value
df
Asymp.Sig.(2-sided)
PearsonChi-Square
皮尔森卡方检验
7.750(a)
.101
LikelihoodRatio
似然比卡方检验
8.510
.075
Linear-by-LinearAssociation
6.248
.012
NofValidCases
a9cells(100.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis1.33.
(其余的省约)
结果分析:
从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(5>
2.7,3>
2.0,3>
1.3)。
从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(Linear-by-LinearAssociation),双尾检验p<
0.012。
因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述 分析