傻瓜化 SPSS 统计分析Word下载.docx
- 文档编号:5682212
- 上传时间:2023-05-05
- 格式:DOCX
- 页数:20
- 大小:87.29KB
傻瓜化 SPSS 统计分析Word下载.docx
《傻瓜化 SPSS 统计分析Word下载.docx》由会员分享,可在线阅读,更多相关《傻瓜化 SPSS 统计分析Word下载.docx(20页珍藏版)》请在冰点文库上搜索。
A:
基本呈正态;
B:
峰偏左,正(右)偏态,“均数-众数”为正值;
C:
峰偏右,负(左)偏态,“均数-众数”为负值。
8.平均数(mean,x¯
):
表示一组性质相同的观察值(x)的平均水平。
平均数包括算术均数(mean,x¯
)、几何均数(geometricmean,G)、中位数(median,M)、众数(mode,M0)、调和均数(harmonicmean,H)和第50百分位数(percentile,P50)等。
算术均数的算式为:
x¯
=∑x/n,x¯
=∑xf/n(f为频数)
中位数(M):
指一组观察值从小到大排列,其位次居中的那个观察值,即P50。
n为奇数时:
M=x((n+1)/2);
n为偶数时:
M=[x(n/2)+x(n/2+1)]/2
9.标准差(standarddeviation,S,SD,StdDev):
表示一组计量数据之间参差不齐的程度,即样本数据的变异范围(离散程度、变异度)。
通常表示为x¯
±
S。
方差(variance,S2):
即标准差的平方。
两组数据“方差齐性”(Equalvariancesassumed),即两组数据参差不齐的程度类似;
两组数据“方差不齐”(Equalvariancesnotassumed),即两组数据参差不齐的程度不一样。
即:
S=(∑(x-x¯
)2/(n-1))0.5
或:
S=((∑x2-(∑x)2/n)/(n-1))0.5S2=(∑x2-(∑x)2/n)/(n-1)
10.标准误(standarderror,SE):
随着样本量的增大,样本均数的变异范围会逐渐缩小。
样本
均数的标准差即标准误:
SE=总体标准差σ/(n)0.5。
率与%也有标准误,240/300=80%:
标准误说明样本均数的抽样误差大小。
通常表示为x¯
±
SE。
由于人们不知道总体的标准差σ,所以只能用样本标准差S来代替。
所以SE=S/(n)0.5。
据上式:
当n→∞,SE→0。
11.组中值:
数据两个组段之间居中的数值为组中值。
例如组段152~153.99cm的组中值为(152+154)/2=153cm。
例如:
一批人的身高:
152~153.99cm者2人,154~155.99cm者18人,156~157.99cm者39人,158~159.99cm者7人。
=?
S=?
x¯
=156.5455,S=1.3494。
(用组中值计算均数时:
x¯
=∑xf/n算出的是近似均数)。
12.一批学生120人,身高(x)在125.9~160.9cm之间,要对其自行列出频数(f)表,并计算平均数Mean(x¯
)与标准差StdDev(S),可用下列语句:
*1-1.当为单个数据时,MeanandSD:
Singlevalue:
.
DATALISTFREE/x.
BEGINDATA.
142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8
134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1
150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3
141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8
150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4
134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5
137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9
141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5
136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9
146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9
ENDDATA.
RECODEx(LOWESTTHRU128.999=127)(129THRU132.999=131)(133THRU136.999=135)
(137THRU140.999=139)(141THRU144.999=143)(145THRU148.999=147)
(149THRU152.999=151)(153THRU156.999=155)(157THRUHIGHEST=159)INTOx1.
VALUELABELSx1127'
125-'
131'
129-'
135'
133-'
139'
137-'
143'
141-'
147'
145-'
151'
149-'
155'
153-'
159'
157-'
FREQUENCIES/VARIABLES=x1/HISTOGRAM=NORMAL/PERCENTILES=255075/STATISTICS=ALL.
DESCRIPTIVESVARIABLES=x1/STATISTICS=ALL.
(结果:
Mean(x¯
)=143.0483,StdDev(S)=5.82057,更准确)
运算结果:
x1的频数表
Frequency
Percent
ValidPercent
CumulativePercent
Valid
125-
1
.8
129-
4
3.3
4.2
133-
9
7.5
11.7
137-
28
23.3
35.0
141-
35
29.2
64.2
145-
27
22.5
86.7
149-
11
9.2
95.8
153-
99.2
157-
100.0
Total
120
当列为频数表的数据时,例如上表数据:
*1-2.MeanandSD:
Frequencytabledata:
DATALISTFREE/xf.
1271131413591392814335147271511115541591
ENDDATA.
WEIGHTBYf.
FREQUENCIESVARIABLES=x/PERCENTILES=255075/STATISTICS=ALL/HISTOGRAM=NORMAL.
DESCRIPTIVESVARIABLES=x/STATISTICS=ALL.(结果:
)=143.1,StdDev(S)=5.6678)
13.某单位某年有75人请过事假,情况是:
请3天者3人,4天者7人,5天者12人,6天者38人,7天者9人,8天者4人,9天者1人,10天者2人。
=5.9079,S=1.3284。
14.某单位某年有75人请过事假,情况是:
*2.当为频数表数据时:
例如75人的请假天数统计分析:
3347512638798491102
DESCRIPTIVESVARIABLES=x/STATISTICS=ALL.
FREQUENCIESVARIABLES=x/STATISTICS=ALL/HISTOGRAM=NORMAL.
MEANSTABLES=x/CELLS=ALL.(结果:
)=5.9079,S=1.3284)
15.t检验(u检验):
用于两组均数间的比较(包括样本均数与总体均数比较、配对设计的差值均数比较、两组样本均数间的比较)。
例如:
RBC平均计数:
甲地人群n1=200,x¯
1=502,S1=48;
乙地人群n2=200,x¯
2=497,S2=49。
结果:
t=1.031,P=0.455,即P>
0.05,可认为两地人群RBC平均计数类似。
16.方差分析(ANOVA,F检验):
用于3组以上均数间的比较。
17.平均增长率r:
动态数列的分析,在SPSS语句中可用一个很简单、有效的公式来计算:
an=a0(1+r)n此公式即“复利计算公式”:
F=P(1+i)n
式中a0或P为现在值(present);
an或F为将来值(future);
r或i为“增长率”或“复利率”;
n为经过的年数。
从以上可推导得:
r=((an/a0))1/n-1n=lg(an/a0)/lg(1+r)a0=an/(1+r)n
公式中有4个参数(an、a0、r、n)。
据以上4个公式:
只要知道其中任何3个参数,即可解得另1个参数。
我国国民经济发展战略目标要在20年后翻2翻,每年平均增长率r要达到百分之几?
据题意翻2翻即an/a0=4倍,r=((an/a0))1/20-1=(4)1/20-1=0.072=7.2%;
如果要在15年后翻2翻,则每年平均增长率r要达到百分之几?
r=((an/a0))1/15-1=(4)1/15-1=0.097=9.7%。
18.某地男生蛔虫感染率40.8%(51/125);
女生蛔虫感染率25.3%(19/75)。
问男生蛔虫感染率是否高于女生,χ2=?
P=?
a=51,b=74,c=19,d=56。
χ2=4.929,df=1,P=0.026。
可认为男生蛔虫感染率高于女生。
19.卡方检验(χ2检验,Chi-Squaretests):
用于两个或多个率(百分比)间的比较,算得PearsonChi-Square值(即χ2值)与P值。
统计分析工作中最常用的SPSS主命令
(见Help菜单→SyntaxGuide→Base→Commands中的许多命令)
1.定义变量、录入数据:
DATALISTFREE/x1x2x3.
数据录入于BEGINDATA.与ENDDATA.之间。
2.计算、产生新变量:
COMPUTE(IF也会产生新变量)
3.对变量重新编码:
RECODE,会产生新变量,一般另行生成(INTO)一个新变量
4.变量的标示:
VARIABLELABELS。
5.数值的标示:
VALUELABELS。
6.打开数据库文件:
GETFILE=‘数据库所在路径,例如c:
\spss\sav\’.
7.另存数据库文件:
SAVEOUTFILE=‘数据库所在路径,例如c:
8.选择所需的案例范围:
(SELECTIF,与EQ即=、LT即<
、GT即>
、NE即≠等联用).
9.数据列表显示:
LISTVARIABLES。
10.计算平均数、标准差、标准误、总和、最小值、最大值、总例数:
DESCRIPTIVES(另会计算Z值),FREQUENCIES,MEANS。
11.计算平均数、标准差、标准误等,以及各种百分位数、列频数表、绘直方图:
FREQUENCIES。
12.两个均数的各种t检验(与总体、成对、成组;
也会计算平均数、标准差、标准误等):
T-TEST/TESTVAL,T-TESTPAIRS,T-TESTGROUP。
13.多个均数的方差分析、协方差分析(F检验,也会计算平均数、标准差、标准误等):
ONEWAY,ANOVA,UNIANOVA。
14.综合多指标的组间比较(HotellingT2检验):
MANOVA,GLM。
15.两个或多个率(百分比)间的比较等—各种χ2检验:
CROSSTABS。
16.非参数检验:
NPARTEST;
非参数相关检验:
NONPARCORR。
17.绘制各种图形(线图、误差线图、直条图、圆图、散点图、控制图):
GRAPH。
18.按变量大小排序(升序为“A”、降序为“D”):
SORT。
19.对变量大小排秩(升序为“A”、降序为“D”):
RANK。
20.各种(线性、偏、距离)相关分析:
CORRELATIONS、PARTIALCORR、PROXIMITIES。
21.多元(逐步)回归分析:
REGRESSION。
22.非条件(两分类)Logistic回归分析:
LOGISTICREGRESSION。
配对调查的条件Logistic回归分析:
COXREG。
23.11种常用的曲线方程拟合:
CURVEFIT。
24.R型、Q型聚类分析:
CLUSTER。
25.判别分析:
DISCRIMINANT。
26.因子分析:
FACTOR。
27.对应分析:
ANACOR、CORRESPONDENCE。
28.同质分析:
HOMALS、OVERALS。
29.缺失值分析:
MVA。
30.信度(可靠性)分析:
RELIABILITY
31.运算函数:
加+、减-、乘*、除以/、乘方**、开方SQRT、常用对数LG10、自然对数LN、指数EXP、总和SUM。
傻瓜化SPSS统计分析
开展调研工作后,会获得许多数据,并要进行统计分析,例如要计算平均数、百分比、观察数据分布趋势、进行常见的两组平均数的t检验、≥3组平均数的方差分析(F检验)、2个(或≥2个)百分比(率)的χ2检验、相关回归分析和绘图(线图、条图、圆形图)等等。
各种绘图均可另行改编,粘贴于Word文件,或PowerPoint幻灯片文件中。
在电脑普及的今日,如果再用笔算、算盘或计算器来进行统计分析、查统计用表来定P值,就未免太落后、太跟不上形势要求了。
建议用世界闻名的SPSS软件包(英语),来做傻瓜化电脑统计分析。
就是说可以利用SPSS的智能,来扩展我们的智能,并节约时间、提高效率。
利用我们提供的傻瓜化计算程序来统计分析,用户的英语水平不高也能傻瓜化地算得结果。
1、构成比的计算与小数定位输出
程序为:
百分比计算.SPS。
构成比一般计算的是2~10多个数据。
例*1是录入12个月数据并复制于求和函数后,可输出含1位或2位小数的百分比,且自动四舍五入;
例*2是表1某省省级卫生机构4种技术职称的人数,运算后可输出含1位小数的百分比。
表1某省3级卫生机构职工学历水平的比较(%)
机构级别
无学历
中专
本/专科
硕/博士'
合计
省级
353(4.2)
3752(45.1)
3830(46.0)
393(4.7)
8328(100.0)
市级
1486(7.9)
9285(49.1)
7971(42.1)
178(0.9)
18920(100.0)
县区级
3868(13.8)
15836(56.6)
8279(29.6)
19(0.1)
28002(100.0)
5707(10.3)
28873(52.3)
20080(36.3)
590(1.1)
55250(100.0)
2、各种平均数与标准差的计算
程序为:
平均数标准差.SPS。
将原始数据在程序编辑器中录入,可快速算得Mean±
S、中位数、几何均数、百分位数、偏度与峰度系数和绘制直方图等。
比起用计算器计算,优点是输入数据可见、可校核、每次计算结果均相同。
例*1计算“身高”均数;
*2例计算“年龄”均数。
3、两组均数的t检验
t检验.SPS。
可在程序编辑器中录入组别及其数据,可马上算得t值与P值(无需查t值表);
论文中如无原始数据,仅列有两组数据的n、Mean、S,也可快速算得其F值(其平方根则为其t值)与P值(无需查t值表)等。
注意:
Levene’s检验的P值(Sig.):
>
0.05时,读第1行的t与P值;
<
0.05时,读第2行的t与P值。
4、多组(≥3组)均数的方差分析(F检验):
方差分析.SPS。
可在程序编辑器中录入组别及其数据,可算得F值与P值(也无需查F值表定P值)。
例如有下列4组数据,问4种饲料的营养价值哪种更好?
5、两个(≥3个)率比较/R×
C表资料的χ2检验
表22组阳性率的比较
组别
例数
+
阳性率(%)
第1组
第2组
204
33
188
10
92.2
30.3
卡方检验.SPS。
当为2组阳性率比较时,要录入2个率的“+”与“-”值;
当为3个率比较时,要分别录入3个率的“+”与“-”值,可算得χ2值与P值(也无需查χ2值表)。
χ2=79.049,P=0.000,第1组阳性率高于第2组。
6、百分比(率)升降趋势的χ2检验
趋势卡方检验.SPS。
例*1问近4年的检出率有无下降趋势?
可录入这4年的“+”(检出)与“-”(未检出)数计算。
判定随年份增加检出率是否下降趋势显著时,要读取“Linear-by-Linear”χ2值与P值才行;
而读取Pearsonχ2值与P值的意义则是“各年份率间差异是否显著”。
因此,“Linear-by-Linear”χ2值与Pearsonχ2值含义不同。
表32000至2003年的感染率趋势
年份
检测人数
阳性数
感染率(%)
2000
2001
2002
2003
661
535
1059
1048
413
315
590
570
62.5
58.9
55.7
54.3
7、11种曲线拟合与向前预测
11种曲线拟合.SPS。
按时间顺序(t)的数据(P),本程序可一下子拟合得11种曲线模型(直线、对数曲线、反函数曲线、二次曲线、三次曲线、复合曲线、幂函数曲线、S形曲线、生长曲线、指数曲线和Logistic曲线),得到各种曲线方程的系数值(b0,b1,b2,b3)及其拟合优度值(Rsq值或F值大、P值小的曲线,拟合得较好),并绘出11种曲线图。
8、季节高峰的余弦模型拟合
余弦模型.SPS。
某病按月发病的病例百分比计算见表4。
表4某病发病的按月分布
月份
2
3
5
6
7
8
12
160
179
199
254
252
338
340
275
259
185
174
136
2751
%
5.8
6.5
7.2
12.3
12.4
10.0
9.4
6.7
6.3
4.9
从表中可见:
6~8月份发病占34.7%。
余弦模型拟合运算后可得计算期望发病数:
ey=229.25+87.5684COS((30(t-5.99))*π/180)
高峰累计日(Peakday)=182.32=182,即高峰月日为7月1日。
可见这样描述比“6~8月份发病占34.7%”更精确、使人对此病的季节
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 傻瓜化 SPSS 统计分析 傻瓜
![提示](https://static.bingdoc.com/images/bang_tan.gif)