非参数统计列联表卡方检验.docx
- 文档编号:18219001
- 上传时间:2023-08-14
- 格式:DOCX
- 页数:26
- 大小:297.29KB
非参数统计列联表卡方检验.docx
《非参数统计列联表卡方检验.docx》由会员分享,可在线阅读,更多相关《非参数统计列联表卡方检验.docx(26页珍藏版)》请在冰点文库上搜索。
非参数统计列联表卡方检验
非参数统计期末大作业
一、Wilcoxon符号秩检验
某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。
在广告创意中,预计广告投放后会产生效果。
一组不看广告组和一组看广告,抽収16位被调查者,让起给产品打分。
现有数据如下
不看广告
62
83
96
99
71
60
97
100
看广告
87
92
90
86
94
95
82
91
分析广告效应是否显著。
1、手算
建立假设:
H0:
广告效应不显苦
H1:
广告效应显著
不看广告组记为x,看广告组记为y。
检验统计量计算表
X
Y
D=x-y
PI
|D|的秩
D的符号
62
87
-25
25
7
-
83
92
-9
9
2.5
-
96
90
6
6
1
+
99
86
13
13
4
+
71
94
-23
23
6
60
95
-35
35
8
-
97
82
15
15
5
+
100
91
9
9
2.5
+
由表可知:
T+二1+4+5+2.5=12.5
T-二7+2.5+6+8=23.5
根据n=8,T+和T-中较大者T-=23.5,查表得,T+的右尾概率为0.230到0.273,在显著性水平a=0.05下,P值显然较大,故没有理由拒绝原假设,表明广告效应不显著。
2^Spss
在spss中输入八组数据(数据1):
i不看广吿
I看广吿I
62
87
?
|
83
92
I1
96
90
I1
99
86
51
71
94
6J
60
95
;1
97
82
M__l
100
91
选择非参数检验中的两个相关样本检验
对话框中选择Wilcoxon,输出如下结果(输岀1):
Ranks
N
MeanRank
SumofRanks
看广告-不看广告NegativeRanks
4’
3.12
12.50
PositiveRanks
4b
5.88
23.50
Ties
0c
Total
8
a看广告<不看广告
b.看广吿>不看广吿
c.看广吿=不看广告
由上表,负秩为4,正秩也为4,同分的情况为0,总共8。
负秩和为12.5,正秩和为23.5,与手算结果一致
TestStatistics1"
看广告・不看广
告
Z
-,771a
Asymp.Sig.(2-tailed)
.441
a.Basedonnegativeranks.
b.WilcoxonSignedRanksTest
由上表,z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为0.441,明显大于0.05,因此在a=0.05的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。
3、R语言(R语言1)
输入语句:
x=c(62,8396,99,71,6037,100)
y=c(87,9290,8694、95,8291)wilcox.test(x,y,exact=F,cor=F)输出结果:
Wilcoxonranksumtestdata:
xandy
W=33,p-value=0.9164
alternativehypotliesis:
tmelocationsliiftisnotequalto0
由输出结果可知,P=0.9164,远大于«=3.05,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。
二、Wald-Wolfowitz游程检验
有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的影响,为此对m二10,n二10只大白鼠分别喂养低蛋白和高蛋白两种饲料,得增重量X,Y(单位:
g)的表如下:
饲料
增重量
低蛋白X
64
71
_2
75
82
83
84
90
91
96
高蛋白Y
42
52
61
65
69
75
78
78
78
81
给定显苦性水半◎二0.05,试用游程检验法检验两种饲料的影响有无显苦差异。
1、手算
建立假设:
H0:
两种饲料对大白鼠无显著差异
H1:
两种饲料对大白鼠有显著差异
将X,Y的数据按从小到大混合排列,得X,Y的混合样本字列:
YYYXYYXXXYYYYYXXXXXX故得游程总数U=6,m=10,n=10,查表得,U=6的概率为0.019,由于是双
侧检验,对于显著性水平0=0.05,对应的P值为2X0.019=0.038 2、Spss 在spss中输入数据(数据2) 在非参数检验中选择两个独立样本检验 EdityewDetaTransformAnalyzeGraphsUtilitiesAdd-onsWindowHelp Reports DescriptiveStatistics 分组 1 61 1 2 71 1 3 72 1 4 75 1 5 82 1 6 83 1 7 83 1 8 90 1 9 91 1 10 96 1 11 42 2 12 52 2 13 61 2 14 652 15 69 2 16 752 17 78 2 81 Tables CompareMeans GeneralLinearModel GeneralizedLirearModes MixedModels Correlate Regression Loglinear NeuralNet空。 "金 Classify DataReduction Scgle NonparametricTeste TimeSeries Survi/al 須MissingValueA仃al^sis. MuftiptoRGsporsG ComplexSampfes 18 782 QualityControl □ROCCurve... 19 20 对话框: var var 丽Chi-Square... miBinorrial… 丽Rurvs... 园1-SampleK-S... <2IndcpendontSamplos... 加IndependentSamples... K2RolctodSampios...朋KRelatedSamples... var za 2 81 2 在DefineGroups输入1和2。 在TestType选中Wald-WolfowitznniSo 開Tv/o-Independent-SamplesTests 開Tv/o- Independent-SamplesTests TestVariableList: Options... TestType Mam-WhitneyU groupingVariable: 分虫(1鼻) DefineGroups... Kolmogorov-Smirnov1 MosesextremereactionsjZWald-Wol1owitzruns OK」|fcawteJ]Biwet」ICancelJ[ 输岀结果如下(输出2): Frequencies 分组 N 增重虽1 10 2 10 Total 20 TestStatistics0c NumberofRuns Z ExactSig. (1-tailed) 增1ft戢MinimumPossible 6’ -2.068 .019 MaximumPossible 8* -1.149 .128 a.Thereare2inter-grouptiesinvolving4cases. b.Wald-WolfowitzTest c.GroupingVariable分组 由上表,p值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白鼠有显著差异。 三、Kolmogorov-Smirnov检验 为了研究两家电信运营商套餐在目标市场的年龄维度上的分布是否相同,该电信运营公司开展了一个社会调查活动。 数据如下: 两种通信套餐的用户年龄 套餐1 套餐2 18 —— 18 48 25 51 oo —— 34 24 42 23 26 26 44 31 38 分析两种套餐的冃标市场年龄的分布是否存在显著性差异。 1、手算 建立假设: H0: 两种套餐的目标市场年龄分布不存在显著差异 H1: 两种套餐的目标市场年龄分布存在显苫差异 险验统计量D的计算表 年龄 fl f2 0 SI(x) S2(x) Sl(x)-S2(x) 18 1 0 1 0 1/7 0 1/7 18 1 0 2 0 2/7 0 2/7 22 1 1 3 1 3/7 1/9 20/63 23 1 0 4 1 1/7 1/9 29/63 24 1 0 5 1 5/7 1/9 38/63 25 1 0 6 1 6/7 1/9 47/63 26 1 1 I 2 1 2/9 7/9 31 0 1 I 3 1 3/9 6/9 34 0 1 J i 4 1 4/9 5/9 38 0 1 1 5 1 5/9 4/9 42 0 1 "f 1 6 1 6/9 3/9 44 0 1 I — 1 1 7/9 2/9 48 0 1 1 8 1 8/9 1/9 51 0 1 I 9 1 1 0 由上表,找出检验统计量D=max|S1(x)-S2(x^|=7/9,m=7,n=9,mnD=7X9X专= 49,查表得,相应的P值为0.008,在5%的显著性水平上,P值足够小,因此拒绝原假设,表明两种套餐的目标市场年龄分布存在显著差异。 2>spss 输入数据(数据3) 在非参数检验中选择两个独立样本检验: £ditViewQataIransformAnalyzeQraphsUHitiesAdd・QnsVMndov^Help 对话框: 运营商1和2分类的变量输入到GroupingVariable,在DefineGroups输入1和2。 在TestType选屮Koimogorov-Smirnovo 在点Exact时打开的对话框中可以选择精确方法(Exact)。 1 畧Two-Indepe^der«-SdmplesTests TestL«t Exact... CpUaw... 圜Two independentSamples;Def-.刃. |S s Group1| 2| Ccninuc~|anccl11Help BouoingvaiiaoeiES«(12j RsfincGroups・ -] TestType _ManrrWhitno/U0KclmogcrcvStnrrw2 MosesextrenereasonsJ/Vald-Wollowtzruns OKEasteResetcancel Wlp 输出结果如下(输出3); Frequencies 运营商 N '幟1 7 2 9 Total 16 TestStatistics3 年龄 MostExtremeDifferences Absolute .778 Positive .000 Negative -.778 Kolmogorov-SmirnovZ 1.543 AsympSig(2-tailed) .017 ExactSig.(2-tailed) .008 PointProbability .006 a.GroupingVanable.运营商 由上表: 精确计算的双尾P值为0.008,与手算结果一致,表明两种套餐的目标市场年龄分布存在显著差异。 、k个独立样本的Kruskal-Wallis检验 为检测四种防护服对人脉搏的影响,找來20人试穿,每种有5人试穿,测量试穿者的脉搏,得到以下表格: 试穿者 防护服1 防护服2 防护服3 防护服4 1 130 104 123 133 2 111 116 119 128 3 114 106 115 130 4 123 98 120 112 5 115 104 117 110 问: 穿四种防护服测得的脉搏有无差异。 1丰覧 、建立假设: H0: 测得的脉搏没有显苕差异 H1: 测得的脉搏有显著差异脉搏等级整理如下: 防护服1 防护服2 防护服3 防护服4 18.5 2.5 15.5 20 6 11 13 17 8 4 9.5 18.5 15.5 1 14 »— 9.5 2.5 12 5 秩和 57.5 21 64 67.5 计算检验统计量H: H N(N+l)2nj3(N+1) 12 20X21 57.52+212+642+67.52 X一3X21 5 =70.854一63 =7.854 查表: 自由度df=3,显苦性水平a=0.05,相对应的临界值卡方=7.82o 显然,H二7.854>卡方=7.82,所以拒绝原假设,表明四种防护服对脉搏的影响有显著差异。 2^spss 输入20个观测值(数据4) 在非参数检验中选择k个独立样本检验 防护服分组定义为1到4 操作如下图: 16; |l33 BJ护服 1 130 1 2 111 1 3 114 1 A 123 1 6 115 1 B 104 2 7 116 2 8 106 2 9 9B 2 10 104 2 11 123 3 12 119 3 13 115 3 14 120 3 15 117 3 4B 133 £ 17 12B 4 18 130 4 19 112 A 20 no A CjQi^cve GoncirulLkriovrMoOU Genernll^dLcmmf MgSMoobIb QwrolGtO Ln^ineof hk*uralfv>*t^orka var 1如 var wform insfyze [jHltlewAd«>up5空n*>v/Help RvBcrit• y DsicntHvet»twbUivb Qo・r°mrg. TestType 9S如VVMKH匸丨里Wton 二^orohwre-Krpm OH]BMttb 输出结果如下(输出4): Ranks 防护服 N MeanRank 脉搏1 5 11.50 2 5 4.20 3 5 12.80 4 5 13.50 Total 20 TestStatistics36 脉搏 Chi-Square 7878 df 3 Asymp.Sig. .049 aKruskalWallisTest b.GroupingVanable防护服 由上表,卡方与手算十分接近,拒绝原假设,即表明四种防护服对脉搏的影响有显苦性差异。 中位数检验 20个数,中位数为115.5, 整理每个总体中大于或小于该中位数的观测值个数,如下表: 1 2 3 4 >115.5 2 1 4 3 10 <=115.5 3 4 1 2 10 5 5 5 5 20 计算Q检验量 =4 Q统计量小于卡方=7.82,没有理由拒绝原假设,表明四种防护服对脉搏的影响没有显著差异。 Spss: 在testtype中选择中位数,输出结果如下: Frequencies 防护服 1 2 3 4 脉搏>Median 2 1 4 3 <=Median 3 4 1 2 TestStatistics1 脉搏 N 20 Median 11550 Chi-Square 4.000, df 3 Asymp.Sig. .261 a.8cells(100.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis25 b.GroupingVanable: 防护服 卡方值为4,与手算结果一致,不拒绝原假设,即表明四种防护服对脉搏的影响没有显著性差异 综上,两种算法的结果不一致! ! ? ? ? ? ? 4、R语言 输入语句(R语言2): x二c(130,111,114,123,115,104,116,106,98,104,123,119,115,120,117 133,128,130,112,110) y=c(l,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4) kruskal.test(x,y) 输出结果: >kruskal.test(x,y) Kruskal-Wallisranksumtost data: xandy Kruskal-Wailischi-squared=7.878,df=3,p-value=0.0486与以上的手算和KS检验法结果一致,拒绝原假设,表明四种防护服防护服对脉搏的影响存在显苦差异。 五、列联表卡方检验 一种原料來自三个不同的地区,原料质量被分成三个不同等级。 从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系。 一级 二级 三级 合计 極1 52 64 24 140 W2 60 59 52 171 地区3 50 65 74 189 合计 162 188 150 500 1、手算: 建立假设: 码: 地区与原料质量无关 H1: 地区与原料质量相关 地区 等级 © 轧 (為含)咎 1 1 52 45.36 0.97 1 2 64 52.64 2.45 1 3 24 42 7.71 2 1 60 55.4 0.38 2 2 59 64.3 0.44 2 3 52 51.3 0.01 3 1 50 61.24 2.06 3 2 65 71.06 0.52 3 3 74 56.7 5.28 合计 19.82 空=19.82 1»1j»l df=(r-l)(c-l)=4 査表得,加05=9.49,由于0=19.82>^05=9.49,因此拒绝原假设,即认为地 区与原料质量相关。 2>SPSS: 操作: DataWeightCases AnalyzeDescnptiveStatisticsCrosstabs 地区*等级Crosstabulation 等级 Total 一级 二级 三级 地区 地区1 Count 52 64 24 140 ExpectedCount 45.4 52.6 42.0 140.0 地区2 Count 60 59 52 171 ExpectedCount 55.4 64.3 51.3 171.0 地区3 Count 50 65 74 189 ExpectedCount 61.2 71」 56.7 189.0 Total Count 162 188 150 500 ExpectedCount 162.0 188.0 150.0 500.0 Chi-SquareTests Value df AsympSig (2-sided) ExactSig. (2-sided) ExactSig.(1-sided) PointProbability PearsonChi-Square 19822, 4 .001 b LikelihoodRatio 20.732 4 .009 .000 Fisher'sExactTest 20.510 .000 Linear-by-LinearAssociation 13.963c 1 .003 .000 .000 .000 NofValidCases 500 a0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis42.00. b.Cannotbecomputedbecausethereisinsu
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 列联表卡方 检验
![提示](https://static.bingdoc.com/images/bang_tan.gif)