第6章 统计假设检验.docx
- 文档编号:8732854
- 上传时间:2023-05-14
- 格式:DOCX
- 页数:15
- 大小:128.37KB
第6章 统计假设检验.docx
《第6章 统计假设检验.docx》由会员分享,可在线阅读,更多相关《第6章 统计假设检验.docx(15页珍藏版)》请在冰点文库上搜索。
第6章统计假设检验
第6章假设检验
本章的主要目的:
⏹已知一个看法,识别出零假设和备择假设,并将这两者用符号形式表示;
⏹已知一个显著性水平,算出临界值;
⏹已知一个假设和样本数据,计算检验统计量的值;
⏹用简单的、非技术性的术语表达一个假设检验的结论;
⏹识别检验一个已知假设可能出现的第Ⅰ类和第Ⅱ类错误。
6.1假设检验的一般问题
所谓假设检验就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应不拒绝或拒绝原假设。
统计学中,假设是指关于一个总体的性质的看法或陈述。
如:
⏹医学研究者认为,健康成年人的平均体温不等于98.6℉(关于总体均值的看法)。
⏹使用手机的司机,其车祸发生率比没有使用手机的司机车祸发生率高13%(关于总体比例的看法)。
⏹当使用新设备制造飞机高度计时,误差中的变异减少了,这使得读数更加一致(关于总体方差的看法)。
复习我们多次提到的小概率事件法则:
在一个已知假设下,如果一个特定观测事件的概率格外小,我们就认为,这个假设可能是不对的。
实例一:
某公司曾经提供了一种称之为“性别选择”的产品,根据广告上的说法,这种产品可以使夫妇“将生一个男孩的概率增加到85%,生一个女孩的概率增加到80%。
”假设我们对100对想要生女孩的夫妇进行一项实验,他们都遵照该公司产品说明行动。
请你使用常识和非正规统计学方法来判断,如果100个婴儿中包含以下数量的女孩,我们应该对“性别选择”的有效性得出什么结论?
①52个女孩?
②97个女孩?
只有当我们得到的女孩数明显多于正常情况下平均得到的数量时,我们才应该认为这种产品是有效的!
虽然52个女孩和97个女孩的结果都大于“平均值”,但52个女孩的结果并不是显著的,而97个女孩的确是一个显著的结果。
1.假设检验的基本思想
我们看一个实例,这个例子很好地阐述了假设检验的基本方法。
多读几次!
实例二:
人体体温。
同第五章的数据,关键的问题是:
这些样本数据(它们的x¯=98.20℉)是否提供了足够的证据,确保我们可以放弃μ=98.6℉这一共识?
我们认为,有充足的证据放弃通常所认为的μ=98.6℉,因为如果均值真的是98.6℉,得到样本均值98.20℉的概率大约是0.0002,这个概率太小了!
看图和计算!
这里的关键之处是:
⏹一般认为μ=98.6℉。
⏹从样本中可以得到x¯=98.20℉。
⏹考虑样本均值的分布、样本容量以及98.48和98.72之间的差异程度,我们发现,如果μ真的是98.6℉,那么98.20℉的样本均值是不可能(因为可能性低于5%)发生的。
⏹对于样本均值98.20℉,有两个合理的解释:
要么是非常罕见的事件发生了,要么μ实际上并不是98.6℉。
因为得到98.20℉这样一个样本均值的概率是那样的低,我们认为更合理的解释是:
μ的值不像是一般所相信的98.6℉。
这个例子告诉我们的核心思想是:
虽然我们通常的观念是μ=98.6℉,但样本均值为x¯=98.20℉,通过使用中心极限定理,我们发现如果均值真是的98.6℉,那么得到一个均值为98.20℉的样本的概率是非常小的,这就说明μ=98.6℉的想法应该被放弃。
假设检验的核心思想是带有概率性质的反证法,具体说来,假设检验主要有以下两个特点:
⏹假设检验所采用的逻辑推理方法是反证法。
为了检验某个假设是否成立,先假定它是正确的,然后根据抽样理论和样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。
⏹这里的合理与否,所依据的是“小概率事件实际不可能发生的原理”。
即在一次观察中小概率事件发生了,则认为原假设是不合理的;反之,小概率事件没有出现,则认为原假设是合理的。
因此假设检验并非严格的逻辑证明,只是带有概率性质的反证法,因为假设检验是基于样本资料来推断总体特征的,且这种推断是在一定置信概率下进行的。
这个例子中,拒绝原假设这一推断结果是在α=0.05的置信水平下得出的,也就是说这一推断结果有99%的把握程度。
2.一个正规的假设检验的组成部分
⏹零假设和备择假设(nullhypothesisandalternativehypothesis)
零假设(用H0表示)是关于一个总体参数值的陈述,它必须包含相等的条件,并且必须写成=,≤或≥(当实际做检验时,我们就在这个参数等于某个特定值的假设下运算)。
如对均值来说,零假设将表述为下面这三种形式之一:
H0:
μ=某个值H0:
μ≤某个值H0:
μ≥某个值
如上例对应于通常人们所认为的平均体温为98.6℉,就表达为H0:
μ=98.6℉。
我们在假设它是正确的含义下直接检验这个零假设,并得到一个结论,要么拒绝H0,要么不拒绝H0。
备择假设(用H1表示)是如果零假设错误则必然正确的陈述。
如对均值来说,零假设将表述为下面这三种形式之一:
H1:
μ≠<某个值H1:
μ>某个值H1:
μ<某个值
基本上,H1是H0的相反,只能拒绝一个,也就是说拒绝了零假设则备择假设就不能拒绝(得到支持);不拒绝零假设就必须拒绝备择假设。
课堂练习一:
识别零假设和备择假设。
作为质检局职员,你设计了一个项目以测试这一说法:
某加油站油泵上的仪表上显示1公升时,汽油供应的平均数量实际上低于1公升。
请识别出零假设和备择假设,将这二者都以符号形式表达。
再次强调:
零假设必须是包含相等条件的说法;它可以是或不是初始的说法。
⏹检验统计量(teststatistic)
检验统计量是从用来制定关于拒绝零假设的决策所使用的样本数据中算出的值。
检验统计量在零假设正确的假设下,将样本统计量转化为一个值,然后检验统计量可以用来测量样本和说法之间的差异是否显著。
课堂练习二:
实例二中的检验统计量z=-6.64。
⏹否定区、显著性水平和临界值(criticalregion,significancelevel,andcriticalvalue)
否定区是指所有使我们拒绝零假设的检验统计量的集合。
如实例二双尾区域。
显著性水平是指当零假设实际上是正确的时,检验统计量将落在否定区的概率(用α表示)。
如果检验统计量落在否定区内,我们就将拒绝零假设,因此α就是当零假设正确时,犯了拒绝零假设的错误的概率。
与第5章置信度定义是一致的。
一般α选为0.01,0.05和0.10。
临界值是指将否定区(在那里我们拒绝了零假设)和不会导致拒绝零假设的检验统计量值分开的任意值。
临界值依赖于零假设的性质、相关的抽样分布及显著性水平α。
课堂练习三:
计算临界值。
假设我们有来自一个罐装可口可乐含量的大样本的均值,罐上所标的含量为12盎司。
应用正态分布。
使用显著性水平α=0.05,对于下面每一个零假设,计算z临界值。
①μ=12盎司(因此否定区在正态分布的双尾处,在那里我们拒绝已知的零假设);②μ≥12盎司(因此否定区在正态分布的左尾处,在那里我们拒绝已知的零假设);③μ≤12盎司(因此否定区在正态分布的右尾处,在那里我们拒绝已知的零假设)。
⏹双尾,左尾,右尾。
一个分布的尾部是指临界值围起来的极端区域。
有一些假设检验是双尾的。
有一些是右尾的,有一些是左尾的。
双尾检验:
否定区在曲线的两端区域(尾部)。
右尾检验:
否定区在曲线的右端区域(尾部)。
左尾检验:
否定区在曲线的左端区域(尾部)。
尾部将对应于包含与零假设显著冲突的值的否定区,我们主要看H1中的符号。
教材图6-1。
⏹假设检验的结论
我们总是检验零假设。
根据检验统计量与临界值的比较来拒绝来不拒绝零假设。
如果检验统计量落在否定区内我们拒绝零假设;否则我们不拒绝零假设。
我们的困难在于用简单的、非技术性的术语来陈述我们的结论。
下图说明了我们怎样组织最终结论的正确用词。
由此,我们发现只有在一种情况下有样本数据支持结论的措词:
如果你想支持某个假设,就将它以作为备择假设,然后希望零假设被拒绝。
我们没有证明零假设!
课堂练习三:
实例二中假设研究人员认为平均人体体温不等于98.6℉。
μ≠98.6℉这个说法就成为备择假设,而零假设就是μ=98.6℉。
结论可以这样陈述:
样本数据支持了平均人体体温不等于98.6℉这个假设。
3.第Ⅰ类和第Ⅱ类错误
我们说过,在检验一个零假设时,我们最终会得出拒绝或不拒绝这个假设的结论。
这个结论有时正确有时不正确!
第Ⅰ类错误:
当零假设实际上正确时我们拒绝了它所犯的错误。
用α代表一个第Ⅰ类错误发生的概率。
第Ⅱ类错误:
当零假设实际上错误时我们没有拒绝了它所犯的错误。
用代表一个第Ⅱ类错误发生的概率。
零假设是正确的
零假设是错误的
决策
我们决定拒绝零假设
第Ⅰ类错误α
(拒绝一个正确的零假设)
正确决策
我们不拒绝零假设
正确决策
第Ⅱ类错误β
(没有拒绝一个错误的零假设)
数学上说明α,β和n是互相关联的,当选择其中两个时另一个也就确定了。
实践中常用α和n。
下面是有用的考虑:
⏹对于任意一个固定的α,样本容量n的增大将使β减小。
⏹对于任意一个固定的样本容量n,α的减小将使β增大;反之相反。
⏹要使α和β都减小,就增加样本容量。
对于后果较为严重的第Ⅰ类错误,我们要选择较小的α值和较大的n。
6.2检验关于均值的假设:
大样本
本节我们应用前面的知识对大样本均值进行假设检验。
我们要学习三种假设检验的方法:
假设检验的传统方法、P值方法、置信区间方法,方法不同但结果是一致的!
我们的样本满足以下假定:
样本是一个简单随机样本;n>30;可以样本标准差s代替总体标准差σ。
下图汇总了用于假设检验的传统方法中的步骤。
实例三:
一个规范的传统假设检验。
我们曾经有一个包括了36罐不同的可乐重量(盎司)组成的样本,这些罐上都标着重量是12盎司。
这里是样本统计量:
n=36,x¯=12.19盎司,s=0.11盎司。
在看到这些统计量时,一个生产线的经理声称可乐的平均重量大于12盎司,这使得公司利润较低。
使用0.01的显著性水平,检验这个经理关于均值大于12盎司的说法。
注意:
①在第7步中,我们使用了决策标准:
如果检验统计量在否定区中,就拒绝零假设;如果检验统计量不在否定区中,就不拒绝零假设。
②我们不是总要所有的步骤,但必须有:
零假设、备择假设、检验统计量的计算、图示、初始结论(拒绝H0或不拒绝H0)、以及简单的非技术性结论。
假设检验的P值方法。
P值方法所使用的是计算得到一个结果的概率,就像我们所算出的那样,如果这个概率非常小,就拒绝零假设。
P值是指在假定零假设正确的条件下,所得到的样本检验统计量的值至少达到从样本数据中所发现的值的概率。
注意这个概念我们在第四章强调过,当你决定一个样本结果是否异常时,你需要计算得到一个至少有你得到的结果那么大的概率,而不是得到这个特定结果本身的概率。
P值就是零假设正确时,一个样本将发生的可能性。
P值
解释
小P值(0.05或更小)
异常的样本结果
与零假设有显著的不同
大P值(大于0.05)
样本结果不是异常的
与零假设没有显著的不同
下图是计算P值的过程。
假设检验的P值方法步骤与传统方法大致一样,只在第6和7步骤不同:
第6步是画出检验统计量并计算P值;第7步是如果P值小于或等于显著性水平α,则拒绝H0。
如果P值大于α,则不拒绝H0。
实例四:
使用P值方法和0.01的显著性水平,检验假设:
罐中可乐重量的均值大于12盎司。
样本数据包括36罐可乐的重量,其均值为12.19盎司,标准差为0.11盎司。
用置信区间检验假设。
置信区间可以用来找出那些非常不可能发生的结果,因此我们可以确定在样本结果和参数的假设值之间是否有显著不同。
先用样本数据构建一个置信区间,然后用决策标准:
一个总体参数的置信区间估计包含了那个参数的可能值,因此我们应该拒绝一个说法,即总体参数有一个没有包含在置信区间中的值。
假设检验
置信区间
双尾:
显著性水平α
使用置信度1-α
单尾:
显著性水平α
使用置信度1-2α
以下部分是我们具体使用这些方法来检验总体假设的过程。
在此我再次提醒大家:
小概率事件法则。
在检验一个假设时,我们做出一个包含相等条件的假设(零假设),然后我们将这个假设和样本结果相比较,以形成下面的结论之一:
⏹当假设(零假设)正确时,如果样本结果能够很容易地出现,我们就把假设和样本结果之间相对较小的差异归因于偶然性。
⏹当假设(零假设)正确时,如果样本不能很容易地出现,我们就可以认为这个假设是不正确的,以此来解释假设和样本结果之间相对较大的差异,因此我们拒绝这个假设。
6.3检验关于均值的假设:
小样本
本节处理小样本情况:
样本是简单随机样本;n≤30;σ是未知的;样本值来自于一个正态分布的总体。
实例五:
Triola说,在一个练习项目运动中,他的心率比统计课上学生的平均心率低。
经过测量,他的心率是每分钟60次,而他班上20名学生的心率列在下面。
使用0.01显著性水平来检验作者的说法:
统计课学生的平均心率大于每分钟60次。
6174727779906979907268648382836288745565
对这个题,我们用P值检验试试?
6.4检验关于比例的假设
同第五章一样,我们的样本满足:
样本是一个简单随机样本;满足二项分布的条件;np≥5和nq≥5成立,所以正态分布可以用来估算样本比例的分布。
实例六:
在一项对1002人的调查中,701人他们在最近的总统选举中投了票。
对下列假设进行检验:
在进行调查时,说他们投了票的人的比例等于61%,这是实际投了票的人数的比例。
使用显著性水平为0.05的传统假设检验方法。
我们用P值检验呢?
6.5检验关于标准差或方差的假设
这里的样本是一个总体服从正态分布(不论样本容量多大)的简单随机样本。
我们用卡方检验统计量和临界值。
实例七:
对于一个成年人的简单随机样本,IQ得分是正态分布的,均值为100,标准差为15。
一个包含13个统计学教授的简单随机样本产生一个标准差s=7.2。
一位心理学家非常肯定地认为统计学教授IQ得分的均值大于100。
他不是很好地理解标准差概念,并且也没有意识到标准差应该低于15。
与之相反,他认为统计学教授IQ得分的标准差等于15,这和一般总体的标准差相同。
使用0.05的显著性水平检验假设:
σ=15。
据这个结果,关于统计学教授IQ得分的标准差,你会得出什么结论?
用P值方法试试。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 统计假设检验 统计 假设检验