试验统计方法总结及经典试题.docx
- 文档编号:9886557
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:25
- 大小:108.18KB
试验统计方法总结及经典试题.docx
《试验统计方法总结及经典试题.docx》由会员分享,可在线阅读,更多相关《试验统计方法总结及经典试题.docx(25页珍藏版)》请在冰点文库上搜索。
试验统计方法总结及经典试题
试验统计方法复习总结
•统计学:
研究事物的数量特征及其数量规律的一门方法论学科
试验因素:
简称因素或因子(factor):
被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应)。
水平(level):
试验因素内不同的级别或状态。
试验处理(treatment):
单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。
简单效应(simpleeffect):
在同一因素内两种水平间试验指标的差异。
主效(maineffect):
一个因素内各简单效应的平均数。
交互作用效应(interactioneffect),简称互作:
因素内简单效应间差异的平均。
互作的实质:
反映了一个因素的不同水平在另一个因素的不同水平上反应不一致的现象.
2.什么是实验方案,如何制定一个正确的实验方案?
试举例说明?
试验方案:
根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。
1.目的明确。
2.选择适当的因素及其水平。
3.设置对照水平或处理,简称对照(check,符号CK)。
4.应用唯一差异原则。
3.什么是实验误差?
实验误差与实验的准确度,精确度以及实验处理间的可靠性有什么关系?
试验误差的概念:
试验结果与处理真值之间的差异
试验误差的分类:
1.系统误差(systematicerror):
由于固定原因造成的试验结果与处理真值之间的差异.
系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;
2.随机误差(randomerror):
由于随机因素或偶然因素造成的
试验结果与处理真值之间的差异.
随机误差影响了数据的精确性,精确性是指观测值间的符合程度。
4实验误差有哪些来源?
如何控制?
来源:
(1)试验材料固有的差异
(2)试验时农事操作和管理技术的不一致所引起的差异
(3)进行试验时外界条件的差异
控制:
(1)选择同质一致的试验材料
(2)改进操作和管理技术,使之标准化
(3)控制引起差异的外界主要因素
选择条件均匀一致的试验环境;
试验中采用适当的试验设计和科学的管理技术;
应用相应的科学统计分析方法。
**1、试验设计(experimentdesign)
广义----是指整个试验研究课题的设计,包括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;
狭义----专指小区技术,特别是抽样方法.重复区组和试验小区的排列方法。
主要通过抽样方法,重复区组和处理小区的不同排列方法,达到控制或减少试验误差的目的.
处理小区----一个处理所占有的一小块试验空间或试验地.
重复区组(block)----一个试验的全部处理小区相邻排列在一起即构成一个区组.
2、田间试验设计的基本原则是什么?
有何作用?
试验设计的三个基本原则
1.重复2.随机3.局部控制
重复的作用:
估计试验误差;降低试验误差。
随机的主要作用:
无偏估计试验误差;研究随机事件----获得随机变量-----概率的性质------进行统计分析(统计推断)!
局部控制就是分范围分地段或分空间地控制非处理因素,使之对各试验处理的影响在较小空间内达到最大程度的一致,从而有效地降低试验误差。
这是降低误差的重要手段之一
**
1总体,样本,参数,统计数的概念和关系?
总体(population):
具有共同性质的个体所组成的集团.
有限总体----由有限个个体构成的总体.
无限总体----总体所包含的个体数目有无穷多个.
样本(sample):
从总体中抽取若干个个体的集合称为样本(sample)。
参数:
由总体中全部个体观察值计算得总体特征值.
统计数(statistic):
测定样本中的各个体而得的样本特征数,如平均数等,称为统计数
关系:
试验研究的目的是为了获得总体的信息或特征;
试验研究的方法则是抽样研究;
利用样本的结果(统计数)推断或估计总体特征(参数).
2算数平均数的意义和特性?
算术平均数一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数
算术平均数的重要特性:
(1)离均差之和为零
(2)离均差平方的总和最小
3变异数的意义、种类和计算?
变异数的意义:
一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性.
变异数的种类:
一、极差二、方差三、标准差四、变异系数
计算:
样本标准差的公式为:
总体标准差用表示:
变异系数(coefficientofvariation)----样本的标准差对均数的百分数:
变异系数是一个不带任何单位的平均一个单位纯数离均程度,其作用:
消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。
**1统计概率、正态离差含义?
统计学上用n较大时稳定的频率近似代表概率。
通过大量实验而估计的概率称为实验概率或统计概率,以p表示。
正态离差:
3小概率原理及其在统计假设测验中的应用?
小概率原理----若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。
小概率事件实际不可能性原理在统计假设测验中的应用:
如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)
**1区间估计,置信区间,置信限,置信度的概念?
区间估计:
在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间.
置信区间(confidenceinterval):
在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间.区间的上、下限称为置信限(confidencelimit)
一般以L1和L2分别表示置信下限和上限。
置信系数或置信度:
保证总体参数位于置信区间的概率以P=(1-)表示。
2什么是统计假设?
统计假设有哪几种?
各有何含义?
假设测验时直接测验的统计假设是那一种为什么?
统计假设(statisticalhypothesis):
对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个,在后面有说明)。
▪无效假设(nullhypothesis):
记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.
▪备择假设(alternativehypothesis):
记作HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.
因为只有无效假设相当于总体已知,这样才能从已知的总体中进行抽样分布,才能进一步计算样本在无效假设中出现的概率。
3区间估计和假设测验的关系?
区间估计与统计假设测验的关系为:
1如果无效假设位于置信区间内,就接受无效假设,称为
差异不显著;
2如果无效假设位于置信区间外,就否定无效假设,接受
备择假设,称为差异显著;
4什么是显著水平?
为什么要有一个显著水平?
根据什么确定显著水平?
它和统计推断有何关系?
用来测验假设的小概率标准5%或1%等,称为显著水平
由于显著水平不同可能直接影响到推断结果.本例题如果
用0.01水平就要接受无效假设,所以必须事先确定显著水平.
选用显著水平的原则:
统计上达显著,实际上有应用价值.
选用显著水平的原则:
试验误差小的,选高水平0.01;
试验误差大的,选低水平0.05.
5什么叫统计推断?
它包括哪些内容?
什么是统计假设测验,它的原理和方法?
统计推断:
利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数).
它有两条路:
一是统计假设测验,二是参数的区间估计.本教材主要是统计假设测验.
统计假设测验的含义:
首先对样本所属的总体提出统计假设(无效假设,备择假设)然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设
具体有以下三大步:
(一)提出统计假设:
对所研究的总体首先提出统计假设
(二)计算概率:
在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率
(三)推断:
根据“小概率事件实际上不可能发生”原理接受或否定无效假设
**1方差分析的基本方法基本步骤?
方差分析的步骤:
1.平方和及自由度的分解:
把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
2.F测验:
利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.
3.多重比较:
对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
2、F测验的两个前提条件?
F测验需具备条件:
(1)变数y遵循正态分布N(,),
(2)s12和s22彼此独立。
3、多重比较方法尺度大小和应用?
多重比较方法尺度的大比较:
1.P=2时:
2.P>2时:
(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法(LSD法);
(2)新复极差法(SSR法)适用于试验精确度一般的所有均值间的相互比较.
(3)q法测验适用于试验精确度较高的所有均值间的相互比较.
4、方差分析的含义是什么?
如何进行自由度和平方和的分解?
如何进行F测验和多重比较?
所谓方差分析(analysisofvariance):
是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。
是关于k(k≥3)个样本平均数的假设测验方法.
平方和及自由度的分解:
把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
F测验:
利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.F测验(方差差异的显著性测验或方差的同质性测验)的方法
1.提出统计假设
2.规定显著水平
3.计算概率
4.推断:
如果就否定无效假设,接受备择假设
如果接受无效假设
多重比较的基本思路
利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值
标准,则它们的总体均值就差异显著;反之就差异不显著
多重比较:
对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
5、方差分析有哪些基本假定?
(1)处理效应与环境效应等应该具有“可加性”(additivity)以组合内只有单个观察值的两向分组资料的线性可加模型为例予以说明
(2)试验误差应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即“正态性”(normality).
(3)所有试验处理必须具有共同的误差方差,即误差同质性(homogeneity)
**1适合性测验独立性测验的含义?
适合性测验的概念:
测验实际次数与理论次数是否相适合的卡平方测验
独立性测验的概念:
测验两个因素的列联次数是否相互独立的卡平方测验.独立性测验的实质:
测验实际次数与理论次数是否相适合的卡平方测验
**1什么叫回归分析?
直线回归方程和回归截距回归系数的统计意义是什么?
如何计算?
如何对直线回归进行假设测验和区间估计?
回归分析:
计算回归方程为基础的统计分析方法。
(一)直线回归方程式
(9·1)
⏹a回归截距(regressionintercept):
a是x=0时Y的值,即回归直线在y轴上的截距。
⏹b回归系数(regressioncoefficient):
b是x每增加一个单位数时,Y平均地将要增加(b>0时)或减少(b<0时)的单位数。
建立回归方程或求a和b的原理是:
最小二乘法或最小平方法原理,即使各个实际值y与回归直线对应值之差平方之和最小.
其几何图形上的含义:
各个实际观测点与回归直线上点之距离和为最小,即误差为最小.
(1).提出统计假设,H0:
=0,Ha:
≠O
(2).规定显著水平为0.05或0.01
(3).计算概率:
计算b来自=0的总体的概率
2什么叫相关分析?
相关系数决定系数各有什么具体意义?
如何计算?
如何对相关系数做假设测验?
相关分析:
计算相关系数为基础的统计分析方法。
计算表示Y和X相关密切程度的统计数,并测验其显著性。
相关系数是两个变数标准化离差的乘积之和的平均数。
⏹相关系数的功能定义:
表示变量间相关性质与程度的统计数
⏹相关系数的计算定义:
由自变量引起的回归平方和占依变量总平方和比率的平方根(见公式9.34下)
⏹相关系数的推导定义:
是两个变数标准化离差的乘积之和的平均数。
一、判断题:
判断结果填入括弧,以√表示正确,以×表示错误。
(每小题2分,共14分)
1多数的系统误差是特定原因引起的,所以较难控制。
(×)
2否定正确无效假设的错误为统计假设测验的第一类错误。
(√)
3A群体标准差为5,B群体的标准差为12,B群体的变异一定大于A群体。
(×)
4“唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。
(√)
5某班30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已知
)。
(√)
6在简单线性回归中,若回归系数
,则所拟合的回归方程可以用于由自变数
可靠地预测依变数
。
(×)
7由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于
推断处理的总体。
(√)
二、填空题:
根据题意,在下列各题的横线处,填上正确的文字、符号或数值。
(每个空1分,共16分)
1对不满足方差分析基本假定的资料可以作适当尺度的转换后再分析,常用方法有
平方根转换、对数转换、反正旋转换、平均数转换等。
2拉丁方设计在两个方向设置区组,所以精确度高,但要求重复数等于处理数,所以应用受到限制。
3完全随机设计由于没有采用局部控制,所以为保证较低的试验误差,应尽可能使试验的环境因素相当均匀。
4在对单个方差的假设测验中:
对于
,其否定区间为
或
;对于
,其否定区间为
;而对于
,其否定区间为
。
5方差分析的基本假定是处理效应与环境效应的可加性、误差的正态性、误差的同质性。
6一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为0.96。
7当多个处理与共用对照进行显著性比较时,常用最小显著差数法(LSD)方法进行多重比较。
三、选择题:
将正确选择项的代码填入题目中的括弧中。
(每小题2分,共10分)
1田间试验的顺序排列设计包括(C)。
A、间比法B、对比法C、间比法、对比法D、阶梯排列
2测定某总体的平均数是否显著大于某一定值时,用(C)。
A、两尾测验B、左尾测验C、右尾测验D、无法确定
3分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为(D)。
A、[-9.32,11.32]B、[-4.16,6.16]C、[-1.58,3.58]D、都不是
4正态分布不具有下列哪种特征(D)。
A、左右对称B、单峰分布C、中间高、两头低D、概率处处相等
5对一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为(C)。
A、
3B、
3C、
12D、
12
四、简答题:
(每小题5分,共15分)
1分析田间试验误差的来源,如何控制?
答:
田间试验的误差来源有:
(1)试验材料固有的差异,
(2)试验时农事操作和管理技术的不一致所引起的差异,
(3)进行试验时外界条件的差异
控制田间试验误差的途径:
(1)选择同质一致的试验材料,
(2)改进操作和管理技术,使之标准化,
(3)控制引起差异的外界主要因素。
2试述统计假设测验的步骤。
答:
(1)对样本所属的总体提出假设,包括无效假设
和备择假设
。
(2)规定测验的显著水平值。
(3)在
为正确的假定下,计算概率值p-值。
(4)统计推论,将p-值与显著水平比较,作出接受或否定H0假设的结论。
3田间试验设计的基本原则是什么,其作用是什么?
答:
田间试验设计的基本原则是重复、随机、局部控制。
其作用是
(1)降低试验误差;
(2)获得无偏的、最小的试验误差估计;
(3)准确地估计试验处理效应;
(4)对各处理间的比较能作出可靠的结论。
1、对频率百分数资料进行方差分析前,应该对资料数据作反正弦转换。
(×)
2、多重比较前,应该先作F测验。
(×)
3、u测验中,测验统计假设
,对
时,显著水平为5%,则测验的
值为
1.96。
(×)
4、多个方差的同质性测验的假设为
,对
(对于所有的
)。
(×)
5、对直线回归作假设测验中,
。
(×)
6、在进行回归系数假设测验后,若接受
,则表明X、Y两变数无相关关系。
(×)
7、如果无效假设
错误,通过测验却被接受,是错误;若假设
正确,测验后却被否定,
为错误。
(×)
8、有一直线相关资料计算相关系数r为0.7,则表明变数x和y的总变异中可以线性关系说明的部分占70%。
(×)
9、生物统计方法常用的平均数有三种:
算术平均数、加权平均数和等级差法平均数。
(×)
10、某玉米株高的平均数和标准差为
(厘米),果穗长的平均数和标准差为
(厘米),可认为该玉米的株高性状比果穗性状变异大。
(×)
1、田间试验设计的基本原则是什么,其作用是什么?
答:
田间试验设计的基本原则是重复、随机、局部控制。
其作用是
(1)降低试验误差;
(2)获得无偏的、最小的试验误差估计;
(3)准确地估计试验处理效应;
(4)对各处理间的比较能作出可靠的结论。
2、何谓随机区组试验设计?
答:
根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。
3、用样本直线回归方程,由X预测Y时,为什么不能任意外推?
答:
因为在试验范围之外,X、Y两个变数间是否存在回归关系和什么样的回归关系,并不知道,
因而用样本直线回归方程,由X预测Y时,不能任意外推。
4、什么是试验误差?
试验误差与试验的准确度、精确度有什么关系?
答:
试验误差指观察值与其理论值或真值的差异。
系统误差使数据偏离了其理论真值,影响了数据的准确性;偶然误差使数据相互分散,影响了数据的精确性。
三、填空题:
根据题意,在下列各题的横线处,填上正确的文字、符号或数值。
(本大题分8小题,每个空1分,共20分)
1、变异数包括极差、方差、标准差、变异系数。
2、小麦品种A每穗小穗数的平均数和标准差值为18和3(厘米),品种B为30和4.5(厘米),根据_CVA_大于_CVB_,品种_A_的该性状变异大于品种_B_。
3、用紫花、长花粉与红花、圆花粉香豌豆杂交,调查
四种类型豌豆株的数目,在测验它们是否按9:
3:
3:
1的比例分离时,应用_
适合性测验__方法测(检)验,如测验否定无效假设,说明__其
四种类型不符合9:
3:
3:
1的分离比例。
4、二项总体也可以称为0,1总体,是因为二项总体中两事件为对立事件,将发生事件记为“1”,另一事件记为“0”。
5、在研究玉米种植密度和产量的关系中,其中种植密度是自变数,产量是依变数。
6、标准正态分布是参数___=0__,_2_=1__的一个特定正态曲线。
7、方差分析的基本假定是处理效应与环境效应的可加性、误差的正态性、误差的同质性。
8、误差可以分为随机误差和系统误差两种类型。
1、下列事件的关系中,属于独立事件的是。
A.一粒种子播种后发芽与不发芽
B.从一束玫瑰花中取出一支,颜色为红色、白色和黄色的事件
C.饲喂幼虫时幼虫的成活与死亡
D.播种两粒种子,第一粒出苗和第二粒出苗
2、算术平均数的两个特性是。
A.∑x2最小,
=0B.
最小,x=0
C.
最小,
=0D.
最小,
=0
3、已知
,则x在区间
的概率为。
A、0.025B、0.975C、0.95D、0.05
4、关于无偏估计值,下列说法正确的是。
A.
是的无偏估计值B.S2不是2的无偏估计值;
C.以n为分母得到的样本方差S02是s2的无偏估计值
D.S是的无偏估计值
5、研究农药残留问题,凭生产经验认为喷洒杀虫剂后的蔬菜中杀虫剂含量μ1高于未喷洒的蔬菜中的含量μ0,那么在做假设测验时,无效假设应该是。
A.H0:
μ1=μ0B.H0:
μ1≤μ0
C.H0:
μ1≥μ0D.H0:
μ1≠μ0
6、为比较去雄和不去雄两种处理对玉米产量的影响,选面积相同的玉米小区10个,各分成两半,一半去雄,一半不去雄。
所得数据应做。
A.u测验B.t测验C.
测验D.F测验
7、次数资料的独立性测验和适合性测验都是。
A.两尾测验B.左尾测验C.右尾测验D.以上都不对
8、方差分析时,进行数据转换的目的是。
A.误差方差同质B.处理效应与环境效应线性可加
C.误差方差具有正态性D.A、B、C都对
9、用标记字母法表示的多重比较结果中,如果两个平均数的后面,既标有相同大写拉丁字母,又标有不同大写拉丁字母,则它们之间差异
A.极显著B.不显著C.显著D.未达极显著
10、单个方差的假设测验,采用的测验方法有
A.u测验B.t测验C.
测验D.F测验
11、以下的第个分布是与自由度无关的。
A.正态分布B.t分布C.χ2分布D.F分布
12、当试验中设有共同对照,多个处理与共同对照进行显著性比较时,常用。
A.LSD法B.SSR法C.q法D.LSR法
13、要得到剩余误差(离回归误差)最小的回归方程,选用的是。
A.矫正法B.离均差和为最小的原理
C.最小二乘法D.计算合并均方值的方法
14、决定系数的取值范围为。
A.[0,1]B.[-1,0]C.[-1,1]D.[-∞,+∞]
15、随机区组试验其方差分析时误差项自由度为DFe,若有一小区数据缺失,则误差项自由度为。
A.DFe-1B.Dfe+1C.DfeD.Dfe-2
三、填空题(每空1分,共15分)
1.有一样本其观察值分别9、6、10、8、12、11、8、8、9,则其算术平均数为_____________,中位数为__________,众数为_______,极差为_______。
2.已知金鱼
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 统计 方法 总结 经典 试题