卫生统计学考试题及答案要点.docx
- 文档编号:16333422
- 上传时间:2023-07-12
- 格式:DOCX
- 页数:22
- 大小:42.46KB
卫生统计学考试题及答案要点.docx
《卫生统计学考试题及答案要点.docx》由会员分享,可在线阅读,更多相关《卫生统计学考试题及答案要点.docx(22页珍藏版)》请在冰点文库上搜索。
卫生统计学考试题及答案要点
《卫生统计学》
一、名词解释
1.计量资料
2.计数资料
3.等级资料
4.总体
5.样本
6.抽样误差
7.频数表
8.算术均数
9.中位数
10.极差
11.方差
12.标准差
13.变异系数
14.正态分布
15.标准正态分布
16.统计推断
17.抽样误差
18.标准误
19.可信区间
20.参数估计
P的含义假设检验中21.型错误III型和22.检验效能23.
24.检验水准方差分析25.26.随机区组设计27.相对数-1-
28.标准化法
29.二项分布
30.Yates校正
31.非参数统计
32.直线回归
33.直线相关
34.相关系数
35.回归系数
36.人口总数
37.老年人口系数
38.围产儿死亡率
39.新生儿死亡率
40.婴儿死亡率
41.孕产妇死亡率
42.死因顺位
43.人口金字塔
二、单项选择题
1.观察单位为研究中的(D)。
A.样本B.全部对象
C.影响因素D.个体
2.总体是由(C)。
A.个体组成B.研究对象组成
C.同质个体组成D.研究指标组成
3.抽样的目的是(B)。
A.研究样本统计量B.由样本统计量推断总体参数
C.研究典型案例研究误差D.研究总体统计量
4.参数是指(B)。
A.参与个体数B.总体的统计指标
C.样本的统计指标D.样本的总和
5.关于随机抽样,下列那一项说法是正确的(A)。
-2-
.抽样时应使得总体中的每一个个体都有同等的机会被抽取A.研究者在抽样时应精心挑选个体,以使样本更能代表总体B.随机抽样即随意抽取个体C.为确保样本具有更好的代表性,样本量应越大越好DB)。
6.各观察值均加(或减)同一数后(
.均数改变,标准差不变BA.均数不变,标准差改变
.两者均改变D.两者均不变C
)。
7.比较身高和体重两组数据变异度大小宜采用(A
B.方差.变异系数AD.标准差C.极差
D)可用来描述计量资料的离散程度。
8.以下指标中(
.几何均数BA.算术均数
D.标准差C.中位数
)。
9.血清学滴度资料最常用来表示其平均水平的指标是(C
B.中位数A.算术平均数
D.平均数C.几何均数
。
)10.两样本均数的比较,可用(C
检验B.tA.方差分析
.方差齐性检验DC.两者均可
?
。
D11.配伍组设计的方差分析中,)等于(配伍?
?
?
?
A.--B.总误差总处理?
?
?
?
?
?
D.---C.+处理总误差总处理误差?
?
|X?
?
|?
,的正态总体中随机抽样,)的概率为5%。
12.在均数为标准差为(B
tSst?
1.96C.D.
A.B.?
1.96?
?
,
X20.0520.05
X13.完全随机设计方差分析的检验假设是(D)。
A.各处理组样本均数相等B.各处理组总体均数相等
C.各处理组样本均数不相等D.各处理组总体均数不全相等
14.已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是(D)。
2检验χBA.分别进行比较.两个率比较的
-3-
D.对性别进行标准化后再比较C.不具备可比性,不能比较
D)。
15.率的标准误的计算公式是(p(1?
pp))1?
pp(D..C.A.B)pp(1?
1?
nnn16.非参数统计应用条件是(C)。
A.总体是正态分布
B.若两组比较,要求两组的总体方差相等
C.不依赖于总体分布
D.要求样本例数很大
17.下述哪些不是非参数统计的特点(D)。
A.不受总体分布的限定B.多数非参数统计方法简单,易于掌握
C.适用于等级资料D.检验效能总是低于参数检验
18.设配对设计资料的变量值为X和X,则配对资料的秩和检验(A)。
21A.把X与X的差数绝对值从小到大编秩21B.把X和X综合从小到大编秩21C.把X和X综合按绝对值从小到大编秩21D.把X与X的差数从小到大编秩2119.秩和检验和t检验相比,其优点是(A)。
A.计算简便,不受分布限制B.公式更为合理
C.检验效能高D.抽样误差小
20.对两样本均数作比较时,已知n、n均小于30,总体方差不齐且分布呈偏态,宜用(C)。
21A.t检验B.u检验
C.秩和检验D.F检验
21.等级资料的比较宜用(B)。
A.t检验B.秩和检验
2检验.四格表XD.CF检验
22.两个小样本比较的假设检验,应首先考虑(D)。
A.t检验B.秩和检验
C.任选一种检验方法D.资料符合哪种检验的条件
23.对于配对比较的秩和检验,其检验假设为(B)。
A.样本的差数应来自均数为0的正态总体
-4-
的非正态总体.样本的差数应来自均数为0B的总体.样本的差数来自中位数为0C.样本的差数来自方差齐性和正态分布的总体D。
).用最小二乘法确定直线回归方程的原则是各观察点(B24.距直线的纵向距离相等A.距直线的纵向距离的平方和最小B.与直线的垂直距离相等C.与直线的垂直距离的平方和最小D。
D)25.实验设计的三个基本要素是随机化、重复、设置对照.BA.受试对象、实验效应、观察指标
处理因素、受试对象、实验效应D.齐同对比、均衡性、随机化C.
)。
.实验设计的基本原则(D26重复、随机化、配对B.A.随机化、盲法、设置对照
随机化、重复、设置对照D..C随机化、盲法、配对
。
D)27.实验设计和调查设计的根本区别是(
.调查设计以人为对象BA.实验设计以动物为对象
.实验设计可人为设置处理因素DC.实验设计可随机分组
(A)。
标准正态分布的均数与标准差分别为28.
1
1与0与0D.0与1B.1与0C.A.?
?
,(C)相应的正态曲线的形状越扁平。
与29.正态分布有两个参数?
?
?
?
越小越大.D越小C..A.越大B?
?
为均数和标准差的正态分布,则X的第95,百分位数等于(B)。
30.若X服从以
?
?
?
?
?
?
?
?
58.?
?
1.962.?
164.?
164AC...BD.三、简答题
1.某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?
为什么?
2.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。
H0.05P?
,理论依据是什么?
,则拒绝假设检验时,当3.0t检验和方差分析的应用条件?
4.
-5-
5.应用相对数时应注意哪些问题?
6.为什么不能以构成比代率?
请联系实际加以说明。
7.应用直线回归和相关分析时应注意哪些问题?
8.统计表有哪些要素构成?
制表的注意事项有哪些?
9.调查设计包含哪些内容?
10.实验设计的基本内容和步骤。
11.诊断试验的设计主要包括哪些程序和内容?
四、分析计算题
12/L10)(?
近似服从均值为4.18,标准差为1.假定正常成年女性红细胞数0.29的正态分布。
令X代表随机抽取的一名正常成年女性的红细胞数,求:
(1)变量X落在区间(4.00,4.50)内的概率;
(2)正常成年女性的红细胞数95%参考值范围。
2.某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对;随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见表1第
(1)、
(2)、(3)栏。
试比较两组猪脑组织钙泵的含量有无差别。
?
g/g)
两组乳猪脑组织钙泵含量(表1
d差值试验组对照组乳猪号
(4)=
(2)-(3)
(1)(3)
(2)
0.07950.355010.2755
-0.05450.254520.2000
0.133030.18000.3130
0.040040.36300.3230
0.04310.311350.3544
0.049560.34500.2955
0.01800.3050
70.2870
0.3086
合计
例;例,有效63793.某医院比较几种疗法对慢性胃炎病人的疗效:
单纯西药组治疗例。
问:
①该资料属例,有效68例;中西医结合组治疗例,有效单纯中药组治疗544765宜选用何种假设检验方种疗法的疗效的差别,3何种资料?
实验设计属何种设计?
②欲比较?
HH0.05?
的8.143④若求得的检验统计量为;与,法?
③写出该种检验方法的相应于10,你如何做出结论?
⑤根据你的结论,你可能犯哪一类统计错检验统计量的临界值为5.99-6-
误?
4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。
问:
(1)如何将病人分组?
(2)如何对结果进行统计分析处理?
5.试就表2资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。
表2甲、乙两医院乳腺癌手术后的5年生存率(%)
院医甲医院腋下淋巴乙
移结转病例数生存率生存率生存数生存数病例数
71.674521530077.7735无50.60428368.38450710有
67.10
755
485
64.24
383
257
合计
名铅中毒工人脱离现场后住院治疗,治6.某年某单位报告了果胶驱铅的疗效观察,30天后再测,尿mg/L1.81,血铅均数为)(0.116疗前测得尿铅均数为mg/L(。
服用果胶)20,说明果胶驱铅的效果较好。
请评述,血铅均数降为)mg/L0.087铅均数降为()mg/L(0.73以上研究。
-7-
参考答案
一、名词解释
1.计量资料:
对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurementdata)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
2.计数资料:
将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(countdata)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
3.等级资料:
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata)。
等级资料又称有序变量。
4.总体:
总体(population)指特定研究对象中所有观察单位的测量值。
样本:
从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample5.)。
抽样误差:
抽样误差(sampling6.error)是指样本统计量与总体参数的差别。
在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
7.频数表:
用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。
?
X表示,样本均数用算术均数:
描述一组数据在数量上的平均水平。
总体均数用8.表示。
9.中位数:
将一组观察值由小到大排列,位次居中的那个数。
10.极差:
亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
11.方差:
方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
12.标准差:
是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
13.变异系数:
用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
14.正态分布:
若资料的频率曲线对应于数学上的正态曲线,则称该资料服从正态分X2?
?
?
?
),N(,标准差为布。
通常用记号的正态分布。
表示均数为的正态分布被称为标准正态分布,通常记为1均数为:
0、标准差为标准正态分布15.
2)(0,1N。
-8-
16.统计推断:
通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。
17.抽样误差:
由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。
18.标准误:
通常将样本统计量的标准差称为标准误。
19.可信区间:
按预先给定的概率确定的包含未知总体参数的可能范围。
20.参数估计:
指用样本统计量估计总体参数。
参数估计有两种方法:
点估计和区间估计。
21.假设检验中P的含义:
指从H规定的总体随机抽得等于及大于(或等于及小于)现0有样本获得的检验统计量值的概率。
22.I型和II型错误:
I型错误指拒绝了实际上成立的H,这类“弃真”的错误称为I型0错误,其概率大小用表示;II型错误,指接受了实际上不成立的H,这类“存伪”?
0的错误称为II型错误,其概率大小用表示。
?
23.检验效能:
1-称为检验效能,它是指当两总体确有差别,按规定的检验水准所?
?
能发现该差异的能力。
24.检验水准:
是预先规定的,当假设检验结果拒绝H,接受H,下“有差别”的结论10?
。
时犯错误的概率称为检验水准,记为25.方差分析:
就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
通过各变异来源的均方与F分布作出统计推断,判断各因素对观测指标有无影响。
误差均方比值的大小,借助26.随机区组设计:
事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。
然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。
27.相对数:
是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。
28.标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。
标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
-9-
29.二项分布:
若一个随机变量X,它的可能取值是0,1,…,n,且相应的取值概率为kn?
kn?
?
?
n)?
)1?
k)?
((P(X为参数的二项分布。
则称此随机变量X服从以、k2分布理论上是一连续性分布,而分认为,由于Yates校正:
英国统计学家YatesF30.?
2值不连续,尤其是自由度为1类资料是间断性的,由此计算出的的四格表,求出?
2值作连续性校正(correctionofcontinuity值可能偏小,此时需对),这一的概率P?
校正即所谓的Yates校正(Yates'correction)。
31.非参数统计:
针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。
由于这类方法不受总体参数的限制,故称非参数统计法(non-parametricstatistics),或称为不拘分布(distribution-freestatistics)的统计分析方法,又称为无分布型式假定(assumptionfree
statistics)的统计分析方法。
32.直线回归:
建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归。
33.直线相关:
是用来描述具有直线关系的两变量x、y间的相互关系。
34.相关系数:
又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。
它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
35.回归系数:
为直线的斜率,其统计学意义是自变量x改变一个单位时,应变量y平b个单位。
均变化36.人口总数:
人口总数(population)是指一个国家或地区在某特定时间点上存活人口的总和。
国际上统计人口数有两种办法:
①实际制(defacto):
即只统计标准时刻某地实际存在的人口数(包括临时在该地的人)。
②法定制(dejure):
只统计某地的常住人口。
37.老年人口系数:
是指65岁及以上老年人口数占总人口数的比重。
65岁及以上的人口数?
老年人口系数?
100%。
老年人口系数用于表明一个
人口总数国家或地区的人口老龄化程度,其大小受社会经济发展水平、生活水平、卫生保健-10-
水平等因素的影响。
38.围产儿死亡率:
围产期是指胎儿体重达到1000克及以上、或孕期满28周,至出生后7天以内的时期。
在此期间的死亡称为围产儿死亡。
计算式为:
同年围产期死胎数+死产数+出生7天内的新生儿死亡数围产儿死亡率=?
1000%
某年围产期死胎数+死产数+活产数。
围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算。
39.新生儿死亡率:
新生儿死亡率(neonatalmortalityrate,NMR)指某地平均每千名活产数中未满28天的新生儿死亡数。
计算式:
同年未满28天的新生儿死亡数‰1000?
新生儿死亡率?
某年活产总数新生儿死亡在婴儿死亡中占很大的比重。
死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。
40.婴儿死亡率:
指某年平均每千名活产中不满1周岁(婴儿)的死亡数。
计算式为:
同年未满1岁婴儿死亡数‰1000?
婴儿死亡率?
某年活产总数41.孕产妇死亡率:
指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活产数之比,常以万分率或十万分率表示,计算式为:
同年孕产妇死亡数?
10000(或孕产妇死亡率?
10万)
某年活产数42.死因顺位:
指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各种死亡原因导致死亡的严重程度。
43.人口金字塔:
将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或年龄构成比为横轴,按男左女右绘制的直方图,其形态如金字塔,故称为人口金字塔。
人口金字塔是对人口年龄、性别构成综合反映的特殊统计图,指示了不同时期人口年龄、性别构成的变化情况,是长期人口出生、死亡、迁入、迁出而形成的,反映了历史的痕迹和变动的趋势。
二、单项选择题
1.D2.C3.B4.B5.A
10..6B.7A.8D.9CC
15.D11.B12.D13.D14.D
20.16C
.17D
.18A
.19A
.C
-11-
21.B22.D23.B24.B25.D
30..28A
C
26.D.B
27.D
29
四、简答题1.答题要点:
:
不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
既使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
2.答题要点:
医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围,也叫正常值范围。
所谓“正常人”不是指完全健康的人,而是指排除了所研究资料的疾病和有关因素的同质人群。
制定参考值范围的一般步骤:
(1)定义“正常人”,不同的资料“正常人”的定义也不同。
(2)选定足够数量的正常人作为研究对象。
(3)用统一和准确的方法测定相应的资料。
(4)根据不同的用途选定适当的百分界限,常用95%。
(5)根据此资料的实际意义,决定用单侧范围还是双侧范围。
(6)根据此资料的分布决定计算方法,常用的计算方法:
正态分布法、百分位数法。
3.答题要点:
P值系由H所规定的总体做随机抽样,获得等于及大于(或等于及小于)0?
0.05时,说明在依据现有样本信息所计算得的检验统计量的概率。
当PH成立的条件下,0?
,因为小概率事件几乎不可能在一次试验中发生,得到现有检验结果的概率小于所以拒绝?
,也H。
同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于0就是说,有了概率保证。
4.答题要点:
t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。
5.答题要点:
应用相对数时应注意的事项有:
⑴计算相对数的分母一般不宜过小。
⑵分析时不能以构成比代替率。
⑶不能用构成比的动态分析代替率的动态分析。
-12-
⑷对观察单位数不等的几个率,不能直接相加求其总率。
⑸在比较相对数时应注意可比性。
⑹对样本率(或构成比)的比较应随机抽样,并做假设检验。
6.答题要点:
率和构成比所说明的问题不同,因而绝不能以构成比代率。
构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。
例如:
以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。
这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。
但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。
若要比较高血压的患病率,应该计算患病率指标。
7.答题要点:
注意以下五个问题
⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。
⑵在进行回归分析和相关分析之前,应绘制散点图。
但观察点的分布有直线趋势时,才适宜作回归、相关分析。
如果散点图呈明显曲线趋势,应使之直线化再行分析。
散点图还能提示资料有无可疑异常点。
⑶直线回归方程的应用范围一般以自变量的取值范围为限。
若无充分理由证明超过自变量取值范围外还是直线,应避免外延。
⑷双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。
⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。
8.答题要点:
一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。
编制统计表的注意事项:
(1)标题概括表的内容,写于表的上方,通常需注明时间与地点。
(2)标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。
(3)线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 考试题 答案 要点