国家开放大学《医学统计学》形考任务1-4参考答案.docx
- 文档编号:12221325
- 上传时间:2023-06-04
- 格式:DOCX
- 页数:25
- 大小:56.25KB
国家开放大学《医学统计学》形考任务1-4参考答案.docx
《国家开放大学《医学统计学》形考任务1-4参考答案.docx》由会员分享,可在线阅读,更多相关《国家开放大学《医学统计学》形考任务1-4参考答案.docx(25页珍藏版)》请在冰点文库上搜索。
国家开放大学《医学统计学》形考任务1-4参考答案
形考任务1
一、名词解释(每题5分,共20分)
1.总体——是指根据研究目的确定的研究对象的全体。
观察单位数理论上可知的总体称为有限总体,观察单位数不可知的总体称为无限总体。
2.误差——误差按其来源及性质,分为随机误差和系统误差。
由偶然因素导致的测量值和真值之差称为随机误差,系统误差是指由某种错误所导致的全部测量值统一高于真值或统一值低于真值的误差。
3.极差——又称为全距,是所有变量值中最大值和最小值之差。
4.变异系数——是同一组数据的标准差与均值的比值,没有量纲。
二、单项选择题(每题2分,共40分)
1.下面有关抽样误差的叙述,正确的是()
A.严格设计和严格实施的研究可以避免抽样误
B.样本量越大,抽样误差越大
C.抽样误差是由于测量人员测量技术不合格导致的误差
D.抽样误差与研究特征的个体差异有关
2.“是否吸烟”的变量类型是()
A.数值型变量资料
B.多分类变量资料
C.等级资料
D.二分类变量资料
3.下面关于样本量的陈述,正确的是()
A.样本量与总体规模有关
B.抽样误差与样本量无关
C.样本量与应答率水平无关
D.样本量需要专门的公式估计
4.下面关于研究对象的陈述,错误的是()
A.研究对象与研究目的有关
B.研究对象可以是人,也可以是动物
C.研究对象不需要来自研究总体
D.研究对象是研究设计的内容
5.下面有关总体的叙述,正确的是()
A.总体是由根据研究目的所确定的全部研究对象
B.总体与研究目的无关
C.总体由样本量决定
D.总体由统计分析方法决定
6.下列选项中,属于数值变量的是( )
A.民族
B.体重
C.血型
D.性别
7.数据录入时,部分数据录入有误,误差的类型属于( )
A.样本与总体之差
B.系统误差
C.随机测量误差
D.抽样误差
8.统计量是( )
A.统计总体数据得到的量
B.反映总体特征的的量
C.使用样本数据计算出来的统计指标
D.使用参数估计出来的
9.某病房记录了50名病人的护理等级,其中特级护理1名,一级护理3名,二级护理12名,三级护理34名,此资料属于( )
A.分类变量资料
B.二分类资料
C.有序分类变量资料
D.数值变量资料
10.下面有关误差的叙述,错误的是( )
A.随机误差不可以避免
B.系统误差一定要避免发生
C.抽样误差包含个体差异
D.因为样本含量越大,抽样误差越小,所样本含量越大越好
11.某药物临床试验数据的两端均没有确定数值,描述其中心位置适用的最佳指标是( )
A.中位数
B.几何均数
C.均数
D.第55百分位数
12.接种某种疫苗一个月后,测定8名患者的抗体滴度分别为1∶10、1∶10、1∶20、1∶20、1∶40、1∶80、1∶80、1∶160,表示平均滴度的最佳指标是( )
A.均数
B.几何均数
C.中位数
D.百分位数
13.对于正态分布的资料,描述分散程度的适宜指标是( )
A.标准差
B.离均差平方和
C.极差
D.四分位数间距
14.已知某数据呈明显单峰偏态分布,描述其分散程度的最佳统计指标是( )
A.全距
B.标准差
C.变异系数
D.四分位数间距
15.频数表中的组段的下限是( )
A.最后一个组段的终点
B.第一个组段的起点
C.每个组段的起点
D.每个组段的终点
16.正偏态分布是指( )
A.集中位置偏向一侧,两侧频数分布不对称
B.集中位置在正中,左右两侧频数分布大体对称
C.集中位置偏向数值小的一侧
D.集中位置偏向数值大的一侧
17.某校6岁女童身高均数为114cm,标准差为10cm,下列正确的选项是( )
A.5%的6岁女童身高≦94cm
B.5%的6岁女童身高≥94cm
C.2.5%的6岁女童身高≥133.6cm
D.2.5%的6岁女童身高≥124cm
18.标准正态分布曲线的特征是( )
A.μ=0,б=1
B.μ=1,б=0
C.μ=1,б=1
D.μ=0,б=0
19.下列有关均数和标准差的叙述,正确的是( )
A.标准差越大,均数对各变量值的代表性越好
B.标准差越小,均数对各变量值的代表性越好
C.均数越大,标准差越小
D.均数越小,标准差越大
20.某组数据26例,变量的平方和以及变量的和分别是675和130,则均数和标准差分别为( )
A.5.1、25
B.26、5.8
C.5、1
D.5、2.7
三、简答题(每题10分,共20分)
1.请简述均数和中位数的适用条件。
参考答案:
算术均值简称均值,适用于描述正态分布或近似正态分布资料的中心位置。
中位数可表示任意分布资料的中心位置。
表示偏离正态分布的单峰对称分布、单峰偏态分布以及分布末端无确切数值的单峰分布资料中心位置的最佳指标为中位数。
2.请简述正态分布的特点。
参考答案:
(1)正态分布是连续型的概率分布。
(2)曲线在X=μ处有最高点;在X=μ+-δ处有两个拐点。
(3)正态分布是一族分布,正态曲线的位置和形状依两个参数(μ,δ2)不同而不同。
四、计算题(每题10分,共20分)
1.现测得A厂10个批次倍他米松片的质量指数分别为0.8652、0.6905、0.7265、0.6959、0.6706、0.4888、0.7419、0.5157、0.5865、0.7917。
试计算均数和中位数。
参考答案:
均值为0.6773,中位数为0.6932。
2.某研究者用蒸汽杀青法和生晒法分别测量10份样品中连翘苷的含量,算得的均数分别为0.631μg/mL和0.095μg/mL,标准差分别为0.05587μg/mL和0.01958μg/mL,试比较两种方法测得的连翘苷含量的分散程度。
参考答案:
两组的均值相差较大,故选择变异系数作为比较两组数据的分散程度的指标。
用两种方法测得连翘苷含量的变异系数分别如下:
蒸汽杀青法:
(0.05587/0.631)×100%=8.85%
生嗮法:
(0.01958/0.095)×100%=20.61%
故用蒸汽杀青法测得连翘苷含量的分散程度低于生嗮法。
形考任务2
一、名词解释(每题5分,共20分)
1.相对数——是由两个有联系的指标之比所构成的统计指标,常用的相对数包括率、构成比和相对比。
2.构成比——又称为构成指标,表示事物内部每一组成部分在整体中所占的比例。
3.标准误——在统计学中,将样本统计量的标准误差称为标准误。
4.置信区间——是指按照一定的置信度(1-a),估计包含未知总体参数的区间范围,该范围称为参数的置信区间。
二、单项选择题(每题2分,共40分)
1.说明某现象发生强度的指标是( )
A.率
B.相对比
C.构成比
D.增长速度
2.构成比所有组成部分的和( )
A.必小于1
B.必等于1
C.必大于1
D.必等于100
3.某年两所企业不同年龄段高血压患病率,均为A企业高于B企业,但总的患病率却是B企业高于A企业,请问出现这种不同的可能原因是( )
A.两所企业病人的严重程度不同
B.两所企业的不同年龄段人数构成不同
C.两所企业的总人数不同
D.两所企业领导构成不同
4.随机抽取某地300名男性和150名女性为研究对象,结果发现男性和女性某病患病率分别为40%和30%,则合并患病率为( )
A.33.3%
B.36.7%
C.35.0%
D.41.2%
5.下列选项中,不受年龄结构影响的指标是( )
A.粗死亡率
B.年龄别死亡率
C.标准化死亡率
D.死因构成
6.下列有关标化后的总患病率的叙述,正确的选项是( )
A.反映了患病的实际水平
B.不随所用标准的变化而变化
C.反映了事物实际发生的强度
D.反映了一种相对水平,仅可作为比较的基础
7.动态数列中定基比指标的类型是( )
A.频率
B.构成比
C.相对比
D.绝对数
8.计算脊髓灰质炎疫苗接种后血清检查的阳转率,分母应该是( )
A.脊髓灰质炎患儿
B.脊髓灰质炎易感患儿
C.脊髓灰质炎疫苗接种人数
D.脊髓灰质炎疫苗接种后阳转人数
9.下列有关率的描述,正确的是( )
A.分母无论大小都可以计算率
B.率是说明某现象发生的频率或强度的指标
C.率表示事物内部各部分的比重大小
D.以m/n表示率,可得出m是n的几分之几
10.动态数列中的绝对增长量指标是( )
A.构成比
B.相对比
C.绝对数
D.频率
11.统计推断的内容包括( )
A.区间估计和点估计
B.参数估计与假设检验
C.统计预测和统计控制
D.统计描述和统计图表
12.统计上认为( )
A.两总体均数差别无统计学意义
B.两样本均数差别无统计学意义
C.两总体均数差别有统计学意义
D.两样本均数差别有统计学意义
13.配对t检验的备择假设(双侧检验)可写为( )
A.μ=μ0
B.μd=0
C.μd≠0
D.μ1≠μ2
14.两样本均数比较,假设检验结果说明( )
A.两总体均数的差别较小
B.两总体均数的差别较大
C.可以认为两总体无差别
D.可以认为两总体有差别
15.两样本均数比较,时,值越小说明( )
A.两样本均数差别越大
B.两总体均数差别越大
C.越有理由认为两样本均数不同
D.越有理由认为两总体均数不同
16.为研究新旧两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批样品,可考虑采用的假设检验方法为( )
A.成组设计t检验
B.成组设计Z检验
C.配对设计t检验
D.配对设计χ2检验
17.方差分析的应用条件之一是方差齐性,它是指( )
A.各比较组相应的样本方差相等
B.各比较组相应的总体方差相等
C.组内方差=组间方差
D.总方差=组内方差+组间方差
18.随机抽取某地300名健康成年女性的血红蛋白量,则其总体均数95%置信区间为(B)
A.P±2.58S
B.x=±1.96sx
C.p±1.96sp
D.x=±2.58sx
19.表示均数抽样误差大小的统计指标是( )
A.标准差
B.标准误
C.方差
D.变异系数
20.完全随机设计的两样本均数进行比较,当方差不齐时,不可选择的检验方法是( )
A.t’检验
B.秩和检验
C.变量变换
D.t检验
三、简答题(每题10分,共20分)
1.应用相对数时的注意事项有哪些?
参考答案:
(1)应注意资料的可比性。
(2)当样本含量(分母)太小时,计算的相对数不稳定,宣用绝对数进行表述。
(3)构成比和率的意义不同,应避免混淆。
(4)对各组观察例数不等的几个率,不能直接相加求总率。
总率应按率的定义公式计算。
(5)样本率之间的比较由于存在抽样误差,需要进行假设检验后,方可对总体做出推断结论。
2.标准差与标准误之间的联系与区别是什么?
参考答案:
标准差是描述一个变量的所有变量值与均值的离散程度的指标。
样本统计量的标准差称为标准误。
样本均值的标准差也称为均值的标准误,它反映样本均值之间的离散趋势,也反映样本均值与总体均值之间的差异,说明了均值抽样误差的大小。
均值标准误的估计值Sx=S/√n,均值标准误的大小与个体变量值的标准差成正比。
四、计算题(每题10分,共20分)
1.一般正常成年男子血红蛋白的平均值为140g/L,某研究者随机抽取25名高原地区成年男子进行检查,得到血红蛋白均数为155g/L,标准差25g/L。
试分析高原地区成年男子的血红蛋白与一般正常成年男子是否不同?
参考答案:
H0:
μ=μ0H1:
μ>μ0α=0.05(单侧)
t=X-μ0S/n=3.00
t=3,0.005
2.25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,两个月后测空腹血糖(mmol/L)如下表所示,试分析两种疗法治疗后患者血糖值是否相同?
25名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L)
编号
甲组血糖值(X1)
编号
乙组血糖值(X2)
1
8.4
1
5.4
2
10.5
2
6.4
3
12.0
3
6.4
4
12.0
4
7.5
5
13.9
5
7.6
6
15.3
6
8.1
7
16.7
7
11.6
8
18.0
8
12.0
9
18.7
9
13.4
10
20.7
10
13.5
11
21.1
11
14.8
12
15.2
12
15.6
13
18.7
参考答案:
该研究属于完全随机设计资料(成组资料)的两样本均值比较的统计问题。
(1)方差齐性检验:
F=S较大2S较小2=4.2224.022=1.102,F0.05/2,(12,11)=3.43
由于F
(2)两独立样本t检验:
t=X1-X2SX1-X2=X1-X2SC2(1n1+1n2)=15.21-10.8517.02×(112+113)=2.64,t0.05/2,23=2.069
由于t>t0.05/2,23,故P<0.05,可以认为,用两种治疗法治疗后患者的空腹血糖值不同,差异有统计学意义。
形考任务3
一、名词解释(每题5分,共20分)
1.统计图——就是依据数字资料,应用点、线、面、体、色彩等的描绘制成整齐而又规律,简明而又知其数量的图形。
2.理论频数——是指在假设多个率或构成比相等的前提下由合计率推算出来的频数。
3.行×列表——对于两个样本率比较的x2检验,基本数据形式是2行2列,称为2×2列联表或四格表。
当行数或列数大于2时,称为行×列表或RxC表。
行x列表资料的x2检验主要用于多个独立样本率或多个独立构成比之间的比较。
4.统计表——是表达数据资料的一种重要形式,是用来表明统计指标与被说明事物之间数量关系的表格。
一般由标题、序号、标目、数字、表注等部分组成。
二、单项选择题(每题2分,共40分)
1.三个独立样本率比较的χ2检验,若χ2>χ20.05,2,统计结论为( )
A.各样本率均不相同
B.各总体率均不相同
C.各样本率不同或不全相同
D.各总体率不同或不全相同
2.某医生用甲药治疗15例病人,治愈8人;用乙药治疗20例病人,治愈2人。
比较两药疗效时,可选用的最佳方法是( )
A.χ2检验
B.t检验
C.校正χ2检验
D.Fisher确切概率法
3.两独立样本设计四格表资料中,如果行合计和列合计不变,实际频数发生变化,则理论频数相应( )
A.增大
B.减小
C.不变
D.先增大后减小
4.两独立样本设计四格表资料χ2检验校正公式的应用条件是( )
A.n≥40且1≤Tmin<5
B.Tmin≥5
C.n≥40或Tmin≥5
D.n≥40且Tmin≥5
5.四格表资料的自由度是( )
A.一定不等于1
B.一定等于1
C.等于行数×(列数-1)
D.等于样本含量-1
6.多个样本率的假设检验,其无效假设是( )
A.m1=m2=……=mn
B.P1=P2=……=Pn
C.X1=X2=……=Xn
D.π1=π2=……=πn
7.配对资料的卡方检验,其备择假设是( )
A.P1=P2
B.P1≠P2
C.B≠C
D.B=C
8.采用配对计数资料的卡方检验时,若b+c<40时,下列方法中正确的是( )
A.校正χ2检验
B.不校正χ2检验
C.增加n后再做检验
D.精确概率法
9.两个四格表资料的卡方检验,资料1的结果为χ2>χ20.01,1,资料2的结果为χ2>χ20.05,1,下列选项正确的是( )
A.资料1两个百分数相差较大
B.资料2两个百分数相差较大
C.资料1更有理由认为两总体率不同
D.资料2更有理由认为两总体率不同
10.对5×4表进行χ2检验,当有5个格子的理论频数1 A.仍做χ2检验 B.作校正的χ2检验 C.应进行适当的合并 D.增加样本例数 11.可以用来描述身高与年龄关系的统计图是( ) A.直条图 B.直方图 C.散点图 D.普通线图 12.适宜绘制线图的资料类型是( ) A.体重和血压之间的关系 B.数值型变量资料的频数分布 C.10年高血压患病率 D.研究对象的受教育程度 13.可以表示原始数据测量值的统计图是( ) A.直条图 B.直方图 C.茎叶图 D.箱式图 14.可用于比较率的长期下降趋势的统计图是( ) A.直条图 B.直方图 C.半对数线图 D.茎叶图 15.下面有关直条图的叙述,正确的是( ) A.直条图纵坐标的取值必须始于0 B.直条图的纵坐标可始于任何数值 C.直条图各直条的宽度不必相等 D.直条图是用来表示数值型变量资料频数分布的统计图形 16.统计图中可展示中位数的统计图是( ) A.散点图 B.线图 C.箱式图 D.茎叶图 17.可以用以指明统计表内数字含义的选项是( ) A.标题 B.数字 C.标目 D.备注 18.用以说明统计表内容和选项是( ) A.备注 B.标题 C.标目 D.数字 19.根据某地7岁-12岁小学生的体质指数的调查资料,对调查者的身高分布进行统计描述,宜绘制的图形是( ) A.直条图 B.线图 C.直方图 D.散点图 20.表达某地两年几种疾病的患病率,宜绘制的图形是( ) A.直方图 B.百分直条图 C.复式直条图 D.散点图 三、简答题(每题10分,共20分) 1.简述两独立样本设计四格表资料χ2检验的类型及应用条件。 参考答案: (1)两独立样本设计四格表资料的χ2检验 当n≥40且Tmin≥5时,用两独立样本设计四格表资料χ2检验的基本公式或专用公式。 当n≥40且1≤Tmin<5时,用两独立样本设计四格表资料χ2检验的校正公式或专用校正公式。 当n<40或Tmin<1时,用两独立样本设计四格表资料的Fisher确切概率法。 (2)配对设计四格表资料的χ2检验 当b+c≥40时,用McNemarχ2检验的基本公式。 当b+c<40时,用McNemarχ2检验的校正公式。 2.简述统计表的制表原则。 参考答案: 统计表的制作原则是重点突出,内容正确,完整,结构简洁,清晰,便于阅读和提取数据信息。 四、计算题(每题10分,共10分) 欲比较心电图和生化测定诊断低血钾的作用,某研究者分别采用两种方法对84名临床确诊的低血钾患者进行检查,结果如下表所示。 试分析两种方法的检测结果有无差别。 两种方法检测低血钾的结果 心电图 生化测定 合计 + — + 48 27 75 — 4 5 9 合计 52 32 84 参考答案: (1)建立检验假设,确定检验水准 H0: π1=π2,两种方法的总体检出率相同 H1: π1≠π2,两种方法的总体检出率不同 a=0.05 (2)计算检验统计量 已知b=27,c=4,b+c=31<40,应采用McNemarX2检验的校正公式计算统计量: Xc2=(b-c-1)2b+c=(27-4-1)227+4=15.61 v=(2-1)×(2-1)=1 (3)确定P值,做出推断结论 查X2界值表,X0.05,12=3.84。 在本例中,X2>X0.05,12,得P<0.05的检验水准,拒绝H0。 可以认为,两种方法的检出率不同,差别有统计学意义。 五、制表题(每题10分,共10分) 某研究利用常规药为对照评价新药的疗效。 服常规药228人中60人有效;服新药258人中80人有效。 试将上述资料用规范的统计表表示。 参考答案: 表1服用新药和常规药的有效率 药物 有效 无效 合计 有效率(%) 新药 80 178 258 31.01 常规药 60 168 228 26.32 合计 140 346 486 28.81 形考任务4 一、名词解释(每题5分,共20分) 1.简单线性回归——借助线性模型进行的回归称为线性回归。 两个变量之间的线性回归称为简单线性回归。 2.简单线性回归——借助线性模型进行的回归称为线性回归。 两个变量之间的线性回归称为简单线性回归。 3.Pearson相关系数——Pearson线性相关分析是用Pearson线性相关系数定量描述两个数值型变量之间线性相关的密切程度与方向的统计学方法。 Pearson总体相关系数用p表示,样本相关系数用表示,r是p的点估计。 4.添加变量的合并——是指将代表同一批研究对象不同特征的数据进行合并。 二、单项选择题(每题2分,共40分) 1.对变量X和Y做线性相关分析时,资料需要符合的条件是( ) A.X和Y有回归关系 B.X服从正态分布 C.Y服从正态分布 D.X和Y服从双变量正态分布 2.线性回归系数t检验的自由度是( ) A.n B.n-1 C.n-2 D.n-3 3.Pearson线性相关系数假设检验的无效假设H0是( ) A.ρ=0 B.ρ≠0 C.r=0 D.r≠0 4.散点图中各散点基本呈直线共变趋势,部分数据点在拟合的直线上,且随X值增大,Y值有增大趋势,说明两个变量之间可能有( ) A.负相关关系 B.正相关关系 C.完全负相关关系 D.完全正相关关系 5.用最小二乘法估计线性回归模型参数的原则是,各观测点距回归直线的( ) A.纵向距离之和最小 B.垂直距离的平方和最小 C.横向距离的平方和最小 D.纵向距离的平方和最小 6.对样本量n=10的资料估计相关系数并进行假设检验,得tr A.两个变量之间不存在相关关系 B.两个变量之间有线性相关关系的可能性小于5% C.尚不能认为两个变量之间存在相关关系 D.两个变量之间的相关关系有统计学意义 7.分析环境噪音强度与居民失眠患病率之间的关系可采用( ) A.Pearson相关分析 B.Spearman等级相关分析 C.直线回归分析 D.卡方检验 8.估计线性相关系数之前,应首先绘制的统计图是( ) A.散点图 B.饼图 C.直方图 D.直条图 9.下列各项中正确的是( ) A.r>0,一定有b>0 B.r>0,一定有b<0 C.r的正负与b的正负无关 D.r<0,一定有b>0 10.相关系数的取值范围是( ) A.r取任意实数 B.-1 C.-1≤r≤1 D.r取非负数 11.下列有关b和r关系的叙述,正确的是( ) A.同一样本b和r的显著性检验结果相同 B.同一样本b和r的显著性检验结果不同 C.同一样本b和r的显著性检验结果可能相同,也可能不同 D.同一样本b和r的显著性检验结果是无关的 12.已知tb1=tb2,则一定有( ) A.tr1=tr2 B.b1=b2 C.r1=r2 D.a1=a2 13.在数据中增加一个变量的操作所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学 国家 开放 大学 医学 统计学 任务 参考答案