知识梳理与自测人教A版文科数学《103用样本估计总体》.docx
- 文档编号:14983617
- 上传时间:2023-06-29
- 格式:DOCX
- 页数:33
- 大小:317.52KB
知识梳理与自测人教A版文科数学《103用样本估计总体》.docx
《知识梳理与自测人教A版文科数学《103用样本估计总体》.docx》由会员分享,可在线阅读,更多相关《知识梳理与自测人教A版文科数学《103用样本估计总体》.docx(33页珍藏版)》请在冰点文库上搜索。
知识梳理与自测人教A版文科数学《103用样本估计总体》
§10.3 用样本估计总体
最新考纲
考情考向分析
1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数,标准差),并做出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
主要考查平均数,方差的计算以及茎叶图与频率分布直方图的简单应用;题型以选择题和填空题为主,出现解答题时经常与概率相结合,难度为中低档.
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
4.众数、中位数、平均数
数字特征
概念
优点与缺点
众数
一组数据中重复出现次数最多的数
众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数
把一组数据按从小到大顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数
=
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
5.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离.
(2)标准差:
s=
.
(3)方差:
s2=
[(x1-
)2+(x2-
)2+…+(xn-
)2](xn是样本数据,n是样本容量,
是样本平均数).
概念方法微思考
1.在频率分布直方图中如何确定中位数?
提示 在频率分布直方图中,中位数左边和右边的直方图的面积是相等的.
2.平均数、标准差与方差反映了数据的哪些特征?
提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.
题组一 思考辨析
1.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )
题组二 教材改编
2.[P100A组T2
(1)]一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4B.8C.12D.16
答案 B
解析 设频数为n,则
=0.25,
∴n=32×
=8.
3.[P81A组T1]若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
答案 A
解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是
=91.5,
平均数
=
=91.5.
4.[P71T1]如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有______人.
答案 25
解析 0.5×0.5×100=25.
题组三 易错自纠
5.若数据x1,x2,x3,…,xn的平均数
=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2B.16,2
C.16,18D.16,9
答案 C
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴
=5,
∴
+1=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为
,则m,n,
的大小关系为________.(用“<”连接)
答案 n 解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5; = ≈5.97. 故n . 题型一 统计图表及应用 命题点1 扇形图 例1(2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图: 则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案 A 解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表: 新农村建设前 新农村建设后 新农村建设后变化情况 结论 种植收入 60%a 37%×2a=74%a 增加 A错 其他收入 4%a 5%×2a=10%a 增加了一倍以上 B对 养殖收入 30%a 30%×2a=60%a 增加了一倍 C对 养殖收入+第三产业收入 (30%+6%)a=36%a (30%+28%)×2a=116%a 超过经济收入2a的一半 D对 故选A. 命题点2 折线图 例2(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位: 万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 答案 A 解析 对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错; 对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确; 对于选项C,D,由图可知显然正确. 故选A. 命题点3 茎叶图 例3(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位: 件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( ) A.3,5B.5,5C.3,7D.5,7 答案 A 解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等, ∴ ×(56+65+62+74+70+x)= ×(59+61+67+65+78),∴x=3.故选A. 命题点4 频率分布直方图 例4某高校调查了200名学生每周的自习时间(单位: 小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) A.56B.60C.120D.140 答案 D 解析 设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D. 思维升华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势. (3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐. (4)①准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆. ②在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布. 跟踪训练1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( ) A.各月的平均最低气温都在0℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于20℃的月份有5个 答案 D 解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D. (2)(2018·黔东南州联考)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间[30,40)内的有2500人,在区间[20,30)内的有1200人,则m的值为( ) A.0.013B.0.13 C.0.012D.0.12 答案 C 解析 由题意,得年龄在区间[30,40)内的频率为0.025×10=0.25, 则赞成高校招生改革的市民有 =10000(人), 因为年龄在区间[20,30)内的有1200人, 所以m= =0.012. (3)(2018·长春质检)已知某班级部分同学一次测验的成绩统计如图所示,则其中位数和众数分别为( ) A.95,94B.92,86C.99,86D.95,91 答案 B 解析 由题中茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故中位数为92,出现次数最多的为众数,故众数为86,故选B. (4)下图是2017年1~11月汽油、柴油价格走势图(单位: 元/吨),据此下列说法错误的是( ) A.从1月到11月,三种油里面柴油的价格波动最大 B.从7月份开始,汽油、柴油的价格都在上涨,而且柴油价格涨速最快 C.92#汽油与95#汽油价格成正相关 D.2月份以后,汽油、柴油的价格同时上涨或同时下跌 答案 D 解析 由价格折线图,不难发现4月份到5月份汽油价格上涨,而柴油价格下跌. 题型二 用样本的数字特征估计总体的数字特征 例5(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组: [20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图: (1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4, 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30, 所以样本中的男生人数为30×2=60, 女生人数为100-60=40, 所以样本中男生和女生人数的比例为60∶40=3∶2, 所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2. 思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小. 跟踪训练2(2018·漳平模拟)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下: (a,b),(a, ),(a,b),( ,b),( , ),(a,b),(a,b),(a, ),( ,b),(a, ),( , ),(a,b),(a, ),( ,b),(a,b),其中a, 分别表示甲组研发成功和失败;b, 分别表示乙组研发成功和失败. (1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平; (2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数 甲= = ; 方差为s = × = . 乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数 乙= = ; 方差为s = × = . 因为 甲> 乙,s ,所以甲组的研发水平优于乙组. (2)记恰有一组研发成功为事件E,在所抽得的15个结果中,恰有一组研发成功的结果是(a, ),( ,b),(a, ),( ,b),(a, ),(a, ),( ,b),共7个.因此事件E发生的频率为 .用频率估计概率,即得所求概率为P(E)= . 1.某教育局为了解“跑团”每月跑步的平均里程,收集并整理了2018年1月至2018年11月期间“跑团”每月跑步的平均里程(单位: 公里)的数据,绘制了下面的折线图. 根据折线图,下列结论正确的是( ) A.月跑步平均里程的中位数为6月份对应的里程数 B.月跑步平均里程逐月增加 C.月跑步平均里程高峰期大致在8,9月 D.1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳 答案 D 解析 由折线图知,月跑步平均里程的中位数为5月份对应的里程数; 月跑步平均里程不是逐月增加的; 月跑步平均里程高峰期大致在9,10月份,故A,B,C错. 2.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( ) A.32 34 32 B.33 45 35 C.34 45 32 D.33 36 35 答案 B 解析 从茎叶图中知共16个数据,按照从小到大排序后中间的两个数据为32,34,所以这组数据的中位数为33; 45出现的次数最多,所以这组数据的众数为45; 最大值是47,最小值是12,故极差是35. 3.从某中学甲、乙两班各随机抽取10名同学,测量他们的身高(单位: cm),所得数据用茎叶图表示如下,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是( ) A.甲班同学身高的方差较大 B.甲班同学身高的平均值较大 C.甲班同学身高的中位数较大 D.甲班同学身高在175cm以上的人数较多 答案 A 解析 逐一考查所给的选项: 观察茎叶图可知甲班同学数据波动大, 则甲班同学身高的方差较大,A选项正确; 甲班同学身高的平均值为 =169.2, 乙班同学身高的平均值为: =171, 则乙班同学身高的平均值大,B选项错误; 甲班同学身高的中位数为 =168, 乙班同学身高的中位数为 =171.5, 则乙班同学身高的中位数大,C选项错误; 甲班同学身高在175cm以上的人数为3人, 乙班同学身高在175cm以上的人数为4人, 则乙班同学身高在175cm以上的人数多,D选项错误. 4.为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位: 元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n等于( ) A.180B.160C.150D.200 答案 A 解析 [30,50]对应的概率为1- ×10=0.65,所以n= =180. 5.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为( ) A.20B.25C.22.5D.22.75 答案 C 解析 产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5, 得x=22.5,故选C. 6.北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是( ) A.第一季度B.第二季度 C.第三季度D.第四季度 答案 B 解析 从题设中提供的图象及数据分析可以看出: 第二季度的三个月中PM2.5的平均浓度指数较为平缓,差异不大较为整齐,因此其方差最小,故选B. 7.已知样本数据x1,x2,…,xn的平均数 =5,则样本数据2x1+1,2x2+1,…,2xn+1的平均数为________. 答案 11 解析 由x1,x2,…,xn的平均数 =5,得2x1+1,2x2+1,…,2xn+1的平均数为2 +1=2×5+1=11. 8.从某企业的某种产品中抽取1000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图,假设这项指标在[185,215]内,则这项指标合格,估计该企业这种产品在这项指标上的合格率为________. 答案 0.79 解析 这种指标值在[185,215]内,则这项指标合格, 由频率分布直方图得到这种指标值在[185,215]内的频率为(0.022+0.033+0.024)×10=0.79, 所以估计该企业这种产品在这项指标上的合格率为0.79. 9.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位: 年)进行追踪调查的结果如下: 甲: 3,4,5,6,8,8,8,10; 乙: 4,6,6,6,8,9,12,13; 丙: 3,3,4,7,9,10,11,12. 三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数. 甲: ________;乙: ________;丙: ________. 答案 众数 平均数 中位数 解析 甲的众数为8,乙的平均数为8,丙的中位数为8. 10.某校女子篮球队7名运动员身高(单位: cm)分布的茎叶图如图,已知记录的平均身高为175cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为________. 答案 2 解析 170+ ×(1+2+x+4+5+10+11)=175, ×(33+x)=5,即33+x=35,解得x=2. 11.某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图: (1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少? (2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费. 解 (1)如题图所示,用水量在[0.5,2)的频率的和为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85. ∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w为整数, ∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3. (2)当w=3时,该市居民该月的人均水费估计为 (0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元). 即当w=3时,该市居民该月的人均水费估计为10.5元. 12.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表. A地区用户满意度评分的频率分布直方图 图① B地区用户满意度评分的频数分布表 满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6 (1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可); B地区用户满意度评分的频率分布直方图 图② (2)根据用户满意度评分,将用户的满意度分为三个等级: 满意度评分 低于70分 70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大? 说明理由. 解 (1)作出频率分布直方图如图: 通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散. (2)A地区用户的满意度等级为不满意的概率大. 记CA表示事件: “A地区用户的满意度等级为不满意”;CB表示事件: “B地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.01+0.02+0.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 103用样本估计总体 知识 梳理 自测 文科 数学 103 样本 估计 总体