高考数学一轮复习人教版用样本估计总体及统计图表名师精编学案.docx
- 文档编号:17903836
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:29
- 大小:246.09KB
高考数学一轮复习人教版用样本估计总体及统计图表名师精编学案.docx
《高考数学一轮复习人教版用样本估计总体及统计图表名师精编学案.docx》由会员分享,可在线阅读,更多相关《高考数学一轮复习人教版用样本估计总体及统计图表名师精编学案.docx(29页珍藏版)》请在冰点文库上搜索。
高考数学一轮复习人教版用样本估计总体及统计图表名师精编学案
第2节 用样本估计总体及统计图表
考试要求 1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;4.了解样本估计总体的取值规律;5.能用样本估计百分位数,理解百分位数的统计含义.
知识梳理
1.频率分布直方图
(1)频率分布表的画法:
第一步:
求极差,决定组数和组距,组距=
;
第二步:
分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:
登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:
反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示
,每个小矩形的面积表示样本落在该组内的频率.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.样本的数字特征
(1)众数:
一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:
把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:
把
称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:
设一组数据x1,x2,x3,…,xn的平均数为
,则这组数据的标准差和方差分别是
s=
,
s2=
[(x1-
)2+(x2-
)2+…+(xn-
)2].
4.百分位数
如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:
一组n个观测值按数值大小排列.如,处于p%位置的值称第p百分位数.
[微点提醒]
1.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为
,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m
+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
3.中位数相当于第50百分位数.
基础自测
1.判断下列结论正误(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )
解析
(1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×
=频率.
答案
(1)√
(2)× (3)√
2.(必修3P1002
(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4B.8C.12D.16
解析 设频数为n,则
=0.25,∴n=32×
=8.
答案 B
3.(必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
解析 ∵这组数据为87,89,90,91,92,93,94,96,
∴中位数是
=91.5,
平均数
=
=91.5.
答案 A
4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.
法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.
答案 A
5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
解析 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.
答案 C
6.(2019·上海黄浦区质检)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的
,则该组的频数为________.
解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为
p,p+
p=1,p=
,则中间一个小矩形的面积等于
p=
,200×
=50,即该组的频数为50.
答案 50
考点一 频率分布直方图
【例1】(2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:
[20,25),第二组:
[25,30),第三组:
[30,35),第四组:
[35,40),第五组:
[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
解
(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴
=0.05,∴x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=
≈32,则中位数为32.
(3)(ⅰ)5个年龄组成绩的平均数为
1=
×(93+96+97+94+90)=94,方差为s
=
×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为
2=
×(93+98+94+95+90)=94,方差为s
=
×[(-1)2+42+02+12+(-4)2]=6.8.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).
规律方法 1.频率分布直方图的性质.
(1)小长方形的面积=组距×
=频率;
(2)各小长方形的面积之和等于1;
(3)小长方形的高=
,所有小长方形的高的和为
.
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
【训练1】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频率分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户和满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?
说明理由.
解
(1)作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:
“A地区用户的满意度等级为不满意”;
CB表示事件:
“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,
P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
考点二 样本的数字特征
【例2】
(1)(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
(2)(2019·聊城模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为
,方差为s2,则( )
A.
=4,s2<2B.
=4,s2>2
C.
>4,s2<2D.
>4,s2>2
解析
(1)刻画评估这种农作物亩产量稳定程度的指标是标准差.
(2)∵某7个数的平均数为4,
∴这7个数的和为4×7=28,
∵加入一个新数据4,∴
=
=4.
又∵这7个数的方差为2,且加入一个新数据4,
∴这8个数的方差s2=
=
<2,故选A.
答案
(1)B
(2)A
规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【训练2】抽样统计甲、乙两位射击运动员的5次训练成绩(单位:
环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
解析
甲=
(87+91+90+89+93)=90,
乙=
(89+90+91+88+92)=90,
s
=
[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
s
=
[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
答案 2
[思维升华]
1.用样本估计总体是统计的基本思想.
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.
2.
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.
3.频率分布表和频率分布直方图都可直观描述样本数据的分布规律.
[易错防范]
直方图与条形图不要搞混
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
数据分析——百分位数的统计含义
1.数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:
收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.
2.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.
3.数据分析主要表现为:
收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.
4.百分位数是统计学述语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.
【案例】阶梯电价的设计(此材料见2017版课程标准P130)
[情境] 为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:
kW·h),以了解这个城市家庭用电量的情况.数据如下:
107 101 78 99 208 127 74 223 31 131
214135896660115189135146127
20397966265111561511068
1629167932121596163178194
194216101981397811019210596
22501382511201121002019884
137203260134156617010072164
17413193100163807695152182
882471917013049114110163202
265189414614914717733957109
10718210114827428982213165224
142611081379025420183253113
130821701101086325023712084
15428817012317231962133130127
107719614077106132106135132
167822585425110769987248
10913425042320113180144116530
200174135160462139133304191283
121132118134124178206626120274
14180187883241364981697757
根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?
[分析]选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:
75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.
通过样本估计总体百分位数的要领是对样本数据进行排序,得到有序样本(在统计学中称之为顺序统计量).利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:
8182231424849505156
57576061616162626363
65666769707071727274
76777778788080828282
83848488888990919393
94959696969798989899
100100100101101101105106106106
107107107107108108109109110110
110111112113113114115116118120
120120121123124127127127130130
130131131132132132133133134134
134135135135135136137137138139
139140141142144416146147148149
151152154156159160162163163164
165167169170170172174174177178
178180182182187189191191192194
194200201201202203203206208212
213214216223224237247250250251
253254258260265274274283288289
304319320324339462498530542626
样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8kW·h,最大用电量为626kW·h,极差为618.初中统计内容中学过的中位数,相当于50%分位数.因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130kW·h左右.
下面确定75%和95%这两个电量临界值.类似中位数的计算,因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).
依据确定了的电量临界值,阶梯电价可以规定如下:
用户每月用电量不超过178kW·h(或每年用电量不超过2136kW·h),按第一档电价标准缴费;每月用电量(单位:
kW·h)在区间(178,297]内(或每年用电量在区间(2136,3564]内),其中的178kW·h按第一档电价标准缴费,超过178kW·h的部分按第二档电价标准缴费;每月用量超过297kW·h(或每年用电量超过3564kW·h),其中的178kW·h按第一档电价标准缴费,(297-178)=119kW·h按第二档电价标准缴费,超过297kW·h的部分按第三档电价标准缴费.
社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.
评析 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.对第p百分位数,严格的定义如下:
第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.
【案例应用1】对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题.也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.
【案例应用2】假设想为退休存够钱.可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%.所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%.
基础巩固题组
(建议用时:
40分钟)
一、选择题
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45B.50C.55D.60
解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.
∴该班学生人数n=
=50.
答案 B
2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )
A.甲B.乙C.丙D.丁
解析 由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.
答案 C
3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析 由图可得,
甲=
=6,
乙=
=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考 数学 一轮 复习 人教版用 样本 估计 总体 统计 图表 名师 精编