人大《统计学》第四版复习Word文件下载.docx
- 文档编号:3338838
- 上传时间:2023-05-01
- 格式:DOCX
- 页数:18
- 大小:152.89KB
人大《统计学》第四版复习Word文件下载.docx
《人大《统计学》第四版复习Word文件下载.docx》由会员分享,可在线阅读,更多相关《人大《统计学》第四版复习Word文件下载.docx(18页珍藏版)》请在冰点文库上搜索。
1521241291161001039295127104
10511911411587103118142135125
117108105110107137120136117108
9788123115119138112146113126
要求:
⑴根据上面的数据进行适当的分组,编制频数分布,并计算出累计频数和累计频率。
⑵按规定,销售收入在125万元以上的为先进企业,115万元—125万元为良好企业,105万元—115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
解:
⑴频数分布表如下:
40个企业按产品销售收入分组表
按产品销售收入分组(万元)
企业数(个)
向上累计
向下累计
企业数
频率
100以下
100-110
110-120
120-130
130-140
140以上
5
9
12
7
4
3
12.5
22.5
30.0
17.5
10.0
7.5
26
33
37
40
35.0
65.0
82.5
92.5
100.03
35
100.0
87.5
--
⑵某管理局下属40个企业分组表
销售收入(万元)
先进企业
良好企业
一般企业
落后企业
11
27.5
22.5
3.3某百货公司连续40天的商品销售额如下:
单位:
万元
41252947383430384340
46364537373645433344
35284634303744263844
42363737493942323635
要求:
根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
解:
频数分布表如下:
某百货公司日商品销售额分组表
按销售额分组(万元)
频数(天)
25—30
30—35
35—40
40—45
45—50
6
15.0
37.5
直方图(略)。
4.2随机抽取25个网络用户,得到他们的年龄数据如下:
单位:
周岁
1915292524
2321382218
3020191916
2327223424
4120311723
(1)计算众数、中位数.
(2)根据定义公式计算四分位数.
(3)计算平均数和标准差.
(4)计算偏态系数和峰态系数.
(5)对网民年龄的分布特征进行综合分析.
(1)众数19、23中位数23
(2)下四分位数19上四分位数26.5
(3)平均数
=24标准差S=
=6.6521
峰度
0.772705
偏度
1.08011
(4)
(5)根据以上计算结果可知,网民年龄的分布特征正偏分布,年龄主要集中在19岁左右.
P1104.5甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品名称
单位成本
(元)
总成本(元)
甲企业
乙企业
10
20
30
2100
3000
1500
3255
比较哪个企业的总平均成本高,并分析其原因。
(元)
甲企业的总平均成本高,因为这个企业单位成本低的产品产量比乙企业少,而单位成本较高的产品产量比乙企业多,使其总平均成本高。
4.11对10名成年人和10名幼儿的身高(单位:
厘米)进行抽样调查,结果如下:
成年组
166
169
172
177
180
170
174
168
173
幼儿组
68
69
70
71
73
72
74
75
(1)要比较成年组和幼儿组的身高差异,应采用什么样的指标测度?
为什么?
(2)比较分析哪一组的身高差异大。
(1)离散系数 因为二个组标志值水平不同,用离散系数可以消除其影响。
(2)
成年组:
标准差S=
=4.2019(厘米)
平均数
=172.1(厘米)
标准差系数
=2.44%
幼儿组:
=2.4967(厘米)
=71.3厘米
=3.5%
幼儿身高差异大.
P154
5.16设X∽N(3,4),求:
⑴P{|X|>2};
⑵P{X>3}。
⑴P{|X|>2}=1-P{|X|≤2}=1-p{-2≤X≤2}
=1-p{(-2-3)/2≤(X-3)/2≤(2-3)/2}
=1-[Φ(-1/2)-Φ(-5/2)]=1-{[1-Φ(1/2)]-[1-Φ(5/2)]}=0.6977
⑵P{X>3}=1-P{X≤3}=1-P{(X-3)/2≤(3-3)/2}=1-Φ(0)=1-0.5=0.5
5.17一工厂生产的电子管寿命X(以小时计算)服从期望值为μ=160正态分布,若要求p{120<X<200}≥0.08,允许标准差σ最大为多少?
(Ф(0.11)≥0.54)
p{120<X<200}=Φ(40/σ)-Φ(-40/σ)=2Φ(40/σ)-1=0.08
则Φ(40/σ)=0.5440/σ=0.11所以σ=363即允许标准差σ最大为363.
5.18一本书排版后一校时出现错误处数X服从正态分布N(200,400),求:
(Ф(0.5)=0.69145Ф(1.5)=0.9332)
(1)出现错误处数不超过230的概率;
(2)出现错误处数在190-210之间的概率。
(1)出现错误处数不超过230的概率
p{X≤230}=Φ[(230-200)/20]=Φ(1.5)=0.9332
或p{X≤230}=0.5+1/2F[(230-200)/20]=0.5+1/2F(1.5)=0.5+1/2*0.8664=0.9332
(2)出现错误处数在190-210之间的概率:
p{190≤X≤210}=F(10/20)=F(0.5)=0.3829
P173
6.1调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差σ=1盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
2、调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差σ=1盎司的正态分布。
如果我们希望样本均值偏离总体均值在0.3盎司之内的概率达到0.95,应当抽取多大的样本?
7.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差;
(2)在95%的置信水平下,求估计误差;
(3)如果样本均值为120元,求总体均值95%的置信区间。
(1)假定总体标准差为15元,
样本均值的抽样标准误差=σ/
=15/
=2.143(元)
(2)在95%的置信水平下,
边际误差=Z
=1.96*2.143=4.2(元)
上限=120+4.2=124.2(元)
下限=120-4.2=115.8(元)
7.8从一个正态总体中随机抽取容量为8的样本,各样本值分别为:
10,8,12,15,6,13,5,11。
求总体均值95%的置信区间。
n=8样本平均数
=10S=
=3.464
α=0.05时,tα/2(n-1)=2.3646
=
=3.464/
=1.225(小时)
置信区间:
上限=10+2.3646*1.225=12.897
下限=10-2.3646*1.225=7.103
7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g。
现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:
g)如下:
每包重量(g)
包数
96—98
98—100
2
3
100—102
102—104
104—106
34
7
4
50
已知食品包重量服从正态分布,要求:
(1)确定该种食品平均重量的95%的置信区间。
(2)如果规定食品重量低于100g属于不合格,确定该批食品合格率的95%的置信区间。
7.18某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。
采取不重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。
(2)如果小区管理者预计赞成的比例能达到80%,估计的边际误差不超过10%.应抽取多少户进行调查(α=0.05)?
8.1已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484。
如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55?
(α=0.05)
μ0=4.55σ=0.108n=9平均数=4.484
①H0:
μ=4.55H1:
μ≠4.55
②Z=
=(4.484-4.55)/0.108/3=-1.833
③取α=0.05查表得:
-Zα/2=-Z0.025=-1.96
④因为︱Z︱<︱Zα/2︱
所以接受H0,即可以认为生产的铁水平均含碳量为4.55.
8.2一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
μ0=700小时σ=60n=36平均数=680小时
μ≥700H1:
μ<700
=(680-700)/60/6=-2
-Zα=-Z0.05=-1.645
④因为Z<-Zα
所以拒绝H0,即这批元件不合格.
8.3某地区小麦的一般生产水平为亩产250kg,其标准差为30kg。
现用一种化肥进行试验,从25个小区抽样结果,平均产量为270kg。
问这种化肥是否使小麦明显增产。
μ0=250公斤σ=30公斤n=25平均数=270公斤
μ≤250H1:
μ>250
=(270-250)/30/5=3.333
Zα=Z0.05=1.645
④因为Z>Zα
所以拒绝H0,即这批化肥能使小麦明显增产.
8.4糖厂用自动打包机打包,每包标准重量是100kg。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量如下:
99.398.7100.5101.298.399.799.5102.1100.5
已知包重服从正态分布,试检验该日打包机工作是否正常。
μ0=100公斤s=1.212n=9平均数=99.98
μ=100H1:
μ≠100
②t=
=(99.98-100)/1.212/3=-0.049
tα/2(n-1)=t0.025(8)=2.306
④因为︱t︱<︱tα/2(n-1)︱
所以接受H0,即该日打包机工作正常.
8.5某种大量生产的袋装食品,按规定不得少于250g。
今从一批该食品中任意抽取50袋,发现有6袋低于250g。
若规定不符合标准的比例超过5%就不得出厂,该批食品能否出厂?
μ0=250克n=50л0=5%P=12%
л0≤5%H1:
л0>5%
=(12%-5%)/0.031=2.258
所以拒绝H0,即这批食品不能出厂.
11.1、从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号
产量(台)
生产费用(万元)
1
5
6
40
42
55
65
78
130
150
155
140
154
8
9
10
11
12
84
100
116
125
165
170
167
180
175
185
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
(2)计算产量与生产费用之间的线性相关系数。
(3)对相关系数的显著性进行检验(α=0.05),并说明二者之间的关系密切程度。
⑴图略
⑵经计算得:
n=12
线性相关系数
=0.9202
⑶
构造检验统计量:
取α=0.05,查表得
拒绝原假设,说明生产费用与产量之间线性相关关系显著.
11.2学生在期末考试之前用于复习的时间(单位:
h)和考试分数(单位:
分)之间是否有关系?
为研究这一问题,一位研究者抽取了8名学生构成的一个随机样本,得到的数据如下:
复习时间x
2016342327321822
考试分数y
6461847088927277
⑴绘制复习时间和考试分数的散点图,判断二者之间的关系形态.
⑵计算相关系数,说明二个变量之间的关系强度.
⑴复习时间和考试分数的散点图(略).
⑵计算相关系数
=0.8621
说明复习时间和考试分数之间高度相关.
11.3根据一组数据建立的线性回归方程为
⑴解释截距
的意义.
⑵解释斜率
⑶计算当
时的
。
⑴截距
=10,说明自变量x为0时,因变量y的起始值.
⑵斜率
=--0.5说明自变量x每增加一个单位,因变量y平均减少0.5个单位.
⑶当
时,
=
=7。
11.4设SSR=36,SSE=4,n=18,要求:
(1)计算判定系数R2并解释其意义。
(2)计算估计标准误差Se并解释其意义。
(1)
说明因变量取值变动中,有90%是因为自变量变动影响的。
其值越小因变量的估计误差越小,回归直线的拟合优度越好。
11.5一家物流公司的管理人员想研究货物的运送距离与运送时间的关系,为此,他抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:
km)和运送时间(单位:
天)的数据如下:
运送距离x
825215107055048092013503256701215
运送时间y
3.51.04.02.01.03.04.51.53.05.0
(1)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(2)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(n=10Σx=7620Σx2=7104300Σy=28.5Σy2=99.75Σxy=26370)
⑴经计算得:
=0.9489
说明两个变量之间的关系很密切。
(2)
=(nΣxy-ΣxΣy)/[nΣx2-(Σx)2]=0.0036
=Σy/n-
Σx/n=0.118所以
+
x=0.118+0.0036x
=0.0036说明运送距离每增加1km,运送时间平均增加0.0036天.
(注:
文档可能无法思考全面,请浏览后下载,供参考。
)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 人大 第四 复习