统计学答案.docx
- 文档编号:6054480
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:20
- 大小:105.96KB
统计学答案.docx
《统计学答案.docx》由会员分享,可在线阅读,更多相关《统计学答案.docx(20页珍藏版)》请在冰点文库上搜索。
统计学答案
统计学课本课后作业题(全)题目:
第1章:
P116,7
第2章:
P52练习题3、9、10、11
第3章:
P116思考题12、14练习题16、25
第4章:
P114思考题6,练习题2、4、6、13
第5章:
P179思考题4、练习题3、4、6、11第6章:
P209思考题4、练习题1、3、6第7章:
P246思考题1、练习题1、7第8章:
P287思考题4、10练习题2、3
第一章6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536kg。
要求:
(1)描述总体;最近的一个集装箱内的全部油漆;
(2)描述研究变量;装满的油漆罐的质量;
(3)描述样本;最近的一个集装箱内的50罐油漆;
(4)描述推断。
50罐油漆的质量应为X50=226.8kg。
7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而
1000名消费者进行匿名
颇具特色。
假定作为百事可乐营销战役的一部分,选择了
性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者
说出A品牌或B品牌中哪个口味更好。
要求:
答:
(1)总体:
市场上的“可口可乐”与“百事可乐”
(2)研究变量:
更好口味的品牌名称;
(3)样本:
1000名消费者品尝的两个品牌
(4)推断:
两个品牌中哪个口味更好。
第二章
3.某百货公司连续40天的商品销售额如下(单位:
万元):
41
25
29
47
38
34
30
38
43
40
46
36
45
37
37
36
45
43
33
44
35
28
46
34
30
37
44
26
38
44
42
36
37
37
49
39
42
32
36
35
根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
解:
采用等距分组
全距=49-25=24
n=40取组距为5,则组数为24/5=取5组
频数分布表:
按销售额分组(万元)
频数(天数)
25-30
4
30-35
6
35-40
15
40-45
9
45-50
6
40
合计
9.某百货公司6月份各天的销售额数据如下(单位:
万元):
257
276
297
252
238
310
240
236
265
278
271
292
261
281
301
274
267
280
291
258
272
284
268
303
273
263
322
249
269
295
(1)计算该百货公司日销售额的均值、中位数和四分位数;
(2)计算日销售额的标准差。
解:
(1)X^7^=8I23=(万元)
将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第
16两个数272和273的平均数:
Me=272273二(万元)2
由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1〜第15
个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的第8位是261,第15位是272,从而:
Ql=261+273272二(万元)
4
同理,后四分位数位于第
16〜第30个数据的中间位置(第23位)靠下四分之一的
位置上,由重新排序后第
23位是291,第16位是273,从而:
Qu=291273272
4
(万元)。
30-2
(XiX)
(2)未分组数据的标准差计算公式为:
s=''."得s=
\n1
10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品
名称
单位成本
(元)
总成本(兀)
甲企业
乙企业
A
15
2100
3255
B
20
3000
1500
C3015001500
比较哪个企业的总平均成本高?
并分析其原因。
解:
设产品单位成本为x,产量为f,则总成本为xf,由于:
平均成本
-xf总成本
X二=
f总产量
而已知数据中缺产量
f的数据,又因个别产品产量
xf
,于是得
xf
210030001500
210030001500
15"20^0
xf_325515001500
f_325515001500
x152030
均成本较高。
原因:
尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
11.在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元)
企业数(个)
200〜300
19
300〜400
30
400〜500
42
500〜600
18
600以上
11
合计
120
计算120家企业利润额的均值和标准差。
解:
设各组平均利润为X,企业数为f,则组总利润为xf,
由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:
按利润额分组(万元)
组中值
企业数(个)
总利润
xf
X
f
200〜300
250
19
4750
300〜400
350
30
10500
400〜500
450
42
18900
500〜600
550
18
9900
600以上
650
11
7150
合计
——
120
51200
于是,120家企业平均利润为:
亲二一^二空凹二(万元);
f120
(XiX)2f
1614666.668=(万元)。
1201
第3章
思考练习:
12解析总体分布、样本分布和抽样分布的含义总体分布:
就是与总体相联系的随机变量的概率分布样本分布:
是与样本相联系的随机向量的联合概率分布抽样分布:
就是作为样本的函数的统计量的分布
14解析中心极限定理的含义:
是阐述大量随机变量之和的分布趋近于正态分布的一系列定理的总称。
16某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为
30小时若规定寿命低于150小时为不合格品。
试求
(1)该企业生产的电池的合格率是多少?
(2)该企业生产的寿命在200小时左右的多大范围内的概率不小于?
解
(1)P(X150)P(Z150200)=p(z1.6667)=
30
合格率为=或%。
(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于,即有:
即:
P{ZK}0.95,&30>,故K>0
30
25某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。
如果生产工艺操作正确,则他生产的夹
克级别应平均840牛顿,标准差15牛顿。
国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。
为了检查其生产过程是否正常,某检验
人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x,
即该样本中夹克级别的均值。
她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。
⑴如果该生产过程仍旧正常,则x的样本分布为何?
⑵假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正
常的话,样本均值X<830牛顿的概率是多少?
⑶在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产
过程的现状有何看法(即夹克级别均值是否仍为840牛顿)?
⑷现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到
了45牛顿。
在这种情况下X的抽样分布是什么?
当X具有这种分布时,则X<830牛顿的概率是多少?
第四章参数估计
6简述样本量与置信水平、总体方差、允许误差的关系。
样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比
2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49
名顾客组成了一个简单随机样本
(1)假定总体标准差为15元,求样本均值的抽样标准误差;
(2)在95%勺置信水平下,求允许误差;
(3)如果样本均值为120元,求总体均值95%勺置信区间。
解:
(1)已假定总体标准差为b=15元则样本均值的抽样标准误差为
(T15
(2)已知置信水平1—a=95%得Za/2二,于是,允许误差是
a/2
=X=。
(3)已知样本均值为X=120元,置信水平1—a=95%得乙/2=,
这时总体均值的置信区间为XZa/2T=120±=124.2
vn\115.8
可知,如果样本均值为120元,总体均值95%勺置信区间为(,)元。
4.从一个正态总体中随机抽取容量为8的样本,各样本值分别为:
解:
(,)。
6.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品
牌的电视机。
其中拥有该品牌电视机的家庭占23%求总体比率的置信区间,置信水平分别为90呀口95%
解:
已知样本容量n=200,为大样本,拥有该品牌电视机的家庭比率p=23%,
拥有该品牌电视机的家庭比率的抽样标准误差为
n\200
⑴双侧置信水平为90%寸,通过2p—1二换算为单侧正态分布的置信水平B二,
查单侧正态分布表得乙/2=,
此时的置信区间为pJ厂P)=23%tx%=27.89%
Yn\18.11%
可知,当置信水平为90%寸,拥有该品牌电视机的家庭总体比率的置信区
间为(%,%)O
⑵双侧置信水平为95%寸,得乙/2=,
此时的置信区间为p乙厂p(1p)=23%±x%=28.8408%
Yn\17.1592%
可知,当置信水平为95%寸,拥有该品牌电视机的家庭总体比率的置信区间为;
(%,%)O
13.根据以往的生产数据,某种产品的废品率为2%如果要求95%勺置信区间,若
要求允许误差不超过4%应抽取多大的样本?
0.042
解:
已知总体比率=2%=,由置信水平1-a=95%得置信度Z/2二,允许误差E
<4%即由允许误差公式
E=Za/2里整理得到样本容量n的计算公式:
a2、2
a2°P、2_,Zn1-n、2_Zaan1-n、1.960.020.98
n_()_()=2/
EEE2
由于计算结果大于47,故为保证使“》”成立,至少应取48个单位的样本。
第五章
4什么是P值?
P值检验决策的意义是什么?
答:
p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。
P值常常作为观察到的数据与原假设不一致程度的度量。
统计量检验采用事先确定显着性水平,来控制犯第一类错误的上限,p值可以有效地补充提供地关于检验可靠性的有限信息。
p值检验的优点在于,它提
供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显着性。
3一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60g一袋的那种土豆片的重量不符合。
店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(g)
u进行检验,
假设陈述如下:
Ho:
u>=60H1:
u<60
(1)与这一假设检验问题相关联的第I类错误是什么?
(2)与这一假设检验问题相关联的第II类错误是什么?
(3)你认为连锁店的顾客们会将哪类错误看得较为严重?
而供应商会将哪类错误看得较为严重?
(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
4某种纤维原有平均强度不超过6g,现希望通过改进工艺来提高其平均强度。
研究人员测得了100个关于新纤维的强度数据,发现其均值为。
假定纤维强度的标准差仍保持为不变,在5%的显着性水平下对该问题进行假设检验。
(1)选择检验统计量并说明其抽样分布是什么样的。
(2)检验的拒绝规则是什么?
(3)计算检验统计量的值,你的结论是什么?
(1)检验统计量zx,在大样本情形下近似服从标准正态分布;
s/Jn
(2)如果zZ0.05,就拒绝H0;
(3)检验统计量z=>,所以应该拒绝H0。
。
6一个视频录像设备(VCR)的平均使用寿命为6年,标准差为年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。
试构造「
个假设检验,能够帮助判定电视的使用寿命的方差是否显着大于视频录像设备的
使用寿命的标准差,
并在
a=
的显着性水平下作出结论。
解:
提出假设H0
2
:
TV
2
VCR
222
0.75,H1:
TV0.75
已知:
n
30,s2
2,
0.05
检验统计量2
n
1s2
29*22
——r103爲52942.557
0.7520.05
2
VCR
拒绝H0,可判定电视使用寿命的方差显着大于VCR
11为比较新旧两种肥料对产量的影响,一边决定是否采用新肥料。
研究者选择了
面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数
据如下表
旧肥料
新肥料
109
1
01
9798
105
109
110
118
109
100
113
111
111
99
112
98
98
94
99
106
117
99
107
119
104
110
111
103
110
119
103
88
108
102
106
97
105
102104
101
取显着性水平a二,用Excel检验
(1)检验结果如下:
t-检验:
双样本等方差假设
变量1变量2
平均
方差
观测值2020
合并方差
假设平均差0
df38
tStat
P(T<=t)单尾
t单尾临界
P(T<=t)双尾t双尾临界t-检验:
双样本异方差假设
变量1变量2
平均
方差
观测值
2020
假设平均差
0
df
37
tStat
P(T<=t)单尾
t单尾临界
P(T<=t)双尾
t双尾临界
(2)方差检验结果如下:
F-检验双样本方差分析
变量1变量2
平均
方差
观测值
2020
df
1919
F
P(F<=f)单尾
F单尾临界
第六章
4简述方差分析的基本思想。
是对比不同影响水平下整体方差和组间方差的差异,即不同水平的数据间方差和随机方差的对比
1从三个总体中各抽取容量不同样本数据,得到的资料见表。
检验3个总体的均值之间
是否有显着差异。
(a=)
三个总体抽取的样本数据
样本1
样本一
样本三
158
153
169
148
142
158
161
156
180
154
149
169
F4.6574Fo.oi8.0215(或Pvalue0.04090.01),不能拒绝原假设。
3某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品
数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。
通过对每个工人生产的产品数进行方差分析得到的结果
(1)完成下面的方差分析表
方差分析表中所缺的数值如下表:
差异源
SS
df
MS
F
P-value
Fcrit
组间
420
2
210
组内
3836
27
——
——
——
总计
4256
29
——
——
——
——
(2)若显着性水平a二,检验三种方法组装的产品数量之间是否有显着差异。
6为检验广告媒体和广告方案对产品销售的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售数据如表。
广告方案广告媒体
报纸
电视
A
8
12
12
8
B
22
26
14
30
C
10
18
18
14
检验广告方案、
广告媒体或其交互作用对销售量的影响是否显着。
(a=)
F广告方案10・75
F0.055.1432(或Pvalue0.01040.05),拒绝原假设。
F广告媒体3F0.055.9874(或P
value0.13400.05),不能拒绝原假设。
F交互作用1.75F°.o55.1432(或Pvalue0.25190.05),不能拒绝原假设。
第七章
1相关分析与回归分析的区别和联系是什么?
答:
相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。
回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。
但它们在研究目的和对变量的处理上有明显区别。
它们均是统计方法,不能揭示现象之间的本质关系。
1.
12
设销售收入x为自变量,销售成本y为因变量。
现已根据某百货公司某年
个月的有关资料计算出以下数据(单位:
万元)
(1)拟合简单西线性回归方程,并对方程中回归系数的经济意义作出结解析
(2)计算可决系数和回归估计的标准方差
(3)对B2进行显着性水平为5%的显着性检验
(4)假定下年一月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。
解:
设简单线性回归方程为:
(2)可决系数为:
2
2XXyiy334229.09"““
R220.9998
XX2yiy2425053.73*262855.25
回归系数经济意义:
销售收入每增加1万元,销售成本会增加万元
所以2是显着不为零
(4)预测:
?
f?
?
Xf40.5660.786*800669.366
95%的
即(,)
7.表中给出y对X2和X3回归的结果:
多元性回归的结果
平方和(SS)
平方
和的均值(MSS)
来自回归(ESS)65965
来自残差(RSS)
总离差(TSS)6604214
(1)该回归分析中样本容量是多少?
(2)计算RSS;
(3)ESS和RSS的自由度是多少?
(4)计算可决系数和修正的可决系数;
(5)怎样检验X2和X3对y是否有显着影响?
根据以上信息能否确定X2和xa各自对y的贡献为多少?
解:
(1)该回归分析中样本容量是14+1=15
(2)计算RSS=66042-65965=77
ESS的自由度为k-1=2,RSS的自由度n-k=15-3=12
(3)计算:
可决系数R265965/660420.9988
修正的可决系数R21竺」(10.9988)0.9986
153
(4)检验X2和X3对Y是否有显着影响
(5)F统计量远比F临界值大,说明X2和X3联合起来对Y有显着影响,但并不能确定X2和X3各自对Y的贡献为多少。
第八章
4甲企业近四年产品销售产量分别增长了9%7%8%6%乙企业这四年产品的
次品率也正好是9%7%8%6%这两个企业这四年的平均增长率和平均次品率的计算是否一样?
为什么?
10循环变动和季节变动的区别是什么?
循环变动与季节变动的区别是,循环变动的周期长短很不一致,不像季节变动那
样有明显的按月或按季的固定周期规律,循环变动的规律性不甚明显。
2.某地区社会商品零售额1988—1992(1993—1997)年期间(1987(1992)年为
基期)每年平均增长10%1993—1997(1998—2002)年期间每年平均增长%1998—2003(2003—2008)年期间每年平均增长%问2003年与1987年相比该地区社会商品零售额共增长多少?
年平均增长速度是多少?
若1997(2002)年社会商品零售额为30亿元,按此平均增长速度,2004(2009)年的社会商品零售额应为多少?
(注意:
上面的年份和书本是不一样的,但数据一样。
把年份改过来就行了,括号里面的年份是书本的。
)
3.
解:
设i年的环比发展水平为xi,贝V已知的三段年均增长率表示为:
16.8%,即为泌
X1997
于是得:
(1)以1987年为基期,2003年与1987年相比,该地区社会商品零售额的发展速度为:
X2003=X1992gX1997gX2003
X1987X1987X1992X1997
=(110%)5(18.2%)5(16.8%)6
从而得知,2003年与1987年相比,该地区社会商品零售额共增长%
(2)1987年至2003年之间,年平均发展速度为:
20031987"2003=165.5442756==%
•X1987
可知,1987年至2003年之间,年平均增长速度为%
(3)若X1997=30亿兀,按平均增长速度%十算X2004,
即由20041997x200418.23%
VX1997
可知,按照假定,2004年的社会商品零售额应为亿元
3某地区国内生产总值在1998—2000年平均每年递增12%2001—2004年平均每年递增10%2005——2007年平均每年递增8%试计算
(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;
(2)若2007年的国内生产总值为500亿元,以后平均每年增长6%到2009年可达多少?
(3)若2009年的国内生产总值计划任务为570亿元,一季度的季节比率为15%.则2009年一季度的计划任务应为多少?
(1)发展总速度(112%)3(110%)4(18%)3259.12%
平均增长速度=10259.12%19.9892%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 答案