春社会统计学期末复习训练Word格式.docx
- 文档编号:6458658
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:23
- 大小:32.59KB
春社会统计学期末复习训练Word格式.docx
《春社会统计学期末复习训练Word格式.docx》由会员分享,可在线阅读,更多相关《春社会统计学期末复习训练Word格式.docx(23页珍藏版)》请在冰点文库上搜索。
A.相关系数 B.离散系数 C.回归系数 D.判定系数
11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是()
A.332.1万户家庭 B.3000户家庭
C.332.1户家庭的年均收入 D.3000户家庭的年均收入
12.下列变量属于数值型变量的是()
A.工资收入B.产品等级
C.学生对考试改革的态度D.企业的类型
13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()
A.环形图 B.饼图 C.直方图 D.条形图
14.在频数分布表中,频率是指()
A.各组频数与上一组频数之比 B.各组频数与下一组频数之比
C.各组频数与总频数之比 D.各组频数与最大一组频数之比
15.两个定类变量之间的相关分析可以使用()
A.λ系数 B.ρ系数 C.γ系数 D.Gamma系数
16.根据一个样本均值求出的90%的置信区间表明()
A.总体均值一定落入该区间内
B.总体均值有90%的概率不会落入该区间内
C.总体均值有90%的概率会落入该区间内
D.总体均值有10%的概率会落入该区间内
17.已知某单位职工平均每月工资为3000元,标准差为500元。
如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的()
A.95% B.68% C.89% D.90%
18.方差分析的目的是()
A.比较不同总体的方差是否相等
B.判断总体是否存在方差
C.分析各样本数据之间是否存在显著差异
D.研究各分类自变量对数值型因变量的影响是否显著
19.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间()
A.相关程度越大 B.相关程度越小 C.完全相关 D.完全不相关
20.正态分布中,
值越小,则()
A.离散趋势越小 B.离散趋势越大 C.曲线越低平 D.变量值越分散
21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为()
A.简单随机抽样 B.系统抽样 C.整群抽样 D.分层抽样
22.某地区2001-2010年人口总量(单位:
万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据()
A.茎叶图 B.环形图 C.饼图 D.线图
23.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值()
A.是平均数的-1.5倍 B.比平均数少1.5
C.等于-1.5倍标准差 D.比平均数低1.5个标准差
24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是()
A.89 B.72 C.88 D.95
25.某班级学生期末英语考试平均成绩为75分,标准差为10分。
如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的()
A.68% B.89% C.90% D.95%
26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为()
A.700 B.0.2 C.3500 D.175000
27.在假设检验中,不拒绝虚无假设意味着()
A.虚无假设是肯定正确的 B.虚无假设肯定是错误的
C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的
28.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间()
A.相关程度越高 B.相关程度越低 C.完全相关 D.没有任何关系
29.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则和组内方差分别为()
A.234,121 B.117,121 C.234,48.4 D.117,81
30.在回归方程中,若回归系数等于0,这表明()
A.因变量y对自变量x的影响是不显著的
B.自变量x对因变量y的影响是不显著的
C.因变量y对自变量x的影响是显著的
D.自变量x对因变量y的影响是显著的
31.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于()
A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样
32.某企业职工的月收入水平分为以下五组:
1)1500元及以下;
2)1500-2000元;
3)2000-2500元;
4)2500-3000元;
5)3000元及以上,则3000元及以上这一组的组中值近似为()
A.3000元 B.3500元 C.2500元 D.3250元
33.对于右偏分布,平均数、中位数和众数之间的关系是()
A.平均数>中位数>众数 B.中位数>平均数>众数
C.众数>中位数>平均数 D.众数>平均数>中位数
34.两组数据的平均数不相等,但是标准差相等。
那么()
A.平均数小的,离散程度小 B.平均数大的,离散程度大
C.平均数大的,离散程度小 D.两组数据离散程度相同
35.在假设检验中,如果所计算出的P值越小,那么检验的结果()
A.越显著 B.越不显著 C.越真实 D.越不真实
36.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着()
A.高度相关 B.中度相关 C.低度相关 D.极弱相关
37.回归平方和(SSR)反映了y的总变差中()
A.由于x与y之间的线性关系引起的y的变化部分
B.除了x对y的现有影响之外的其他因素对y变差的影响
C.由于x与y之间的非线性关系引起的y的变化部分
D.由于x与y之间的函数关系引起的y的变化部分
38.根据一个具体的样本求出的总体均值90%的置信区间()
A.以90%的概率包含总体均值 B.绝对包含总体均值
C.10%的可能性包含总体均值 D.绝对不包含总体均值
39.在假设检验中,虚无假设和备择假设()
A.都有可能成立 B.都不可能成立
C.有且只有一个成立 D.备择假设一定成立,虚无假设不一定成立
40.在方差分析中,某一水平下样本数据之间的误差称为()
A.组内误差 B.组间误差 C.组内平方 D.组间平方
41.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
A.22000名学生 B.2200名学生
C.22000名学生的每月生活费用 D.2200名学生的每月生活费用
42.从变量分类看,下列变量属于定序变量的是()
A.专业 B.性别 C.产品等级 D.收入
43.在频数分布表中,比率是指()
C.各组频数与总频数之比 D.不同小组的频数之比
44.根据一个样本均值求出的90%的置信区间表明()
45.判断下列哪一个不可能是相关系数()
A.-0.89 B.0.34 C.1.32 D.0
46.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明()
A.收入每增加1元,消费增加0.8元
B.消费每增加1元,收入增加0.8元
C.收入与消费的相关系数为0.8
D.收入对消费影响的显著性为0.8
47.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为()
48.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是()
A.86 B.77 C.90 D.88
49.经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有()
50.残差平方和(SSE)反映了y的总变差中()
51.某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适()
A.回归分析 B.方差分析 C.卡方检验 D.列联表分析
52.用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为()
53.方差分析的目的是()
54.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是()
A.变量 B.总体 C.样本 D.统计量
55.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形()
56.如果一组数据中某一个数值的标准分值为1.8,这表明该数值()
A.是平均数的1.8倍 B.比平均数多1.8
C.等于标准差的1.8倍 D.比平均数高出1.8个标准差
57.下列哪种情况不适合用方差分析()
A.性别对收入的影响 B.专业对收入的影响
C.年龄对收入的影响 D.行业对收入的影响
58.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为()
A.700 B.0.2 C.3500 D.140
59.根据一个具体的样本求出的总体均值95%的置信区间()
A.以95%的概率包含总体均值 B.5%的可能性包含总体均值
C.绝对包含总体均值 D.绝对不包含总体均值
60.在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之间()
61.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为()
A.432,71 B.216,71 C.432,426 D.216,426
62.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
63.某班级学生平均每天上网时间可以分为以下六组:
1)1小时及以下;
2)1-2小时;
3)2-3小时;
4)3-4小时;
5)4-5小时;
6)5小时及以上,则5小时及以上这一组的组中值近似为()
A.5小时 B.6小时 C.5.5小时 D.6.5小时
64.对于左偏分布,平均数、中位数和众数之间的关系是()
65.一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。
A.一班学生体重的离散程度大 B.二班学生体重的离散程度大
C.两个班学生体重的离散程度相同 D.无法判断
66.在假设检验中,如果所计算出的P值越大,那么检验的结果()
A.越不显著 B.越显著 C.越不真实 D.越真实
67.如果收入与支出之间的线性相关系数为0.92,而且二者之间具有统计显著性,那么二者之间存在着()
68.在假设检验中,不拒绝虚无假设意味着()
A.虚无假设是肯定正确的 B.虚无假设肯定是错误的
C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的
69.某单位对该厂第一加工车间残品率估计高于13%,而该车间主任认为该比例(
如果要检验该说法是否正确,则假设形式应该为()
≥0.13;
0.13 B.
≤0.13;
>0.13
=0.13;
≠0.13 D.
>0.13;
≤0.13
70.在频数分布表中,频率是指()
A.各组频数与上一组频数之比 B.各组频数与下一组频数之比
C.各组频数与总频数之比 D.不同小组的频数之比
二、名词解释
1.抽样单位与抽样框
2.普查与抽样调查
3.参数与统计量
4.方差与标准差
5.独立样本与配对样本
6.总体与样本
7.抽样分布
8.二维表
9.相关系数
10.组内均方
11.普查
12.误差减少比例
13.散点图
14.正态分布
15.最小二乘法
16.概率抽样
17.中位数
18.置信区间
19.区间估计
20.中心极限定理
21.假设检验
22.均值
23.虚无假设与替换假设
24.置信水平
25.离散系数
26.离散变量与连续变量
27.众数
三、简答题
1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)网络供应商的姓名
(2)每月的网络服务费
(3)每月上网时间
(4)上网的主要目的
(5)上周收到的电子邮件数量
(6)每月用于网上购物的金额
(7)上月网上购物的次数
(8)使用的电脑的品牌
(9)上网是否玩游戏
(10)电脑是否带有光盘刻录机
2.调查方法主要包括哪几种?
简要说明各种方法的优缺点。
3.什么是简单一元线性回归分析?
其作用是什么?
4.举例简要说明社会研究过程。
5.按测度水平,变量可分为哪几类?
并举例说明。
6.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。
7.等距分组和不等距分组有什么区别?
请举例说明。
8.举例说明什么是自变量和因变量,二者之间是什么关系?
9.简要说明卡方的拟合优度检验和独立性检验的含义。
10.条形图和直方图有什么区别?
11.简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。
12.简述定类变量、定序变量和数值型变量集中趋势测量的方法。
13.一元线性回归模型中有哪些基本假定?
14.举例说明什么是离散变量和连续变量。
15.SPSS主要有哪些功能?
16.在SPSS中如何定义变量属性?
17.统计表主要由哪几部分构成?
18.简述相关系数的取值与意义。
19.概率抽样方法主要包括哪几种?
20.简要说明卡方的拟合优度检验和独立性检验的含义。
21.数据分析中的归纳法和演绎法分别是什么?
22.什么是简单回归分析?
24.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)考研辅导班参加者的姓名
(2)家庭月消费
(3)温度
(4)上个月外出吃饭的次数
(5)产品等级
(6)民族
(7)工资收入水平
(8)生活满意度
四、计算题(每题15分,共30分)
1.某校社会学专业同学统计课成绩如下表所示。
社会学专业同学统计课成绩表
学号
成绩
101023
76
101037
75
101052
70
101024
91
101038
101053
88
101025
87
101039
101054
93
101026
78
101040
90
101055
62
101027
85
101041
101056
95
101028
96
101042
86
101057
101029
101043
97
101058
66
101030
101044
101059
82
101031
101045
92
101060
79
101032
101046
101061
101033
80
101047
101062
101034
81
101048
101063
68
101035
101049
101064
94
101036
83
101050
77
101065
要求:
(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。
(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。
2.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。
通过分析得到以下结果:
方差分析表
变差来源
SS
df
MS
F
Sig.
回归
A
B
C
D
0.000
残差
205158.07
E
—
总计
1642866.67
11
(1)计算上面方差分析表中A、B、C、D、E、F处的值。
(2)商品销售量的变差中有多少是由价格的差异引起的?
(3)销售量与价格之间的相关系数是多少?
3.某公司招聘职员时,要求对职员进行两项基本能力测试。
已知,A项测试中平均分数为90分,标准差是12分;
B考试中平均分数为200分,标准差为25分。
一位应试者在A项测试中得了102分,在B项测试中得了215分。
若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?
4.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进行线性回归分析,得到:
方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。
(1)写出广告费用y与销售量程x之间的线性回归方程。
(2)假如广告费用投入50000元,根据回归方程估计商品销售量。
(3)计算判定系数
,并解释它的意义。
5.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。
(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。
以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。
注:
6.某企业使用3种方法组装一种新的产品,为确定哪种方法生产效率最高,随机抽取30名工人,并指定每人使用其中的一种方法。
通过对每个工人生产的产品数进行分析得到下面的方差分析表。
请完成方差分析表。
组间
210
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 统计学 期末 复习 训练