统计学考查内容资料整理.docx
- 文档编号:13839406
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:30
- 大小:371.65KB
统计学考查内容资料整理.docx
《统计学考查内容资料整理.docx》由会员分享,可在线阅读,更多相关《统计学考查内容资料整理.docx(30页珍藏版)》请在冰点文库上搜索。
统计学考查内容资料整理
《社会经济统计学》考查内容
第一章:
绪论
1、统计的含义、研究对象和特点
一、统计的含义:
人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。
在不同的场合,统计一词有统计工作、统计资料、统计科学三种含义。
二、统计的研究对象:
是统计工作的规律,即搜集、整理和分析统计数据的方法,是一门方法论科学。
三、统计的特点:
1)数量性(最基本特点);2)具体性;3)综合性(或者总体性)。
2、统计学的基本概念:
总体、总体单位、标志、指标、变量
一、总体:
在某种共性的基础上由许多个别事物结合起来的整体。
其特征1)同质性;2)大量性;3)差异性。
二、总体单位:
构成总体的个别事物。
三、标志:
指说明总体单位特征的名称,由标志名称+标志值构成。
其分类:
1)品质标志、数量标志;2)不变标志、可变标志(包括变异和变量)。
四、指标:
是说明总体数量特征的概念。
由指标名称+指标值组成。
五、变量:
可变的数量标志。
3、标志和指标的区别和联系
1)区别:
①指标说明总体的特征;而标志说明总体单位的特征
②指标只反映总体的数量特征;标志既可以反映总体单位的数量特征,也可以反映总体单位的品质特征
2)联系:
指标的数值是由总体各单位的数量标志的标志值汇总而得到的
第二章:
统计数据的搜集、整理和显示
第一节统计调查
一、普查:
是指为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查。
特点:
涉及面广、工作量大、时间性强、耗费较多、组织工作复杂。
二、随机抽样调查:
是指按随机原则从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法。
特点:
最科学的非全面调查。
三、非随机抽样调查:
是指调查者有意识地或随意而非随机地从总体中抽取部分单位进行调查的统计方法。
特点:
一般不用于推算总体指标。
1)重点抽样,是指只对总体中为数不多但影响颇大的重点单位进行研究的一种非全面调查。
特点:
以较少的人力、物力和财力,几时地掌握总体的基本情况及其发展变化的基本趋势。
2)典型抽样,是指根据对调查对象的初步了解,有意识地从中挑选具有代表性的单位进行研究的一种非全面调查。
四、定期统计报表:
是指按国家统一规定的指标体系、表格形式、报送程序和报送时间,定期地自下向上地向国家和上级主管部门报送统计资料的一种统计调查形式。
第二节统计整理
一、统计整理的分组:
1、统计分组:
指根据社会经济现象的特点和统计研究的目的要求,按某种重要标志把总体分成若干部分的科学分类。
分组原则:
组内尽量相似,组间尽量差异。
统计分组的关键:
①选择分组标志;②划分各组界限。
2、统计分组的作用:
①划分社会现象的不同类型
②揭示社会经济现象的内部结构
③分析社会现象间的依存关系
二、统计分组相关概念:
组数、组距、组限、组中值(及其计算)
1、组数:
即将总体分为几组。
1)品质分组的组数由两个因素决定:
事物本身的特点和统计研究的任务
2)数量分组的组数由两个因素决定:
①全距=最大标志值-最小标志值
②组距=各组最大标志值(上限)-各组最小标志值(下限)=全距÷组数
2、组距:
各组的最大标志值(上限)与最小标志值(下限)之差。
3、组限:
是指每组两端的数值,其中每组的起点数值(最小值)称为下限,最点数值(最大值)称为上限。
4、组中值:
是各组组距的中点值,代表组内各标志值的一般水平,具有平均数性质(但不是平均数)。
5、计算:
组距=上限-下限
组中值=(上限+下限)÷2=下限+组距/2=上限-组距/2
6、分组形式:
A、单项式分组:
1)适合于离散变量
2)将一个变量值作为一组
3)适合于变量值变动幅度较小的情况
B、组距式分组:
1、适合于连续变量和变动幅度较大的离散变量
2、适合于变量值较多的情况
3、将变量值的一个区间作为一组必须遵循“不重不漏”的原则
4、可采用等距分组,也可采用不等距分组
三、分布数列及其种类;
1、分布数列(次数分布或次数分配):
指反映总体单位在各组分布状况的一系列数字。
分布数列组成要素:
1)组的名称;2)各组次数(频数)或频率
2、分布数列的种类:
1)按分组标志的不同:
①品质数列,是指按品质标志分组所形成的分布数列,它由各组名称和各组单位数构成。
②变量数列,是指按数量标志分组所形成的分布数列,由变量和次数两个要素组成。
2)按分组形式不同:
①单项式数列,是指各组都由一个具体的变量值(单项)来表示的数列。
②组距式数列,是指各组都由两个变量值界定的变量区间(组距)来表示数列,又分为等距数列和不等距数列。
四、统计整理的制表:
1)要合理安排统计表的结构。
2)总标题应该简要反映表的基本内容,还要指出资料所属时间和地点。
3)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。
4)表中的上下两条横线一般用粗线,其他线用细线。
5)通常情况下,统计表的左右两边不封口。
6)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。
7)对于没有数字的表格单元,一般用“—”表示
8)必要时可在表的下方加上注释
第三章:
综合指标
第一节总量指标
一、总量指标(绝对指标):
是反映社会经济现象在一定时间、地点条件下所达到的总规模、总水平或工作总量的综合指标。
、
二、总量指标的种类:
1)按其反映总体内容不同:
总体总量,即总体单位数,是由每个总体单位加总而得到的。
标志总量,是指总体各单位某一数量标志的总和。
2)按其反映时间状态的不同:
时期指标(时期数),是指反映社会经济现象在一段时间内所达到的总规模、总水平或工作总量。
时点指标(时点数),是指反映社会经济现象在某一时点(时刻)所达到的数量状态。
3)按采用的计量单位不同:
实物指标,是指以实物单位计量的总量指标,即以事物的物理属性或自然属性作为计量单位的指标。
价值指标,是指以货币为计量单位的总量指标。
劳动量指标,是指以劳动量单位计量的总量指标。
三、时期指标与时点指标的比较:
时期指标的特点
1)时期指标数值连续统计
2)不同时期的时期指标数值可以累计相加
3)时期指标数值大小与统计期限长短有关
时点指标的特点
1)时点指标的数值间断统计
2)不同时期的时点的指标数值不能累计相加
3)时点指标的数值大小与其时间间隔长短无直接相关
第二节相对指标
一、相对指标:
两个有联系的统计指标进行对比的比值,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。
表现形式:
①成数;②系数和倍数;③百分数、千分数、万分数;④单名数和复名数
二、相对指标的种类:
1)计划完成相对数:
现象在某一段时间内的实际完成数与计划完成数之比。
作用:
考核、反映计划完成的程度(进度)。
计算公式:
计划完成相对数=实际完成数/计划完成数×100%
产量、产值增长百分数:
计划完成相对数=(100%+实际增长%)/(100%+计划增长%)×100%
产品成本降低百分数:
计划完成相对数=(100%-实际降低%)/(100%-计划规定降低%)×100%
2)结构相对数:
总体中某部分数值与该总体数值对比的比值。
作用:
反映总体内部构成情况的综合指标。
特点:
①必须与统计分组相结合;②分子的数值是分母数值的一部分;③总体中各部分比重之和等于1或100%;④表现形式为无名数(百分数、千分数或成数)。
计算公式:
结构相对数=总体某部分数值/总体数值×100%
3)比例相对数:
同一总体内某一部分数值与另一部分数值对比的比值。
作用:
反映总体各部分间的内在联系与比例关系。
(同一总体不同部分比较)特点:
①对比的分子分母属于同一总体;②分子分母可以互换(与结构相对数的区别);③比例相对数的数值,一般用百分数或几比几的形式表示。
计算公式:
比例相对数=总体中某一部分数值/同一总体另一部分数值×100%
4)比较相对数:
同一时间的同类指标在不同空间对比的比值。
作用:
反映同类现象在不同空间的数量差异或不平衡程度,发现先进与后进。
特点:
①分子分母的数值分别属于不同的总体;②分子分母是同类指标;③分子分母可以互换。
计算公式:
比较相对数=甲地区某指标数值/乙地区同一指标数值×100%
5)动态相对数:
某一社会经济现象在不同时期两个数值对比的比率,又称发展速度或指数。
作用:
反映事物发展变化的方向与程度。
其中:
报告期又称计算期,是研究或计算时期。
基期是作为比较基础的时期。
计算公式:
动态相对数=报告期数值/基期数值×100%
6)强度相对指标:
两个性质不同但有一定联系的总量指标之间的对比。
作用:
①反映事物存在的密度、普遍程度、运动强度、负担强度;②反映经济效益的高低。
特点①强度相对数一般采用有名数(复名数)为计量单位,即由分子分母原有的计量单位构成。
②有的强度相对指标分子分母可以互换,有正指标和逆指标,正指标的比值的大小与其反映的强度、密度和普遍程度成正比,而逆指标正好相反。
计算公式:
强度相对数=某一指标数值/另一有联系的指标数值×100%
第三节平均指标
1、平均指标及其种类;
一、平均指标:
同质总体某一标志在一定时间、地点、条件下所达到的一般水平,是总体的代表值,它描述分布数列的集中趋势。
特点:
同质性、代表性和抽象性。
作用:
①可以比较同类现象在不同单位、不同地区间的平均水平;②可以比较同类现象在不同时期的平均水平;③可用于研究事物之间的依存关系;④利用平均数还可以进行推算和预测。
二、平均指标的种类:
1)数值平均数:
算术平均数、调和平均数和几何平均数。
2)位置平均数:
众数和中位数。
2、各种平均指标的计算:
一、算术平均数:
算术平均数=同一总体的标志总量/同一总体的总体总量
1)简单算术平均数:
2)加权算术平均数:
二、调和平均数(倒数平均数)
1)简单调和平均数:
是标志值倒数的算数平均数的倒数。
计算公式:
2)加权调和平均数:
是指各单位标志值倒数的加权算术平均数的倒数。
计算公式:
三、几何平均数:
几何平均法是n个变量连乘积的n次根。
一般适用于各变量值之间存在环比关系的事物。
1)简单几何平均数:
2)加权几何平均数:
3)注意:
①变量数列中任何一个变量值不能为0,一个为0,则几何平均数为0。
②用环比指数计算的几何平均易受最初水平和最末水平的影响。
③几何平均法主要用于动态平均数的计算。
四、众数:
总体中出现次数最多的变量值,通常以符号M0表示。
优点:
不受极端值的影响。
可能没有众数或有几个众数。
由组距数列计算众数:
第一步确定众数所在的组,
第二步通过公式计算众数值。
下限公式:
M0=L+Δ1/(Δ1+Δ2)×d
上限公式:
M0=U-Δ2/(Δ1+Δ2)×d
五、中位数:
总体各单位标志值按大小排序后,处于中间位置上的标志值,通常以符号Me表示。
优点:
不受极端值的影响。
1)未分组数据:
中位数位置=(N+1)/2
2)组距分组数据:
中位数位置=N/2
第四节变异指标
1、变异指标的概念和种类;
变异指标(标志变动度指标):
是综合反映总体各单位标志值及其分布的差异程度的指标。
变异指标的作用:
1)衡量平均数代表性的重要尺度。
变异度指标值越大,平均数的代表性越低;反之亦然。
2)衡量现象变动的稳定性和均衡程度。
3)计算抽样误差和确定样本量的依据。
变异度指标的种类:
1)全距
2)平均差、标准差、方差、离散系数
2、掌握各种变异度指标的含义和计算(若考计算,数据都很少,计算过程非常简单):
一、全距(极差):
是指总体各单位标志值中最大值与最小值之差,一般以R表示。
计算公式:
R=xmax-xmin
二、平均差:
是指总体各单位标志值对其算术平均数的离差绝对值的算术平均数,一般以A.D.表示。
优缺点:
能全面反映一组数据的离散程度。
由于采用绝对值运算,数学性质较差,实际中应用较少。
计算公式:
未分组数据(不加权):
组距分组数据(加权):
四、标准差(均方差):
是总体各单位标志值对算术平均数的离差的平方的算术平均数的平方根。
一般以σ表示。
方差:
标准差的平方。
一般以σ2表示。
优点:
反映了各单位标志值与算术平均数的平均差异;且计算简单,易于数学处理。
计算公式:
1)总体方差和标准差:
未分组数据(不加权)
组距分组数据(加权)
2)样本方差和标准差:
未分组数据
组距分组数据
五、变异系数(离散系数或标志变动度系数):
是指各种变异度指标与其算术平均数对比得到的相对数。
标准差系数:
标准差与算术平均数的比值。
Vσ=σ/x
第四章:
抽样估计与假设检验
一、(标准)正态分布
f(x)=随机变量X的频数,=总体方差,=3.14159,e=2.71828,x=随机变量的取值(- 标准正态分布的使用 1)将一个一般的转换为标准正态分布 2)计算概率时,查标准正态概率分布表 3)对于负的x,可由(-x)x得到 4)对于标准正态分布,即X~N(0,1),有P(aXb)ba,P(|X|a)2a1。 5)对于一般正态分布,即X~N(,),有 二、抽样调查的相关概念: 1、基本概念: 总体和样本;总体指标和样本指标 1)总体: 所要认识的研究对象全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。 一般用N来表示总体的单位数。 2)样本: 从总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。 一般用n表示样本单位数。 3)总体指标: 根据总体各单位的标志值或标志属性计算的综合指标。 其是惟一确定的。 4)样本指标: 根据样本各单位标志值或标志属性计算的综合指标。 2、重复抽样和不重复抽样 1)重复抽样(放回抽样): 同一单位有多次重复被抽中的机会,并且每次抽样之前总体单位数目始终不变,每个单位抽中或抽不中的机会在各次都是相同的。 可以看作是进行n次抽取可以看成是进行n次相互独立的试验。 2)不重复抽样(不放回抽样): 同一单位只有一次被抽中的机会,并且总体单位数目随着样本单位数目抽取的次数的增多而愈变愈少。 每个单位抽中或抽不中的机会在各次是不同的。 3、抽样误差: 实际误差、平均误差和极限误差。 误差: 由样本得到的估计值与被估计的总体未知参数之差,或样本指标数值与总体指标数值之间的差数。 抽样误差(随机误差): 按随机原则抽样时,由于随机抽样的偶然因素而引起的抽样指标和全及指标之间的绝对离差。 其不包括登记误差和系统性误差。 1)实际误差: 是指在一次抽样中由随机因素引起的样本指标与总体指标之间的离差。 2)平均误差: 是指样本平均数(或样本成数)的标准差。 它反映了所有抽样结果所得的样本指标值与总体指标值的平均误差。 理论公式: 实际公式: ①重复抽样 ②不重复抽样 或者 3)极限误差(置信区间): 即用一定的概率来保证抽样误差不超过某一给定的误差范围。 4、掌握抽样调查的几种组织形式及其特点: 简单随机抽样、类型抽样、等距抽样、整群抽样和多级抽样。 a、简单随机抽样(纯随机抽样): 是不对总体做任何加工整理,按照随机原则直接从总体N个单位中抽取n个单位作为样本进行调查的抽样方式。 特点: 1)最基本也是最简单的抽样组织方式; 2)分为重复和不重复抽样两种情况; 3)每个单位都有相等的中选机会。 b、类型抽样(分层抽样或分类抽样): 是将总体单位先按一定标志分组,然后在各组中随机抽取样本的抽样组织方式。 类型抽样是应用于总体内各单位在被研究标志上有明显差别的抽样。 主要原则是: 分组时应使组内差异尽可能小,使组间差异尽可能大。 c、等距抽样(机械抽样或系统抽样): 是先将总体各单位按有关标志或无关标志进行排列,再按照固定的顺序和间隔来抽选样本单位的一种抽样组织形式。 特点: 等距抽样是不重复抽样,通常可以保证被抽取的单位在总体中均匀分布,缩小各单位之间的差异程度,提高样本的代表性。 d、整群抽样: 是先将总体各单位划分成若干群,再以群为单位从中随机地抽取出若干群来,对被抽中群的所有单位进行调查的一种抽样组织形式。 特点: 1、调查单位比较集中,进行调查比较方便,可以减少调查人员来往于调查单位之间的时间和费用。 2、设计和组织抽样比较方便。 3、它的精度比起简单随机抽样来要低一些。 e、多级抽样(多阶段抽样): 他把抽取样本单位分为n个步骤进行,即先从总体中抽取一级单位,然后再从抽中的一级单位中抽取二级单位,直到抽取最终单位。 特点: 1、调查的总体范围分布广。 2、节省人财物等费用。 3、灵活、方便。 三、估计量的优良标准有哪些 1、无偏性: 是指样本指标估计总体指标时,要求样本指标所有可能取值的平均数等于估计总体指标的属性。 证明θ是无偏估计量: 1)样本平均数x是总体平均数X的无偏估计量。 2)样本方差Sn2是总体方差σ2的有偏估计量。 3)样本方差S2n-1是总体方差σ2的无偏估计量。 2、有效性: 是指用样本指标估计总体指标时,要求样本方差为最小的属性。 3、一致性: 是指用样本指标估计总体指标时,要求当样本单位数逐渐增大时,样本指标逐渐趋于总体指标的属性。 四、总体均值区间估计计算(只考查正态总体且方差已知或非正态总体、方差未知、大样本情况) 置信度: 是指总体指标落在某一区间内的概率保证程度,通常用概率函数F(t)表示。 区间估计(置信区间): 是指在一定的概率保证程度下,某总体指标所在的区间范围。 对总体平均数的区间估计有两种情形: 1、根据已经给定的极限抽样误差范围,求概率保证程度F(t),进而进行点估计和区间估计。 2、根据给定概率保证程度F(t),求出极限抽样误差,进而进行点估计和区间估计。 五、假设检验 1、假设检验的含义和步骤; 假设检验(统计检验或显著性检验): 是指利用样本的实际统计量,去检验事先对总体某些数量特征所作出的假设是否可信,进而为决策取舍提供依据的一种统计分析方法。 假设检验的步骤: 1)提出假设; 2)确定适当的检验统计量; 3)规定显著性水平a; 4)计算检验统计量的值; 5)作出统计决策。 2、原假设、备择假设; 原假设(“0假设”): 待检验的假设,研究者想收集证据予以反对的假设,总有=,≤或≥,一般以H0表示。 备择假设: 与原假设对立的假设,研究者想收集证据予以支持的假设,总有≠,<或>,一般以H1表示。 3、基本概念: 显著性水平、置信水平、置信区间、P值;双侧检验和单侧检验; A、显著性水平、置信水平、置信区间、P值: 1)显著性水平: 原假设为真时,拒绝原假设的概率,由研究者事先确定,一般以α表示,常用α值: 0.01、0.05、0.10。 2)置信水平: 是指总体参数值落在样本统计值某一区间的概率,1-α。 3)置信区间: 是指在一定的概率保证程度下,某总体指标所在的区间范围。 4)P值: 在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,反映实际观测到的数据与原假设H0之间不一致的程度。 决策规则: ①单侧检验: 若p<α,则拒绝H0;②双侧检验: 若p<α/2,则拒绝H0。 B、、双侧检验和单侧检验: 1)双侧检验: 备择假设没有特定的方向性,并含有符号“”的假设检验。 要检验样本平均数与总体平均数有没有显著差异,而不问差异的方向是正差或负差时,应采用双侧检验。 2)单侧检验: 备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。 备择假设的方向为“<”,称为左侧检验;备择假设的方向为“>”,称为右侧检验。 不仅仅要检验样本平均数与总体平均数有没有显著差异,而且要追究是否发生预先指定方向的差异时,应采用单侧检验。 4、总体均值检验(不考查小样本) 总体是否已知? 用样本标 准差S代替 T检验 小 样本容量n 否 是 Z检验 Z检验 大 大样本检验方法的总结: 5、假设检验的两类错误。 第一类错误(弃真错误): 原假设为真时,拒绝原假设,第一类错误的概率为a(显著性水平)。 第二类错误(取伪错误): 原假设为假时,接受原假设,第二类错误的概率为β。 第五章: 相关与回归分析 一、区分函数关系和相关关系 1、函数关系: 是指现象之间存在着严格的依存关系。 特点: 对于某一变量的每一个数值,都有另一变量的确定值与之相对应,并且这种关系可用一个数学表达式反映出来。 2、相关关系: 是指现象之间存在着非严格的、不确定的依存关系。 特点: 某一现象在数量上发生变化会影响另一现象数量上的变化,而且这种变化在数量上具有一定的随机性。 3、区别: 1)函数关系中两变量之间的关系是确定的;相关关系中两变量之间的关系是不确定。 2)函数关系变量之间关系可以用方程y=f(x)表示出来;相关关系不能用一定的方程表示。 3)函数关系是相关关系的特例,函数关系是完全的相关关系。 二、相关关系的种类、相关系数的取值范围 1、相关关系的种类: 1)按相关的程度分为: 完全相关、不完全相关、不相关。 2)按相关的方向分为: 正相关、负相关。 3)按相关的形式分为: 线性相关、非线性相关。 4)按影响因素的多少分为: 单相关、复相关。 2、相关系数取值范围: 1)符号: 如果为正号,则表示正相关,如果为负号,则表示负相关。 通俗点说,正相关就是变量会与参照数同方向变动,负相关就是变量与参照数反向变动; 2、取值为0,这是极端,表示不相关; 3、取值为1,表示完全正相关,而且呈同向变动的幅度是一样的; 4、如果为-1,表示完全负相关,以同样的幅度反向变动; 5、取值范围: [-1,1]。 三、回归的含义和种类; 1、回归: 研究自变量与因变量之间关系形势的分析方法,其目的在于根据已知自变量来估计和与预测因变量的总平均值。 2、种类: 1)按变量多少: 一元回归方程和多元回归方程。 2)按是否线性: 线性回归方程和非线性回归方程。 四、相关分析和回归分析的区别和联系; 1、相关分析: 是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。 2、回归分析: 是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 3、区别: 1)相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化; 2)相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量; 3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。 4、联系: 都是研究及测度两个或两个以上变量之间关系的方法。 五、简单直线回归的原理: 最小平方法的中心思想 1、相关分析与回归分析的步骤: 1)进行相关关系的定性分析; 2)确定回归方程; 3)计算相关系数或相关指数,对回归方程变量之间的相关性进行显著性检验; 4)利用回归方程式进行推算和预测; 5)对推算和预测作出置信区间估计。 2、简单直线回归的原理: 1)简单直线回归分析: 对两个具有线性关系的变量,配合线性回归方程,并根据自变量的变动来测定因变量平均发展趋势的分析方法。 2)简单直线回归原理: ①总体回归参数β0和β1是未知的,必须利用样本数据去估计; ②样本统计量β0和β1代替回归
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 考查 内容 资料 整理