统计学知识.docx
- 文档编号:9490772
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:27
- 大小:85.04KB
统计学知识.docx
《统计学知识.docx》由会员分享,可在线阅读,更多相关《统计学知识.docx(27页珍藏版)》请在冰点文库上搜索。
统计学知识
统计资料的整理
第一节统计整理的意义和步骤
一、统计整理的意义
统计整理是根据统计研究的任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。
通过统计调查所搜集到的资料,只是一些个别单位的、分散的、不系统的原始资料,所反映的问题常常是事物的表面现象,不能深刻揭示事物的本质,更不能从量的方面反映事物发展变化的规律性,这就有必要对统计调查所获得的原始资料进行科学的整理。
统计资料整理就是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,是统计工作中一个十分重要的中间环节,起着承前启后的作用。
它既是统计调查阶段的继续和深入,又是统计分析的基础。
因此,统计整理的质量不仅直接关系到调查资料能否发挥其应有的作用,而且也直接影响到统计分析和预测能否得出正确的结论。
二、统计整理的步骤
(1)设计和制定统计资料汇总方案统计汇总方案应明确规定各种统计分组和各项汇总指标。
(2)审核在汇总整理前,应对原始资料进行认真审核,审核其完整性、及时性、准确性,及时纠正错误。
(3)分类选择最基本、最能说明问题本质特征的标志对资料进行科学的分类分组。
(4)汇总按分组要求进行分组汇总,并在此基础上加以全面汇总,计算出综合指标,使之能反映出调查对象的全貌。
(5)编制统计表将统计整理的结果,用合适的表格简明扼要地表达出来,从而形成了统计表的模式。
三、统计资料的审核
主要检查资料的完整性、及时性和准确性。
资料完整性的检查是指检查被调查单位和项目有无遗漏,是否齐全。
资料及时性的检查是检查资料是否按规定项目和时间报送以及未能上报的原因。
资料准确性的检查是审核工作的重点,主要检查调查资料的正确与否。
一般有两种方法进行检查:
计算检查和逻辑检查。
计算检查就是通过简单计算的方法检查各项数值的计算结果有无差错。
逻辑检查就是从逻辑道理上检查资料的内容是否合理,各调查项目之间有无矛盾,是否符合实际。
第二节统计分组与资料汇总
一、统计分组
(一)统计分组的概念
统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。
其目的就是把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起,保持各组内统计资料的一致性和组与组之间资料的差异性,以便进一步运用各种统计方法,研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律性。
例如,人口按性别、年龄、民族、文化程度、职业等标志就划分出各种各样的组。
(二)统计分组的作用
1.划分现象类型
社会经济现象存在着复杂多样的类型,各种不同的类型有着不同的特点以及不同的发展规律。
在整理大量统计资料时,有必要运用统计分组法将所研究的现象总体划分为不同的类型组来进行研究。
举例见表3-1表3-11999年各产业从业人员比例
表3-11999年各产业从业人员比例
产业类别
人数/万人
比例/%
第一产业
35364
50.1
第二产业
16235
23.0
第三产业
18987
26.9
资料来源:
《中国统计年鉴(2000年)》第116页,中国统计出版社
2.揭示现象内部结构
在对现象总体进行科学分组的基础上,计算各组单位数或分组指标量在总体总量中所占比重,形成了总体的结构分布状况。
各组所占比重数大小不同,说明它们在总体中所处地位不同,对总体分布特征的影响也不同,其中比重数相对大的部分,决定着总体的性质或结构类型。
借助于总体各部分的比重在量上的差别和联系,用以研究总体内部各部分之间存在的差别和相互联系。
将总体的结构分组资料按时间的移动联系起来进行分析,可以反映由于各组比重变化及速度不同而引起各组地位改变的状况,分析各组变动的内在原因,从而认识总体由量变到质变的转化过程及其发展变化的规律性。
从表
3-2所示,大致可看出:
在我国能源消费结构中,煤炭比重下降,原油、天然气、
水电比重不断提高,逐步向优质、高效、环保方向发展。
表3-2我国能源消费总量及构成
我国能源消费总量及构成
年份
能源消费总量
/万吨标准煤
占能源消费总量的比例/%
原煤
原油
天然气
水电
1970
29291
80.9
14.7
0.9
3.5
1980
60275
72.2
20.7
3.1
4.0
1990
98703
76.2
16.6
2.1
5.1
1997
138173
71.5
20.4
1.7
6.4
1999
122000
67.1
23.4
2.8
6.7
资料来源:
《中国统计年鉴(2000年)》第239页,中国统计出版社
3.分析现象之间的依存关系
一切社会经济现象之间,都存在相互联系、相互依存、相互制约的关系,如商业企业中商品销售额与流通费用的关系。
统计中运用分组法研究这种依存关系时,是将总体单位中的一个标志作为分组标志进行分组,观察其他标志与分组标志的联系情况。
如表3-3所示。
表3-3某市百货商店的年销售额与流通费用情况
按销售额分组/万元
商店数/个
每百元销售额中的流通费/元
50以下
25
11.2
50~200
70
10.4
200~400
130
9.9
400以上
75
6.7
由表3-3的分组资料可见,销售额与流通费用具有明显的依存关系,即销售额越大,每百元销售额中的流通费用越少。
(三)统计分组的种类
1.按照分组标志的多少,可分为简单分组、复合分组和分组体系
简单分组就是对被研究现象总体只按一个标志进行的分组。
如人口按性别分组、人口按年龄分组等。
复合分组就是对同一总体选择两个或两个以上标志层叠起来进行的分组。
即在按某一标志分组的基础上再按另一标志进一步分组。
例如,为了认识我国高校学生的构成,我们可以同时采用学科、学制、性别等三个标志进行
分组:
理科文科本科本科男男
女女专科专科男男
女女
这样分组的结果就形成几层重叠的组别。
它的特点是:
可以从几个不同的角度了解总体内部的差别和关系,比简单分组能更全面、更深入地研究问题;复合分组的组数随着分组标志的增加而成倍增加,如果组数太多,反而不易揭示问题的实质。
社会现象是复杂的,需要从各个方面进行观察和研究,以获得对事物的全
貌的认识,这就需要采用相互联系、相互补充的多个分组标志对总体进行多种分组,即形成分组体系。
例如对人口总体进行统计研究,必须通过按性别、按年龄、按民族、按婚姻状况等多种分组形成的分组体系,才能对人口总体的自然构成有较深刻的认识。
2.按照分组标志的性质可分为品质分组和数量分组
品质分组就是用反映事物的属性、性质的标志分组。
按品质标志进行分组,情况也不同,有的比较简单,比如,人口按性别分组;有的则比较复杂,比如,人口按职业分组。
在统计实践中为了便于统计的名称、范围和计量单位的统一,国家制定有统一的分类目录,如:
《国民经济行业分类和代码》、《全国工农业产品(商品、物资)分类与代码》、《大中小型工业企业划分标准》、《行业划分标准》、《关于统计上划分城乡的规定》等。
按数量标志分组就是选择反映事物数量差异的标志分组。
在数量标志变
异的范围内,划分各组的数量界限,将总体区分为若干个组。
例如,企业按产值分组,学生按成绩分组。
(四)选择分组标志的原则
1.根据研究目的与任务选择分组标志
任何一个总体现象,都有许许多多个标志。
有些标志对某一问题是至关重要的,而对另一个问题则是无关紧要的。
因此分组标志的确定,应根据统计认识的具体目的、任务不同而有所不同。
例如,国民经济的所有制性质,部门(行业)、城乡等分组固然都是重要的分组,但是,随着研究目的的不同,实际选择的分组标志也不同。
如果要研究国民经济发展速度,比例关系、平衡关系,按部门分类是最基本的分组;如果要研究人民的生活水平,由于生活水平的高低是由收入情况决定的,则按不同的社会阶层(如工人、农民等)分组,按城乡分组,就是比较重要的分组。
2.选用能反映事物本质或主要特征的标志
在总体的若干标志中,有些是根本性的、本质的或主要的标志,有些则是非本质的、次要的标志,要根据研究问题的需要,选择最本质的标志来进行统计分组。
比如:
在研究商业企业的规模时,营业面积、仓储能力、职工人数、商品销售额、流动资金等都是反映商业企业规模的标志。
3.根据现象所处的历史条件及经济条件来选择标志
社会是不断发展的,在不同的历史条件和经济条件下,选择的分组标志也不一样,要根据情况的变化而变化。
例如,企业按规模分组。
反映企业规模的标志很多,如职工人数、产品产量、产值、生产能力、固定资产价值等。
选择哪一个作为分组标志,就必须结合企业所处的具体条件来确定。
在劳动密集型或技术不发达的条件下,宜选职工人数作为分组标志;在技术密集型或技术装备比较先进的条件下,宜采用生产能力或固定资产价值作为分组标志,这样才能确切地反映现象的本质特征。
二、统计资料汇总
(一)统计资料汇总的组织形式
(1)逐级汇总逐级汇总是按照一定的统计管理系统,由各级统计机构自下而上地逐级将调查资料汇总上报。
如,我国的定期统计报表。
它的特点是便于就地审核与改正原始资料的差错,能满足地区和部门的需要,但较费时费
力。
(2)集中汇总集中汇总是把统计调查资料集中在组织调查的最高机关或由它指定的机构进行汇总。
它的特点是不经中间环节,可以大大缩短汇总时间,便于贯彻统一的汇总纲要,并可使用现代化的汇总手段来提高汇总效率和质量。
(二)统计资料汇总的方法
(1)手工汇总就是用算盘和小型计算器进行的汇总。
具体的手工汇总方法有划记法、过录法、折叠法和卡片法等。
划记法,就是用点、线等符号计算各组和总体单位数的方法。
过录法,是将调查资料过录到事先准备好的整理表上,然后再计算加总,编制出统计表。
折叠法,是将调查表中需要汇总的同一横行或纵栏预先折好,按顺序一一叠在一起,进行汇总计算,再填制统计表。
卡片法,是按分组汇总的要求,将调查表中的资料摘录到卡片上,然后,根据卡片进行分组和汇总计算。
(2)计算机汇总广泛使用电子计算技术是我国统计工作现代化的重要标志之一。
计算机数据处理包括对原始数据的加工、存贮、合并、分类、逻辑检查、运算以及打印出汇总表或图形等。
计算机数据处理的全部过程大体上分为五个步骤:
①编程序。
②编码。
③数据录入。
④逻辑检查。
⑤制表打印。
第三节分配数列
一、分配数列的意义
在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配或分配数列。
分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比率,又称频率。
分配数列是统计资料整理的结果,是进行统计描述和统计分析的重要方式。
它可以表明总体的分布特征及内部结构情况,并可据此研究总体某一标志的平均水平及其变动的规律性。
二、分配数列的种类
(一)品质数列按品质标志分组所编制的分配数列叫品质数列。
它由分组的名称和次数
两个要素构成。
对于品质数列,如果分组标志选择得好,分组标准定得恰当,
那么事物性质的差异表现得也比较明确,总体中各组的划分也就容易解决,从而能准确地反映总体的分布特征。
(二)变量数列
按数量标志分组形成的分配数列称为变量数列。
变量数列按照变量类型的不同,可分为离散型变量数列和连续型变量数列。
离散型变量其变量值只能取整数,不可能有小数。
如职工人数、企业数、机器台数等都是离散型变量。
连续型变量是指变量的取值是连续不断的,相邻两值之间可作无限分割,变量值可以用小数表示。
如产值、工资、利润等。
变量数列按形式不同,分为单项数列和组距式数列。
单项数列中每一组的变量值只有一个,即每组由一个变量值来代表,如表3-4所示。
组距数列中每一组数值是由两个变量值所确定
的一个数值范围来表示的,如表3-5所示。
表3-41997年妇女生育孩次分布
资料来源:
1995年1%人口抽样调查
三、变量数列的编制
对于离散型变量,若变量值个数少,变动幅度小,只要编制单项数列。
变量值个数即为组数,如表3-4所示。
对于连续型变量,如果变量值个数多,变动幅度大,就有必要编制组距数列。
下面简要介绍一下有关组距数列的几个概念。
(一)确定组数与组距
总体中最大变量值与最小变量值之差称为全距(R)。
在组距数列中,同一组内的最大变量值称为上限,最小变量值称为下限,上限与下限之差称为组距(i)。
例如,某班36名同学《统计学基础》考试成绩如下:
(单位:
分)
56798086868064658187878267688388
90847173849274859293857676859479
97865686
若将上述资料,先按数值大小排列如下:
56566465676871737476767979808081
82838484858585868686868787889092
92939497
经初步加工,大致可看出资料的集中趋势,资料的最小值为56分,最大值为97分,则全距=97分-56分=41分。
根据常规,将组距定为10,把总体分为5组。
第一组为50~60,第二
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 知识