统计学(2章数据搜集与整理).ppt
- 文档编号:18770296
- 上传时间:2023-11-05
- 格式:PPT
- 页数:89
- 大小:805KB
统计学(2章数据搜集与整理).ppt
《统计学(2章数据搜集与整理).ppt》由会员分享,可在线阅读,更多相关《统计学(2章数据搜集与整理).ppt(89页珍藏版)》请在冰点文库上搜索。
第二章统计数据的搜集与整理,本章重点,统计调查的意义及要求。
几种常用的统计调查方式。
市场调查问卷的设计。
统计整理的意义。
统计分组的含义及作用。
分配数列的种类及编制。
统计表的编制。
第一节统计数据的搜集,一、统计调查的意义及要求统计调查的含义统计调查的要求准确、及时、全面、经济。
按调查对象包括的范围分全面调查非全面调查,二、统计调查的种类,按调查登记的时间是否有连续性经常调查一次调查,按调查组织方式分统计报表专门调查,三、调查方案设计,调查方案的内容,确定调查目的,调查要达到的具体目标回答“为什么调查?
”调查之前必须明确,确定调查目的例,城市住户调查:
反映城市居民家庭人口、就业、收入、消费、储蓄、手存现金、商品需求和住房等变化情况,为党和国家研究制定劳动力就业、工资和奖金、社会福利、货币流通、商品生产和供应等政策提供依据;为确居民消费价格指数权数、确定贫困线的划分、计算社会商品购买力、国民收入分配比例及其他相关资料提供依据。
城镇劳动力调查:
为国家及时掌握和了解我国城镇失业情况,研究制定劳动就业政策,加强调控提供依据。
确定调查对象和调查单位,调查对象:
调查研究的总体或调查范围调查单位:
需要对之进行调查的单位。
可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?
”,确定调查对象和调查单位例,城市住户调查对象是:
在城市和县城关镇中按随机原则抽选的部分非农业居民家庭及其成员,包括单身户,但不包括集体户口中的单身者。
城镇劳动力调查对象:
采用按常住人口登记的原则对调查范围内被抽中的住户中15岁及15岁以上人口进行调查,调查以户为单位进行,既调查家庭户,也调查集体户。
全国约抽取25万人。
确定调查项目和调查表,调查项目:
调查的具体内容调查表:
表现调查项目的表格或问卷回答“调查什么?
”,调查内容举例城市住户调查,主要包括:
城市住户基本情况调查表;城市住户现金收支调查表;城市住户消费支出调查表;居民家庭成员基本情况一览表;城市住户居住情况表;城市住户不同收入水平家庭调查表;城市住户实物收入调查表;城市住户主要指标调查表。
其主要内容包括:
居民家庭人口和劳动就业状况,收入和现金支出状况,消费水平和消费结构状况,购买主要商品数量及变化情况,耐用消费品拥有量及变化情况,家庭食品消费及营养状况,家庭住房情况,实物收入状况,货币流动、储蓄、债权债务情况,各类居民家庭之间收入、消费差异情况。
调查方案设计中的其他问题,明确调查所采用的方法确定调查资料的所属时间和调查工作的期限调查的组织与实施细则,四、统计调查方式,统计调查方式,普查(概念要点),为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄,抽样调查(概念要点),从总体中随机抽取一部分单位(样本)进行调查,具有经济性、时效性强、适应面广、准确性高等特点,目的是推断总体的未知数字特征,最常用的调查方式,统计表报(概念要点),统计调查方式之一过去曾经是我国主要的数据收集方式按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据有各种各样的类型,重点调查和典型调查(概念要点),典型调查从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体,重点调查从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体,数据的搜集方法,数据的搜集方法,访问调查(概念要点),调查者与被调查者通过面对面地交谈而获得资料有标准式访问和非标准式访问标准式访问通常按事先设计好的问卷进行非标准式访问事先一般不制作问卷,对不起,打扰了!
邮寄调查(概念要点),也称邮寄问卷调查是一种标准化调查调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种,电话调查(概念要点),调查者利用电话与被调查者进行语言交流以获得信息时效快、成本低问题的数量不宜过多,您好!
我是调查公司的调查员,电脑辅助调查(概念要点),又称电脑辅助电话调查电脑与电话相结合完成调查的全过程一般需借助专门的软件进行硬件设备要求较高,座谈会(概念要点),也称集体访谈将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料参加座谈会的人数不宜过多,一般为610人侧重于定性研究,个别深度访问(概念要点),一次只有一名受访者参加、针对特殊问题的调查适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题侧重于定性研究,观察法(概念要点),就调查对象的行动和意识,调查人员边观察边记录以收集所需信息调查人员不是强行介入能够在被调查者不察觉的情况下获得资料,实验法(概念要点),在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料有室内实验法和市场实验法,统计数据的间接来源,公开出版物:
中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴、世界经济年鉴、国外经济统计资料、世界发展报告,六、问卷设计,问卷设计的意义问卷的格式,问题的主要类型及询问方式根据所提问题的性质不同-直接性问题-间接性问题-假设性问题根据对问题的作答方式不同-开放性问题-封闭性问题-事实性问题根据所提问题的内容-行为性问题-态度性问题,设计问句时应注意的问题1.避免提笼统、抽象或过于专业化的问题。
2.避免用不确切的词。
3.避免使用含糊不清的句子。
4.避免引导性提问。
5.避免提断定性的问题。
6.避免提出令人难堪、禁忌和敏感的问题。
7.问句要考虑时间性。
8.拟定问句要有明确的界限。
9.避免一问多答的问题。
问卷中的答案设计1.答案设计的基本方法二项选择、多项选择法、顺位法、回忆法、比较法2.答案设计时应注意的问题答案要穷尽、答案须互斥、定距、定比设计、避免问题与答案不同、要有注释和填答标记,答案要互斥:
例您平时每月的支出中,花费最多的是:
食品服装书籍书报杂志日用品娱乐交际饮料其他,问卷的编排设计和要求1.问卷的顺序容易回答的较难的敏感的事实与个人情况2.问题的衔接,第二节统计数据的整理,一、统计整理的含义二、统计整理的内容三、统计整理的步骤,四、统计分组
(一)统计分组的含义
(二)统计分组的作用,1.划分社会现象的类型,2.研究统计总体的结构及变动,3.研究社会现象之间的依存关系某企业销售额与流通费用率,五、分组标志的选择1.分组标志的选择原则根据研究目的选择分组标志。
选择反映事物本质的标志。
根据经济发展变化及历史条件选择分组标志。
2.分组的种类品质标志分组和数量标志分组简单分组和复合分组,六、分配数列
(一)分配数列的概念
(二)分配数列的种类(三)变量数列1.变量数列的构成2.变量数列的种类单项变量数列组距变量数列,单变量值分组(要点),1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况,频数分布表的编制(实例),117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121,【例3.3】某生产车间50名工人日加工零件数(单位:
个)如下,试采用单变量值对数据进行分组。
单变量值分组表(实例),组距分组(要点),将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,组距分组中常用的基本概念,上限闭口组下限组限上开口开口组下开口组距上限下限(等距、不等距),次数密度:
指单位组距的分布次数。
例某单位研究员年龄分布数列,组中值:
闭口组(上限下限)2缺下限本组上限临组组距2开口组缺上限本组下限临组组距2,等距分组的种类,等距分组表(上下组限重叠),等距分组表(上下组限间断),等距分组表(使用开口组),3.变量数列的表示方法列表法用表格的形式表示总体总量在各组的分布情况。
图示法:
直方图折线图曲线图扇形图,柱形图,条形图,饼图,七、频数分布表的编制,
(一)数据的审核、筛选与排序,数据的审核发现数据中的错误数据的筛选找出符合条件的数据3.数据排序发现数据的基本特征升序和降序,数据的审核(原始数据),审核的内容完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等,数据的审核(原始数据),审核数据准确性的方法逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定距和定比数据的审核,数据的审核(第二手数据),适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要时效性审核应尽可能使用最新的统计数据确认是否必要做进一步的加工整理,数据的筛选,对审核过程中发现的错误应尽可能予以纠正当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容包括:
将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出,数据的排序(要点),按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成,数据的排序(方法),定类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分定距和定比数据的排序递增排序:
设一组数据为X1,X2,XN,递增排序后可表示为:
X
(1)X
(2)X(N),
(二)编制频数分布表的步骤,编制频数分布表的步骤,将数据资料从小到大顺序排列,找出最大值和最小值计算全距,即全距最大值最小值确定组数(一般为515组)计算组距的近似值,即组距全距组数(组数最好为整数),例:
某公司20个售货小组销售额完成情况,单位:
万元,某公司20个售货小组销售额次数分布,第三节统计表一、统计表的概念二、统计表的结构形式上看:
名称、横栏标题、纵栏标题、数字。
内容上看:
主词、宾词。
三、统计表的种类,按主词分简单表单一分组表复合分组表按宾词分简单设计复合设计,主词,宾词,数据,第四节Markway分析系统的应用
(一),数据录入:
(1)双击变量,在变量名称下定义变量名,同时确定变量的类型和宽度;
(2)双击变量名称,在定义的变量名称下输入变量值。
数据从小到大或从大到下顺序排列:
点击:
数据处理-记录排序-变量名-在“排序方式”中选择“升序排序”或“降序排序”-确定。
编制组距变量数列:
点击:
数据处理-重新编码-在“重新编码字段”点入变量名-选择等距或不等距;,等距:
确定起点、步长(组距)-确定不等距:
定义组编码、确定下限、上限后点击“添加”,往复将所有数据编入相应的组后点击“确定”。
数据汇总点击:
数据处理-数据合并-分组变量、汇总变量-确定。
画图在“图形图表”下,选择你需要的图形。
除直方图用原变量绘制外,其他常用图形均用分组变量绘制。
选择题(数据收集)1、要了解上海市居民家庭的收支情况,最适合的调查方式是:
A、普查B、重点调查C、典型调查D、抽样调查2、下例调查中,最适合采用重点调查的是A、了解全国钢铁生产的基本情况B、了解全国人口总数C、了解上海市居民家庭的收支情况D、了解某校学生的学习情况,3、普查是为了某种特定的目的而A、专门组织的一次性的全面调查B、专门组织的经常性的全面调查C、非专门组织的一次性的全面调查D、非专门组织的经常性的全面调查4、调查的标准时间是A.调查资料所属的时间B.进行调查的时间C.调查工作期限D.调查资料报送的时间,5、重点调查中重点单位是指A.标志总量在总体中占有很大比重的单位B.具有典型意义或代表性的单位C.那些具有反映事物属性差异的品质标志的单位D.能用以推算总体标志总量的单位6、调查方案应包括以下哪些主要内容A、确定调查目的B、确定调查对象和调查单位C、拟订调查提纲D、确定调查时间E、编制调查的组织计划,选择题(数据整理)1、某企业职工的工资分为四组:
(1)800元以下;
(2)8001000元;(3)10001500元;(4)1500元以上,则1500元以上的这组组中值应近似为()A、1500元B、1600元C、1750元D、2000元,2、次数分配数列是()。
A.按数量标志分组形成的数列B.按品质标志分组形成的数列C.按统计指标分组所形成的数列D.按数量标志和品质标志分组所形成的数列3、企业按资产总额分组()。
A.只能使用单项式分组B.只能使用组距式分组C.可以单项式分组,也可以用组距式分组D.无法分组,4、统计分组是()A.在统计总体内进行的一种定性分类B.在统计总体内进行的一种定量分类C.将同一总体区分为不同性质的组D.把总体划分为一个个性质不同的、范围更小的总体E.将不同的总体划分为性质不同的组5、统计分组的作用是()A.划分社会经济类型B.说明总体的基本情况C.研究同质总体的结构D.说明总体单位的特征E.分析被研究现象总体诸标志之间的联系和依存关系,6、在组距数列中,组中值是()A.上限和下限之间的中点数值B.用来代表各组标志值的平均水平C.在开放式分组中无法确定D.在开放式分组中,可以参照相邻组的组距来确定E.就是组平均数7、在次数分配数列中()A.总次数一定,频数和频率成反比B.各组的频数之和等于100C.各组频率大于0,频率之和等于1D.频数越小,则该组的标志值所起的作用越小E.频率又称为次数,8.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:
要求:
录入数据;将数据从小到大或从大到下顺序排列;编制组距变量数列;画出条形图、饼图、直方图;对上述结果进行分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 搜集 整理