数据收集与整理实习报告.docx
- 文档编号:15816808
- 上传时间:2023-07-08
- 格式:DOCX
- 页数:21
- 大小:218.85KB
数据收集与整理实习报告.docx
《数据收集与整理实习报告.docx》由会员分享,可在线阅读,更多相关《数据收集与整理实习报告.docx(21页珍藏版)》请在冰点文库上搜索。
数据收集与整理实习报告
指导老师:
组长:
组员:
数据收集与整理实习报告
第一部分实习计划……………………………………………………………………2
第二部分抽样方法的理论阐述………………………………………………………3
第三部分数据整理与分析……………………………………………………………4
抽样程序与输出结果………………………………………………………4
抽样框与简单分析…………………………………………………………7
第四部分实习过程及总结……………………………………………………………7
实习过程……………………………………………………………………7
实习总结……………………………………………………………………8
第五部分附件…………………………………………………………………………10
附件一………………………………………………………………………10
附件二………………………………………………………………………12
第一部分实习计划
作为当代的大学生,我们应该学会理论联系实际。
我们不能纸上谈兵,要把所学的专业知识运用到实践中去,这次数据收集与整理的实习,可以让我们把在课堂上所学到的知识运用到实践中去,同时也能帮助我们更好地掌握课堂所学的知识。
为了能够顺利的完成实习任务,我们小组的实习计划如下:
准备阶段(12月16日—12月18日)
时间:
12月16日
任务:
建立实习讨论组,共同学习往年优秀的实习报告,明确实习的各项事宜。
人员安排:
全组成员
时间:
12月17日
上午
任务:
小组讨论,确定研究方向,谈论并确定实习分工
人员安排:
全组成员
下午
任务:
与老师沟通,针对实习的相关安排的合理性与老师进行讨论
人员安排:
时间:
12月17日—12月18日
任务:
回顾、学习实习所要用到的相关知识
人员安排:
全组成员
时间:
12月18日20:
30-21:
30
任务:
讨论两天以来所学相关知识的难点,并予以解决
安排人员:
全组成员
数据收集与整理及抽样阶段(12月19日—12月21日)
时间:
12月19日
上午
任务:
收集相关数据
人员安排:
下午
任务:
整理、录入数据
人员安排:
晚上
任务:
根据所收集的数据进行讨论合适的抽样方法,确定数据的抽样方法
人员安排:
全组成员
时间:
12月20日
任务:
编写SAS的抽样程序,进行抽样
人员安排:
陈代明
时间:
12月21日
任务:
对抽样结果进行整理,做出抽样框
人员安排:
实习报告撰写阶段(12月22日—12月23日)
时间:
12月22日
任务:
报告各部分的撰写
人员安排:
全组成员
任务:
整理报告的各部分,进行内容扩充,总结成文
人员安排:
任务:
修改实习报告,最终定稿
人员安排:
全组成员
尾声
时间:
12月23日晚
聚餐,实习心得分享
人员安排:
全组成员
第二部分抽样方法的理论阐述
我们小组采用分层抽样的抽样方法对数据进行处理,各层的样本量分配方法采用比例分配。
我们将其理论知识阐述如下:
分层抽样的定义
分层抽样又称分类抽样或类型抽样。
是一种利用辅助信息,在抽样之前将总体的单位按某种特征划分为互不交叉、互不重叠的若干个层,然后再从每一层内进行单纯随机抽样,组成一个样本的方法。
分层抽样的特点
分层抽样将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,而抽样保证了所抽取的样本具有足够的代表性。
在不断增加样本规模的前提下降低抽样的误差,提高抽样的精度。
分层抽样不仅能对总体指标进行推算,而且能够对各层至今推算,非常便于了解总体内不同层次的情况,也便于对总体不同的层次或类别进行单独研究。
该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
所以,分层抽样要求尽可能地降低层内差异,使层间差异尽可能大。
分配方法
确定样本量在各层的分配有很多分配方法,我们小组采用的是比例分配的方法。
比例分配是指按各层单元数占总体单元数的比例进行分配。
分层抽样的步骤:
(1)根据分层的目的确定分层的标志,将总体分成若干层。
(2)根据实际情况,确定一个合适的总体样本量。
(3)选择合适的分配方法,确定样本量在各层的分配
(4)根据确定的各层样本量,在每一层进行随机抽样。
(5)综合每层抽样,组成样本。
报告中涉及的符号及公式说明
用下标h表示层号(h=1,2,…,L),关于第h层的记号如下:
单元总数:
总体单元:
样本单元数:
总样本量:
层权:
抽样比:
样本均值:
样本方差:
总体均值
的简单估计:
第三部分数据整理与分析
抽样程序与输出结果
我们小组抽样数据来源于世界银行WDI数据库中2005年与2010年45个国家货物和服务进出口占国内生产总值比重调查的数据,原始数据见附件。
我们把45个国家按洲分成三层,即亚洲国家
(1),欧洲国家
(2),美洲、澳洲及非洲国家(3)。
我们将总样本量n定为20,各层样本量按比例分配,具体结果见下表:
1
23
23/45
10
10/23
2
11
11/45
5
5/11
3
11
11/45
5
5/11
用SAS进行分层抽样的程序如下;
dataa;
inputidcountry$area$E2005$E2010$I2005$I2010$;
cards;
1中国137.0829.4531.5524.79
2中国香港1198.70222.96186.27217.35
3中国澳门194.4789.60①58.4342.11①
4孟加拉国116.5818.5323.0524.93
5文莱170.1718.5327.2918.53
6柬寨164.0859.61①72.7562.66①
7印度119.2918.4722.0324.86
8印度尼西亚134.0724.6129.9222.98
9伊朗133.0632.65②24.6622.62②
10以色列142.6036.9642.9034.92
11日本114.3312.64①12.9512.33①
12哈萨克斯坦153.5444.8644.7326.64
13韩国139.2749.81①36.5745.90①
14老挝133.8033.1148.3337.97
15马来西亚1117.4796.42①94.6474.88①
16蒙古158.7756.8163.6166.38
17缅甸10.500.500.500.50
18巴基斯坦115.6912.9019.5618.98
19菲律宾146.1434.8051.7436.62
20新加坡1229.98211.06200.58183.01
21斯里兰卡132.3418.9141.2726.50
22泰国173.5771.3074.6963.89
23越南169.3670.7273.5482.56
24埃及330.3421.2932.6128.20
25尼日利亚346.5439.3731.0526.63
26南非327.3825.5427.8527.12
27加拿大337.8128.72①34.0930.43①
28墨西哥327.1029.7628.5530.92
29美国310.3811.24①16.1213.99①
30阿根廷325.0722.2619.1917.56
31巴西315.1310.2511.5211.16
32委内瑞拉339.6618.1120.4712.66
33捷克272.2169.55①69.0463.82①
34法国226.1823.27①27.0525.23①
35德国241.1140.83①35.8135.89①
36意大利225.9423.99①26.0224.39①
37荷兰269.6269.22①61.1061.99①
38波兰237.0931.1537.8331.38
39俄罗斯联邦235.2028.6721.5120.46
40西班牙225.6823.38①30.9625.53①
41土耳其221.8623.1825.3526.21
42乌克兰251.4846.7150.6448.89
43英国226.3827.69①29.8030.06①
44澳大利亚318.1019.79②20.5421.61②
45新西兰327.3628.20①29.5926.53①
;
procprintdata=a;
run;
odshtml;
procsortdata=a;
byarea;
run;
procsurveyselectdata=amethod=srsn=(10,5,5)out=b;
strataarea;
run;
procprintdata=b;
run;
odshtmlclose;
运行后,系统输出结果如下:
SAS系统2012年12月31日星期一下午09时42分58秒3
SelectionSamplin
ObsareaidcountryE2005E2010I2005I2010ProbWeight
112中国香港198.70222.96186.27217.350.434782.3
214孟加拉国16.5818.5323.0524.930.434782.3
315文莱70.1718.5327.2918.530.434782.3
4111日本14.3312.64①12.9512.33①0.434782.3
5112哈萨克斯53.5444.8644.7326.640.434782.3
6113韩国39.2749.81①36.5745.90①0.434782.3
7115马来西亚117.4796.42①94.6474.88①0.434782.3
8117缅甸0.500.500.500.500.434782.3
9121斯里兰卡32.3418.9141.2726.500.434782.3
10122泰国73.5771.3074.6963.890.434782.3
11234法国26.1823.27①27.0525.23①0.454552.2
12235德国41.1140.83①35.8135.89①0.454552.2
13238波兰37.0931.1537.8331.380.454552.2
14241土耳其21.8623.1825.3526.210.454552.2
15242乌克兰51.4846.7150.6448.890.454552.2
16325尼日利亚46.5439.3731.0526.630.454552.2
17328墨西哥27.1029.7628.5530.920.454552.2
18329美国10.3811.24①16.1213.99①0.454552.2
19331巴西15.1310.2511.5211.160.454552.2
20344澳大利亚18.1019.79②20.5421.61②0.454552.2
抽样框与简单分析
根据输出结果得到分层抽样框如下:
层数
抽样国家
1
中国香港孟加拉国文莱日本哈萨克斯韩国马来西亚缅甸斯里兰卡泰国
2
法国德国波兰土耳其乌克兰
3
尼日利亚墨西哥美国巴西澳大利亚
根据样本框可得各层样本量数据,见附件2
根据各层样本量数据,通过可以计算
2005年与2010年各层货物和服务出口占国内生产总值比重的均值,如下:
h
年份
2005年
2010年
1
各层样本均值
61.647
55.446
2
35.544
33.028
3
23.45
22.082
2005年与2010年各层货物和服务进口占国内生产总值比重的均值,如下:
h
年份
2005年
2010年
1
各层样本均值
54.196
51.145
2
35.336
33.52
3
21.556
20.862
由上面的计算结果,可大体估计,2010年与2005年相比,45个国家货物和服务出口占国内生产总值比重略有下降,其中欧洲国家下降最明显。
2010年与2005年相比,45个国家货物和服务进口占国内生产总值比重都略有下降,下降速度相当。
第四部分实习过程及总结
实习过程
一、讨论实习计划
时间:
12月15日地点:
宿舍参加人员:
完成工作:
制定实习计划,做初步实习分工,并在QQ上建立讨论组
二、选取数据的讨论
时间:
12月16日地点:
1号食堂二楼参加人员:
全体组员
完成工作:
共同学习历年数据收集与整理的实习报告,吸取经验,明确实习报告的写作技巧及注意事项,讨论实习的选用数据的范围。
时间:
12月17日地点:
1号食堂二楼参加人员:
全体组员
完成工作:
确定实习选用数据的范围
三、学习理论知识
时间:
12月17日—12月18日地点:
宿舍参加人员:
全体组员
完成工作:
回顾、学习实习所要用到的相关知识
时间:
12月17日地点:
05503机房参加人员:
完成工作:
与老师沟通交流,确定实习计划的可行性
时间:
12月18日地点:
各自宿舍参加人员:
全体组员
完成工作:
在QQ讨论组讨论在学习理论知识过程中遇到的难点,并予以解决。
四、数据收集与整理
时间|:
12月19日上午地点:
宿舍参与人员:
完成工作:
收集相关数据
时间:
12月19日下午地点:
宿舍参与人员:
完成工作:
整理、录入数据
时间:
12月19日晚上地点:
1号食堂2楼参与人员:
全体成员
完成工作:
根据所收集的数据进行讨论合适的抽样方法,确定数据的抽样方法
时间:
12月31日上午地点:
宿舍参与人员:
完成工作:
编写SAS的抽样程序,进行抽样
时间:
12月31日下午地点:
宿舍参与人员:
完成工作:
检查所编写好的SAS的抽样程序,再次运行
时间:
12月31日晚上地点:
宿舍参与人员:
完成任务:
对抽样结果进行整理,做出抽样框,并进行简单分析
五、实习报告撰写
时间:
2013年1月1日地点:
各自宿舍
完成工作:
封面设计部分:
目录设计部分:
陈科
实习计划部分:
抽样方法的理论阐述部分:
抽样程序及运行输出结果部分
抽样框录入级分析部分:
实习过程及总结撰写:
时间:
1月2日上、下午地点:
宿舍
完成任务:
实习过程及总结撰写修改:
整理报告的各部分,进行内容扩充,总结成文:
时间:
1月2日晚上地点:
宿舍参与人员:
全体成员
完成工作:
修改实习报告,最终定稿
实习总结
2013年1月2日晚上九点,数据收集与整理的实习终于落下了帷幕。
为什么我们要在总结的开头用了“终于”二字?
难道是因为对我们小组成员而言,在这个实习过程中身受煎熬?
当然,实际情况并非如此。
我们之所以要用“终于”二字,是因为这个实习本应该在2012年12月22日完成的,但是由于中途有好几门课程要考试,才推迟了10天。
对此,我们也深表歉意。
虽然这个实习的时间并不长,也没有让我们投身到社会工作中去。
但是,它却让我们把在课堂上所学习到的理论知识应用到实践中,帮助我们更好地掌握课堂上所学的知识。
在学习理论知识的时候,很多同学都在疑惑,课堂上所学的理论知识到底在实践中有没有用处,老师让我们熟记的那些公式能否应用到实践中去呢?
当然,我们小组的成员也同样有这些疑问。
但是,通过这次数据收集与整理的实习,我们明白,那些在课堂所学的理论知识在实践中都有它的应用。
通过此次实习,我们不仅巩固了课本知识,还成功的把所学专业知识运用到生活实践工作中去。
我们用比较简单的抽样知识把数据进行分析,把复杂的工序简单化。
这次实习看似很容易完成,工作量也不是很大,但是,如果要圆满完成,也并非易事。
这次实习让我们明白,团队协作的重要性。
在一个团队中,团队协作是至关重要的。
在一个团队中,我们应该相互帮助,发挥力所能及的作用。
为了让实习能顺利完成,我们还应该合理分工,做到每个在团队中都能发挥其最大价值。
当然了,在一个团队中,我们同样需要懂得相互体谅、相互包容,不能斤斤计较。
这次实习,有很多小组讨论了,在提出意见建议时,难免会有分歧。
记得,在选用抽样方法的小组讨论中,大家各抒己见,讨论异常的激烈,对于一些小细节,有些组员争论得面红耳赤,出现了意见分歧。
这次,组长当然是不能袖手旁观的。
但是谁都没有错,因为大家都是想把实习弄得更好。
大家唯有冷静下来,相互理解,和气的商量,选用最佳方案。
当然,对于一个团队而言,分工合理性也是很重要的。
每个人掌握的知识不尽相同,如果我们能够根据组员的长处分工,不仅可以让大家发挥自己的长处,而且能提高工作效率。
在团队工作中,我们应该善于发现他人的长处。
当然,人不是万能的,每个人的能力都是有限,人更不是完美的,能者多劳,大家应该相互理解,也许在某一方面,他并不能帮什么忙,但是也许在其他方面,他也会助你一臂之力。
这次实习中,我们闹过矛盾,刷过小性子,但是归根基地都是因为我们想把实习工作做好。
虽然,在别人看来,这个实习并不难,我们所做的抽样也并不复杂,但是,我们想说:
我们仍让为我们感到自豪。
因为除了做好实习,我们也从实习领会到很多东西,我们学会了团结协作,我们懂得相互理解、相互包容。
我们不得不指出,在这次实习中,小组存在的一些问题。
第一点是:
我们没有很好地把控时间,如期完成实习工作;第二点是:
准备阶段,并没有完全把实习需要用的知识理解清楚,导致实习进度变慢;第三点是:
某些工作分工不够合理,没有让每位组员都发挥自己的长处。
在实践中,存在着做的不够好的,并不可怕,可怕的是,明明知道自己做得不够好,还不去寻找问题所在。
我们小组会吸取这次实习的经验,争取下次避免出现类似问题。
实习结束了,我们也因为这次实习而成长,慢慢变得成熟。
作为一名大学生,我们应该多把所学的理论知识运用到实践中去,并在每一次实践中成长,善于总结,发现自己的不足之处,并予以改正、提高,不断在实践中进步。
这次实习承载着我们的笑,见证了我们的成长。
也许在别人看来,这次实习并不是那么难忘,但对于我们而言,它却是我们一笔不菲的财富
第五部分附件
附件一
货物和服务进出口占国内生产总值比重(单位:
%)
IP
国家和地区CountryorArea
和类class
货物和服务出口占
国内生产总值比重
ExportsofGoodsand
ServicesaspercentageofGDP
E
货物和服务进口
占国内生产总值比重
ImportsofGoodsand
ServicesaspercentageofGDP
I
2005
2010
2005
2010
1
中国
1
37.08
29.45
31.55
24.79
2
中国香港
1
198.70
222.96
186.27
217.35
3
中国澳门
1
94.47
89.60①
58.43
42.11①
4
孟加拉国
1
16.58
18.53
23.05
24.93
5
文莱
1
70.17
18.53
27.29
18.53
6
柬寨
1
64.08
59.61①
72.75
62.66①
7
印度
1
19.29
18.47
22.03
24.86
8
印度尼西亚
1
34.07
24.61
29.92
22.98
9
伊朗
1
33.06
32.65②
24.66
22.62②
10
以色列
1
42.60
36.96
42.90
34.92
11
日本
1
14.33
12.64①
12.95
12.33①
12
哈萨克斯坦
1
53.54
44.86
44.73
26.64
13
韩国
1
39.27
49.81①
36.57
45.90①
14
老挝
1
33.80
33.11
48.33
37.97
15
马来西亚
1
117.47
96.42①
94.64
74.88①
16
蒙古
1
58.77
56.81
63.61
66.38
17
缅甸
1
0.50
0.50
0.50
0.50
18
巴基斯坦
1
15.69
12.90
19.56
18.98
19
菲律宾
1
46.14
34.80
51.74
36.62
20
新加坡
1
229.98
211.06
200.58
183.01
21
斯里兰卡
1
32.34
18.91
41.27
26.50
22
泰国
1
73.57
71.30
74.69
63.89
23
越南
1
69.36
70.72
73.54
82.56
24
埃及
3
30.34
21.29
32.61
28.20
25
尼日利亚
3
46.54
39.37
31.05
26.63
26
南非
3
27.38
25.54
27.85
27.12
27
加拿大
3
37.81
28.72①
34.09
30.43①
28
墨西哥
3
27.10
29.76
28.55
30.92
29
美国
3
10.38
11.24①
16.12
13.99①
30
阿根廷
3
25.07
22.26
19.19
17.56
31
巴西
3
15.13
10.25
11.52
11.16
32
委内瑞拉
3
39.66
18.11
20.47
12.66
33
捷克
2
72.21
69.55①
69.04
63.82①
34
法国
2
26.18
23.27①
27.05
25.23①
35
德国
2
41.11
40.83①
35.81
35.89①
36
意大利
2
25.94
23.99①
26.02
24.39①
37
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 收集 整理 实习 报告