统计实验xindoc.docx
- 文档编号:16405211
- 上传时间:2023-07-13
- 格式:DOCX
- 页数:39
- 大小:405.01KB
统计实验xindoc.docx
《统计实验xindoc.docx》由会员分享,可在线阅读,更多相关《统计实验xindoc.docx(39页珍藏版)》请在冰点文库上搜索。
统计实验xindoc
统计上机指导
教学部经管教学部
授课教师武霞
专业
班号
学号
姓名
实验一数据预处理
一、实验目的
能熟练运用EXCEL的相关功能对数据进行排序、分组等预处理功能。
具体要求:
1、运用EXCEL中的“数据”菜单对已知数据进行排序、筛选和分类汇总
2、运用FREQUENCY函数对数据进行分组
二、实验过程指导
1、运用EXCEL中的“数据”菜单对已知数据进行排序与分类汇总。
表1-1100个麦穗的每穗小穗数
18
15
17
19
16
15
20
18
19
17
17
18
17
16
18
20
19
17
16
18
17
16
17
19
18
18
17
17
17
18
18
15
16
18
18
18
17
20
19
18
17
19
15
17
17
17
16
17
18
18
17
19
19
17
19
17
18
16
18
17
17
19
16
16
17
17
17
16
17
16
18
19
18
18
19
19
20
15
16
19
18
17
18
20
19
17
18
17
17
16
15
16
18
17
18
16
17
19
19
17
Excel可以根据用户的要求对数据清单的行或列数据进行排序。
排序时,Excel将利用指定的排序顺序重新排列行、列或各单元格,从而使研究对象的规则性更加简洁地表现出来。
例1.1随机抽取100个小麦麦穗,计数每穗小穗数,未加整理的原始数据列于表1-1。
利用Excel操作步骤:
录入原始数据
在菜单中选择“数据”中的“排序”选项,弹出排序对话框(图1-1)。
图1-1图1-2
在排序对话框窗口中,选择“主要关键字”列表中的“每穗小穗数”作为排序关键字,并选择按“递增”排序,在“列表”中选择“有标题行”。
若没有输入“每穗小穗数”标题行,在“列表”中选择“无标题行”。
然后单击“确定”按钮,即可得到排序的结果如图1-2所示。
从数据排序结果可以看出,每穗小穗数从15个到20个变动范围的递增顺序排列。
若想进一步知道某一种类型小穗数有多少个,可利用Excel中的“分类汇总”功能。
在“数据”菜单中选择“分类汇总”选项,Excel便会自动地创建公式,生成自动分级显示的数据清单。
但要注意在分类汇总前需要先对数据进行排序。
在数据清单中使用分类汇总的方法如下:
先选择需要分类汇总的数据区域A1:
A100,然后选择“数据”菜单中的“分类汇总”选项,则打开“分类汇总”对话框如图1-3所示。
图1-3图1-4
在“分类字段”的下拉式列表中选择要进行分类的列标题,在“汇总方式”的下拉式列表中选择进行汇总的方式,本例中选择按“每穗小穗数”进行分类,选择按“计数”进行汇总,单击“确定”按钮,便得到分类汇总的结果如图1-4所示。
在对数据进行了分类汇总之后,可以观察到“每穗小穗数”为15个有6个,“每穗小穗数”为16个有15等等。
2、利用频数分布函数进行分组
频数分布函数(FREQUENCY)的语法形式为:
FREQUENCY(data_array,bins_array)
其中:
Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。
频数分布函数(FREQUENCY)可以对一列垂直数组返回某个区域中数据的频数分布。
建立频数分布的步骤:
先对数据进行排序,以了解全部数据的变动范围;
选择全部数据的分组组数;
确定分组的组限;
最后对各组数值所出现的频数进行计数。
例1.2以例1.1数据为例说明之。
打开“100个每穗小穗数.xls”工作表。
在单元格C2中输入“分组”,在单元格D2中输入“频数”。
在C3:
C8区域中依次输入15,16,17,18,19,20,作为频数接受区域,它们分别表明每穗小穗数由15个、16个等的个数。
选定D3:
D8区域,在“插入”菜单中单击“函数”选项,打开“插入函数”对话框如图1-5及图1-6所示。
图1-5图1-6
在数据区域“Data_array”中输入单元格A2:
A101,在数据接受区间Bins_array中输入单元格C3:
C8,在对话窗口中可以看到其相应的频数是6,15,32,25,17,5,0。
由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应先按下F2,再按下Ctrl+Shift+Enter组合键,得到频数分布如图1-7所示。
图1_________________________________________________________________________________________________________________-7
另外,直接利用Excel函数公式也可以得到同样结果。
用鼠标选定单元格D3:
D9,注意不要释放选定区域。
在D3单元格中输入频数分布函数公式:
=FREQUENCY(A2:
A101,C3:
C8)
在这个公式中,数据区域为A2:
A101,接受区间为C3:
C8,按Ctrl+Shift组合键,同时敲“回车”键,得到频数分布与上面相同。
从频数分布结果可以看出,每穗小数以17个为最多,且以每穗小数17个为中心对称分布。
三、实验内容
(一)下表为某班期末考试成绩
姓名
统计学成绩
数学成绩
英语成绩
经济学成绩
李婷婷
69
68
84
86
牛海荣
91
75
95
94
张亮
54
88
67
78
李丹
81
60
86
64
赵青
75
96
81
83
王路
83
72
66
71
袁丽丽
75
58
76
90
孙宁
87
76
92
77
要求利用Excel完成以下操作
1.在Excel中录入原始数据
2.在菜单中选择“数据”中的“排序”选项,分别针对统计学成绩、数学成绩、英语成绩、经济学成绩将原始数据进行升序和降序排列。
(二)下表为某企业某日50名员工生产零件数记录表
12
13
12
16
14
13
12
15
16
12
14
12
13
14
13
14
13
15
13
14
12
13
13
15
12
13
15
14
16
15
13
15
12
13
15
16
12
13
13
13
15
14
14
15
14
13
12
12
16
16
要求利用Excel完成以下操作
1.在Excel中录入原始数据
2.在菜单中选择“数据”中的“分类汇总”选项,针对生产零件数进行分类,尝试分别按照“计数”“求和”和“平均值”进行汇总。
3.利用频数分布函数(FREQUENCY)对原始数据进行分组
四、实验报告
1.将实验内容
(一)中按照统计学成绩进行升序排列的结果记录在下表内
姓名
统计学成绩
数学成绩
英语成绩
经济学成绩
2.将实验内容
(二)中利用“求和”进行汇总的结果记录在下表内(只记录电脑生成部分)
3.将实验内容
(二)中利用频数分布函数(FREQUENCY)对原始数据进行分组的结果记录在下表中
教师评语:
成绩评定:
年月日
实验二数据的显示
一、实验目的
能熟练运用EXCEL的相关功能对数据整理生成图表。
具体要求:
1、运用EXCEL中的图表向导对变量值数据生成折线图、条形图、饼图等图形。
2、运用EXCEL中的图表向导对多变量值数据生成箱线图
3、掌握直方图分析工具的运用
二、实验过程指导
1、绘制统计图的基本步骤
Excel提供“图表向导”工具,帮助创建适合于数据信息和分析目的的各种图表,下面先简单描述一下图表操作的基本步骤。
①使用“图表向导”工具制作图表之前,选定数据所在的单元格,如果希望数据的行列标题显示在图表中,则选定区域还应包括含有标题的单元格。
②单击“插入”菜单中的“图表”选项,按照“图表向导”中4个步骤的指令进行操作。
第1步“图表类型”:
每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。
第2步“图表数据源”:
选定包含数据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表中显示它们。
生成图表时,应将各行列标志包含到选定区域中。
若预览图表看去很合适,则表示所选数据区正确。
单击“下一步”按钮。
第3步“图表选项”:
为选定的图表设置某些标准选项。
修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。
单击“下一步”按钮。
第4步,“图表位置”:
可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,可以为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。
2、单变量值数据
单批数据可以表示成折线图、条形图、饼图等图形,它们的绘制大致相同,仍以例1.1100个麦穗的每穗小数为例说明之。
步骤:
①打开“数据整理.xls”工作表。
②在Excel的“插入”菜单中选择“图表”选项,Excel会启动图表向导,
③弹出“图表向导”对话框窗口。
在“图表类型”列表中选择“柱形图”(图2-1),在“子图表类型”列表中选择“三维簇状柱形图”,单击“下一步”按钮,进入数据源对话框。
图2-1图2-2
在这步对话框中,主要是选择数据源如图2-18所示。
单击“数据区域”右端的“压缩对话框”按钮,打开工作表,在工作表上将鼠标指向单元格B2,按下鼠标左键,拖到K11单元格,再单击“压缩对话框”按钮,回到源数据对话框。
确定F14:
F19单元格作为此图的数据源,同时,也应注意数据系列是以行还是以列方式排列,如果正确,此时,便有一个预览的图形如图2-3所示,如满意可单击“下一步”按钮,进入“图表选项”对话框。
图2-3图2-4
在对话框“名称”中输入“100个麦穗的每穗小数”;在“图例”页面中选择底部,至于其他功能则不需改动与填加,这些过程都会在图表预览框中看到,如果满意,单击“完成”按钮结束,得到图形图2-4。
双击所绘制的图形,则会得到图2-5的对话框。
单击“字体”页面,在“字体”列表中选择“宋体”,在“字形”列表中选择“常规”,在“字号”列表选择“10”。
图2-5
从所获得的图中可以清楚地看到,在调查的100个麦穗的每穗小数中,每穗17个小穗数最多。
条形图和柱形图可交换使用。
Excel的条形图是水平条形,Excel柱形图为竖直条形。
两种图表都可以用来表示与一组或几组分类相关的数值,它可用于不同现象的比较,也可以采用时间顺序描述现象的发展趋势。
在条形图或柱形图中,各长条或柱的宽度与各长条间的距离彼此均等,条的长度与所代表的变量值成比例。
3、多变量值数据——箱线图
例2.1从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试进行调查,得表2-1。
表2-1学生成绩表
课程名称
学生编号
1
2
3
4
5
6
7
8
9
10
11
英语
76
90
97
71
70
93
86
83
78
85
81
经济数学
65
95
51
74
78
63
91
82
75
71
55
西方经济学
93
81
76
88
66
79
83
92
78
86
78
市场营销学
74
87
85
69
90
80
77
84
91
74
70
财务管理
68
75
70
84
73
60
76
81
88
68
75
基础会计学
70
73
92
65
78
87
90
70
66
79
68
统计学
55
91
68
73
84
81
70
69
94
62
71
计算机应用基础
85
78
81
95
70
67
82
72
80
81
77
根据上表计算出11名学生各科考试成绩的下四分位数、最大值、最小值和上四分位数如表2-2:
表2-211名同学成绩整理表
学生编号
下四分位数
最大值
最小值
上四分位数
1
66.5
93
55
80.5
2
76.5
95
73
90.5
3
69
97
51
88.5
4
70
95
65
86.5
5
70
90
66
81
6
65
93
60
84
7
76.5
91
70
88
8
71
92
69
83.5
9
76.5
94
66
89.5
10
69.5
86
62
83
11
69
81
55
77.5
在Excel的“插入”菜单中选择“图表”选项,Excel会启动图表向导,弹出“图表向导”对话框窗口。
在“图表类型”列表中选择“柱形图”,在“子图表类型”列表中选择“股价图”(图2-6)单击“下一步”按钮,进入数据源对话框。
按上表形式输入数据,按下“确定”,完成,即可得到11名学生课程考试成绩的箱线图图2-7。
图2-6图2-7
4、直方图分析工具
利用“工具”下拉菜单中的“数据分析”工具,同样可以作图。
如果在Excel的“工具”菜单中没有找到“数据分析选项,必须在Excel中重新安装“分析工具库”内容(见概述)。
a)直方图分析工具库的内容
直方图分析工具是一个用于确定数据的频数分布、累计频数分布,并提供直方图的分析模块。
它在给定工作表中数据单元格区域和接收区间的情况下,计算数据的频数和累积频数。
在“工具”菜单中,单击“数据分析”选项,弹出数据分析对话框,如图2-8所示。
图2-8图2-9
在“分析工具”列表框中,单击“直方图”分析工具,则会弹出“直方图”对话框如图2-9所示。
在“输入区域”中,输入A2:
A102,然后选定标志,并在输出区域中输入单元格D1,选定图表输出,表示需要直方图与频数表。
单击“确定”按钮,直方图分析工具便生成所需图。
三、实验内容
康师傅酸梅汤
可口可乐
康师傅酸梅汤
汇源果汁
王老吉凉茶
王老吉凉茶
康师傅酸梅汤
可口可乐
王老吉凉茶
可口可乐
康师傅酸梅汤
可口可乐
可口可乐
果粒橙
康师傅酸梅汤
可口可乐
果粒橙
康师傅酸梅汤
可口可乐
果粒橙
果粒橙
王老吉凉茶
王老吉凉茶
果粒橙
王老吉凉茶
可口可乐
康师傅酸梅汤
康师傅酸梅汤
汇源果汁
汇源果汁
汇源果汁
康师傅酸梅汤
可口可乐
可口可乐
可口可乐
可口可乐
果粒橙
王老吉凉茶
汇源果汁
果粒橙
王老吉凉茶
可口可乐
果粒橙
可口可乐
王老吉凉茶
可口可乐
康师傅酸梅汤
果粒橙
汇源果汁
康师傅酸梅汤
(一)下表是某调查机构对某日50名消费者购买饮料品牌的调查
记录
要求利用Excel完成以下操作
1.在Excel中录入原始数据
2.用上述资料分别绘制彩色和黑白条形图、折线图
3.用上述资料分别绘制三种样式饼图
(二)下表是2009年我国几个主要城市各月份的平均相对湿度数据
月份
北京
长春
南京
郑州
武汉
广州
成都
昆明
兰州
西安
1
49
70
76
57
77
72
79
65
51
67
2
41
68
71
57
75
80
83
65
41
67
3
47
50
77
68
81
80
81
58
49
74
4
50
39
72
67
75
84
79
61
46
70
5
55
56
68
63
71
83
75
58
41
58
6
57
54
73
57
74
87
82
72
43
42
7
69
70
82
74
81
86
84
84
58
62
8
74
79
82
71
73
84
78
74
57
55
9
68
66
71
67
71
81
75
77
55
65
10
47
59
75
53
72
80
78
76
45
65
11
66
59
82
77
78
72
78
71
53
73
12
56
57
82
65
82
75
82
71
52
72
要求利用Excel绘制箱线图
(三)以下是北方某城市1~2月份各天气温的记录数据
-3
-9
-22
-17
-7
-14
-16
-25
-9
0
-6
-11
-1
-5
-19
-8
-9
7
-7
-18
-14
-4
8
-3
-4
-3
-11
5
-21
-6
2
-6
-25
-24
-6
-18
-19
-24
-3
-9
-8
-12
5
-15
-15
-6
-6
5
-12
-19
-22
-16
9
-15
0
2
-1
-4
-13
-1
-4
-1
-24
-4
7
要求利用Excel进行以下操作
1.在Excel中录入原始数据
2.绘制直方图
3.尝试更改原始数据,看直方图的变化
四、实验报告
1.在实验内容
(一)中绘制各种图之前需要做的准备工作有哪些?
请记录准备工作的过程和结果
2.在实验内容
(二)中绘制各种图之前需要做的准备工作有哪些?
请记录准备工作的过程和结果
3、在实验内容(三)中更改原始数据后直方图发生哪些变化,请举例说明
教师评语:
成绩评定:
年月日
实验三数据描述与分析
一、实验目的
能熟练的用Excel的描述统计工具进行数据的描述和分析。
具体要求:
1、集中趋势的测定与分析
2、离中趋势的测定与分析
3、分布形态的测定与分析
4、描述统计分析功能的运用
二、实验过程指导
1、集中趋势的测定与分析
图3-1数据分布的形状
在图3-1数据分布中,各个变量值与中间位置的距离越近,所出现的次越多,与中间位置的距离越远,所出现的次数越少,从而形成了以中间值为中心的集中趋势。
统计学中通常用均值来描述总体分布的集中趋势。
在Excel中既可手工创建公式计算各种平均数,也可利用Excel中的统计函数。
在“统计函数”类别中用于集中趋势测定的常用函数有三种:
均值、中位数和众数。
1)均值函数(AVERAGE)
均值函数是应用比较广泛的一种平均数函数,它能够计算一组数据的算术平均数。
其语法结构为:
AVERAGE(number1,number2,...)。
其中:
number1,number2,...为要计算平均数的1~30个参数。
2)中位数函数(MEDIAN)中位数函数用于描述居于数据分布中心位置的数值。
其语法结构为:
MEDIAN(number1,number2,...)。
其中:
number1,number2,...是需要找出中位数的1~30个数字参数。
3)众数函数(MODE)众数函数用于计算一组数据中出现频率最多的数值。
其语法结构为:
MODE(number1,number2,…)。
其中:
number1,number2,…是用于众数计算的1~30个参数,也可以使用单一数组(即对数组区域的引用)来代替由逗号分隔的参数。
例2.1以表1.1100个麦穗的每穗小穗数为例计算平均数。
1打开“数据整理.xls”工作簿,选择“100个麦穗的每穗小穗数”工作表。
2在单元格B7中输入“均值”,在B8中输入“中位数”,在B9中输入“众数”。
③选定单元格C7,单击“插入”菜单,选择“函数”选项,Excel会弹出“粘贴函数”对话框窗口。
④在“函数分类”列表中选择“统计”,在“函数名”列表中选均值函数“AVERAGE”。
单击“确定”,
则弹出“AVERAGE”函数对话窗口。
⑤在“Number1”区域中输入数据A2:
A102后,对话窗口底部便显示出计算结果17。
如果对话窗口中没有计算结果,便说明计算有错误,需要再检查一下。
⑥单击“确定”按钮,计算完成。
⑦也可以直接在单元格C7中输入均值函数公式“=AVERAGE(A2:
A102)”,然后敲回车键,得到同样结果。
⑧在单元格C8中输入公式“=MEDIAN(A2:
A102)”计算中位数。
⑨在单元格C9中输入公式“=MODE(A2:
A102))”计算众数。
2、离中趋势的测定与分析
如图3-2所示,三个不同的曲线表示三个不同的总体,其均值相同,但离中趋势不同。
图3-2表示离散性数据示意图
描述方差离散性的统计数有:
方差与标准差、分位差、变异系数、极差等。
1)标准差
在Excel中用于计算标准差的函数有两个。
a)总体标准差函数(STDEVP)总体标准差函数用来反映相对于均值的离散程度。
其语法结构为:
STDEVP(number1,number2,…)。
其中,number1,number2,…为对应于样本总体的1~30个参数。
b)样本标准差函数(STDEV)样本标准差函数用来计算样本中相对于均值的离散程度。
其语法结构为:
STDEV(number1,number2,…)
其中,Number1,number2,…为对应于总体样本的1~30
2)分位差
四分位距是总体中第3四分位数与第1四分数之差四分位距可包括位于总体分布中心的50%,它能集中地反映总体的特征。
总体第50%位置的数值是第2四分位数Q2;位于总体第75%位置的数值是第3四分位数Q3。
四分位数函数QUARTILE可以计算一组数据的四分位数。
其语法结构为:
QUARTILE(array,quart)
其中:
Array为计算四分位数的数组或数据区域,Quart决定返回第几个四分位数。
如果quart等于0,函数QUARTILE返回最小值;quart等于1,函数QUARTILE返回第1四分位数,(第25个百分排位);quart等于2,函数QUARTILE返回中位数(第50个百分排位);如果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 实验 xindoc
![提示](https://static.bingdoc.com/images/bang_tan.gif)