数据分析实验报告表分析解析.docx
- 文档编号:2390474
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:28
- 大小:22.65KB
数据分析实验报告表分析解析.docx
《数据分析实验报告表分析解析.docx》由会员分享,可在线阅读,更多相关《数据分析实验报告表分析解析.docx(28页珍藏版)》请在冰点文库上搜索。
数据分析实验报告表分析解析
实验课程:
数据分析
专业:
信息与计算科学
班级:
学号:
姓名:
中北大学理学院
..
..
实验一SAS系统的使用
【实验目的】
了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。
【实验内容】
1.将SCORE数据集的内容复制到一个临时数据集test。
SCORE数据集
Name
Sex
Math
Chinese
English
Alice
f
90
85
91
Tom
m
95
87
84
Jenny
f
93
90
83
Mike
m
80
85
80
Fred
m
84
85
89
Kate
f
97
83
82
Alex
m
92
90
91
Cook
m
75
78
76
Bennie
f
82
79
84
Hellen
f
85
74
84
Winceletf
90
82
87
Butt
m
77
81
79
Geoge
m
86
85
82
Tod
m
89
84
84
word教育资料
..
Chris
f
89
84
87
Janet
f
86
65
87
2.将SCORE数据集中的记录按照
math的上下拆分到
3个不同的数据集:
math
大于等于90的到good数据集,math在80到89之间的到normal数据集,math
在80以下的到bad数据集。
3.将3题中得到的good,normal,bad数据集合并。
【实验所使用的仪器设备与软件平台】SAS
【实验方法与步骤】
1:
DATASCORE;
INPUTNAME$Sex$MathChineseEnglish;
CARDS;
Alice
f
90
85
91
Tomm
95
87
84
Jenny
f
93
90
83
Mike
m
80
85
80
Fred
m
84
85
89
Kate
f
97
83
82
Alex
m
92
90
91
Cook
m
75
78
76
Bennie
f
82
79
84
Hellen
f
85
74
84
Winceletf
90
82
87
Butt
m
77
81
79
Geoge
m
86
85
82
Todm
89
84
84
Chris
f
89
84
87
Janet
f
86
65
87
;
Run;
PROCPRINTDATA=SCORE;
DATAtest;
SETSCORE;
2:
DATAgoodnormalbad;
SETSCORE;
word教育资料
..
SELECT;
when(math>=90)outputgood;
when(math>=80&math<90)outputnormal;
when(math<80)outputbad;
end;
Run;
PROCPRINTDATA=good;
PROCPRINTDATA=normal;
PROCPRINTDATA=bad;
3:
DATAAll;
SETgoodnormalbad;
PROCPRINTDATA=All;
Run;
【实验结果】
结果一:
结果二:
word教育资料
..
结果三:
word教育资料
..
word教育资料
..
实验二上市公司的数据分析
【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟悉
数据分析方法,培养学生分析处理实际数据的综合能力。
【实验内容】表2是一组上市公司在
2001年的每股收益〔eps〕、流通盘(scale)
的规模以及2001年最后一个交易日的收盘价(price).
表2
某上市公司的数据表
代码
流通盘
每股收益
股票价格
000096
8500
000099
6000
000150
12600
000151
10500
000153
2500
000155
13000
000156
3600
000157
10000
000158
10000
000159
7000
000301
15365
000488
7700
000725
6000
000835
1338
000869
3200
000877
7800
000885
6000
000890
16934
000892
12000
000897
14166
000900
21423
000901
4800
000902
6500
000903
6000
000905
9500
000906
6650
000908
8988
000909
6000
000910
8000
000911
7280
000912
15000
000913
8450
000915
4599
000916
34000
000917
11800
000918
6000
word教育资料
..
1、对股票价格
1〕计算均值、方差、标准差、变异系数、偏度、峰度;
2〕计算中位数,上、下四分位数,四分位极差,三均值;
3〕作出直方图;
4〕作出茎叶图;
5〕进行正态性检验〔正态W检验〕;
6〕计算协方差矩阵,Pearson相关矩阵;
7〕计算Spearman相关矩阵;
8〕分析各指标间的相关性。
2、1〕对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计
值及残差;
2〕给定显著性水平α=0.05,检验回归关系的显著性,检验各自变量对因变量的影响的显著性;
3〕拟合残差关于拟合值
?
X2及X1X2
的残差图及残差的正态
QQ图。
分析
Y,X1
这些残差,并予以评述。
【实验所使用的仪器设备与软件平台】SAS
【实验方法与步骤】
data
prices;
input
numscaleepsprice;
cards;
000096
000099
000150
12600
000151
10500
word教育资料
..
000153
25000
.056
000155
13000
000156
36000
.033
000157
10000
000158
10000
000159
70000
.008
000301
15365
000488
77000
.101
000725
60000
.044
000835
13380
000869
32000
.194
000877
7800-
000885
6000-
000890
16934
000892
12000
000897
14166
000900
21423
000901
48000
.005
000902
6500-
000903
60000
.109
000905
95000
.046
000906
66500
.007
000908
89880
.006
000909
60000
.002
000910
80000
.036
000911
72800
.067
000912
15000
000913
84500
.062
000915
45990
.001
000916
34000
000917
11800
000918
6000-
run;
PROCPRINTDATA=prices;
run;
proc
meansdata=prices
meanvar
std
skewness
kurtosis
cv;
var
price;
output
out=result;
run;
proc
univariate
data=pricesplot
freq
normal;
var
price;
output
out=result2;
run;
proc
capability
data=pricesgraphics
noprint
;
word教育资料
..
histogram
price/normal;
run;
proc
corr
data=prices
pearson
spearmancovnosimple
;
var
price;
with
price;
run;
proc
reg
data=prices;
modelprice=scaleeps/
selection
=backwardnointpr
;
outputout=pricesp=p
r=r;
proc
data=prices;
run
【实验结果】
word教育资料
..
word教育资料
..
word教育资料
..
对于问题二结果:
word教育资料
..
word教育资料
..
word教育资料
..
实验三美国50个州七种犯罪比率的数据分析
【实验目的】通过使用SAS软件对实验数据进行主成分分析和因子分析,熟悉
数据分析方法,培养学生分析处理实际数据的综合能力。
【实验内容】表3给出的是美国50个州每100000个人中七种犯罪的比率数
据。
这七种犯罪是:
Murder〔杀人罪〕,Rape〔强奸罪〕,Robbery〔抢劫罪〕,Assault
〔斗殴罪〕,Burglary〔夜盗罪〕,Larceny〔偷盗罪〕,Auto〔汽车犯罪〕。
表3
美国50
个州七种犯罪的比率数据
State
Murder
Rape
Robbery
Assault
Burglary
Larceny
Auto
Alabama
Alaska
Arizona
Arkansas
California
Colorado
Connecticut
Delaware
Florida
Georgia
Hawaii
Idaho
Illinois
Indiana
Iowa
Kansas
Kentucky
Louisiana
Maine
Maryland
Massachusetts
Michigan
Minnesota
Mississippi
Missouri
Montana
Nebraska
Nevada
NewHampshire
NewJersey
word教育资料
..
NewMexico
NewYork
NorthCarolina
Ohio
NorthDakota
Oklahoma
Oregon
35061
Pennsylvania
RhodeIsland
SouthCarolina
SouthDakota
Tennessee
Texas
Utah
Vermont
Virginia
Washington
WestVirginia
Wisconsin
Wyoming
1、1〕分别用样本协方差矩阵和样本相关矩阵作主成分分析,二者的结果有何差
异?
2〕原始数据的变化可否由三个或者更少的主成分反映,对所选取的主成分给
出合理的解释。
3〕计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序.
2、从样本相关矩阵出发,做因子分析。
【实验所使用的仪器设备与软件平台】SAS
【实验方法与步骤】
首先将上述数据复制到excel,再通过SAS导入数据至数据集crime。
样本协方差矩阵做主成分分析:
procprincompcovariance;
run;
样本相关矩阵做主成分分析:
procprincompdata=work.crime;
run;
对第一样本主成分排序
word教育资料
..
procprincompdata=crimeout=defen;
run;
procsortdata=defen;
byprin1;
run;
procprintdata=defen;
run;
2、
程序:
procfactorscore;
run;
【实验结果】
word教育资料
..
word教育资料
..
word教育资料
..
word教育资料
..
word教育资料
..
实验四1991年全国各省、区、市城镇居民
月平均收入的数据分析
【实验目的】通过使用SAS软件对实验数据进行判别分析和聚类分析,熟悉数
据分析方法,培养学生分析处理实际数据的综合能力。
【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下表,变
量含义如下:
X1-人均生活费收入〔元/人〕;X2-人均全民所有制职工工资〔元/
人〕;X3-人均来源于全民标准工资〔元/人〕;X4-人均集体所有制工资〔元/人〕;
X5-人均集体职工标准工资〔元/人〕;X6-人均各种奖金及超额工资〔元/人〕;X7-
人均各种津贴〔元/人〕;X8-职工人均从工作单位得到的其他收入〔元
/人〕;X9-
个体劳动者收入〔元/人〕。
省(区市)
类
x1
x2
x3
x4
x5
x6
x7
x8
x9
名
型
北京
1
天津
1
河北
1
11
12
上海
1
31
山东
1
湖北
1
广西
1
海南
1
四川
1
1021
云南
1
新疆
1
山西
2
内蒙古
2
吉林
2
黑龙江
2
江西
2
河南
2
贵州
2
陕西
2
甘肃
2
青海
2
宁夏
2
word教育资料
..
辽宁
3
江苏
3
浙江
3
13
安徽
3
福建
3
湖南
3
124
广东
待
114
判
西藏
待
0
判
1、1〕判定广东、西藏两省区属于哪种收入类型,并用回代法及交叉确认法对误
判率作出估计。
2〕进行Bayes判别,并用回代法与交叉确认法验证判别结果。
2、1〕用最短距离法、最长距离法与类平均法聚类,画出谱系图,并写出分3
类的结果;
2〕快速聚类法聚类,并写出分3类的结果。
【实验所使用的仪器设备与软件平台】SAS
【实验方法与步骤】
1:
发现数据四川省X9数据存在异常,通过查阅课本170页表5.3可得此处数据应为1.21.
首先将上述数据建立excel表格,再通过SAS直接导入到名为shuju的数据集中。
将数据
省(区
x1
x2
x3
x4
x5
x6
x7
x8
x9
市)名
广东
114
西藏
0
导入‘daipang’数据集。
‘shuju’数据集删除最后两行运行以下程序
procdiscrimdata=shuju
testdata=daipangmethod=normal
listcrosslisttestlist;
classleixing;
varx1-x9;
word教育资料
..
run;
2:
将上述结果也导入至数据集SHUJU中
SINGLE(或SIN):
最短距离法.
procclusterdata=shujumethod=sinouttree=y1;
run;
proctreedata=y1nclusters=3out=z1;
run;
procprintdata=z1;
run;
COMPLETE(或COM):
最长距离法.
p
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 实验 报告 解析