多元统计分析东北大学秦皇岛分校.docx
- 文档编号:17457892
- 上传时间:2023-07-25
- 格式:DOCX
- 页数:9
- 大小:19.58KB
多元统计分析东北大学秦皇岛分校.docx
《多元统计分析东北大学秦皇岛分校.docx》由会员分享,可在线阅读,更多相关《多元统计分析东北大学秦皇岛分校.docx(9页珍藏版)》请在冰点文库上搜索。
多元统计分析东北大学秦皇岛分校
多元统计分析-东北大学秦皇岛分校
以下是为大家整理的多元统计分析-东北大学秦皇岛分校的相关范文,本文关键词为多元,统计分析,东北,大学,秦皇岛,分校,,您可以从右上方搜索框检索更多相关文章,如果您觉得有用,请继续关注我们并推荐给您的好友,您可以在成教大学中查看更多范文。
多元统计分析实验指导书
李喆编写
东北大学秦皇岛分校
二○一六年五月
1
前言
本课程为金融学专业大二学生的专业平台课。
通过本课程的学习,使学生掌握多元统计分析的基本概念、基本原理和基本结果及各种多元统计分析方法的背景、功能、作用、计算方法及实际应用,能够利用spss软件运行数据处理方法,从而为学会如何通过建立模型对现实的经济生活进行分析模拟,为实证分析打下一定的理论基础
2
目录
实验一熟悉spss软件.................................4实验二实验三实验四
假设检验、相关分析和回归分析..................22聚类分析.....................................36主成分分析和因子分析,对应分析................40
3
实验一熟悉spss软件
[实验目的]
1、利用spss软件建立数据文件;
2、利用spss软件进行基本的统计分析;3、学会使用spss软件统计绘图;[实验内容]
一、熟悉spss界面
(一)启动方法
启动方法:
开始→程序→spssInc→spss16.0。
(二)spss的主窗口
启动spss16.0后,弹出一个选择对话框,可以选择打开已经存在的数据文件,也可以做出其他选择。
各选项分别对应:
运行指南;数据录入;运行已存在的查询;使用数据库向导建立一个新的文件;打开已存在的数据文件*.sav/*.sys;打开其它类型的数据文件*.xls/*.txt/*.dat;运行spss时不显示该对话框。
(三)数据编辑窗口
4
菜单栏包括:
File:
文件操作。
完成文件的打开、新建、保存、打印和关闭等操作
edit:
文件编辑。
完成文本或数据内容的选择、复制、剪贴、查找和替换等操作View:
浏览编辑。
完成文本或数据内容的状态栏、工具栏、字体、网格线和数值标签等功能的操作
Data:
数据管理。
完成数据变量名称和格式的定义,数据资料的选择、排序、加权,数据文件的转换、连接和汇总等操作
Transform:
数据转换。
完成数据的计算、重新编码和缺失值替代等操作
Analyze:
数据分析。
完成基本统计分析、均值比较、相关分析、回归分析、聚类分析、因子分析、对应分析等一系列统计分析方法的选择与应用
graphs:
制作统计图形。
完成条形图、饼形图、直方图、散点图等统计图形的制作与编辑。
utilities:
实用程序。
有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。
Add-ons:
附加
windows:
窗口控制。
可进行窗口的排列、选择和显示等help:
帮助
二、利用spss软件建立数据文件
(一)变量的定义
窗口视图中有“VariableView”标签和“DataView”标签。
单击“VariableView”标签,定义变量。
每一个变量须定义如下属性:
name;Type;width;Decimals;Label;Values;missing;columns;Align;measure。
1、name:
变量名称,其总长度不能超过64个字符(32个汉字)。
定义变量名应注意:
5
①以字母为首,后面跟A~Z,0~9字符;②不允许以数字、横线或下划线开头;③“?
”、“!
”、“/”等不能作为变量名。
④可以用汉字做变量名。
2、Type
变量类型,单击变量类型,弹出VariableType对话框,有8种类型可供选择numeric;comma;Dot;scientificnotation;Date;Dollar;customcurrency;string;
3、width
数据或字符串的宽度,默认的变量长度是8位。
当变量为某些特定类型时,该设置无效,如日期型变量。
4、Decimals
小数位数。
默认的小数位数是2位5、Label
变量标签。
用来说明变量代表的实际意义。
建议使用中文。
6、Values变量值标签。
对变量可能取值附加的进一步说明。
对分类变量往往要定义其取值的标签。
7、missing
缺失值,单击“missing”按钮:
①nomissingValues:
没有缺失值。
②Discretemissingvalues:
离散缺失值。
③Rangeplusoneoptionaldiscretemiss:
定义缺失值范围8、columns
显示数据的宽度。
定义数据在屏幕上该变量对应列的显示列宽。
默认值为8个字符,范围是1~255。
显示宽度不影响机内值和分析运算结果,只影响显示。
9、Align
字符排列方向。
10、measure
数据测量类型。
是指变量是如何测量的,可有3种选择
①scale:
尺度变量(连续变量)。
是默认的类型,即使用距离或比率量尺测量的数据。
scale可以是数值型、日期型和货币型变量,但不能是字符串型变量。
例如,身高和体重。
ordinal:
顺序变量。
是指变量之间的顺序有实际意义,但没有距离关系。
顺序变量可以用有序的数字作为代码,设置了值标签的变量被认为是有序的分类变量,可以作为分组变量,也可以参与某些分析过程的运算。
ordinal可以是数值型和字符串型变量。
③nominal:
分类变量。
分类变量值之间没有顺序关系,只能作为分组变量使用。
nominal与ordinal一样,只是不要求变量有次序关系。
(二)数据的输入
单击“DataView”标签,从数据编辑器中输入数据。
(三)数据的编辑1.修改数据:
找到想要修改的数据,双击,修改2.插入或删除一行数据
6
3.插入或删除一个变量(列)
(四)数据文件的合并1.横向合并数据文件
(1)打开第一个数据文件。
(2)单击Data→mergeFile→AddVariables(3)单击“oK”按钮
7
注意事项:
两个文件中有重复的关键变量,要保证关键变量中间不要缺少数字,如果有不足的必修不足之后才能进行合并,否则会出现错误结果。
8
2.纵向合并数据文件
纵向合并数据文件就是将一份数据按观测量分成几部分,然后分别输入数据并存储为几个较小的spss观测量数据文件,最后将这几个观测量数据文件中的数据上下对接,进行纵向合并。
spss纵向合并数据文件的操作过程如下:
(1)打开第一个数据文件
(2)单击菜单Data→mergeFile→Addcases
(3)若要求合并后的数据能看出来自哪个数据文件,可以选Indicatecasesourceas
variable项,操作同横向合并数据文件。
(4)单击“oK”按钮
9
三、用spss进行基本统计分析
(一)数据整理1.数据排序
(1)选择菜单Data→sortcases,弹出一个sortcases对话框。
(2)将主排序变量从左面的列表框中选到右侧的sortby框中,并在sortorder选项中
选择按该变量的升序(Ascending)还是降序(Descending)排序。
(3)单击“oK”按钮
10
2.分类汇总
选择菜单Data→Aggregate项,弹出一个AggregateData对话框
3.数据变换
11
数据变换是在原有变量数据的基础上,计算产生一些含有更丰富信息的新数据。
选择菜单Transform→compute,弹出computeVariable对话框。
(二)数据分组
数据分组就是根据统计研究的需要,将数据按某种标准重新划分为不同的组别。
1.单项式分组
(1)选择菜单Transform→AutomaticRecode,弹出AutomaticRecode对话框。
12
(2)将对话框左侧列表框的分组变量选择到右侧的Variable→newname框中。
(3)在“newname”按钮右侧的框内输入存放分组结果的新变量名,并单击“newname”
按钮。
(4)在“Recodestartingfrom”选项中选择单项式分组按升序还是按降序)进行。
(5)单击“oK”按钮
2.组距式分组
组距式分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
(1)确定分组:
首先将原始资料按升序进行排列并计算极差R;其次由斯特吉斯经验公式确定组数和组距,即组数k=1+3.322lgn,组距d=R/k;
13
最后确定组限。
取第一组下限略高于最小变量值,则该组上限=该组下限+组距。
(2)选择菜单Transform→Visualbinning
14
(三)计算基本描述统计量1、标准化:
spss提供了计算描述统计量的功能,它可以将原始数据资料转换成标准化值并以变量
?
x的形式存入数据编辑窗口中,公式:
Z_x?
s运行:
Analyze→Descriptivestatistics→Descriptives
15
16
(四)频数分析
spss提供:
频数分布表,基本描述统计量,统计图(条形图、饼形图和直方图)
17
四、统计绘图
(一)统计图的绘制1.条形图(bar)graphs→bar
18
2.饼形图(pie)graphs→pies
19
3.线形图(Line):
graphs→Line
4.散点图(scatter):
graphs→scatter
(二)统计图的编辑1.图形编辑窗口、设置图形中的数值标签
20
分别是未旋转和旋转之后的因子载荷矩阵,可以看出每个变量在某个公因子上有较高的载荷。
gDp、工业总产值、固定资产投资和货物周转量在第一因子上有较高载荷,因此,第一因子命名为总量因子;职工平均工资、居民消费水平在第二因子上有较高载荷,因此,第二因子命名为收支因子;居民消费价格指数、商品零售价格指数在第三因子上有较高载荷,因此第三因子命名为价格因子
因子得分的系数矩阵,计算得到的因子得分作为新变量存放在数据文件中,可以进行后续的评价和分类
给出了因子得分的协方差矩阵,各因子之间是正交的,即彼此相互独立。
(三)根据因子得分进行综合评估
以提取的3个公因子的方差贡献率作为权重,结合各因子得分,建立综合评价模型:
w?
0.40091FAc1_1?
0.27713FAc2_1?
0.21784FAc3_1
46
47
三、学会使用spss进行对应分析;
同一直角坐标系内同时表达出变量与样品两者之间的相互关系
(一)操作步骤1、数据预处理
对数据要定义三个变量:
行变量、列变量和尺度变量(实际观测值,常被指定为加权变量)
Data->weightcases
运行以后,数据编辑器中的原始数据并没有变化,只是在右下角的状态栏中显示“weighton”字样。
但利用加权后的数据进行统计分析后所得到的结果与没加权数据进行统计分析后得到的结果完全不同。
48
、对应分析
49
2
(二)结果解释
50
最后,小编希望文章对您有所帮助,如果有不周到的地方请多谅解,更多相关的文章正在创作中,希望您定期关注。
谢谢支持!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 东北大学 秦皇岛 分校
![提示](https://static.bingdoc.com/images/bang_tan.gif)