Stata入门-计量经济学及Stata应用.pptx
- 文档编号:18937868
- 上传时间:2024-02-16
- 格式:PPTX
- 页数:54
- 大小:529.49KB
Stata入门-计量经济学及Stata应用.pptx
《Stata入门-计量经济学及Stata应用.pptx》由会员分享,可在线阅读,更多相关《Stata入门-计量经济学及Stata应用.pptx(54页珍藏版)》请在冰点文库上搜索。
陈强,2015年,计量经济学及Stata应用,高等教育出版社。
第第2章章Stata入入门门12.1为为什么使什么使用用StataStata软件因操作简单且功能强大,为目前在欧美最流行的统计与计量软件,拥有众多用户。
Stata公司定期升级软件,以适应计量经济学的迅猛发展。
Stata软件还留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。
一些最新计量方法,可在线查找和下载由用户编写的Stata命令程序(user-writtenStatacommands)。
这些“非官方命令”(也称“外部命令”)的使用方法与官方命令完全相同,使得Stata的功能如虎添翼。
本教材使用Stata13版本(2013年6月发布)。
对于绝大多数命令与功能,即使用更低的Stata版本(如Stata11或Stata12),也几乎没有差别。
2.2Stata的窗口的窗口安装Stata13后,在安装的文件夹中将出现如下Stata13图标(Stata11或Stata12的图标大同小异),参见图2.1:
图2.1Stata13的图标双击此Stata图标,即可打开Stata。
2如想在电脑桌面创建开启Stata软件的快捷方式,可右键点击Stata13的图标,然后选择“发送到”“桌面快捷方式”,参见图2.2。
图2.23发送Stata13到桌面快捷方式打开Stata后可看到,在最上方有一排“下拉式菜单”(pull-downmenu),参见图2.3:
图2.3Stata的下拉式菜单在Stata中运行单个命令主要有两种方式,其一为点击菜单,其二为在“命令窗口”输入命令。
通过菜单执行命令(menu-driven)可能要点击多重菜单,通常还要填写对话框(dialog),以明确命令参数,不如在命令窗口直接输入命令方便。
在菜单之下,为一系列图标,起着快捷键的作用,参见图2.4。
4图2.4Stata的快捷键在快捷键图标之下,有五个窗口,参见图2.5。
图2.55Stata13的主要窗口2.3Stata操作操作实实例例以数据集grilic_small.xls(Excel文件)为例,该文件包含30名美国年轻男子的教育投资回报率数据。
1导入数据首先,打开Stata软件,点击快捷键DataEditor(Edit)图标(参见图2.6),即可打开Stata的数据编辑器,参见图2.7。
图2.66DataEditor(Edit)图标图2.7Stata的数据编辑器其次,用Excel打开文件“grilic_small.xls”,会看到如下Excel格式的数据文件:
7图2.8Excel表中的数据共有3列变量,分别为s(schooling,教育年限),expr(experience,工龄)与lnw(lnwage,工资对数)。
8复制此Excel表中所有数据(Ctrl+),粘贴到DataEditor中(Ctrl+V)。
在DataEditor中会出现对话框,参见图2.9:
图2.9DataEditor的对话框此对话框问你“第一行为数据还是变量名”,点击相应选择即可。
9导入数据的另一方法是(特别在数据量很大的情况下),点击菜单“File”“Import”,然后导入各种格式的数据,参见图2.10;但不如直接从Excel表中粘贴数据更为方便。
图2.1010使用Import导入数据关闭DataEditor(Edit)后,会看到右上方的变量窗口出现了3个变量,分别为s,expr与lnw。
点击快捷键Save图标(参见图2.11中鼠标位置,也可点击菜单“File”“Save”),将数据存为Stata格式的数据文件(扩展名dta,为data的缩写),比如grilic_small.dta。
图2.11Save图标此后可用Stata直接打开grilic_small.dta,无须再从Excel中导入数据。
11打开Stata数据集的方式有两种。
方法之一,点击快捷键Open图标(参见图2.12),寻找要打开的dta文件位置。
图2.12Open图标方法之二,在命令窗口输入以下命令(假设文件grilic_small.dta在E盘的根目录),然后回车(按Enter键):
.useE:
grilic_small.dta,clear逗号“,”之后的“clear”为“选择项”(option),表示可替代内存中的已有数据。
1213使用命令use打开dta数据文件,需输入此文件的路径;一般不如使用快捷键Open寻找此文件更为方便。
如要关闭一个数据集,以便使用另外一个数据集,可输入命令.clear内存中数据将被清空,然后可再打开另一数据集。
2变量的标签在变量窗口,变量的“名字”(Name)旁边会显示其“标签”(label)。
点击VariablesManager图标(参见图2.13),即可打开变量管理器,然后编辑变量名、标签等。
图2.13VariablesManager图标比如,将变量s的标签改为“schooling”,然后点击“Apply”(应用),参见图2.14。
图2.1414变量管理器的对话框15Stata严格区分大小写字母(casesensitive)。
建议变量名使用小写字母,便于阅读。
3审视数据如想看数据集中的变量名称、标签等,可输入命令.describe其中,“describe”的下划线表示,可将该命令简写为“d”。
Containsobs:
vars:
size:
data303270variablenamestoragetypedisplayformatvaluelabelvariablelabelsexprlnwagebytefloatfloat%8.0g%8.0g%8.0gschoolingSortedby:
Note:
datasethaschangedsincelastsaved如想看变量s与lnw的具体数据,可使用命令.listslnwslnw186.215114.868166.315166.109125.964125.481125.823165.841166.068125.416115.704125.493165.979126.356126.12166.176126.082155.849125.481166.136145.652125.142165.501115.778155.652161.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.more17在屏幕底端出现带下划线的英文字“more”,用鼠标单击“more”,可翻看下页的结果。
如想连续滚屏显示命令运行结果,可输入命令.setmoreoff如又想恢复分页显示运行结果,可输入命令.setmoreon如只想对数据集的一部分子集执行命令,比如只看s与lnw的前5个数据,可使用命令.listslnwin1/5slnw186.215114.868166.315166.109125.9641.2.3.4.5.18如要罗列从第11-15个观测值,可输入命令.listslnwin11/15slnw115.704125.493165.979126.356126.1211.12.13.14.15.也可通过逻辑关系来定义数据集的子集。
比如,要列出所有满足条件“s16”(教育年限为16年及以上)的数据,可使用命令.listslnwifs=1619slnw186.215166.315166.109165.841166.068165.979166.176166.136165.501166.071166.0711.3.4.8.9.13.16.20.23.27.30.“=”表示“大于等于”。
其他表示关系的逻辑符号为“=”(等于),“”(大于),“”(小于),“=16反之,如只想保留满足“s16”条件的观测值,可使用命令.keepifs=162021删除观测值之后,Stata不提供类似于MicrosoftWord的撤销(undo)命令。
一般建议慎重删除数据,最好先将原始数据备份。
如想将数据按照变量s的升序排列,可输入命令.sorts.list22sexprlnw1114.868111.0065.778112.9625.7041206.0821205.5291205.823127.1286.3561205.4931205.1651210.0776.1212.9165.416124.3335.48112.6925.4811205.142121.1915.964141.3785.65215.2555.65215.8465.759151.3745.8491606.109166.3635.501161.5116.0711606.06816.4786.17616.2776.071164.3636.136161.8725.84116.7986.31516.5565.97918.3846.2151.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.23命令sort无法按照变量的降序排列。
如想按降序排列,可使用命令gsort:
.gsort-s.list24sexprlnw18.3846.21516.5565.97916.7986.315161.8725.841164.3636.13616.2776.07116.4786.1761606.068161.5116.071166.3635.5011606.109151.3745.84915.8465.75915.2555.652141.3785.652121.1915.9641205.14212.6925.481124.3335.48112.9165.4161210.0776.121205.1651205.493127.1286.3561205.8231205.5291206.082112.9625.704111.0065.7781114.8681.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.254画图看数据的最直观方法是画图。
想看变量s的分布情况,可输入以下命令画直方图(参见图2.16):
.histograms,width
(1)frequency“histogram”表示直方图。
选择项“width
(1)”表示将组宽设为1(否则将使用Stata根据样本容量计算的默认分组数),选择项“frequency”表示将纵坐标定为频数(默认使用密度)。
051015Frequency1012161814schooling图2.16教育年限的直方图教育年限的分布呈双峰状,受12年教育的人数最多(高中毕业),其次为受16年教育者(大学毕业)。
2627如想知道更多有关命令histogram选项与用法,可输入命令.helphistogram对于任何Stata命令,只要输入“helpcommand_name”即可查看该命令的“帮助文件”(helpfile)。
如想考察教育年限与工资对数之间的关系,最直观方法是画s与lnw之间的散点图,可输入命令(参见图2.17):
.scatterlnws4.5566.5lnw5.51012161814schooling图2.17教育年限与工资对数的散点图工资对数与教育年限似乎存在正相关关系。
2829如想在散点图上标注出每个点对应于哪个观测值,可先定义变量n,表示第n个观测值:
.genn=_n“_n”表示第n个观测值。
然后以变量n作为每个点的标签来画散点图,参见图2.18。
.scatterlnws,mlabel(n)选择项“mlabel(n)”表示,以变量n作为标签(marklabel)。
1271417519102123241118262521682292316901384.5566.5ln(wage)5.51012161814schooling图2.18加标签的散点图Stata有丰富的作图方法。
更多作图方法,参见下拉式菜单“Graphics”(参见图2.19)。
30图2.1931Stata的作图功能325统计分析如想看变量s的统计特征,可输入命令.summarizesVariableObsMeanStd.Dev.MinMaxs3013.82.1399321118此结果显示变量s的样本容量、平均值、标准差、最小值与最大值。
如不指明变量,则显示所有变量的统计指标。
.sumVariableObsMeanStd.Dev.MinMaxs3013.82.1399321118expr301.6586672.445213010.077lnw305.7932.36799564.8686.35633如要显示变量s的经验累积分布函数(empiricalcumulativedistributionfunction),可使用命令.tabulatesschoolingFreq.PercentCum.11310.0010.00121240.0050.001413.3353.3315310.0063.33161033.3396.671813.33100.00Total30100.00“Freq”表示频数,“Percent”表示百分比,而“Cum.”表示累积百分比。
34如要显示工资对数、教育年限、工龄之间的相关系数,可输入命令.pwcorrlnwsexpr,sigstar(.05)“pwcorr”表示“pairwisecorrelation”(两两相关),“sig”表示显示相关系数的显著性水平(即p值,列在相关系数的下方)。
“star(.05)”表示给所有显著性水平小于或等于5%的相关系数打上星号。
35lnwsexprlnw1.0000s0.5368*1.00000.0022expr0.2029-0.11321.00000.28230.5514lnw与s的相关系数为0.5368,且在1%水平上显著(p值为0.0022)。
lnw与expr的相关系数也达到0.2029,但不显著(p值为0.2823,可能因为样本容量较小,仅为30)。
s与expr的相关系数为-0.1132,可能因为上学时间长的年轻人,参加工作时间就不长,但此负相关关系也不显著(p值为0.5514)。
366生成新变量在Stata中定义新变量,可通过命令generate来实现。
比如,输入如下命令可定义教育年限的对数。
.generatelns=log(s)如要定义s的平方项,可使用命令.gens2=s2如要生成s与expr的互动项(interactionterm),可输入命令.genexprs=s*expr37如想根据工资对数lnw计算工资水平w,可使用命令.genw=exp(lnw)在计量经济学中,常使用“虚拟变量”(dummyvariable,也称“哑变量”),即取值只能为0或1的变量,比如性别。
假设定义“s16”为“受过高等教育”,并使用变量college来表示:
college1,如果s160,其他(2.1)可使用如下命令.gencolleg=(s=16)38括弧“()”表示对括弧中的表达式“s=16”进行逻辑评估:
如果此式为真,则取值为1;如果为假,则取值为0。
在上面命令中,不慎把college打成colleg了。
可使用如下命令将变量重新命名:
.renamecollegcollege变量colleg被重新命名为college(也可使用变量管理器)。
如想将“受过高等教育”的定义改为“s15”,但仍用college作为变量名。
方法之一,去掉现有变量college,再重新定义一次:
.dropcollege39.gencollege=(s=15)方法之二,只需一个命令:
.replacecollege=(s=15)此命令直接将原变量(s16)替换为新变量(s15)。
对于较长的变量名,输入变量名较麻烦。
有如下三个简便方法。
方法一,直接在变量窗口双击需要的变量,该变量名就会出现在命令窗口。
40方法二,如有以下变量s1,s2,s3,s4,s5(比如,对教育年限的5种度量方法),可用s1-s5来表示这5个变量。
方法三,用“*”号来简化变量名的书写。
假设想将内存中所有以“s”开头的变量都去掉,可输入命令.drops*这将去掉内存中的s1,s2,s3,s4,s5变量(删除之后无法恢复,故应慎重使用)。
7Stata的计算器功能Stata也可作为计算器使用,命令格式为“displayexpression”。
比如,计算ln2,可输入如下命令.displaylog
(2).69314718如要计算2,则可输入命令.dis20.51.414213641428调用命令与终止命令如果每次都完整地输入整行命令,可能较费时。
较有效率的方法是,调用某个曾经使用过的命令,并在此基础上修改。
调用旧命令的方法有两种。
方法一,把光标放在命令窗口,按键盘上的“PgUp”键调用上一条命令,按“PgDn”键调用下一条命令。
方法二,在历史命令窗口单击旧命令,将旧命令调入命令窗口,然后进行编辑;如果用鼠标双击旧命令,将再次执行此旧命令。
有时运行某个命令费时较长(比如,在数值计算时,迭代无法收敛)。
如想中途停止该命令的执行,可点击快捷键Break图标(参见图2.20),或直接在键盘上同时按“Ctrl+Break”。
图2.20Break图标9Stata的日志如希望在每次使用Stata时,储存其运行结果,可点击菜单“File”“Log”“Begin”定义“日志文件”(logfile),参见图2.21。
43图2.21定义日志文件也可直接点击快捷键Log图标,参见图2.22。
44图2.22Log图标此时会出现如下对话框,参见图2.23。
在对话框中输入日志的文件名,并存储在指定的位置即可:
图2.2345日志文件的对话框46Stata日志文件的扩展名为smcl。
也可直接在命令窗口输入如下命令:
.logusingtodayname:
log:
D:
StataSE13StataSE13today.smcllogtype:
smclopenedon:
15Sep2014,14:
00:
15在当前路径就会生成一个名为“today.smcl”的日志文件。
定义日志文件后,在Stata中的所有操作及结果,都将记录在日志中,直至退出此日志文件。
47如要暂时关闭日志(不再记录输出结果),可输入命令.logoff如要恢复使用日志,可输入命令.logon如要彻底退出日志,则可输入命令.logclose如要查看日志文件的内容,可点击菜单“File”“Log”“View”,然后寻找此日志文件,参见图2.24。
图2.24查看日志文件2.4Stata命令命令库库的更新的更新由于Stata版本不同(即使同为Stata13),如果发现极少数命令无法运行,可在命令窗口输入,4849.updateall这将更新你的Stata命令库(Stata“ado”文件及其他可执行文件)。
Stata用户还写了大量的外部命令或非官方命令(user-writtensoftware),可直接下载到Stata中使用。
最流行的Stata非官方命令下载平台为“统计软件成分”(StatisticalSoftwareComponents,SSC),由BostonCollege维护,网址为http:
/ideas.repec.org/s/boc/bocode.html。
50从SSC下载Stata程序的命令为:
.sscinstallnewcommand所有下载与安装过程都将自动完成(包括新命令的帮助文件)。
如非官方命令不是来自SSC,一般需手工安装,将所有相关文件下载到指定的Stata文件夹中即可(通常为adoplus)。
如不清楚应把文件复制到哪个文件夹,可输入以下命令,显示Stata的系统路径(systemdirectories):
.sysdir51会看到类似于以下的结果(取决于Stata的安装位置),STATA:
D:
StataSE13StataSE13BASE:
D:
StataSE13StataSE13adobaseSITE:
D:
StataSE13StataSE13adositePLUS:
c:
adoplusPERSONAL:
c:
adopersonalOLDPLACE:
c:
ado将下载的新命令文件复制到PLUS所指示的那个文件夹即可(此处为“c:
adoplus”)。
52如想使用某种估计方法,不知道它是否存在,可输入命令.searchkeyword此命令将搜索Stata帮助文件、Stata常见问题、Stata案例、StataJournal,StataTechnicalBulletin等。
进一步的搜索可输入以下命令.finditkeyword命令findit的搜索范围比命令search更广,还包括Stata的网络资源。
事实上,“findit”等价于“search,all”。
532.5进进一步学一步学习习Stata的的资资源源更多Stata知识,将在本书以后章节中逐步介绍。
Stata英文参考书包括Baum(2006),CameronandTrivedi(2010),以及Stata出版社(StataPress)出版的系列书籍。
加州大学洛杉矶分校(UCLA)网站(http:
/www.ats.ucla.edu/stat/stata/)有大量Stata的资源及实例(搜索“StataUCLA”即可找到此网站)。
中文参考书包括陈传波Stata十八讲,陈强(2014),胡咏梅(2010),兰草(2012),劳伦斯汉密尔顿(2008),李春涛、张璇(2009),王群勇(2007,2008),王天夫、李博柏(2008),杨菊华(2012),张鹏伟、李嫣怡(2011)等。
54Stata本身的“帮助”(Help)菜单包含了详细的使用说明,比如,“helphistogram”。
更高级的学习,可查看Stata手册(Statamanuals),这些手册对每个Stata命令都进行了详尽的说明。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Stata 入门 计量 经济学 应用