Stata学习笔记和国贸理论总结.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Stata学习笔记和国贸理论总结

Stata学习笔记一、认识数据(一)向stata中导入txt、csv格式的数据 1.这两种数据可以用文本文档打开,新建记事本,然后将相应文档拖入记事本即可打开数据,复制 2.按下stata中的edit按钮,右键选择paste special 3.*.xls/*.xlsx数据仅能用Excel打开,不可用记事本打开,打开后会出现乱码,也不要保存,否则就恢复不了。逗号分隔的数据常为csv数据。(二)网页数据网页上的表格只要能选中的,都能复制到excel中;网页数据的下载可以通过百度“国家数据”进行搜索、下载二、Do-file 和 log文件打开stata后,第一步就要do-file,记录步骤和历史记录,方便日后查看。Stata处理中保留的三种文件:原始数据 (*.dta),记录处理步骤 (*.do),以及处理的历史记录 (*.smcl)。三、导入StataStata不识别带有中文的变量,如果导入的数据第一行有中文就没法导入。但是对于列来说不会出现这个问题,不分析即可(Stata不分析字符串,红色文本显示;被分析的数据,黑色显示);第一行是英文变量名,选择“Treat first row as variable names”在导入新数据的时候,需要清空原有数据,clear命令。导入空格分隔数据:复制——Stata中选择edit按钮或输入相应命令——右键选择paste special——并选择,确定;导入Excel中数据,复制粘贴即可;逗号分隔数据,选择paste special后点击comma,然后确定。Stata数据格式为 *.dta,导入后统一使用此格式。四、基本操作(几个命令)(一)use auto,clear 。在清空原有数据的同时,导入新的auto数据。(二)browse 。浏览数据。(三)describe 和 list。查看数据,describe 和 list 使用list命令能使我们根据自己的需要选择数据(例如其与in/if语句的结合使用)。(四)Scatter。作图命令,scatter 散点图(scatter price mpg )(五)Summarize。描述统计,常写作sum/su,求变量的个数、平均值、标准差、最小值和最大值。(六)generate。生成数据,简写为gen。(七)replace。修改数据,命令 replace 该命令不推荐使用,一般不会改变原始数据的。剔除缺失值、异常值, 或者批量修改数据均可以通过 replace 命令加上条件语句实现.(八)Tabstat 。描述性统计,tabstat 变量列表,statistics(统计量列表)(九)Rename 。对变量更名,rename 旧变量名新变量名。一次只能对一个变量名重命名。(十)Order 。对变量排序,order变量列表[,选项] (十一)Sort/gsort 。对观测值排序,sort 变量列表;gsort [+/-]变量,注意,方括号可有可无。Sort是升序排序,当第一个变量出现相同时,才会对第二个变量排序,否则是不会管后面的变量的排序的;gsort(general sort)即可升也可降,视+和-而定。为了保证数据的原始性,为了最后恢复数据排序,一般在排序前,生成新的变量num,最后对num排序就可以恢复。(十二)Keep/drop 。保留/删除变量或数据,keep/drop 变量列表;keep/drop 条件。注意:请不要随意删除变量或数据,因为可以使用if条件句!(对行改变)每一次只能使用keep 和drop 中的一个命令。(十三)Count 。按条件对观测值计数,count [条件],方括号可有可无,直接输入条件。(十四)Recode 。批量修改观测值,recode 变量列表(规则),括号必须有。规则如下:#=#,比如3=1,值为3的全改为1;#/#=#,比如min/3000=0,3000以下全为0。如果加generate,则会生成新的变量。规则为:recode 变量列表(规则)(规则), gen (新变量)。(十五)Encode/decode。字符串与数值转换,encode变量,generate(新变量)。将stata不能识别的红色字符串改为数值,而且必须生成新变量,即generate(新变量)不能省。Decode是将label 的数值转换为字符串变量,也必须生成新变量,即generate(新变量)不能省。(十六)Display。显示字符串/变量值,display 字符串或变量或表达式。By/bysort 分组地重复执行某一命令:by 变量列表;bysort变量列表。By后面一般是一个类别的变量。一般在命令前加by 变量列表:就可以,冒号后的命令碧血是完整的。此命令实际是先按变量列表分组,然后再执行后面的命令

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档