- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4讲数据操作和数据管理1讲解
第四讲 数据操作和数据管理(一)
参考书:Also see)
①Mitchell, M. N. 2010. Data Management Using Stata: A Practical Handbook. College Station, TX: Stata Press.
②Long, J. S. 2009. The Workflow of Data Analysis Using Stata. College Station, TX: Stata Press.
③Hamilton, L. C. 2013. Statistics with Stata: Updated for Version 12. 8th ed. Boston: Brooks/Cole. (中文版见⑤)
④Baum, C. F. 2009. An Introduction to Stata Programming. College Station, TX: Stata Press
⑤《应用STATA做统计分析》(劳伦斯·汉密尔顿著,郭志刚等译,重庆大学出版社,2011)。
⑥《社会统计分析与数据处理技术:STATA软件的应用》(杨菊华,中国人民大学出版社,2008)
数据分析的第一步首先要求将原始数据改造为Stata可用的格式。我们可以将一个新数据通过以下几种方式载入Stata:①键盘输入;②读取原始数据的ASCII格式文件;③将电子表格数据粘贴到数据编辑窗口(Editor)中;④应用第三方数据转换程序将其他电子表格、数据库或统计程序创建的系统数据集直接转换过来。一旦Stata有了内存数据,我们就可以在Stata中将其存为Stata格式,以利将来方便地取用和更新。
数据操作和管理包括如下功能:
⑴基本数据命令
⑵创建和删除变量
⑶函数和表达式
⑷日期和时间
⑸加载,保存,导入和导出数据
⑹合并数据
⑺重塑数据集
⑻标签,显示格式和注释
⑼变量的更改和重命名
⑽检查数据
⑾文件操作
⑿混合数据命令
当数据管理任务很复杂或需要重复进行时,Stata用户可以编写自己的程序来自动完成这些工作。尽管Stata是因其分析功能而著名,其实它同时也具有广泛的数据管理功能。本讲将介绍其中一些基本功能。
一、基本数据命令
1.[D] use . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Load Stata dataset
use Load Stata dataset (打开Stata数据集)
例1:(打开指定变量,可应用条件语句:if in)
use ln_wage grade age tenure race using nlswork
describe
2.[D] save . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Save Stata dataset
save Save Stata dataset (保存Stata数据集)
ave filename (首次保存文件)
save, replace (保存且替换已有文件)
3.[D] describe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Describe data in memory or in file
describe Describe data in memory or in file(描述内存或文件中的数据,生成内存数据或文件数据的概要)
注意:第一,变量名保证没有歧义的情况下可以使用缩写,或使用缩写通配符(~)代替省略部分,例如displ~ ;第二,可以指定一系列的变量,如变量1-变量n
例1:
use states,clear
describe, numbers (变量按顺序编号,变量名前面加上数字序号)
describe, fullnames(完整变量名)
describe state region median marriage divorce(变量列表,注意此处用到了缩写)
例2:
use census,clear
describe pop* (通配符*)
describe state region pop18p(stat或po都是错误的)
例3:
describe usin
您可能关注的文档
- 第4章餐饮原材料的采购与保管讲解.ppt
- 第4章:桩基础工程讲解.ppt
- 第4章:电话支付讲解.ppt
- 第4章铸件凝固组织讲解.ppt
- 第4章马氏体转变讲解.ppt
- 第4节AAS干扰以及抑制讲解.ppt
- 第4节、电流的测量讲解.ppt
- 第4节动能和势能讲解.ppt
- 第4节 焦耳定律讲解.ppt
- 第4章:陆标定位讲解.ppt
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)