- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
中国人民大学陈传波
STATA十八讲:4数据整理
4数据整理
4.1拆分与连接数据文件要掌握的命令
为了折分或者合并数据文件,要掌握下面的命令。这也是该小节的学习目标。
命令
命令
命令解释
用法示例
drop
删除变量或者观察值
dropmath
keep
保留变量或者观察值
keepmath
append
将两个数据集拼接(观察值拼接)
appendusingmath
merge
将两个数据集合并(变量合并)
mergeidusingmath
reshape
将数据重整
reshapelonginc,i(id)j(yr)
stack
将多列数据转换成一列数据
stackabcd,into(ef)
xpose
数据转置
xpose,clear
以上命令可以通过helpcommand查看到具体的命令格式
数
数据A
数据连接与拆分(drop/keep)
append
数据A
数据B
数据A数据B
merge
数据B
4.2案例:拆分与连接数据
4.2.1横向拆分数据
要完成的任务(任务4.1)将mydata数据分成三个数据文件,分别为学生基本信息文件student.dta,经济学成绩文件economy.dta和数学成绩文件math.dta。
原始数据文件mydata.dta
中国人民大学陈传波
STATA十八讲:4数据整理
i
id
name
gender
minority
economy
math
1
John
1
1
40
68
2
Chris
1
2
80
52
3
Jack
0
2
90
76
4
Huang
0
2
43
90
5
Tom
0
3
70
96
6
Han
1
1
53
85
7
Phillip
0
2
85
36
8
Jin
1
2
95
65
将要新生成的三个数据文件如下
student.dta
i
id
name
gender
minority
1
John
1
1
2
Chris
1
2
3
Jack
0
2
4
Huang
0
2
5
Tom
0
3
6
Han
1
1
7
Phillip
0
2
8
Jin
1
2
STATA十八讲:4数据整理
economy.dtaid
1
2
3
4
5
6
7
8
economy
40
80
90
43
70
53
85
95
math.dta
m
math
68
52
76
90
96
85
36
65
id
1
2
3
4
5
6
7
8
横向拆分数据案例的参考操作
*-将mydata拆分成学生基本信息数据文件student--------------------
中国人民大学陈传波
中国人民大学陈传波
STATA十八讲:4数据整理
cdd:/mydata/
usemydata,clear
dropeconomymath
savestudent,replace
*-将mydata拆分成经济学成绩数据文件economy--------------------
usemydata,clear
keepideconomy
saveeconomyt,replace
*--将mydata拆分成数学成绩数据文件math--------------------
usemydata,clear
keepidmath
savemath,replace
4.2.2纵向拆分数据
要完成的任务(任务4.2):将mydata数据分成二个数据文件,分别为女生数据集female.dta和男生数据集male.dta。原始数据同上。该任务完成后将要形成的数据如下
female.dta
i
id
name
gender
minority
economy
math
3
Jack
0
2
90
76
4
Huang
0
2
43
90
7
Phillip
0
2
85
36
5
Tom
0
3
70
96
1
John
1
1
40
68
male.dta
id
name
gender
minority
economy
math
John
1
1
40
68
1
6
Han
1
1
53
85
8
Jin
1
2
95
65
2
Chris
1
2
80
52
STATA十八讲:4数据整理
您可能关注的文档
- XXXXX局网络安全规划方案.docx
- TDC成衣洗水培训资料.docx
- T+采购流程相关业务处理.docx
- SF36生活质量调查表及计分说明(修正).docx
- Scratch3最新12失重控制-讲义(无logo).docx
- SARS应该如何预防?.docx
- SAP SD 面试知识点精华.docx
- S7-300400-热电偶的接线及信号处理.docx
- QSY管道完整性管理规范.docx
- QC-10防腐质量控制程序-修改--1.docx
- 写考差的检讨书5篇.docx
- 单身青年联谊活动方案7篇.docx
- 人教鄂教版科学【核心素养目标】1.3《食物的消化》课件(25张PPT).pptx
- 人教鄂教版科学【核心素养目标】1.2《袋子里面有什么》课件(29张PPT).pptx
- 人教鄂教版科学【教学课件】15 建筑中的材料 参考课件1.pptx
- 人教鄂教版科学【教学课件】16 建筑中的结构 参考课件1.pptx
- 人教鄂教版科学《炉火周围的热现象》PPT课件.pptx
- 人教鄂教版科学【核心素养目标】1.4《饮食与健康》课件(26张PPT).pptx
- 人教鄂教版科学【新课标】1.2《谁的植物长得好》课件(21张PPT).pptx
- 品牌危机公关管理:复苏与挽救.pptx
文档评论(0)