stata学习资料-第六章.docVIP

  • 52
  • 0
  • 约 6页
  • 2017-01-02 发布于贵州
  • 举报
6.1 问题:假如我们有一个截面数据,内容是一些病人在一些诊所就诊的记录,比如病人信息和诊所ID。我们还有一个表,内容是每个诊所对应的地区编号。我们怎么把表二中的地区编号和表一中的每个诊所联系起来,或者说如何将两张表整合到一起? 比较二的方法:用if条件筛选,逐个代换。P118有介绍 核心知识点:merge命令的使用 主键一对多情况下的数据整合 其中作为主键的clinicid 在表一中并不是唯一确定的观测值 不能简单的1:1匹配合并 这时就需要用到1:m或m:1 use 表一 merge m:1 主键 using 表二 (此处为m:1是因为表一中clinicid有重复) 结果为: 备注:关于新版和旧版命令的区别:一是语法区别,旧版是merge 主键 using 表二, uniqusing. 其中uniqusing是用来确定唯一观测值的,新版省掉了。二是新版不用先对主键排序才能合并,而旧版命令必须排序。 m:m即表一和表二中主键clinicid都不唯一。语法为 merge m:m 主键 using 表二 6.2 问题:很多数据源提供的数据适用于展示 但不适用于分析处理,如何将其转换成我们所需要的形式 核心知识点: reshape命令的使用 reshape 命令是stata提供的重要的数据管理工具之一。如果我们想要调整你现有数据的结构,就要熟悉reshape的

文档评论(0)

1亿VIP精品文档

相关文档