教案5_数据的合并与转换.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
资料来自网络,请保护知识产权,请您下载后勿作商用,只可学习交流使用。

第一个问题:母亲的数量 . sort mothid . by mothid: keep if _n==1 (424 observations deleted) 按母亲的身份号码分群(by mothid) 保留每位母亲的第一个观察值(if _n==1) 424个观察值被删除。故数据共有1684位母亲(2108-424) * 第二个问题:母亲的子女数 . by mothid: gen ceb=_N 按mothid的分类,生成一个名为ceb的变量,即母亲的总生育数量 变量的取值依赖于mothid出现的总次数,由_N表示 . tab ceb ceb | Freq. Percent Cum. ----+----------------------------------- 1 | 1,303 61.81 61.81 2 | 690 32.73 94.54 3 | 96 4.55 99.10 4 | 8 0.38 99.48 5 | 5 0.24 99.72 6 | 6 0.28 100.00 ----+----------------------------------- Total | 2,108 100.00 * 从长数据到宽数据(I) . reshape wide kidid age girl yob, i(mothid) j(order) ① ② ③ ④ (note: j = 1 2 3 4 5 6) ① :reshape wide命令告诉Stata,将长数据格式转换成宽数据格式 ②:命令参数后面的变量kidid,age,girl即是需要转换的变量 ③ :i(mothid) 告诉Stata,以mothid为标准进行转换。命令reshape需要一个共同的标识符(ID),利用该标识符将每个孩子指定给他的母亲;将兄弟姊妹指定给同一母亲 * 从长数据到宽数据(II) . reshape wide kidid age girl yob, i(mothid) j(order) ① ② ③ ④ (note: j = 1 2 3 4 5 6) ④:在从长数据转换为宽数据的过程中,需要另一个标识符,表明转换后变量尾缀的取值,也就是给每个新的母亲层次的变量指定一个相应的尾缀 本例中,它是由j()来表示的。该命令告诉Stata ,按照order的数值给变量kidid, age,girl指定尾缀 假若一位母亲有六个孩子,孩子的顺序(order)为1,2,3,4,5,6,则在宽数据中,age将会变成age1,age2,…… age6。变量后面的尾缀代表每个孩子与兄弟姊妹之间的长幼顺序关系。变量j自动消失,变成了其它变量的后缀 * N(by mothid: keep if _n==1);为什么 变量数目;kidid1-kidid6,age1-age6,girl1-girl6;变量order自动消失;缺失 合并后数据的基本情况(describe)、分布(list) * 从长到宽:转换后的数据结构特点 观察值减少;变量增加 虽然变量增加,但变量名称的主干不变,age还是叫age,girl还是叫girl,kidid还是叫kidid 不同的是,在原变量的后面,都增加了1-6的数字尾缀。尾缀1表示第一个孩子,尾缀2表示第二个孩子,以此类推 尾缀的取值取决于代表孩子长幼序列的变量j(order);该变量在生成宽格式数据的过程中消失了,取而代之的是新变量的后缀 * 两类常见的错误 1. 缺失值错误 标识符变量不能有缺失值。否则,Stata将停止工作,并显示错误。如:当变量j有缺失时: order contains missing values r(498); (变量order有缺失值) 非常数错误 Stata按照指明的变量进行转换,并假定数据中其它变量在同一组群中仅有一个取值,即常数。当该假定不成立时,软件也会停止工作,并输出错误提示 . reshape wide kidid age girl, i(mothid) j(order) * 5.4.3. 从宽数据到长数据

文档评论(0)

allap + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档