- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
stata常用命令分析
调整变量格式:?format x1 %10.3f ——将x1的列宽固定为10,小数点后取三位?format x1 %10.3g ——将x1的列宽固定为10,有效数字取三位?format x1 %10.3e ——将x1的列宽固定为10,采用科学计数法?format x1 %10.3fc ——将x1的列宽固定为10,小数点后取三位,加入千分位分隔符?format x1 %10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符?format x1 %-10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐?合并数据:?use C:\Documents and Settings\xks\桌面\2006.dta, clear?merge using C:\Documents and Settings\xks\桌面\1999.dta?——将1999和2006的数据按照样本(observation)排列的自然顺序合并起来?use C:\Documents and Settings\xks\桌面\2006.dta, clear?merge id using C:\Documents and Settings\xks\桌面\1999.dta ,unique sort?——将1999和2006的数据按照唯一的(unique)变量id来合并,在合并时对id进行排序(sort)?建议采用第一种方法。?对样本进行随机筛选:?sample 50?在观测案例中随机选取50%的样本,其余删除?sample 50,count?在观测案例中随机选取50个样本,其余删除?查看与编辑数据:?browse x1 x2 if x33 (按所列变量与条件打开数据查看器)?edit x1 x2 if x33 (按所列变量与条件打开数据编辑器)?数据合并(merge)与扩展(append)?merge表示样本量不变,但增加了一些新变量;append表示样本总量增加了,但变量数目不变。?one-to-one merge:?数据源自stata tutorial中的exampw1和exampw2?第一步:将exampw1按v001~v003这三个编码排序,并建立临时数据库tempw1?clear?use t:\statatut\exampw1.dta?su ——summarize的简写?sort v001 v002 v003?save tempw1?第二步:对exampw2做同样的处理?clear?use t:\statatut\exampw2.dta?su?sort v001 v002 v003?save tempw2?第三步:使用tempw1数据库,将其与tempw2合并:?clear?use tempw1?merge v001 v002 v003 using tempw2?第四步:查看合并后的数据状况:?ta _merge ——tabulate _merge的简写?su?第五步:清理临时数据库,并删除_merge,以免日后合并新变量时出错?erase tempw1.dta?erase tempw2.dta?drop _merge?数据扩展append:?数据源自stata tutorial中的fac19和newfac?clear?use t:\statatut\fac19.dta?ta region?append using t:\statatut\newfac?ta region?合并后样本量增加,但变量数不变?茎叶图:?stem x1,line(2) (做x1的茎叶图,每一个十分位的树茎都被拆分成两段来显示,前半段为0~4,后半段为5~9)?stem x1,width(2) (做x1的茎叶图,每一个十分位的树茎都被拆分成五段来显示,每个小树茎的组距为2)?stem x1,round(100) (将x1除以100后再做x1的茎叶图)?直方图?采用auto数据库?histogram mpg, discrete frequency normal xlabel(1(1)5)?(discrete表示变量不连续,frequency表示显示频数,normal加入正太分布曲线,xlabel设定x轴,1和5为极端值,(1)为单位)?histogram price, fraction norm?(fraction表示y轴显示小数,除了frequency和fraction这两个选择之外,该命令可替换为“percent”百分比,和“density”密度;未加上discrete就表示将price当作连续
文档评论(0)