Stata统计解析总结计划命令.docx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精品文档 精品文档 PAGE PAGE8 精品文档 PAGE Stata统计剖析常用命令汇总 一、winsorize极端值办理 范围:一般在  1%和  99%分位做极端值办理,对于小于  1%的数用  1%的值赋值,对于大于  99%的数用  99%的值 赋值。 1、Stata  中的单变量极端值办理: stata11.0,在命令窗口输入 “finditwinsor后,系”统弹出一个窗口,安装 winsor模块 安装好模块之后,就能够调用 winsor命令,命令格式: winsor var1,gen(newvar)p(0.01) 或许在命令窗口中输入: ssc install winsor安装winsor命令。winsor命令不能进行批量办理。 2、批量进行 winsorize极端值办理: 翻开链接:,找到 winsorizeJ,点击右键,另存为到 stata 中的 ado/plus/目录下即可。命令格式: winsorizeJ var1var2var3,suffix(w)即可,这样会生成三个新变量, var1wvar2w var3w,而且默认的是上下 1%winsorize。如 果要改正分位点,则写成如下格式: winsorizeJvar1var2var3,suffix(w)cuts(595) 。 3、Excel中的极端值办理:(略) winsor2  命令使用说明 简介:winsor2winsorizeortrim(iftrimoptionisspecified)thevariablesinvarlistatparticularpercentilesspecifiedbyoptioncuts(##).Indefult,newvariableswillbegeneratedwithasuffix"_w"or"_tr",whichcanbechangedbyspecifyingsuffix()option.Thereplaceoptionreplacesthevariableswiththeirwinsorizedortrimmedones. 相比于 winsor命令的改良: 能够批量办理多个变量; 不单能够winsor,也能够trimming; (3)附加了 by()选项,能够分组 winsor 或 trimming; 增加了replace选项,能够不必生成新变量,直接替换原变量。典范: *-winsorat(p1p99),getnewvariable"wage_w" . sysusenlsw88,clear . winsor2wage *-left-trimmingat2thpercentile . winsor2wage,cuts(2100)trim *-winsorvariablesby(industrysouth),overwritetheoldvariables . winsor2wagehours,replaceby(industrysouth) 使用方法: 1.请将  winsor2.ado  和winsor2.sthlp 放置于  stata12\ado\base\w  文件夹下; 输入helpwinsor2能够查察帮助文件; 二、描绘性统计 1、summarize 命令格式: su、sum或许summarize[varlist][if][in][weight][,options] 如果summarize或sum后不加任何变量,则默认对数据中的所有变量进行描绘统计 options  选项:detail  表示产生更为详尽的统计变量 Separator(n)表示每  n个变量画一条分界限,  n=0  表示禁止使用分界限 Summarize 描绘统计输出表中包含:样本容量、平均数、标准差、最小值和最大值 2、tabstat 命令格式:tabstat[varlist][if][in][weight][,options] options 选项:stat(statname) 表示设定所需要的统计量 col(stat)或c(s)表示将结果报表转置 统计量: mean:平均数 count/n:观察值数目 sum:加总 max/min :最大值/最小值 range:极差sd:标准差 cv:变异系数 semean:平均 标准误差 skewness:偏度var:方差 kurtosis :峰度 median/p50:中位数 p#:#%百分位数 比如:tabstat[varlist],stat(countmeansdmedianminmaxrange)col(stat) 3、描绘性统计结果输出到 word或Excel 用sum做的描绘性统计: logout,save(miaoshutongji)

文档评论(0)

zdq0037 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档