- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精品文档
精品文档
PAGE
PAGE8
精品文档
PAGE
Stata统计剖析常用命令汇总
一、winsorize极端值办理
范围:一般在
1%和
99%分位做极端值办理,对于小于
1%的数用
1%的值赋值,对于大于
99%的数用
99%的值
赋值。
1、Stata
中的单变量极端值办理:
stata11.0,在命令窗口输入 “finditwinsor后,系”统弹出一个窗口,安装 winsor模块
安装好模块之后,就能够调用 winsor命令,命令格式: winsor var1,gen(newvar)p(0.01)
或许在命令窗口中输入: ssc install winsor安装winsor命令。winsor命令不能进行批量办理。
2、批量进行 winsorize极端值办理:
翻开链接:,找到 winsorizeJ,点击右键,另存为到 stata 中的 ado/plus/目录下即可。命令格式: winsorizeJ
var1var2var3,suffix(w)即可,这样会生成三个新变量, var1wvar2w var3w,而且默认的是上下 1%winsorize。如
果要改正分位点,则写成如下格式: winsorizeJvar1var2var3,suffix(w)cuts(595) 。
3、Excel中的极端值办理:(略)
winsor2
命令使用说明
简介:winsor2winsorizeortrim(iftrimoptionisspecified)thevariablesinvarlistatparticularpercentilesspecifiedbyoptioncuts(##).Indefult,newvariableswillbegeneratedwithasuffix"_w"or"_tr",whichcanbechangedbyspecifyingsuffix()option.Thereplaceoptionreplacesthevariableswiththeirwinsorizedortrimmedones.
相比于 winsor命令的改良:
能够批量办理多个变量;
不单能够winsor,也能够trimming;
(3)附加了 by()选项,能够分组 winsor 或 trimming;
增加了replace选项,能够不必生成新变量,直接替换原变量。典范:
*-winsorat(p1p99),getnewvariable"wage_w"
. sysusenlsw88,clear
. winsor2wage
*-left-trimmingat2thpercentile
. winsor2wage,cuts(2100)trim
*-winsorvariablesby(industrysouth),overwritetheoldvariables
. winsor2wagehours,replaceby(industrysouth)
使用方法:
1.请将
winsor2.ado
和winsor2.sthlp 放置于
stata12\ado\base\w
文件夹下;
输入helpwinsor2能够查察帮助文件;
二、描绘性统计
1、summarize
命令格式: su、sum或许summarize[varlist][if][in][weight][,options]
如果summarize或sum后不加任何变量,则默认对数据中的所有变量进行描绘统计
options
选项:detail
表示产生更为详尽的统计变量
Separator(n)表示每
n个变量画一条分界限,
n=0
表示禁止使用分界限
Summarize 描绘统计输出表中包含:样本容量、平均数、标准差、最小值和最大值
2、tabstat
命令格式:tabstat[varlist][if][in][weight][,options]
options
选项:stat(statname)
表示设定所需要的统计量
col(stat)或c(s)表示将结果报表转置
统计量:
mean:平均数
count/n:观察值数目
sum:加总
max/min
:最大值/最小值
range:极差sd:标准差
cv:变异系数
semean:平均
标准误差
skewness:偏度var:方差
kurtosis
:峰度
median/p50:中位数
p#:#%百分位数
比如:tabstat[varlist],stat(countmeansdmedianminmaxrange)col(stat)
3、描绘性统计结果输出到
word或Excel
用sum做的描绘性统计:
logout,save(miaoshutongji)
文档评论(0)