统计学:3. 数据的定量统计描述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 数据的定量统计描述 3.1 数据集中趋势的统计描述 众数 中位数 平均数 * * 求众数(mode) 方法一:命令(通过生成一个新的变量来求众数) egen [varname]=mode(varname) 举例: use data2, clear egen x=mode(femal) disp x egen y=mode(age) disp y 方法二:编程序 use data2, clear preserve //将数据表data2保留起来,未免被新数据覆盖 contract femal, freq(count) summ count //执行summ命令后,将部分统计值保存在数组r()中 keep if count = = r(max) list restore * * 求中位数(median) 命令 centile [varlist] [if] [in] [, options] 或 tabstat [varlist] [if] [in] [, options] 举例: use data2, clear centile age tabstat age, s(med) * 求平均数(mean) 命令: ameans [varlist] [if] [in] [weight] [, options] (可求算术,几何和调和平均数) mean varlist [if] [in] [weight] [, options] (求算术平均值/标准差/置信区间) 举例: import excel using exceldata.xls, firstrow amean age mean age 3.2 数据离散趋势的统计描述 异众比率 四分位差 极差、标准差、方差 变异系数 * * 求异众比率(variation ratio) 通过编写程序实现 use data2, clear preserve contract femal, freq(count) summ count //执行summ命令后,将部分统计值保存在数组r()中 generate m=r(max) //将变量count中的最大值赋给变量m generate s=r(sum) //将变量count中的所有值之和赋给变量s generate vr=m/s disp vr * 求四分位差(interquartile range ) 命令: tabstat varlist [if] [in] [weight] [, options] 当option为 s(iqr)时,为求变量的四分位差 举例: use data2, clear tabstat age, s(iqr) * 求极差(range) 命令: tabstat varlist [if] [in] [weight] [, options] 当option为 s(r)时,为求变量的极差 举例: use data2, clear tabstat age, s(r) * 求标准差(standard deviation) 和方差(variance) 命令: tabstat varlist [if] [in] [weight] [, options] 当option为 s(sd)时,为求变量的标准差 当option为 s(v)时,为求变量的方差 举例: use data2, clear tabstat height, s(sd) tabstat height, s(v) * 求变异系数(coefficient of variation) 命令: tabstat varlist [if] [in] [weight] [, options] 当option为 s(cv)时,为求变量的变异系数 举例: use data2, clear tabstat height, s(cv) 补充: 采用summarize , detail命令可以计算均数、标准差、峰度系数、偏度系数、多个百分位数。不加detial可以得到最大值、最小值。 * 3.3 数据偏斜和尖削程度的统计描述 偏度系数 峰度系数 * * 求偏度系数(skewness) 命令: tabstat varlist [if] [in] [weight] [, options] 当option为

您可能关注的文档

文档评论(0)

学习让人进步 + 关注
实名认证
文档贡献者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档