4.数据描述性分析重点.pptx

  1. 1、本文档共129页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
河北工程大学数学系 第一章 数据描述性分析 数据描述性分析 研究背景 研究方案 研究成果 研总结 均值、方差等数字特征 研究背景 研究方案 研究成果 研总结 均值、方差等数字特征 研究背景 研总结 均值、方差等数字特征 研究背景 研总结 均值、方差等数字特征 研究背景 研总结 均值、方差等数字特征 研究背景 研总结 偏度 研究背景 研总结 均值、方差等数字特征 研究背景 研总结 总体的数据特征 研究背景 研总结 设观测数据是由总体X中取出的样本,总体的分布函数是F 。当X为离散分布时,总体的分布可由概率分布列刻画: 总体为连续分布时,总体的分布可由概率密度 刻画。连续分布中最重要的是正态分布,它的概率密度 及分布函数 分别为 总体的数据特征 研究背景 研总结 总体的数据特征 研究背景 研总结 总体的数据特征 研究背景 研总结 总体的数据特征 研究背景 研总结 总体的数据特征 研究背景 研总结 总体数字特征和样本数字特征 研究背景 研总结 总体数字特征和样本数字特征 研究背景 研总结 MEANS过程 研究背景 研总结 PROC MEANS 选择项(options) VAR 变量名表; 指定需求计算的数值变量及次序 BY 变量名表; 按其取值形成多个观测组,然后计算对应的描述 性统计量(要求对By变量已排序) CLASS 变量名表; 与By类似,但不要求事前排序,结果以单表 形式输出 FREQ 变量名表; 输入数据系频数表资料时才使用 OUTPUT OUT=SAS 数据集 统计量关键词=变量名表; SAS中可以计算的描述性统计量部分关键字及其含义 研究背景 研总结 关键字 所代表的含义 n 有效数据记录数 nmiss 缺失数据记录数 mean 均值 std 标准差 var 方差 median 中位数 mode 众数 CV 变异系数 max 最大值 SAS中可以计算的描述性统计量部分关键字及其含义 研究背景 研总结 关键字 所代表的含义 min 最小值 css 校正的离均差平方和 uss 未校正的离均差平方和 skew 偏度 kurt 峰度 clm 可信限(上下界值) lclm 可信限下侧界值 uclm 可信限上侧界值 qrange 四分位数间距 例 研究背景 研总结 从19个杆塔上的普通盘形绝缘子测得该层电导率 的数据如下: 9.89 8.00 6.40 6.17 5.39 7.27 9.08 10.40 11.20 8.75 6.45 11.90 10.30 9.58 9.24 7.75 6.20 8.95 8.33 计算均值、方差、标准差、变异系数、偏度、峰度。 例 研究背景 研总结 例 研究背景 研总结 例 研究背景 研总结 例 研究背景 研总结 例 研究背景 研总结 组段 组中值 组频数 5.5~6.0 5.75 4 6.0~6.5 6.25 3 6.5~7.0 6.75 15 7.0~7.5 7.25 42 7.5~8.0 7.75 49 8.0~8.5 8.25 78 8.5~9.0 8.75 50 9.0~9.5 9.25 31 9.5~10.0 9.75 5 例 研究背景 研总结 例 研究背景 研总结 例 研究背景 研总结 例 研究背景 研总结 SAS程序为 data p9; do g=1 to 2; input n; do i=1 to n; input x@ @;output; end;end; Cards; 11 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 13 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.58 1.87 ; proc means; var x; by g; run; 例 研究背景 研总结 Proc UNIVARIATE 研究背景 研总结 统计程序univariate与统计程序means的功能大同小异,都可以计算数值变量的描述性统计值 但UNIVARIATE能够对变量的分配情形提供更多的信息:

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档