SAS简介与基本数据操作教程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以上创建的SAS数据集都在默认的work数据库中 而work数据库创建于windows的临时文件夹。。。 创建我们自己的固定数据库 数据集一次创建,以后可以反复使用。。。 创建固定的SAS数据库 在目录d:\temp创建名为mylib的SAS数据库 创建数据集的程序,现在为: data mylib.sale; input name $ sales region $ type $; cards; staler 9664 east sm young 22969 east sm … … wilson 97214 north c run; 如何进行简单的统计分析 如计算均值、方差、置信区间、T检验。。。 计算均值、方差、标准差。。。 proc means data=mylib.sale MEAN VAR STD CLM ALPHA=0.05; var sales; run; MEAN:变量的平均数 STD:变量的标准差 VAR:变量的方差 CLM:总体均值置信区间的上限和下限 LCLM:置信区间的下限 UCLM:置信区间的上限 ALPHA=0.05:1-置信水平 MEANS过程还可以计算 N:输入的观测值个数 NMISS:每个变量所含缺失值的个数 MIN:变量的最小值 MAX: 变量的最大值 RANGE:变量的极差(范围) SUM:变量所有值的和 USS:每一变量原始数据的平方和 (未校正平方和) CSS:每一变量的离均差平方和(校正平方和) , CV:变异系数 变异系数(coefficient of variation, 简记为CV) : ?????? 是指标准差与平均数的百分比率。即   CV = s/ ??? × 100 % 极差(range) : 一组数据中的最大值与最小值之差为极差。 MEANS过程还可以计算 STDERR:每一变量的标准误差(平均数的标准差) T:在Ho: μ = 0时的t值 PRT:在Ho: μ = 0的假设下,统计量t大于t分位数绝对值的概率. SKEWNESS:偏斜度 KURTOSIS:峭度 偏度:Skewness是以正态分布为标准来描述样本数据对称性的统计量。 Skewness= ??????????????????????????? 正态分布的偏度为0; 右偏分布的偏度为正数; 左偏分布的偏度为负数。 峰度:Kurtosis 是以正态分布为标准来描述样本数据 分布密度偏离正态分布曲线的程度的统计量。 Kurtosis= ????????????????????????????????????????正态分布的峰度度为0, 两侧的极端数据较少,呈尖峰式分布,峰度度为负数; 两侧的极端数据较多,呈偏平式分布,峰度度为正数。 T值:是?未知的正态分布的均值的假设检验所用的统计量。 T= ??????????????????????????? 这个统计量满足t(n-1)分布 销售数据 我们的数据为: 如果我们想对east、west、south、north地区分别计算均值、方差、置信区间、T值呢? 如果想对east、west、south、north地区分别计算 proc means data=mylib.sale MEAN VAR STD CLM ALPHA=0.05 T PRT; var sales; class region; run; 上机练习1:对east、west、south、north地区分别计算均值 上机练习2:计算下表的中人均收入、居住面积的样本均值、样本标准差、总体均值的95%置信区间   省(市,区) 人口增长 文盲率  负担系数 科技人员 人均国民 人均居住    编号   率(%)  (%)   (%)  比重(%) 收入(元) 面积(m2)     1     1.10   14.96   52.2   13.63   1661   6.2     2     1.20   17.20   56.6   10.14   1523   5.0     3     1.70   29.55   75.5   4.31    514   5.6     4     1.90   24.35   81.5   5.86    760   5.6     5     2.51   31.08   81.0   6.95    485   6.0     6     1.60   16.58   65.8   8.26    969   4.6     7     2.00   21.78   75.9   8.14    645   5.0     8     2.70   22.1

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档