- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以上创建的SAS数据集都在默认的work数据库中 而work数据库创建于windows的临时文件夹。。。 创建我们自己的固定数据库 数据集一次创建,以后可以反复使用。。。 创建固定的SAS数据库 在目录d:\temp创建名为mylib的SAS数据库 创建数据集的程序,现在为: data mylib.sale; input name $ sales region $ type $; cards; staler 9664 east sm young 22969 east sm … … wilson 97214 north c run; 如何进行简单的统计分析 如计算均值、方差、置信区间、T检验。。。 计算均值、方差、标准差。。。 proc means data=mylib.sale MEAN VAR STD CLM ALPHA=0.05; var sales; run; MEAN:变量的平均数 STD:变量的标准差 VAR:变量的方差 CLM:总体均值置信区间的上限和下限 LCLM:置信区间的下限 UCLM:置信区间的上限 ALPHA=0.05:1-置信水平 MEANS过程还可以计算 N:输入的观测值个数 NMISS:每个变量所含缺失值的个数 MIN:变量的最小值 MAX: 变量的最大值 RANGE:变量的极差(范围) SUM:变量所有值的和 USS:每一变量原始数据的平方和 (未校正平方和) CSS:每一变量的离均差平方和(校正平方和) , CV:变异系数 变异系数(coefficient of variation, 简记为CV) : ?????? 是指标准差与平均数的百分比率。即 CV = s/ ??? × 100 % 极差(range) : 一组数据中的最大值与最小值之差为极差。 MEANS过程还可以计算 STDERR:每一变量的标准误差(平均数的标准差) T:在Ho: μ = 0时的t值 PRT:在Ho: μ = 0的假设下,统计量t大于t分位数绝对值的概率. SKEWNESS:偏斜度 KURTOSIS:峭度 偏度:Skewness是以正态分布为标准来描述样本数据对称性的统计量。 Skewness= ??????????????????????????? 正态分布的偏度为0; 右偏分布的偏度为正数; 左偏分布的偏度为负数。 峰度:Kurtosis 是以正态分布为标准来描述样本数据 分布密度偏离正态分布曲线的程度的统计量。 Kurtosis= ????????????????????????????????????????正态分布的峰度度为0, 两侧的极端数据较少,呈尖峰式分布,峰度度为负数; 两侧的极端数据较多,呈偏平式分布,峰度度为正数。 T值:是?未知的正态分布的均值的假设检验所用的统计量。 T= ??????????????????????????? 这个统计量满足t(n-1)分布 销售数据 我们的数据为: 如果我们想对east、west、south、north地区分别计算均值、方差、置信区间、T值呢? 如果想对east、west、south、north地区分别计算 proc means data=mylib.sale MEAN VAR STD CLM ALPHA=0.05 T PRT; var sales; class region; run; 上机练习1:对east、west、south、north地区分别计算均值 上机练习2:计算下表的中人均收入、居住面积的样本均值、样本标准差、总体均值的95%置信区间 省(市,区) 人口增长 文盲率 负担系数 科技人员 人均国民 人均居住 编号 率(%) (%) (%) 比重(%) 收入(元) 面积(m2) 1 1.10 14.96 52.2 13.63 1661 6.2 2 1.20 17.20 56.6 10.14 1523 5.0 3 1.70 29.55 75.5 4.31 514 5.6 4 1.90 24.35 81.5 5.86 760 5.6 5 2.51 31.08 81.0 6.95 485 6.0 6 1.60 16.58 65.8 8.26 969 4.6 7 2.00 21.78 75.9 8.14 645 5.0 8 2.70 22.1
文档评论(0)