SAS培训班讲义Word版与版内容相同方便打印使用.docVIP

SAS培训班讲义Word版与版内容相同方便打印使用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Made by Daibingchuan and lihui PAGE 4 课程名称: 数据处理 ▲数据类型 a. 横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别) 名词术语  1、数据集:数据的集合,由样本(行)和变量(列)组成 b.时间序列数据集(time series data set):是由一个或几个变量在不同时间的观测值所构成的。 c.混合横截面数据集(pooled cross section data set):有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同。 d.综列数据集(panel data set):由横截面数据集中每个样本的一个时间序列组成。(定点长期调查) 其他专门数据类型: 1、离散数据(discrete data):通常在考察个人、家庭或企业的决策行为时,通过问卷调查获得,由此发展出“离散选择模型” 2、持续数据(survival data):用于考察变量从开始到结束或调查终止前所经过的时间长度,如失业持续时间、罢工持续时间、甚至怀孕间隔 3、cohort(一代人) data -- 为持续收集特定社会群体在一段时间内的变化的数据。如:调查七十年代出生的样本在10年间的汽车持有率数据或就业率数据等。 SAS运行环境的界面 菜单栏: 文件 编辑 工具 解决方案: 各功能模块 窗口 帮助 SAS资源管理器 我的电脑 逻辑库:类似我的电脑,不同的是,在sas系统里才存在的,关闭sas系统后,在本地机中不容易找到 包括4个目录:work(临时文件夹)map, sasuser, sashelp ▲SAS工作空间 ?可以通过“查看”调取: 程序窗口(PROGRAM EDITOR) ?运行记录窗口(LOG) ?输出窗口(OUTPUT) ▲SAS程序第一例 ?SAS/HelloWorld.sas? ?注:以后程序文件省略后缀,直接简记为文件名称,如此例简记为HelloWorld,需要说明文件类型时才标明后缀。 Ctrl+e 清空 除特殊字符外,大小写不区分 数据步 Data a; 生成以a命名的数据集,这里a是空的数据集 File print; 将原本在日志窗口中输出的内容转移至输出窗口中输出 Put ‘hello world’; 将put后的内容在日志窗口中呈现 Run; Proc print; 将前面运行的结果在输出窗口显示 Run; 运行后,日志窗口中显示执行情况 深蓝 固有关键词 浅蓝 普通关键词 Insight模块 在逻辑库中新建一个文件夹“培训”,放入培训中需要的文件 在“命令行”中输入“insight”,启动insight 逻辑库及其所含的数据 界面: 菜单 文件 编辑:可以设置 分析:图形、分析 灰色不可操作的菜单 左上角的小三角 移动 查找 新建观测(样本) 新建变量 抽取样本 左边的小方框,作图时用于表示这样的样本 填充数据:选定需要填充的范围,鼠标右键,“填充值” 对话框:值:1 增加值:1 表示从1开始,增量为1 默认变量名和变量类型,类型可以改变 抽取样本 选定2个变量,右键“抽取”,对这两个样本进行更加详细的分析 编辑窗口工具,出现调色板,标记色彩 对事先选定的样本标记,方便对数据作直观的研究 事先未选定样本,创建标记色彩的规则:每个样本的每一个变量,符合某种条件时将该样本标记为某种颜色。 查看一个数据集的概况:右键、属性 “标签” 对数据集添加密码等 打开“分析”中的分布、拟合、多元等的窗口后,原先灰色不可选的菜单菜可操作(Tables\Graphs\Curves等) “分析”菜单中也可作图 分布:输出大多数常用的统计量 拟合:回归分析 多元:方差分析 不同的分析方法,Tables\Graphs\Curves菜单里显示的功能也是不同的 ▲SAS程序的书写格式 ?1、SAS程序由语句组成,语句用分号结束。 ?2、SAS语句可以从某一行的任意位置开始; ?3、几个SAS语句可以写在同一行上,但每句要使用分号 ?4、一个语句也可以写成几行,只要语句中的单词不被断开就可以。在一个语句中各个单词之间至少要有一个空格。 ?5、SAS程序中一般不区分大小写(字符串中要区分大小写) ?6、用 /*注释的内容*/ 来对程序进行注释,绿色显示 ▲SAS程序的结构 ?SAS数据集 样本(观测、记录)、变量(字段、域)、表(数据

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档