网站大量收购独家精品文档,联系QQ:2885784924

统计分析软件基础教程-Insight的数据探索功能.ppt

统计分析软件基础教程-Insight的数据探索功能.ppt

  1. 1、本文档共89页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计分析软件基础教程-Insight的数据探索功能.ppt

Page* Page* 图中有两个盒形图,女生一个,男生一个.从图中看出,男生身高普遍高于女生,且女生身高分布左偏较男生严重.这种并排盒形图可以十分直观地比较不同性别身高的分布. 绘制盒形图时若指定多个Y变量也可以作出并排的盒形图.比如,同时指定身高和体重作为Y变量作盒形图就可以生成身高和体重的并排的盒形图. Page* 分析(Analyze) ?盒形图/马赛克图(Box Plot/Mosaic Plot(Y)) 对连续型变量作盒形图,而对名义型变量将作出马赛克图.比如,对性别变量作马赛克图后,点击菜单项值(Values)后将标出男女生的人数、百分比. 马赛克图一般是对两个名义型变量来作图.比如,先把数据集CLASS中变量AGE的量测水平由Int改为Nom,并取消所有变量的选定,点击盒形图/马赛克图,在弹出的选择变量的对话窗中选SEX为Y变量,AGE为X变量,画出的马赛克图如下(选中值菜单后的结果). Page* Page* 数据探索的二维方法—线图 SAS/Insight可以作折线图、散点图、散点图矩阵,可以在散点图中刷亮观测. 线图要求指定一个取值由小到大的X变量,还有一个或几个Y变量,以X变量为横坐标对Y变量画曲线.为了演示连线图,打开SASUSER.AIR数据集(由 文件(File)?打开(Open)菜单),这个数据集收集了德国某城市一周中每小时记录的空气污染情况.变量DATETIME是记录的日期时间,为特殊SAS格式数据,变量DAY为星期几,HOUR为几点钟,CO、O3、SO2、NO、DUST分别为一氧化碳、臭氧、二氧化硫、一氧化氮、粉尘的浓度,WIND为风速.要求绘制一氧化碳随日期时间变化的连线图.步骤如下:可以在未选任何变量的情况下, 由分析(Analyse)?线图(Line Plot), 弹出变量对话框如下图: Page* 选DATETIME为X变量,CO为Y变量,并选HOUR为标签变量,然后按确定键,即可绘制出CO的时间序列曲线图. Page* Page* 单击曲线上某一个点可以显示该观测点的时间是几点(若没有规定标签变量,则显示观测序号),双击某点可以查看该观测的全部资料.由图上可以看出CO的高峰一般在早晨8点和晚上17点-21点. 用图形菜单(右键或单击向右三角)中的Observations可以画出各个数据点的符号.可以在图上同时画出多条连线图. Page* 比如,想考察风速对污染的影响,在图形窗口中再由主菜单 编辑(Edit)?窗口(Window)?重建(Renew), 把WIND也作为Y变量,画出的图就有两条不同颜色的连线,单击图形左边变量名WIND可以加亮表示对应的曲线(如下图),以便区分这两条连线.若点击风速最高的点,则将显示时间是11点,而此时间OC浓度很小.注意在一条曲线中被选中时在另一条连线也被选中.从此图可以看出风速对污染有较明显的影响,风大时污染较轻. Page* Page* 绘制散点图也要求规定一个X变量和一个Y变量,但不要求X变量有从小到大的次序,画图不用连线而是用散点画出每一对观测点的X、Y坐标的位置. 比如对SASUSER.CLASS,我们希望通过画散点图了解身高和体重的关系.在数据窗口中先选定体重(为Y轴变量),再选定身高(为X轴变量),由菜单 分析(Analyze)? 散点图(Scatter Plot) 就可以生成以体重为纵轴以身高为横轴的散点图. 从图中可以看出体重与身高有明显的线性相关关系.以下散点图中还借用手动工具改变散点的符号和颜色(男生为蓝色用+号,女生为红色用*号) 数据探索的二维方法—散点图 Page* Page* 为了解哪一个点代表哪一个学生,单击一个点可以显示其观测序号,双击可以查看观测的信息.为了在单击时可以显示学生名字而不是观测序号,需要把NAME指定为标签变量.这时先不在数据窗口选X、Y变量,而是直接由菜单 分析(Analyze)? 散点图(Scatter Plot) 弹出变量对话框,在其中选X、Y变量并把NAME指定为标签(Label)变量.这时,如单击散点图中最左下角的那个点可以显示名字. 选多个点可以用附加选中的办法(Shift或Ctrl单击). Page* 为了在散点图中选定多个点,SAS/Insight还提供了一种称为“ 刷亮(Brushing)”的操作.在图中拖动鼠标光标可以拖出一个小长方形,在这个长方形中的点都被选中,称它为刷子.选中的点在数据窗口也被选中,可以在数据窗口翻页查看,或用数据窗口的查找下一个(Find Next)菜单命令查看,或在数据窗口用 移

文档评论(0)

lzhlmcl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档