第四章--探索性数据分析.pptx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章探索性数据分析教学目的了解数据分析的思想;掌握单组数据、 多组数据、 分类数据、 分组数据的描述性分析教学重点、难点单组数据、多组数据、分类数据、分组数据的描述性分析单组数据的描述性统计分析图形正态性检验描述性统计图形直方图hist()茎叶图stem( )框须图boxplot( )正态性检验QQ图qqnorm( );qqline( )与正态密度比较P102使用经验分布P103描述性统计平均水平总体描述:summary() 均值和五数 五数:fivenum( )分位数:quantile( )思考:怎么求出10%的数?描述性统计变异程度极值:max()-min()四分位极值:IQR()标准差:sd()方差:var()绝对离差:mad()什么是绝对离差?偏度/峰度:两组数据的描述性统计分析散点图:plot() 添加曲线:lines(lowess()) 多维可用loess()如果数据过于集中,看不清楚怎么办呢?两组数据的描述性统计分析等高线图:(MASS)library(MASS)z=kde2d(x,y)contour(z)如何在途中添加标题?两组数据的描述性统计分析三维透视图:persp()如果看不出数据间明显关系时,可对数据进行变换。例如取对数,取倒数多组数据的描述性统计分析对数据框进行分析(d)图形散点图:plot(d)或pairs(d)矩阵图:matplot(d) 在同一图形中框须图:boxplot(d)多组数据的描述性统计分析描述性统计分析summary(d)aggregate(d,a,mean) a是分类数据相关系数:线性的:pearson(默认) 非线性的:spearman或kendallcor(x,y) cor(x,y,method=”spearman”)分组数据的描述性统计分析按一个变量分成若干子集条件散点图:coplot()一个因子变量coplot(y~x|a)二个因子变量coplot(y~x|a*b)分组数据的描述性统计分析直方图:三种方法①多次使用hist();P119②hists(x,a)③histogram();P122框须图:boxplot(x~a)分组数据的描述性统计分析条形图:stripchart(x~a,method=” ”)method中有overplot重叠放置 stack垒起来 jitter散放在周围密度曲线:densityplot(~x|a)分类数据的统计分析放方法都为分类数据,则用列联表①通过矩阵建立:P126②由原始数据构建:table(x,y)分类数据的统计分析放方法边际列表(行和、列和)margin.table()频率列联表(频率)prop.table()对比:round(prop.table(x.y,1))round(prop.table(x.y,1))分类数据的统计分析放方法图形:条形图:barplot() P128点图:dotchart()作业P1304.74.8上机课上交

文档评论(0)

js1180 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档