- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总体方差(population variance) : 样本方差(sample variance): 本文档共52页;当前第29页;编辑于星期三\8点17分 两个均值一样,但右边的要“胖”些,方差为左边的一倍 本文档共52页;当前第30页;编辑于星期三\8点17分 标准差(Standard deviation) 本文档共52页;当前第31页;编辑于星期三\8点17分 如何用图来表示数据? 本文档共52页;当前第32页;编辑于星期三\8点17分 本文档共52页;当前第33页;编辑于星期三\8点17分 直方图 本文档共52页;当前第34页;编辑于星期三\8点17分 本文档共52页;当前第35页;编辑于星期三\8点17分 盒型图 本文档共52页;当前第36页;编辑于星期三\8点17分 茎叶图 其中茎叶图中茎的单位为10cm,而叶子单位为1cm。比如,由于第一行茎为150cm,因此叶子中的九个数字001223344代表九个数目150、150、151、152、152、153、153、154、154cm等。每行左边有一个频数(比如第一行有9个数目,第二行有17个等等);可以看出最长的一行为从165cm到169cm的一段(有35个数)。 本文档共52页;当前第37页;编辑于星期三\8点17分 数据挖掘-数据的统计分析基础 张洪祥 本文档共52页;当前第1页;编辑于星期三\8点17分 在统计学中,数据按变量值是否连续可分为连续数据与离散数据两种. 连续数据又称连续变量:在一定区间内可以任意取值的数据叫连续数据,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。 所谓离散型数据,又称计数型:就是数据可以经过观测而知的,间断性的、可一个一个计算的 本文档共52页;当前第2页;编辑于星期三\8点17分 统计学的分类 1、描述性统计学(descriptive statistics): 用局部数据或者不完整数据中指标性数字来表示所有数据。 2、推论统计学(inferential statistics):用(样本)数据来对(总体)事物做结论。 本文档共52页;当前第3页;编辑于星期三\8点17分 数据的中心(集中)趋势度量: 数据的度量散布: 数据的基本统计描述 本文档共52页;当前第4页;编辑于星期三\8点17分 中心趋势度量:均值(mean) 本文档共52页;当前第5页;编辑于星期三\8点17分 本文档共52页;当前第6页;编辑于星期三\8点17分 中心趋势度量:中位数(median) 本文档共52页;当前第7页;编辑于星期三\8点17分 中心趋势度量:众数(mode)、中列数(midrange) 本文档共52页;当前第8页;编辑于星期三\8点17分 本文档共52页;当前第9页;编辑于星期三\8点17分 数据的度量散布-极差、分位数 设X1,X2,…,X是某数值属性X上的观测的集合 。 极差:是该集合中最大值Max()与最小值Min()之差。 分位数:把数据划分成基本上大小相等连贯集合的每一间隔上的点。 本文档共52页;当前第10页;编辑于星期三\8点17分 本文档共52页;当前第11页;编辑于星期三\8点17分 离群点:挑选落在第3个四分位数之上或第1个四分位之下到少1.5*IQR处的值。 五数概括(fiver-number summary): Minimum、Q1、Median、Q3、Maximum. 数据的度量散布-离群点、五数概括 本文档共52页;当前第12页;编辑于星期三\8点17分 本文档共52页;当前第13页;编辑于星期三\8点17分 数据的标准得分 某观测值xi的标准得分定义为 本文档共52页;当前第14页;编辑于星期三\8点17分 数据的标准得分 在我们的例子中,张颖的标准得分为(90-78.53)/9.43=1.22,而刘疏的标准得分为(82-70.19)/7=1.69。 显然如果两个班级平均水平差不多,刘疏的成绩应该优于张颖的成绩;这是在标准化之前的数据中不易看到的。 本文档共52页;当前第15页;编辑于星期三\8点17分 总体(population)是根据研究目的确定的具有相同性质的个体所构成的全体。 样本(sample)是从总体中随机抽取的部分观察单位 抽样(sampling) 指从总体抽取部分个体的过程 样本含量(sample size): 样本所包含观察单位的数目 样本与总体 本文档共52页;当前第16页;编辑于星期三\8点17分 样本的选取应注意什么问题? 一是要留意样本在总体中是否具有代表性, 二是样本容量必须足够大, 三是注意样本避免遗漏某一群体 一般地,如果从总体中按一定规则抽取n个个体进行观察(或试验
您可能关注的文档
最近下载
- 论 自由 精品读本.pdf
- 医疗器械质量管理体系文件.pptx
- 金融中心施工总承包工程项目特色与观摩亮点介绍.pptx
- 小学数学六年级上册期中易错题重难点试卷含详细答案解析1524.docx
- 做自己的心理医生【26页】.pptx
- Module 4 单元整体教学设计 外研版(三起)六年级上册英语.docx
- 环球金融中心项目专项测量放线施工方案.docx
- 环球金融中心项目施工总承包工程质量创优策划.ppt
- 鼎信JB-QT-TS3200火灾报警控制器(联动型)安装使用说明书 XF2.900.029AS Ver.pdf VIP
- 中华护理学会团体标准TCNAS 21─2021解读:胰岛素皮下注射(1).pptx
文档评论(0)