- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章 数据分析 根据大量数据提取某些目标信息(称为数据分析、数据挖掘等)是一类非常重要的实际问题。限于篇幅,本章涉及的数据分析是非常基础的,其目的是让读者对利用MATLAB进行数据分析有一个初步的了解,主要内容包括: 数据排序分析,包括排序、最大(小)数、分位数; 数据求和(积)、差分; 数据统计分析。 前两部分可以归结为基本数据分析。关于插值、回归分析、曲线拟合、傅立叶分析等内容将在第10章高级数值计算中介绍。MATLAB提供的统计工具箱涵盖了大部分数据统计分析功能。 9.1 最大(小)值、中位数 已知数据序列,求序列的最大值、最小值及中位数是实际工程中经常遇到的问题。对这类数据分析问题,MATLAB提供了强大的支持。MATLAB提供的函数max、min、median分别用于求数据序列的最大值、最小值和中位数,详细的使用方法见表 9.2 排序 数据的排序是理论和实际中经常遇到的问题。MATLAB提供sort和sortrow两个函数用于数据的排序操作。这两个函数不仅可以用于数值数据的排序,而且对字符串数据也可以进行排序,这里主要讲述数值排序,对于字符串的排序只稍作介绍。 sort对数组元素按升序或降序进行排列,数组元素的类型可以是整型、浮点型、逻辑类型等数值类型,也可以是字符、字符串。函数sort对字符或字符串数组的排序依据ASCII表进行;对复数数值类型,sort函数首先比较各元素的模值,在模值相同的情况下,考虑上的相位值;对于NaN数据,sort函数将其排在最后,不管是按升序还是降序排列。 9.3 分位数 对数据序列, 分位数是满足 的q,其中 是数据序列的长度,是x中不大于q的元素个数。通常上式的等号不能成立,这样可以定义p分位数是使 最小的q。 MATLAB利用函数quantile求数据序列的分位数,其调用格式为: Y = quantile(X, p) Y = quantile(X, p, dim) 9.4 求和(积)、差分 本节介绍数据序列的求和、求积、差分运算。MATLAB中利用函数sum、prod和diff对数据序列作求和、求积及差分等运算,这些内容相对简单,这里不再作过多的文字描述,读者只需练习给出的示例就能熟悉掌握相关函数的用法。 9.4.1 求和 MATLAB中的函数sum用于对数组求和,sum函数以数组A作为数据输入,sum(A)沿数组第一个非1的维进行求和。若A为向量,则返回该向量的和;若A为矩阵,则函数沿列方向求和,返回一个行向量,行向量的元素对应A每一列的和。sum(A, dim)指定函数沿第dim维求和。实际上MATLAB中很多函数的调用格式都与此类似,如前面用到的min、max、sort等。这里为这种类型的函数取一个名字,称为数组支持函数。对下面章节中出现的数组支持函数,如无特别的调用格式,则对其调用方法不作特别说明。 另外sum函数还提供给用户一个选项,该选项可限定运算结果的类型,如sum(…, ‘double’)限定结果为double型,即使输入数据为整型,默认情况会返回double型。 9.4.2 求积 prod函数用于数据序列求积,其使用方法与sum函数相似,是一种数组支持函数,调用格式为: prod(A) prod(A, dim) 9.4.3 求累计和、积和差分 除了一般的求和与求积,MATLAB还定义了两种累积运算,即累积和、累积积,分别由函数cumsum、cumprod实现。累积求和、累积求积函数都是数组支持函数,相应的调用格式为: cumsum(A) cumsum(A,dim) cumprod(A) cumprod(A,dim) 9.5 均值和方差 9.6 数据预处理 数据传输、处理可能存在一些随机错误,从而使数据出现缺失或异常等现象,这对后续的数据分析有可能存在不利的影响。本节将采用MATLAB中一些常用的数据预处理方法来解决数据的缺失和异常问题。这些在数据分析之前进行。 9.6.1 处理缺失数据 缺失数据的处理是一个非常困难的问题,随根据具体问题的不同,处理方法也各异。为了数据分析的方便,将缺失数据用NaN表示是一个非常便利的方法。 NaN是MATLAB的一个特殊数据,即“Not a Number”,MATLAB规定,NaN参与的数学运算结果均为NaN。例如向量,对其求和、积,结果均为NaN。在MATLAB命令窗口输入以下代码。 x = [1,2,NaN,4]; sum(x) ,prod(x) 运行结果如下。 ans = NaN ans = NaN 9.6.2 处理奇异值 数据传输、处理的错误可能是数据发生异常, 对异常数据可以采用与缺失数据相似的处理方法,即去除异
您可能关注的文档
- 如何进行语文试卷讲评.ppt
- 如何进行调查研究工作与写调查报告.ppt
- 如何进行道理分析.ppt
- 如何进行有效沟通.ppt
- 如何选定论文题目.ppt
- 如何防止叉车自燃.ppt
- 如何面试中选对人.ppt
- 如何选择数据分析方法.ppt
- 妇产科医疗纠纷防范课件123.ppt
- 妙笔生花的公文写作之道:如何撰写机关公文.ppt
- 2024年学校党总支巡察整改专题民主生活会个人对照检查材料3.docx
- 2025年民主生活会个人对照检查发言材料(四个带头).docx
- 县委常委班子2025年专题生活会带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”对照检查材料四个带头:.docx
- 巡察整改专题民主生活会个人对照检查材料5.docx
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)7.docx
- 2025年度民主生活会领导班子对照检查材料(“四个带头”).docx
- 国企党委书记2025年度民主生活会个人对照检查材料(五个带头).docx
- 带头严守政治纪律和政治规矩,维护党的团结统一等(四个方面)存在的问题整改发言提纲.docx
- 党委书记党组书记2025年带头增强党性、严守纪律、砥砺作风方面等“四个带头”个人对照检查发言材料.docx
- 2025年巡视巡察专题民主生活会对照检查材料.docx
最近下载
- 2023-2024学年山东省济南市市中区九年级上学期化学期末试题及答案.pdf VIP
- 上海中考《历史》2021年考试真题(含答案).pdf VIP
- 高二上学期期末考试(化学)试题含答案.pdf VIP
- 六年级分数解决问题100题.pdf
- ABB直流传动DCS400(20 1000A 9 522kW)晶闸管功率变流器用户手册(中文).pdf VIP
- (期末测试卷)2023-2024学年六年级数学上册人教版期末测试卷(二)(含答案).doc VIP
- 一年级语文下册《读读童谣和儿歌》指导教案.doc VIP
- 汽车电气设备构造与维修考试试题集(含答案)共7套.docx
- 儿童医疗辅导.pptx
- 殡葬领域乱象整治整改措施.doc
文档评论(0)