大数据基础 课件 课件5-3 数据预处理原理.pptx

大数据基础 课件 课件5-3 数据预处理原理.pptx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

浙江经贸职业技术学院《大数据基础》.移动商务营销课程群5.2.1数据预处理原理5.2数据预处理5.2.2Pandas数据预处理与预处理数据采集大数据基础Unit5

?数据预处理的意义与方法5.2.1数据预处理原理原始数据不一致重复不完整含噪声高维度数据预处理方法数据清洗数据集成数据变换数据归约

?数据清洗5.2.1数据预处理原理干净数据填充空值、丢失值消除异常数据平滑噪声数据去掉数据中的噪音纠正不一致的数据

?数据集成5.2.1数据预处理原理模式匹配整合不同数据源中的元数据。数据冗余数据中存在的直接冗余和间接冗余。数据值冲突对于一个现实世界实体,其来自不同数据源的属性值或许不同。

?数据变换5.2.1数据预处理原理光滑去除数据中的噪声聚集对数据进行汇总或聚集数据泛化使用概念分层,用高层概念替换低层或“原始”数据规范化将属性数据按比例缩放,使之落入一个小的特定区间属性构造可以构造新的属性并添加到属性集中,以帮助挖掘过程

?数据规约5.2.1数据预处理原理特征归约从原有的特征中删除不重要或不相关的特征,或者通过对特征进行重组来减少特征的个数。样本归约从数据集中选出一个有代表性的样本的子集,从而减少成本、加快速度、拓宽范围、甚至提高精度。征值归约特将连续型特征的值离散化,使之成为少量的区间,每个区间映射到一个离散符号。

《大数据基础》在线开放课程组《大数据基础》.移动商务营销课程群

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档