(26)--6.5 物联网数据分析与挖掘-数据预处理.pdf

(26)--6.5 物联网数据分析与挖掘-数据预处理.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据的预处理和知识发现

数据的预处理原因

主要技术

数据清洗

数据清洗主要是删去数据中

重复的记录,消除数据中的噪

声数据,纠正不完整和不一致

的数据。

噪声数据是指数据中存在着

错误或异常的数据

不完整数据是指数据中缺乏

某些属性值

不一致数据是指数据内涵出

现不一致情况

数据清洗

数据清洗

填补遗漏的数据值

平滑有噪声的数据

识别或除去异常值

解决不一致问题。

数据集成

数据集成是将这些数据源中的数据集中存放在一个统

一的数据存储(如数据仓库)中。

数据转换

数据转换指将一种格式的数据转换为另外一种格式的

数据,其目的就是为了使数据和将来要建立的模型拟合

得更好,形成适合挖掘的形式。

数据归约

数据归约是指在尽可能保持数据原貌的情况下,最大

限度地精简数据量,因此也称为数据消减。

属性选择

数据采样

数据的预处理

通过综合使用这些数据预处理技术能够帮助改善数据

的质量,进而提高后续数据挖掘的有效性和准确性。

知识发现

知识发现是一个选择和提取数据的过程,它能自动地

发现新的、精确的、有用的模式以及现实世界现象。

广义知识发现

数据立方体:数据立方体是实现某些常用的、代价

较高的聚集函数的计算,如计数、求和、平均、最

大值等,并将这些实现视图存储在多维数据库中。

面向属性的归约:面向属性的归约则是以类SQL语

言表示数据挖掘查询,收集数据库中的相关数据集,

然后在相关数据集上应用一系列数据推广计数进行

数据推广。

狭义知识发现

关联知识发现:关联知识发现是反映一个事件和其他

事件之间依赖或关联。如果两项或多项属性之间存在

关联,那么其中一项的属性值就可以依赖其他属性值

进行预测。

分类知识发现:分类知识发现是反映同类事物共同性

质的特征型知识和不同事物之间的差异型特征。

预测知识发现:预测型知识发现是有历史的和当前的

数据去推测未来的数据,也可以认为是以时间为关键

属性的关联知识发现。

谢谢大家

文档评论(0)

177****2883 + 关注
实名认证
内容提供者

热爱教育,专注于教育领域创作与分享,让我们共同进步。

1亿VIP精品文档

相关文档