_物联网中的智能决策.pptVIP

下载本文档

2
0
约5.09千字
约 34页
2021-03-25 发布于天津
举报
版权申诉

_物联网中的智能决策.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第 13 章物联网中的智能决策内容提要智能决策是物联网“智慧”的来源。本章将介绍数据挖掘的基本流程，基本类型和典型算法。 13.1 数据挖掘概述 13.2 数据挖掘的基本类型和算法 * 13.3 智能决策与物联网什么是数据挖掘？数据挖掘有哪三个步骤？本章内容 13.1 数据挖掘概述数据挖掘（ Data Mining ） ? 从大量数据中获取潜在有用的并且可以被人们理解的模式的过程 ? 是一个反复迭代的人机交互和处理的过程，历经多个步骤，并且在一些步骤中需要由用户提供决策数据挖掘的过程： ? 数据预处理、数据挖掘和对挖掘结果的评估与表示 ? 每一个阶段的输出结果成为下一个阶段的输入 13.1 数据挖掘概述数据挖掘的过程 ? 数据预处理阶段 ? 数据准备：了解领域特点，确定用户需求 ? 数据选取：从原始数据库中选取相关数据或样本 ? 数据预处理：检查数据的完整性及一致性，消除噪声等 ? 数据变换：通过投影或利用其他操作减少数据量 ? 数据挖掘阶段 ? 确定挖掘目标：确定要发现的知识类型 ? 选择算法：根据确定的目标选择合适的数据挖掘算法 ? 数据挖掘：运用所选算法，提取相关知识并以一定的方式表示 ? 知识评估与表示阶段 ? 模式评估：对在数据挖掘步骤中发现的模式 ( 知识 ) 进行评估 ? 知识表示：使用可视化和知识表示相关技术，呈现所挖掘的知识 13.1 数据挖掘概述数据挖掘的过程 13.1 数据挖掘概述 13.2 数据挖掘的基本类型和算法 * 13.3 智能决策与物联网数据挖掘的基本类型和算法有那些？本章内容 13.2 数据挖掘的基本类型和算法数据挖掘的基本类型关联分析 (Association Analysis) 聚类分析 (Clustering Analysis) 离群点分析 (Outlier Analysis) 分类与预测 (Classification and Prediction) 演化分析 (Evolution Analysis) 描述性挖掘任务：刻划数据库中数据的一般特性预测性挖掘任务：在当前数据上进行推断和预测关联分析关联分析的目标是从给定的数据中发现频繁出现的模式，即关联规则关联规则通常的表述形式是 X Y ，表示“数据库中满足条件 X 的记录 ( 元组 ) 可能也满足条件 Y” 以某电器商场销售记录为例：含义： 4% ( 支持度 ) 的顾客的年龄在 20 至 29 岁且月收入在 3000 至 5000 元，且这样的顾客中， 65% ( 置信度 ) 的人购买了笔记本电脑关联分析挖掘关联规则，需要置信度和支持度越高越好基本概念项集：满足若干条件的数据项的集合，如果条件数为 k ，则称 k - 项集 ? 满足年龄 ( 顾客 , “20~29”) 的项集是 1- 项集 ? 满足年龄 ( 顾客 , “20~29”) 收入 ( 顾客 , “3000~5000”) 的项集是 2- 项集计算步骤 ? 首先找到具备足够支持度的项集，即频繁项集 ? 然后由频繁项集构成关联规则，并计算置信度关联分析如何寻找频繁项集 ? Apriori 算法基本思想：利用已求出的 k - 项集来计算 ( k +1)- 项集 ? 首先计算频繁 1- 项集 ? 然后根据两个频繁 k - 项集 { p 1 , p 2 , ..., p k } ， { q 1 , q 2 , ..., q k } 计算频繁 (k+1)- 项集，其中 p i = q i ， 1= i=k -1 ，且该 ( k +1)- 项集为 { p 1 , p 2 , ..., p k , q k } ? 最后判定该 ( k +1)- 项集是否频繁即可缺点：可能产生大量候选项集，并需要重复地扫描数据库 ? FP-Growth 算法利用树状结构保存项集，从而减小了计算频繁项集所需的存储空间关联分析如何由频繁项集构造关联规则，并计算置信度关联规 A B 的置信度其中 count(A AND B) 为满足条件 A 以及 B 的数据项数目， count(A) 为满足条件 A 的数据项数目计算步骤 ? 对于每一个频繁项集 S ，计