- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
动态数据挖掘在物联网中的应用
陈圣兵
邮箱:luck_2u@163.com
计科系软件教研室
引例 身边的数据挖掘
淘宝网
引例 身边的数据挖掘
优酷
引例 身边的数据挖掘
超市
数据挖掘无处不在
未来(软件)系统的核心竞争在于智能化,
为管理者提供决策支持,提供用户提供个性
化服务。
数据挖掘的概念
数据挖掘(Data Mining) 是从大量的数据中,提取隐含在其
中的、潜在有用的信息和知识的过程,又称知识发现
(Knowledge Discovery in Database, KDD)。
DM的任务:
• 关联分析 :找出隐藏的某些属性间的联系
• 聚类:按相似性将数据归类
• 分类:找出类别的特征,将数据分类
• 预测:分析出数据的变化规律,并据此对未来数据进行预测。
关联分析:关联规则挖掘
关联规则反映一个事物与其他事物之间的相互依存
性和关联性。如果两个或者多个事物之间存在一定
的关联关系,那么,其中一个事物就能够通过其他
事物预测到。
示例:
bread, milk fruit
“买面包和牛奶的人也会买水果”
关联分析:关联规则挖掘
商家对关联规则的利用
bread, milk fruit
“买面包和牛奶的人也会买水果”
把牛奶和面包作特价品以使更多的人买水果
把水果和牛奶、面包放在一起增加水果销量
把水果放在远离牛奶、面包的地方,增加其他商品
的销量
关联分析的应用
有没有更多的商品具有相关性?如何寻找这
些相关性?
频繁模式: 数据中频繁出现的模式(项集,序
列,等等)
Apriori算法:使用或选项集找出频繁项集
频繁1-项集 频繁2-项集 … 频繁n-项集
关联规则的度量
规则 AB
支持度s:同时包含A和B的事务的百分率
|| {T D | A B T} ||
s(A B)
|| D ||
可信度c:包含A 的事务中也包含B的百分率
|| {T D | A B T} ||
c(A B)
|| {T D | A T } ||
The Apriori Algorithm—An Example
假设有数据如下:
Tid Items
10 A, C, D
20 B, C, E
30 A, B, C, E
40 B, E
The Apriori Algorithm—An Example
Itemset sup
Database TDB
文档评论(0)