- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联规则挖掘AssociationRuleMining
第三章 关联规则挖掘
Association Rule MiningAssociation Rule Mining
背景简介 (Motivation)
超市购物:商场经理可能想了解顾客的购物习惯。例如:
顾客多半会在一次购物时买哪些商品?”。分析的结果
可用于市场规划、广告策划和分类设计。
文本分类:个性化新闻推荐系统希望对新闻进行分类,推
进用户感兴趣类别的新闻内容给用户。系统可以通过挖掘
哪些关键词与某个类别经常联系在一起,找出文档的分类
标准标准。。
信息推荐:电子商务网站推荐用户所需的信息。如:下载
某种类型音乐的用户通常具有什么样的特点
解决这些问题的一种有效途径就是 Association Rule
Mining” (关联规则挖掘)
Association Rule Mining
Given a set of transactions, find rules that will predict the
occurrence of an item based on the occurrences of other
items in the transaction
Market-Basket transactions
Example of Association Rules
TID Items
{Diaper} {Beer},
1 Bread, Milk
{Milk, Bread} {Eggs,Coke},
2 Bread, Diaper, Beer, Eggs {Beer, Bread} {Milk},
3 Milk, Diaper, Beer, Coke
4 Bread, Milk, Diaper, Beer Implication means co-occurrence,
not causality!
5 Bread, Milk, Diaper, Coke
Definition: Frequent Itemset
Itemset
– A collection of one or more items
Example: {Milk, Bread, Diaper
– k-itemset TID Items
An itemset that contains k items 1 Bread, Milk
Support count () 2 Bread, Diaper, Beer, Eggs
3 Milk, Diaper, Beer, Coke
–– Frequency of occurrence of an itemsetFrequency of occurrence of an itemset
4 Bread, Milk, Diaper, Beer
– E.g. ({Milk, Bread,Diaper}) = 2
文档评论(0)