- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关联规则挖掘算法1iJ|死及』e“CRM中的府用
关联规则挖掘算法1iJ|死及』e“CRM中的府用 摘要
关联规则挖掘算法研究及其在CRM中的应用
摘要
数据挖掘(或知识发现)出现于20世纪80年代末,目前已经成为人工智能 和数据库等领域的研究热点。它有着广阔的应用前景,并将在新的世纪里在各个 领域发挥其强大的生命力。R.Agrawal等在1993年提出了关联规则问题,现在 关联规则已经成为数据挖掘研究的重要方向,并且吸引了众多专家和学者的关 注。
本文比较研究了现有的关联规则挖掘算法如Apriori算法、增量式更新算法 等,发现存在问题有二,其中之一是当数据库中增加新的数据时,多数算法要重 新扫描整个大型数据库,效率较低。另一个问题是由于现有算法中项目集的支持 度是基于整个数据库计算的,当新增的数据中出现新项目时,即使包含新项目的 项目集频繁地出现,现有算法常把这些项目集作为非频繁项目集,由此产生的关 联规则不能反映最近的商业活动。
本文根据以上算法存在的问题,首先提出了一个新的概念——敏感性,用来 衡量各种关联规则挖掘算法对新项目的重视情况。然后一方面从改进算法的时间 效率出发,引入一个参数C(1≤C≤。。),根据旧数据集的支持度大于或等于
minsup/c的频繁项目集和新增数据集发现频繁项目集,而不需扫描整个旧数据 集:另一方面从敏感性出发,对于只出现在新数据集中的频繁项目集,则直接作 为整个数据集的频繁项目集。紧接着本文通过实验把改进的算法与增量式更新算 法进行了比较分析。最后结合数据仓库知识,探讨了如何把关联规则应用于客户
关系管N(CRM)eP。
关键词
数据挖掘,关联规则,数据仓库,客户关系管理
注:本项目获浙江省自然科学基金的资助(资助号为601076)
关联规则挖掘算法研究及其相-CRM中的廊用
关联规则挖掘算法研究及其相-CRM中的廊用 摘要
STUDY ON ALGORITHM 0F MINING ASSOCIATION
RULES AND THE APPLICATION OF IT IN CRM
ABSTRACT
Data Mining or Knowledge Discovery emerged in the late 1980s has become a hotspot in the fields of artificial intelligence and database technology.Data mining has its wide application prospect and is expected to continue to flourish in the new millennium.R.Agrawal etc.first put forward the issue of mining association roles in 1993.Now it has been an significant content ofdata mining and SO draws attention of many researchers.
After we have studied existing algorithms of mining association rules such as Apriori,Incremental Updating algorithm etc.,two problems are found.One of the problems is that most of the algorithms must scan the whole large database when new data are added to it.So it will make the discovering frequent item sets very slow. Another problem is that the item sets which includes new items will be oRen regarded as unfrequent item sets even if they happened frequently in new data set because the support of the item sets is calculated based on the whole database.So the association
rules come from above frequent item sets Can’t reflect the recent business activity.
Having known the pro
您可能关注的文档
- 海上侵权行为法归责原则研究-国际法学专业论文.docx
- 贵州小七孔景区钙华成因的水化学和碳氧同位素特征及古环境重建-自然地理学专业论文.docx
- 哈尔滨市紫丁香“绿量”的研究-园林植物与观赏园艺专业论文.docx
- 关于重庆“立法回避制度”的案例分析-法律·宪法与行政法专业论文.docx
- 管道噪声有源控制的工程实现及应用研究-水声工程专业论文.docx
- 韩国汉语课堂中影视教学法的问题及其改善方案-汉语国际教育专业论文.docx
- 广播电视卫星地球站系统设计-控制理论与控制工程专业论文.docx
- 锅炉汽包水位测量误差分析-控制理论和控制工程专业论文.docx
- 关于建立复合型大学英语教学模式的探索-外国语言学及应用语言学专业论文.docx
- 过渡金属硫属化合物纳米结构和纳米粒子的控制合成-高分子化学与物理专业论文.docx
- 关于盈亏平衡在航运企业运用的研究-会计学专业论文.docx
- 关联交易的公司法规制-法律专业论文.docx
- 关于盈亏平衡分析在航运企业运用的研究-会计学专业论文.docx
- 光照度计全自动检定系统设计和研制-精密仪器及机械专业论文.docx
- 关于四川移动通信公司创建移动服务营销的系统-工商管理(EMBA)专业论文.docx
- 广东年水资源的时空分布特征和预测研究-气象学专业论文.docx
- 惯性摩擦焊接过程温度场的数值模拟研究-材料加工工程专业论文.docx
- 关于交通财务“十一五”重点工作规划问题研究-产业经济学专业论文.docx
- 关于烟台大学后勤社会化改革的研究-工商管理专业论文.docx
- 广州市大沙地污水处理厂控制系统的研究与设计-控制工程专业论文.docx
文档评论(0)