关联规则挖掘算法研究及其在CRM中的应用-计算机应用技术专业论文.docxVIP

下载本文档

0
0
约5.87万字
约 62页
2019-04-12 发布于上海
举报
版权申诉

关联规则挖掘算法研究及其在CRM中的应用-计算机应用技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关联规则挖掘算法1iJ|死及』e“CRM中的府用关联规则挖掘算法1iJ|死及』e“CRM中的府用摘要关联规则挖掘算法研究及其在CRM中的应用摘要数据挖掘(或知识发现)出现于20世纪80年代末，目前已经成为人工智能和数据库等领域的研究热点。它有着广阔的应用前景，并将在新的世纪里在各个领域发挥其强大的生命力。R．Agrawal等在1993年提出了关联规则问题，现在关联规则已经成为数据挖掘研究的重要方向，并且吸引了众多专家和学者的关注。本文比较研究了现有的关联规则挖掘算法如Apriori算法、增量式更新算法等，发现存在问题有二，其中之一是当数据库中增加新的数据时，多数算法要重新扫描整个大型数据库，效率较低。另一个问题是由于现有算法中项目集的支持度是基于整个数据库计算的，当新增的数据中出现新项目时，即使包含新项目的项目集频繁地出现，现有算法常把这些项目集作为非频繁项目集，由此产生的关联规则不能反映最近的商业活动。本文根据以上算法存在的问题，首先提出了一个新的概念——敏感性，用来衡量各种关联规则挖掘算法对新项目的重视情况。然后一方面从改进算法的时间效率出发，引入一个参数C(1≤C≤。。)，根据旧数据集的支持度大于或等于 minsup／c的频繁项目集和新增数据集发现频繁项目集，而不需扫描整个旧数据集：另一方面从敏感性出发，对于只出现在新数据集中的频繁项目集，则直接作为整个数据集的频繁项目集。紧接着本文通过实验把改进的算法与增量式更新算法进行了比较分析。最后结合数据仓库知识，探讨了如何把关联规则应用于客户关系管N(CRM)eP。关键词数据挖掘，关联规则，数据仓库，客户关系管理注：本项目获浙江省自然科学基金的资助(资助号为601076) 关联规则挖掘算法研究及其相-CRM中的廊用关联规则挖掘算法研究及其相-CRM中的廊用摘要 STUDY ON ALGORITHM 0F MINING ASSOCIATION RULES AND THE APPLICATION OF IT IN CRM ABSTRACT Data Mining or Knowledge Discovery emerged in the late 1980s has become a hotspot in the fields of artificial intelligence and database technology．Data mining has its wide application prospect and is expected to continue to flourish in the new millennium．R．Agrawal etc．first put forward the issue of mining association roles in 1993．Now it has been an significant content ofdata mining and SO draws attention of many researchers． After we have studied existing algorithms of mining association rules such as Apriori，Incremental Updating algorithm etc．，two problems are found．One of the problems is that most of the algorithms must scan the whole large database when new data are added to it．So it will make the discovering frequent item sets very slow． Another problem is that the item sets which includes new items will be oRen regarded as unfrequent item sets even if they happened frequently in new data set because the support of the item sets is calculated based on the whole database．So the association rules come from above frequent item sets Can’t reflect the recent business activity． Having known the pro