数据挖掘中的关联规则(ASSOCIATION%20RULES)和序列模式.docVIP

下载本文档

25
0
约2.69万字
约 24页
2019-07-26 发布于江西
举报
版权申诉

数据挖掘中的关联规则(ASSOCIATION%20RULES)和序列模式.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE 12 PAGE 23 数据挖掘中的关联规则和序列模式主题：数据挖掘中的关联规则(Association Rules)和序列模式(Sequential Patterns) 指导老师：朱扬勇复旦大学计算机系97级软件杨靖 9724016 2001.5 数据挖掘中的关联规则(Association Rules)和序列模式(Sequential Patterns) 【Abstract】 Database mining is motivated by the decision support problem faced by most large retail organizations. Progress in bar-code technology has made it possible for retail organizations to collect and store massive amounts of sales data, referred to as the basket data. We can get some information useful for sale or produce procedure through mining in the data while these information usually reflected by a certain pattern. We discussed two patterns in this theme: association rules and sequential patterns. Also we presented a program for resolving the problem “ to find large item set”, and compared some algorithms about these subjects. 【摘要】数据挖掘由一些大型零售机构所面临的“决策支持”问题(decision support problem)所激发。应用条形码技术采集的大量销售数据成为挖掘的基础。通过对这些数据进行数据挖掘我们可以找到对于商业销售及生产极为有效的一些信息(这些信息通过具体的模式得到反映)，从而可以提高销售和生产效率，降低成本，取得最大的商业效益，这就是数据挖掘的意义所在。本文就数据挖掘中的两种模式：关联规则(Association Rules)和序列模式(Sequential Patterns)的概念和作用进行了探讨，对关联规则中寻找大项集(Large Item Set)的部分用程序加以实现，并对此两个模式的实现过程用程序流程的方式加以说明，讨论了几种不同的实现算法。【术语】知识发现 —— KDD(Knowledge Discovery in Databases)用数据库管理系统来存储数据，用机器学习的方法来分析数据，挖掘大量数据背后的知识，称为数据库中的知识发现数据挖掘 —— 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程【背景概述】随着数据库技术的迅速发展以及数据库管理系统的广泛应用，人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息，人们希望能够对其进行更高层次的分析，以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能，但无法发现数据中存在的关系和规则，无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段，导致了“数据爆炸但知识贫乏”的现象。计算机技术的另一领域——人工智能自1956年诞生之后取得了重大进展。经历了博弈时期、自然语言理解、知识工程等阶段，目前的研究热点是机器学习。机器学习是用计算机模拟人类学习的一门科学，比较成熟的算法有神经网络、遗传算法等。用数据库管理系统来存储数据，用机器学习的方法来分析数据，挖掘大量数据背后的知识，这两者的结合促成了数据库中的知识发现(KDD：Knowledge Discovery in Databases)的产生。实际上，数据库中的知识发现是一门交叉性学科，涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等多个领域。从数据库中发现出来的知识可以用在信息管理、过程控制、科学研究、决策支持等