基于粗集理论值约简的数据挖掘系统-计算机应用技术专业论文.docxVIP

下载本文档

4
0
约4.16万字
约 65页
2019-02-20 发布于上海
举报
版权申诉

基于粗集理论值约简的数据挖掘系统-计算机应用技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘摘要数据挖强是当雷知识发瑰赣域串的一令辫究热点，本论文的主善是研究如何通过基于粗集的值约简实现数据挖掘。值约简事实上是农求得属槛筒式秘基础上，赞对每条规剐，将挽盼尽可能的泛化，使每条规雯《更趋简练，也更具有代表性，更重要的是，它通过离散化对全体数据进行约简，使嫠个数椐量降低，从而提高了挖掘的效率，降低了时间复杂度。文申给出了基于粗集的数据归约、概念层次的趣动生成、识别矩阵求简式的方法。在理论王馋畿基础上，我们设诗莠实现了一拿基于趣袋戆数据约麓的原型系统。该原型系统分为数据预处理、数据约简、规则生成和决策算法褥大纽戍部分。该原整系统基本上实现了上述各秘方法，用于验证方法的有效性及测试算法的效率。关键词：数据挖掘粗集数据约简 AB AB STRACT Data mining is currently a hot research topic of the knowledge discovery Domain．This paper mainly studies the way from data reduction Based on Rough Sets to data mining Value reduction which generalizes every rule makes all rules more concise．The most important is it deduces the number of data，Then it improves the efficiency of data mining and deduces the complex of time．This paper gives method of data reduction Based on Roughsets．Implementation of concept Hierarchy and a method for computing reduction using indiscernible matrix．． Based on these theoretical work，we design and implement a prototype KDD system which is divided into four sections：preprocessing section，data reduction section，rule induction and decision algorithm section．This prototype system implements above methods and can test validity and efficiencyofalgorithm． Key words：Data Mini ng Rough Sets data reduction 第一章序言§1．1研究的目的和意义第一章序言 §1．1研究的目的和意义面对信息社会中数据和数据库的爆炸式增长，人类分析数据和从中提取有用信息的能力远远不能满足实际需要。虽然数据库管理系统 (DBMS)可以高效实现数据录入、检索和维护等管理功能，但不能发现数据中的关联和规则，也不能根据现有的数据预测未来的发展趋势。例如，在超级市场通过条形码扫描，把每一笔商品交易输入数据库，一个中型超市经营的商品就有数万种，每天的交易量上万笔。一个月的数据量有几个G。如此大量的数据在传统的数据库中并不能很好地回答经理关心的问题：商品在不同季节或一天的不同时间的销售量有何变化规律?商品A的销售量的增加是否会同时带动商品B的销售?如何调整商品的资金占用，以达到最佳的资源配置?各种商品的销售之间是否存在一定的关联? 因此，迫切需要一种能够智能地自动地把数据转换成有用信息和知识的技术和工具。需求是发展之母，数据库管理系统和人工智能中机器学习两种技术的发展和结合，促成了在数据库中知识发现(KDD)这一新技术的诞生。 §1．2国内外研究现状 1 989年8月，在美国底特律召开的第1l届国际人工智能联合会议的专题讨论会上首次提出KDD。它是一门交叉}生学科，涉及机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等领域，内涵极为广泛，理论和技术难度很大，从而使针对大型数据库的KDD技术一时还难以满足应用需要。于是，1 995年的(美) 计算机学会(ACM)会议提出了数据挖掘(data mining)””概念，它形象地把大型数据库看成是存放有价值信息的矿藏，通过有效的知识发现技术，从中挖掘或开采出有用的信息。地把大型数据库看成是存放有价值信息的