基于粗糙集理论的数据挖掘方法研究-计算数学专业论文.docxVIP

下载本文档

4
0
约4.68万字
约 58页
2019-02-22 发布于上海
举报
版权申诉

基于粗糙集理论的数据挖掘方法研究-计算数学专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘摘要本文遥过在褪糙集懿倍惠表示翁蘩醚上，由鼗糙集蕊代数表示窝信息表示瓣～致性，旋出了一种基于信息量的糯糙集属性约简算法，该冀法的基本愚想蹙通过属性塑髅性的发量求出粗糙集的核，然后在核的基础上，继矮依据属性重疆性魏度量，隧约篱鹁信息鳖裙愿莛性焱舍懿蕊惫量棚等这一准刘柬逐芎j二鬓牲约麓，算法篱荦，效率离。通过研究传统数据挖掘方法的知识评估标准缀小支持度葶口娥小嚣信艘，发现有些知识可能被忽略，提出新增的知识评估标准——支持度最小膨胀艘和支持度楚，{、颈{ll{|臻，稳溪这舔令王l}麴魏知识译估标灌，练合爨毒支蒋凌窝最小置信发柩准，对数据库述行分部挖掘，可以褥出更加深屡次的有趣的知识。并举例浇磷了这一对新增标准的可行性。传绞数键笼攘方法一般是以寥务数据露惫直接静挖掇对象，这裁遮藏了必矮在挖掘过穗中对于宠大的事务鼗舔瘁送行多次翁扫箍来提取甄鼋鞋，效率比较低。数据挖掇怒为了完成知濒挖掘这任务，知识是～耪频繁出现黝属性焚合，它实际上是一种频繁出现的属性的关联。在此基础上，本文提出了～种伴随2．频繁集赘鼗摇存豫缝穆，挥隽事务数据瘁鹣醛jii；。存入嚣孛靛是事务数据库中频繁出瑗 (超过一种比最小支持艘小的支持艘滚僮的一静度鲞标准)2元关系酶集合。将数据挖掘建立在伴随2“频繁集数据的基础上，悬 H军十很好的想法。由于伴随2．频繁集数糍库本痨是一罩串超出一个确定润篷的2．元璃毪集会，这群，攫多对予挖菰无蔫豹数据将不菠考懋，两显它本隽是对事务数獾抟一种泛纯，数羹乡。以伴随2一频繁蕊数据库干挈为数据挖掘瞧对象，可阻避免对于事务数搅库的频繁扫描，很大程度上提高了挖掘的效率。本文聚螽～帮分缀会以上三个方疆：疆馋夔2．频繁集为数攒挖撼对象，别矮基予信息爨瓣糯麓集凰注约篱算法，懿鼹标准加上新增翡知识评估标准速行知识挖掘。这种数据挖掘方法和结构，饿得算法简单，挖掘效率商，挖掘的知识中除了传统的数提挖掘方法中珂}丑褥到的那部分之外，包含蓑一些更加有趣的信息。霆蓝吴煮缀嵩弱实际瘟鼷徐篷。除此之外，本文还提出了一种黼散的关联规则的挖掘算法。关键词数据挖掘；最小支持度；鬣小置信度；粮糙集；信息鬟；属性的重甏矬：伴随2。频繁黧：最小澎涨度；最小预测馕 AbstractBased Abstract Based on the coherence of information express and algebraic express ofRough set，this paper presents a kind of attribute reduction algorithm with rough set based on information quantlty．7the main idea of this algorithm is to find the Core of attribute set according to the importance of attributes，then to reduce attributes according to the measurement of the importance of attributes， and the information quantity of reduction must be equal to origin attribute set．This algorithm is very easy,and can attain high efficiency． Under the evaluation standards(minimum support and minimum confidence)of traditional DM methods，some knowledge will be ignored．This thesis presents a set of new knowledge evaluation standards(minimum expandability and minimum forecast)．By using this pair of appended evaluation standards，minimum support and minimum confidence，to mine the database part after part,we can get more interesting knowledge in deep layer． Traditional DM methods，generally,use database directly,and scan the database many