基于粗糙集理论的关联知识发现-计算机软件与理论专业论文.docxVIP

基于粗糙集理论的关联知识发现-计算机软件与理论专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
y775488 y 775488 论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行研究工 作所取得的研究成果。尽我所知,除文中已经标明引甩的内容外,本 论文不包含任何其他个人或集体已经发表或撰写过的研究成果;所涉 他人的所有研究成果,均已在文中以明确方式标明。本人完全意识至Ⅱ 本声明的法律结果由本人承担。 学位论文作者签名:王夫b 2005年6月1日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅。本人授权云南师范大学可以将本学位论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或扫描等复制手段保存和汇编本学位论文。 学位论文作者签名:王芡太 指导老师签名:想乡哪 2005年6月1日 致谢论文的开题、写作和修改都得到了导师夏幼明教授的悉心指导, 致谢 论文的开题、写作和修改都得到了导师夏幼明教授的悉心指导, 夏老师在学习和生活上都给予了我极大的启迪和帮助。他独特的知识 结构,严谨的治学态度,踏实的工作作风 都将令我终生难忘。在 这三年的求学期间,还得到了林毓槠教授、杨秀国教授和冯乔生副教 授等的谆谆教诲和亲切鼓励。我谨向三年来费心培养我的老师们致以 最诚挚的的谢意。过去的已凝固为历史,受业的画面将永远铭刻在记 忆中!并化为无尽的动力,促使我不停向前。 也向我的同窗和朋友们表达最衷心的感谢,人生路上有了你们是 如此多姿多彩! 历经漫长和反复的锤炼,如今拙文终于也不得不恭呈于诸位面 前,心中却有一种失落,甚至说是羞愧难当。浅薄鄙陋之处可能会很 多,甚至可能会是一塌糊涂,还望诸位多多包涵,不吝热心赐教。 撰写本论文的过程中,本人参考了前辈和时贤的不少论著,受到 了很多启发,在此一并表示感谢。 最后,向培育我的母校一云南师范大学致以最崇高的敬意,祝愿 她的明天更加绚丽多彩。 王天志 2005年5月予昆明 摘 摘 要 粗糙集理论是一种新的处理模糊和不确定性知识的数学工具。其主要思想是在保持分类 能力不变的前提下,通过知识约简,导出问题的决策或分类规则。它与其他处理不确定性问 题理论的最显著的区别是它无需提供问题所需处理的数据以外的任何先验信息。粗糙集理论 认为知识就是人类和其他物种所固有的分类能力,粗糙集的一大优势就是其极强的分类能力 [史忠植,2002]。传统的关联规则挖掘算法没有对数据集进行属性的约倚,这将导致挖掘出 的关联规则可能存在大量的冗余,不利于决策者的结果分析和决策。而且传统关联规则挖掘 算法仅适用于布尔型(定性)的关联规则的挖掘,不能直接进行定量的规则挖掘。 有鉴于粗糙集的这些优势,粗糙集理论便被运用于关联规则的挖掘中。将粗糙集理论运 用于关联规则的挖掘大致经历以下过程:预处理一一将连续属性离散化,处理矛盾信息等, 属性约简一一包括两个过程,属性集的约简和属性值的约简,规则提取一一关联挖掘。 论文主要工作: (1)对知识表达理论应用于粗糙集理论进行了研究,引用了知识量、平均知识量、熵和 联合熵等概念,并将联合熵,即条件属性集和决策属性集的联合表达的平均知识量,应用于 粗糙集的连续属性离散和属性约简中,作为处理的判别标准; (2)对连续属性离散化的一种方法“增类减类算法”进行了改进,提出了连续属性联台 熵离散化算法。增类减类算法经历了两个过程:先将每个属性分为两类.此时判断新的属性 集的支持度——是否满足与原属性集的支持度相等的条件,若楣等,停止增类过程;若不等, 则继续对下一个属性进行增类过程,直到满足条件。然后进行减类过程,依次对每个属性的 分类数减少一个,判断新的支持度是否满足同样的条件,若满足则继续对下一个属性进行减 类,若不满足,则停止减类过程,该属性的分类数即为此次减类前的分类数。而连续属性联 台熵离散化算法根据支持度和属性离散的性质,只进行了一个减类过程,以初始时等价类作 为初始分类.然后对各个属性按分级聚类法减少一个该属性等价数的分类,看是否满足条件 属性对决策属性的联合熵相等的条件,若满足则对下一个属性进行同样的减类处理,直到支 持度下降为止。 (3)为求属性集的等价类引入了等价类的二进制表示,属性集的等价类可以通过各个属 性等价类的二进制表示的与运算来求解,通过属性及属性集的二进制表示还可以求解关联规 则的支持度、兴趣度和准确度。在规则的发现中结合了支持度、兴趣度和准确度作为关联规 则过滤的阈值。 (4)给出了决策属性等价类算法来求解决策表的属性等价类;给出了二进制支持度算法 来为求解关联规则的支持度,丽*趣度和准确度都可以通过支持度来计算;为求解有效关联 规则给出了有效关联规则算法。 关键词离散化等价类属性约简联合熵二进制表示兴趣度准确度 第

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档