- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
海量数据与知识贫乏导致了数据挖掘技术的出现,它的主要目标是采用自动
的、智能化的新技术来分析海量数据,以获得有效的、隐含的、以前未知的、有
潜在使用价值的有用信息。它是当今众多学科领域特别是数据库领域最前沿的研
究课题之一。粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主
要思想是在保持分类能力不变的情况下,通过知识约简,导出问题的决策或者分
类规则。计算智能技术以神经网络、模糊逻辑以及进化计算等为核心,模仿人类
的思维方式及演化规律,已经在工业控制、模式识别等领域得到了广泛的应用。
目前,在数据挖掘领域粗糙集和计算智能方法相结合还主要用于数据预处理阶
段,基于他们的分类、聚类和关联规则挖掘算法还很少。
本文介绍了数据挖掘、粗糙集理论和计算智能理论的基本概念以及应用,分
析了粗糙集理论和计算智能理论在数据挖掘方面的应用以及它们之间的互补性。
针对粗糙集在处理符号属性方面的优势,设计了一种新的聚类算法,将基于共享
机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义
遗传算法的适应度函数,实验表明该算法在面向符号属性进行聚类时具有较高的
聚类准确率。此外,提出了一种新型分类算法,将粗糙集与组织协同进化分类算
法相结合,利用支持子集的思想来决定组织的适应度,利用支持子集得到的启发
信息来加快进化速度,增强种群之间的相互协同,实验表明,当数据集中的属性
全部为符号属性时,该算法具有较高的分类准确率并且时间代价较小。
关键词:粗糙集;数据挖掘;计算智能;遗传算法;组织协同进化;分类;聚类
ABSTRACT
Massivedataand of ledtothe ofdata
knowledge appearancemining
lacking
to unknownand
whichmain is obtain
technology goal effective,implied,previous
in forefrontofresearchof
valuable data is the topics
information.Todaymining
databasefields.Theset isausefultooltodeal、析tll and
roughtheory vagueness
rule reduction
caninducedecisionorclassification
uncertainty.It throughknowledge
whilethe wasnotdecreased.The of
classifyability technologycomputational
neural and
whichincludes networks,fuzzylogic evolutionary
intelligence
imitatehumanof andevolutionandhasbeen used
computation waythinking widely
of
inthe
文档评论(0)