- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于灰关联分析的连续值属性约减算法.doc
基于灰关联分析的连续值属性约减算法
摘 要:
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。
关键词:属性约减;灰关联分析;重叠度;连续值属性
中图分类号: TP301.4
文献标志码:A
Continuous-valued attributes reduction algorithm based on gray correlation
Abstract:
Since most current attributes reduction algorithm can be only used for discrete decision tables, the correlation degree between condition attributes and decision attributes was defined as the importance degree of attributes, and meanwhile the overlap degree was defined based on the correlation degree and importance degree among attributes. The condition attributes importance was renewed according to the overlap degree. To achieve the reduction of continuous-valued attributes set, an attributes reduction algorithm based on gray correlation analysis was proposed. The feasibility and effectiveness of the algorithm were verified in the simulation.
Key words:
attribute reduction; grey correlation analysis; overlap degree; continuous-valued attribute
0 引言
当前大多数属性约减算法是基于粗糙集的,粗糙集理论是一种用于数据挖掘和知识发现的强有力数学工具,但是粗糙集理论定义在经典的等价关系和等价类基础上,处理的是符号值或者离散值,是清晰的、非连续的数据,而对于现实应用中广泛存在的连续型属性值,如温度、湿度和网络流量等,经典粗糙集理论在进行分析处理时能力有限,表现出较大的局限性。
文献[1-2]定义了模糊粗糙集的概念,即本文中所指的连续值属性集,文中给出一种解决连续值粗糙集的方法,将属性约简问题转化为优化问题。此类方法不能直接处理连续值数据,而是通过将连续属性进行离散化处理来把粗糙集应用于连续值属性,然而离散化后的属性值与原始属性值在实数值上存在差异,导致某种程度的信息损失。在文献[3-4]中胡清华等基于度量空间邻域和邻域关系的概念提出了一种实数空间的粗糙集模型,该模型对属性样本数据进行粒化,用连续样本值在模型中的邻域关系来代替样本值的数据关系。文献[5]中提出一种基于灰色关联度的属性约简算法来消除冗余特征,但在该算法中灰关联仅仅作为属性的重要性测度,没有考虑如何评价属性之间信息重叠特性。而文献[6]中则应用灰关联分析对连续值属性间的近似性来进行分类,这样同样会出现信息损失的问题。
针对以上问题,本文在灰关联理论的基础上,分析属性的重要度和重叠度,提出一种更适合处理连续值属性约减问题的基于灰关联的连续值属性约减算法,并通过仿真实验与其他属性约减方法进行分析比较,说明本算法的合理性和高效性。
1 基本概念
1.1 属性约减
属性集的约简(Attribute Reduction)是粗糙集理论的关键问题之一。文献[7]对现有的属性约减算法进行了总结,从本质描述、算法分类、算法效率等几个方面,对决策表的冲突检测算法和属性约减算法进行了系统的分析比较。现有的属性约简算法分为三类:1)Pawlak约简算法。这种方法按照约简的定义进行求解,但是需要对条件属性集的幂集中所有元素进行考察,该算法的理论指导意义大于其实际应用效果,但其计算速度慢,且不易计算机实现,故其实
您可能关注的文档
最近下载
- 导学案:1.3位置变化快慢的描述—速度.docx VIP
- 2024监理规范知识竞赛练习试题及答案.doc VIP
- 1-3位置变化快慢的描述 速度 【解析版】(人教版2019).doc VIP
- 5.1《倍的认识》课件(共23张PPT) 人教版 三年级上册数学.pptx VIP
- 冀教版小学数学四年级下册【全册】课时练+单元测试卷(含答案).pdf VIP
- 2024威海热电集团有限公司招聘试题及答案解析.docx
- 课时1.3 位置变化快慢的描述—速度(练习)-高中物理同步(人教版2019必修第一册).docx VIP
- HG/T 20275-2017 - 化工设备工程施工及验收规范.pdf VIP
- hg20675-1990t化工企业静电接地设计规程.(完整).doc VIP
- 2025上饶市四股桥乡“回村任职大学生” 选聘考试备考题库及答案解析.docx VIP
文档评论(0)