- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
摘要
属性约简作为经典的维度约简方法,旨在通过去除冗余和无关的属性,缩小数据
规模,提升后续分类任务的性能。元启发式算法以其全局搜索能力在属性约简领域受
到了广泛关注。尽管元启发式算法存在显著优势,但其约简结果却深受初始种群质量
的影响。如果初始种群设置不当,不仅会导致约简结果的稳定性降低,还会进一步影
响后续分类任务的稳定性和准确性。因此,提升初始种群的质量对于优化约简结果,
提升后续分类任务的性能具有重要意义。
围绕如何改进初始种群的生成策略,提升初始种群的质量,本文进行了较为深入
的研究。通过归纳总结现有种群初始化方法所存在的不足,提出了一种改进后的元启
发式属性约简算法框架。该框架引入了一种类别相关度量——局部约束分数,以此作
为指导,优化种群的初始化过程。通过这一方法,有望生成高质量的初始种群,提升
约简结果的稳定性,并优化后续分类任务的性能。此外,本文还在医学领域对该框架
进行了验证,确保其在实际应用中的有效性。具体而言,本文的研究内容和成果主要
包括以下两点:
一、提出一种局部约束分数引导的元启发式属性约简框架。
本研究从局部视角出发,提出了一种类别相关度量——局部约束分数,用于揭示
特定标签上属性的类别区分能力,并引入到元启发式属性约简算法中。首先,通过计
算每个标签下属性的局部约束分数,生成局部约束矩阵,对矩阵中对应标签下属性的
局部约束分数进行排序,可以快速识别出具有更好类别区分能力的属性。接着,将识
别出的属性作为初始种群的基础,同时结合随机策略填充种群的剩余位置。最终,将
得到的结果作为元启发式属性约简算法的初始种群,通过迭代优化逐步寻找最优或近
似最优的属性子集。在20组UCI数据集上进行对比实验的结果表明:相较于原始的
元启发式属性约简算法,局部约束分数引导的元启发式属性约简算法在约简结果的稳
定性方面取得了显著提升。同时后续分类任务的性能也取得大幅提升,平均分类稳定
性和分类准确率的提升在5%左右。
二、在医学领域中进一步验证局部约束分数引导的元启发式属性约简框架的有效
性。
本研究以糖尿病风险数据集为起点,验证了局部约束分数引导的元启发式属性约
简算法在医学领域的有效性。为确保数据集的完整性和准确性,采用缺失值与异常值
处理、特征工程和min-max归一化处理等多种数据预处理手段,为后续的数据分析提
供支撑。在最终形成的糖尿病数据集上,选取了约简结果稳定性、分类准确率及分类
I
江苏科技大学电子信息硕士学位论文
稳定性作为指标,用于全面评估局部约束分数引导的元启发式属性约简算法与三种优
化后的元启发式属性约简算法(COGA,IPSO,MTLBO)的性能表现。实验结果表明:
在约简结果稳定性、分类准确性和稳定性的比较中,取得最优性能的都是建立在局部
约束分数引导框架上的元启发式算法。
关键词属性约简;类别相关度量;元启发式算法;粗糙集
II
目录
目录
摘要1
AbstractIII
目录V
ContentsVII
第1章绪论1
1.1研究背景与意义1
1.2国内外研究现状2
1.2.1粗糙集理论研究现状2
1.2.2属性约简研究现状3
1.2.3元启发式算法研究现状4
1.3论文组织结构5
第2章相关基础理论7
2.1经典粗糙集7
2.2邻域粗糙集7
2.3不确定性度量8
2.4类别相关度量9
2.5属性约简10
2.6本章小结10
第3章元启发式算法在属性约简中的应用11
3.1元启发式算法在属性约简中的应用11
3.2遗传算法12
3.3森林优化算法
文档评论(0)