最大相关和最大差异的高维数据特征选择算法.pdfVIP

最大相关和最大差异的高维数据特征选择算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

JournalofComputerApplicationsISSN1001⁃90812024⁃03⁃10

计算机应用,2024,44(3):767-771CODENJYIIDUhttp://www.joca.cn

文章编号:1001-9081(2024)03-0767-05DOI:10.11772/j.issn.1001-9081.2023030365

最大相关和最大差异的高维数据特征选择算法

*

孟圣洁,于万钧,陈颖

(上海应用技术大学计算机科学与信息工程学院,上海201418)

(∗通信作者电子邮箱1171920149@qq.com)

摘要:针对高维数据存在冗余信息且维度过高的问题,提出基于信息量的最大相关最大差异特征选择算法

(MCD)。首先,利用互信息(MI)度量特征和标签之间的相关性,对特征进行排序,选择互信息最大的特征加入特征子

集;然后,引入信息距离度量特征之间的信息冗余性及差异性,设计评价准则对每个特征进行评价,使特征子集中特

征和标签的相关性、特征之间的差异性最大;最后,用前向搜索策略结合评价准则进行属性约简,最优化特征子集。

采用2种不同的分类器,在6个数据集上和mRMR(minimal-Redundancy-Maximal-Relevancecriterion)、RReliefF等5个

经典算法进行对比实验,利用分类精度验证MCD的有效性。在支持向量机(SVM)分类器下,平均分类精度提高了

5.67~23.80个百分点;在K-近邻(KNN)分类器下,平均分类精度提高了2.69~25.18个百分点。可见,MCD在绝大多

数情况下,能有效去除冗余特征,分类精度有明显提高。

关键词:特征选择;高维数据;特征冗余;相关性;分类准确率;降维

中图分类号:TP181文献标志码:A

Featureselectionalgorithmforhigh-dimensionaldatawith

maximumcorrelationandmaximumdifference

*

MENGShengjie,YUWanjun,CHENYing

(SchoolofComputerScienceInformationEngineering,ShanghaiInstituteofTechnology,Shanghai201418,China)

Abstract:Aimingattheproblemsofredundantinformationandtoohighdimensioninhigh-dimensionaldata,a

MaximumCorrelationmaximumDifferencefeatureselectionalgorithm(MCD)basedonthemaximumcorrelationof

informatio

文档评论(0)

教师资格证、公共营养师持证人

本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。

领域认证该用户于2024年07月07日上传了教师资格证、公共营养师

1亿VIP精品文档

相关文档