基于自适应超图的无监督特征选择方法研究.pdf

下载文档

0
0
约8.23万字
约 59页
2024-01-19 发布于江苏
举报
版权申诉
保障服务

基于自适应超图的无监督特征选择方法研究.pdf

1、本文档共59页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

摘要

随着信息技术的快速发展，人们可获取数据的规模越来越大，数据维度

也越来越高。数据的高维度特征会导致“维数灾难”，同时会降低下游任务

的性能。此外，获取大量数据的标签在实际中往往需要大量的成本。因此，

如何对高维无标签数据进行特征选择，降低数据维度以高后续任务的性能

已经成为大数据挖掘的一个重要问题。

为了解决上述问题，本文出了基于自适应超图的无监督特征选择方法。

首先，根据不同的核函数方法，本文构建了多个超图来刻画特征间不同的高

阶相关关系。其次，考虑到不同超图之间存在潜在的一致性，本文使用多个

超图学习一个共同超图。此外，为了保留数据的全局信息，高特征的判别

力，本文对特征权重矩阵进行了正交约束。最后，本文将特征学习和自适应

超图学习统一到一个框架中，相互促进，从而有利于选出最优特征子集。

为了验证本文所方法的有效性，将该方法在7个公开数据集上和相关

的特征选择方法进行比较。实验结果表明，本文出的方法在两个评价指标

上具有较优的性能。此外，本文也在一个实际信用数据集上验证了本文方法

的有效性。

关键词：无监督特征选择；自适应超图学习；一致性信息

1绪论1

1.1研究背景1

1.2研究意义3

1.3本文研究内容和组织结构3

1.4本章小结5

2国内外研究综述6

2.1特征选择概述6

2.2基于简单图学习的无监督特征选择16

2.3基于超图学习的无监督特征选择19

2.4基于特征选择的经济学案例分析21

2.5本章小结22

3基于自适应超图的无监督特征选择方法研究23

3.1引言23

3.2自适应超图的无监督特征选择24

3.3模型优化28

3.4实验方案及分析32

3.5本章小结41

4面向信用数据特征选择的实证研究42

4.1引言42

4.2信用数据介绍44

4.3实验设计45

4.4实验结果分析46

4.5本章小结47

5本文总结与展望48

5.1本文总结48

基于自适应超图的无监督特征选择方法研究

5.2研究展望49

参考文献50

致谢57

1绪论

1.1研究背景

近些年，随着网络信息技术和多媒体的发展，各行各业的数据都呈现指

数级增长的状态，因此产生了海量的高维数据。各种各样高维数据集的出现

可以使我们更加清晰地了解事物的表象，但高维数据中往往存在大量的冗余

数据和无关数据，为数据集增添了很多没有意义的特征，这会降低机器学习

和信贷风险评估算法的效果，若想从高维数据中获取有用的信息，则需要通

[1]

过降维方法从高维数据中获取有用的特征。因此特征选择方法成为了很多统

计学和机器学习领域的研究者研究的焦点问题之一。从高维数据中挖掘有意

义的特征，称为数据挖掘，它可以从原始的数据集中取出数据内部隐含的，

并对经济社会的生产和人们生活有价值的信息，并且借助计算机技术寻找数

据中蕴含的规律。数据挖掘在模式识别，图像处理和信贷风险等领域有着广

您可能关注的文档

文档评论（0）

136****6583 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：7043055023000005

1亿VIP精品文档

更多 >

基于自适应超图的无监督特征选择方法研究.pdf