基于自适应超图的无监督特征选择方法研究.pdf

基于自适应超图的无监督特征选择方法研究.pdf

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

摘要

随着信息技术的快速发展,人们可获取数据的规模越来越大,数据维度

也越来越高。数据的高维度特征会导致“维数灾难”,同时会降低下游任务

的性能。此外,获取大量数据的标签在实际中往往需要大量的成本。因此,

如何对高维无标签数据进行特征选择,降低数据维度以高后续任务的性能

已经成为大数据挖掘的一个重要问题。

为了解决上述问题,本文出了基于自适应超图的无监督特征选择方法。

首先,根据不同的核函数方法,本文构建了多个超图来刻画特征间不同的高

阶相关关系。其次,考虑到不同超图之间存在潜在的一致性,本文使用多个

超图学习一个共同超图。此外,为了保留数据的全局信息,高特征的判别

力,本文对特征权重矩阵进行了正交约束。最后,本文将特征学习和自适应

超图学习统一到一个框架中,相互促进,从而有利于选出最优特征子集。

为了验证本文所方法的有效性,将该方法在7个公开数据集上和相关

的特征选择方法进行比较。实验结果表明,本文出的方法在两个评价指标

上具有较优的性能。此外,本文也在一个实际信用数据集上验证了本文方法

的有效性。

关键词:无监督特征选择;自适应超图学习;一致性信息

1

目录

目录

1绪论1

1.1研究背景1

1.2研究意义3

1.3本文研究内容和组织结构3

1.4本章小结5

2国内外研究综述6

2.1特征选择概述6

2.2基于简单图学习的无监督特征选择16

2.3基于超图学习的无监督特征选择19

2.4基于特征选择的经济学案例分析21

2.5本章小结22

3基于自适应超图的无监督特征选择方法研究23

3.1引言23

3.2自适应超图的无监督特征选择24

3.3模型优化28

3.4实验方案及分析32

3.5本章小结41

4面向信用数据特征选择的实证研究42

4.1引言42

4.2信用数据介绍44

4.3实验设计45

4.4实验结果分析46

4.5本章小结47

5本文总结与展望48

5.1本文总结48

1

基于自适应超图的无监督特征选择方法研究

5.2研究展望49

参考文献50

致谢57

2

1绪论

1绪论

1.1研究背景

近些年,随着网络信息技术和多媒体的发展,各行各业的数据都呈现指

数级增长的状态,因此产生了海量的高维数据。各种各样高维数据集的出现

可以使我们更加清晰地了解事物的表象,但高维数据中往往存在大量的冗余

数据和无关数据,为数据集增添了很多没有意义的特征,这会降低机器学习

和信贷风险评估算法的效果,若想从高维数据中获取有用的信息,则需要通

[1]

过降维方法从高维数据中获取有用的特征。因此特征选择方法成为了很多统

计学和机器学习领域的研究者研究的焦点问题之一。从高维数据中挖掘有意

义的特征,称为数据挖掘,它可以从原始的数据集中取出数据内部隐含的,

并对经济社会的生产和人们生活有价值的信息,并且借助计算机技术寻找数

据中蕴含的规律。数据挖掘在模式识别,图像处理和信贷风险等领域有着广

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档