不平衡图的半监督分类研究.pdf

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华东师范大学硕士学位论文 摘要 摘要 图作为一种描述事物与事物之间关系的数据结构,常常被用来表征复杂的数据 关系。基于图结构的节点分类任务在社交、政治和生物工程等等多个领域均有应用。 在实际应用中,为了充分利用未标注数据以及保持图型结构数据的完整性,图的节 点分类任务通常采用半监督分类的形式。然而,由于受到数据采样偏差和其他客观 原因的影响,标注数据在类别之间的分布往往是不平衡的。 目前已有的图的半监督分类方法在不平衡数据集上的适应性比较差。大多数图 神经网络方法完全未考虑类别不平衡的问题,在聚合特征信息的过程中没有区分多 数类和少数类标注数据的重要性,易使得属于少数类的样本更可能被误分类为多数 类。另外,一些深度图神经网络方法在信息聚合的过程中存在不同类别的节点特征 趋同的问题,导致分类效果下降。针对图神经网络方法在聚合特征信息过程中不区 分多数类和少数类的问题,本文提出了聚合尺度自适应的图神经网络方法ASAGNN, 该方法根据节点与标注节点在图结构上的相对位置为不同的节点设计不同的聚合尺 度,使得属于少数类的标注样本的特征信息有更多的机会被其较远的邻域节点使用, 从而降低少数类被误分为多数类的可能。针对一些深度的图神经网络方法引起的特 征不可区分的问题,本文提出了ClusteringGCN 方法,该方法根据节点的原始特征 对原始图进行聚类,并对子图和原始图分别应用GCN 模型的图卷积层。 ClusteringGCN 方法增强了节点的原始特征在分类过程的作用,保证聚合特征后的 节点特征的可区分性,达到减缓过度平滑的目的。 此外,本文尝试将常用的处理不平衡数据集的方法应用到不平衡图的半监督分 类问题中。本文提出了图过采样方法,该方法为少数类生成新的样本点来优化图的 结构,并利用代价敏感技术来改进图的半监督分类模型。 Cora Citeseer Pubmed 为了验证上述方法的有效性,本文在 、 和 基准数据集上进 行实验。实验结果表明ASAGNN 方法和ClusteringGCN 方法优于多种常用的方法; 图过采样和代价敏感技术的应用可以有效提高半监督分类模型在不平衡图上的性能; I 华东师范大学硕士学位论文 摘要 尤其结合代价敏感技术的ASAGNN方法在大多数数据集上的表现都优于其他方法。 关键词:半监督分类;不平衡分类;图神经网络;图表示学习;深度学习 II 华东师范大学硕士学位论文 ABSTRACT ABSTRACT Graph, a data structure, which describes the relationship between things, is often used to represent complex data relationships. The node classification tasks based on graph structure are applied in many fields such as social, political, and biological engineering. In practical applications, in order to make full use of unlabeled data and maintain the integrity of graph structure, the node classification task of graphs usually takes the form of semi-supervised classification. Howe

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档