- 1、本文档共82页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华东师范大学硕士学位论文 摘要
摘要
图作为一种描述事物与事物之间关系的数据结构,常常被用来表征复杂的数据
关系。基于图结构的节点分类任务在社交、政治和生物工程等等多个领域均有应用。
在实际应用中,为了充分利用未标注数据以及保持图型结构数据的完整性,图的节
点分类任务通常采用半监督分类的形式。然而,由于受到数据采样偏差和其他客观
原因的影响,标注数据在类别之间的分布往往是不平衡的。
目前已有的图的半监督分类方法在不平衡数据集上的适应性比较差。大多数图
神经网络方法完全未考虑类别不平衡的问题,在聚合特征信息的过程中没有区分多
数类和少数类标注数据的重要性,易使得属于少数类的样本更可能被误分类为多数
类。另外,一些深度图神经网络方法在信息聚合的过程中存在不同类别的节点特征
趋同的问题,导致分类效果下降。针对图神经网络方法在聚合特征信息过程中不区
分多数类和少数类的问题,本文提出了聚合尺度自适应的图神经网络方法ASAGNN,
该方法根据节点与标注节点在图结构上的相对位置为不同的节点设计不同的聚合尺
度,使得属于少数类的标注样本的特征信息有更多的机会被其较远的邻域节点使用,
从而降低少数类被误分为多数类的可能。针对一些深度的图神经网络方法引起的特
征不可区分的问题,本文提出了ClusteringGCN 方法,该方法根据节点的原始特征
对原始图进行聚类,并对子图和原始图分别应用GCN 模型的图卷积层。
ClusteringGCN 方法增强了节点的原始特征在分类过程的作用,保证聚合特征后的
节点特征的可区分性,达到减缓过度平滑的目的。
此外,本文尝试将常用的处理不平衡数据集的方法应用到不平衡图的半监督分
类问题中。本文提出了图过采样方法,该方法为少数类生成新的样本点来优化图的
结构,并利用代价敏感技术来改进图的半监督分类模型。
Cora Citeseer Pubmed
为了验证上述方法的有效性,本文在 、 和 基准数据集上进
行实验。实验结果表明ASAGNN 方法和ClusteringGCN 方法优于多种常用的方法;
图过采样和代价敏感技术的应用可以有效提高半监督分类模型在不平衡图上的性能;
I
华东师范大学硕士学位论文 摘要
尤其结合代价敏感技术的ASAGNN方法在大多数数据集上的表现都优于其他方法。
关键词:半监督分类;不平衡分类;图神经网络;图表示学习;深度学习
II
华东师范大学硕士学位论文 ABSTRACT
ABSTRACT
Graph, a data structure, which describes the relationship between things, is often
used to represent complex data relationships. The node classification tasks based on
graph structure are applied in many fields such as social, political, and biological
engineering. In practical applications, in order to make full use of unlabeled data and
maintain the integrity of graph structure, the node classification task of graphs usually
takes the form of semi-supervised classification. Howe
您可能关注的文档
- Ⅱ-Ⅵ族半导体单晶电子自旋动力学.pdf
- ADHD与ASD儿童执行功能及心理理论的比较和分型.pdf
- AEPS-3社会沟通领域中文版的修订与应用研究.pdf
- Broad域上某类弱拟对称映射的性质.pdf
- Cartan型李代数S(n)B-子代数的分类和维数.pdf
- FDI技术溢出、吸收能力对制造业产出的影响.pdf
- Fujino完备光滑环簇猜想的一个反例.pdf
- K12教师机器人教育接受度模型建构与实证研究——以江西省为例.pdf
- MPaxos_适用于大规模部署与变化负载的低延迟高吞吐的一致性协议的设计与实现.pdf
- PZT基铁电薄膜晶体管的制备与性能研究.pdf
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)