异构信息网络中节点相似性搜索并行算法研究.pdfVIP

异构信息网络中节点相似性搜索并行算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第37卷第3期浙江万里学院学报Vo1.37No.3

2024年5月JournalofZhejiangWanliUniversityMay2024

异构信息网络中节点相似性搜索并行算法研究

徐小玉,陈仲委

(浙江万里学院,浙江宁波315100)

摘要:传统的基于串行计算的节点相似性搜索算法,在处理增量式异构信息网络数据流时面临效率低下、资源

消耗过大等问题。为此,文章利用同构信息网络中并行约简的基本原理与基本方法,定义了异构信息网络的并行

约简度量方法:值相似依赖度和余弦实体相似依赖度,提出异构数据流中元路径下节点相似性搜索并行算法(F-

PathSim),F-PathSim可以并行约简、并行计算,整体上删除对节点相似性搜索允余的数据,减少对整个数据集的重

复处理。在DBLP数据集上进行大量的实验,实验结果表明F-PathSim能较好的适应异构信息网络中增量式数据

流中节点相似性搜索要求。

关键词:异构信息网络;同构信息网络;并行约简;元路径;增量式数据流;相似依赖度

中图分类号:TP18文献标识码:A文章编号:1671-2250(2024)03-0082-09

0引言

异构信息网络[1,2是把顶点与类型标签相连的数据图,用于刻画不同类型对象间的复杂限制语义,可

以用不同类型的实体、实体间联系表达出多元化、互动性高的信息。异构信息网络节点间的相似性搜索是

推荐系统、信息检索和连接关系预测等研究的理论基础[3-5]。近年来对节点相似性搜索算法的改进及应用

研究越来越受到重视,如赵泽亚、贾岩涛等人将网络中边上的时间信息融人结构路径中,实现了时序关系

预测陈湘涛、丁平尖等人提出了基于建立时间的不同,计算其时间差异度,针对给定的元路径,获得异

构信息网中动态相似性的度量口,吴钦臣提出了一种新的组合元路径挖掘算法,可用于元路径约束下的节

点间相似性度量8;文献[9-11扩展了动态异构信息网络相似性搜索的应用领域。

尽管传统相似性搜索算法也在不断改进,但随着异构网络数据量几何级的增长,基于串行计算的相

似性搜索传统算法效率低下、资源消耗过大等问题日益突出。由于同构信息网络的并行约简在处理海量

数据具有很好的效率[12-14],在特征选择、不确定分析、概念漂移探测等有较好的应用[15-22]。因此,本文以同构

信息网络的并行约简为基础,对异构信息网络数据集进行子集簇的划分和穴余数据删减的处理,提出新

的异构信息网络并行约简方法,从而降低异构信息网络中节点相似性搜索算法的时间和空间复杂度,提

高计算效率。

1异构信息网络中节点相似性搜索并行算法的理论基础

1.1异构信息网络

本节对异构信息网络的信息网络、网络模式、元路径、PathSim等相关概念进行介绍。

定义1l信息网络(InformationNetwork)是一个带有对象类型映射函数β:V→A和链接类型映射Φ:

E→R函数的有向图G(V,E),其中,任意EV是一个不同的类型,记为β(v)A,每个链接eEE一个特

收稿日期:2024-01-23

基金项目:浙江省社会科学界联合会研究课题成果“共同富裕视域下社区精准志愿服务体系的研究与实现”(2023N075)

作者简介:徐小玉(1990一),女,河南准滨人,浙江万里学院文献与信息中心工程师,研究方向:人工智能。

·82·

徐小玉,陈仲委:异构信息网络中节点相似性搜索并行算法研究第3期

定关系类型Φ(e)→R,当IAI1或IRI1时,称该网络为异构信息网络(HeterogeneousInformationNetwork,

HIN),否则称为同构信息网络。

定义2网络模式是带有对象类型映射:V-A、链接映射Φ:E→R的异构信息网络G(V,E)(G是

定义在对象类型A和关系类型集合R上的有向图)的元模板,记为TG(A,R)为网络模式(NetworkSchema)。

文献信息网络是常见的异构信息网络,其网络模式如图1所示。

作者

文档评论(0)

你就是我的小鱼鱼 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年10月18日上传了教师资格证

1亿VIP精品文档

相关文档