- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
图模型被广泛应用于表示实体之间的关系,并衍生了大量实际应用。随着
信息技术的高速发展,人们正在众多领域中采集越来越大且越来越多的图数据。
在计算机科学、生物学、社会科学和脑科学等领域,理解网络是极为重要的。然
而,由于网络的庞大规模,大多数网络分析算法已经不能正常工作。另一方面,
内聚子图挖掘算法既能揭示图的关键性质,又能有效地在海量图上进行计算。
kcore 模型是稠密子图挖掘领域中研究最多的模型。kcore 的模式和它的层
次分解被广泛应用于许多领域,例如社会学,万维网和生物学。相关研究的算法
通常需要一个输入参数k ,但却没有手工选取参数以外的确定方式。在本文中,
给定一张图和一个社区评分标准,需快速找到最佳的k 值令kcore set 或kcore
的评分最高。这个问题极具挑战性,因为现有各种各样的社区评分指标并且它们
在大型数据集上的计算代价高昂。通过精心设计的顶点排序技巧,本文设计了计
算最优的k 值的算法,算法具有最优的时间和空间复杂度,并且能够使用于大多
数社区评分指标。本文设计的算法也能够计算每个kcore 和每个kcore set 的评
分,并且能够帮助其他kcore 相关问题的算法设计。在10 个真实世界网络上进
行了广泛的实验,数据规模最大为数十亿条边,实验结果验证了本文设计的算法
的高效率以及输出结果的有效性。
关键词: kcore; 核分解; 社区评分指标; 社区发现; 参数选取;
i
ABSTRACT
Graphs have been widely used to represent the relationships of entities in a large
spectrum of applications. With the rapid development of information technology, peo
ple are collecting increasingly more and larger graph data in various scenarios. It is of
greatimportancetomakesenseofgraphsinfieldsincludingcomputerscience,biology,
social science, and brain science. However, most algorithms for network analysis are
no longer functional due to the huge scale of graphs. Cohesive subgraph mining algo
rithms,ontheotherhand,canbothrevealcrucialpropertiesofagraphandbecomputed
efficientlyonmassivegraphs.
The kcore model is the most wellstudied model in cohesive subgraph mining.
Themodeof kcoreanditshierarchicaldecompositionhavebeenappliedinmanyareas,
such as sociology, the world wide web, and biology. Algorithms on related studies
often need an input value of parameter k, while there is no existing solution other than
manualselection. Inthispaper,givenagraphandascoringmetric,weaimtoefficiently
find the best value of k such that the score of the kcore (or kcore set) is the highest.
The problem is challenging because there are various community scoring metrics and
the computatio
原创力文档


文档评论(0)