- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于邻域信息的社区发现方法-纯粹数学与应用数学
2015 年 2 月 纯粹数学与应用数学 Feb. 2015
第 31 卷 第 1 期 Pure and Applied Mathematics Vol. 31 No. 1
基于邻域信息的社区发现方法
韩路 张海
(西北大学数学学院, 陕西 西安 710127)
摘要:考虑含有节点邻域信息的新模块度函数的社区发现方法和最优分组下标度参数
的选择问题 通过谱松弛方法求解模块度函数的最大化问题 最终利用新算法快速求
解 并通过真实网络数据验证算法能更好的发现社区
关键词:模块度函数 邻域信息 谱方法
中图分类号: 文献标识码: 文章编号:
:
前前前言言言
复杂网络作为一种数据关系的表达方法 成为目前机器学习领域的热点之一 其中 网络中
的节点表示研究问题的对象 边表示对象和对象之间的一种属性关系 在现实世界中 复杂网络
常分为以下几种类型 如技术网络 社交网络 信息网络和生物网络等 社区描述网络的结
构 它是指在一个较大的网络中 网络的结构特征通过节点位于不同组表现出来 比如组内边的
联接比较紧密 组间边的联接比较稀疏 如何有效发现网络中的社区 对于理解网络功能和结构
有着重要意义 例如 在一个学术关系网络中 节点表示作者 边表示每两位作者之间是否有合
作发表论文 此网络中的社区可能由一些研究方向相同或相近的作者组成 形成不同特征的社
区 因此 如何发现此类社区并预测网络中某一位作者所属的社区 对于研究网络的行为具有实
际意义 近年来 社区发现是网络研究的热点之一
和 第一次提出模块度函数 用于社区发现 尽管模块度函数自提出后
得到广泛应用 发展了很多以该函数为目标函数的新算法 如 提出的一种贪婪策略
下的快速聚合算法 和 提出的一种谱聚类方法等 但是该函数 并没有利用节
点的邻域信息 对于很多有节点信息的真实网络 则该模块度函数 并不能很好地度量该网络
的社区结构 因此 研究结合节点信息的社区发现方法有着重要意义 而文献 利用了节点的
邻域信息 扩展并提出了新的模块度函数 它度量了节点的邻域信息 不但适合节点
有额外信息的网络 而且可以得到不同标度下的社区结构 虽然该文章给出了在特定标度下的
收稿日期:
基金项目:国家自然科学基金
作者简介:韩路 硕士生 研究方向 机器学习
纯粹数学与应用数学 第 31 卷
最优分组结果 但是并没有给出如何选取此标度的方法 通常地 基于模块度函数方法发现社区
有许多典型的算法 如何利用并推广现有算法到结合了节点信息的新模块度函数发现社区 同
时如何选取最优分组时的标度是本文关注的问题
谱分析方法早在 世纪 、 年代就已经被提出 该方法后来被发展成许多不同的谱
聚类方法 其基本思想是通过对邻接矩阵形成的拉普拉斯矩阵或者标准拉普拉斯矩阵的特
征值与特征向量进行分析 从而进行网络的社区发现 而 将谱分析方法与模块度
函数最大化相结合 提出一种谱方法并应用于社区发现
本文研究将 所提出的谱方法推广到新的模块度 同时解决新模块度函数最优分组
时标度参数的选择问题 通过将最大化 问题转化为谱松弛问题 进而提出一种二分的谱算
法 同时给出了最优分组时标度的选取方法 最后 通过在三个真实网络数据上进行实验 结果
表明该算法能够有效的给出实际
文档评论(0)