- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复杂网络节点相似性研究及其应用
华北电力大学数理系
Research on Nodes Similarity in Complex Networks and Their Application
目录
一
二
四
三
绪论
余弦相似性指标在复杂网络社区检测中的应用
余弦值相似性指标在复杂网络链路预测中的应用
总结与展望
2/32
复杂网络简介 1.1
技术网络,社会网络,信息网络,生物网络
数学表示:
何为复杂网络
(1-1)
3/32
图1-1 随机网络及其度分布
图1-2 蛋白质网络度分布
度与幂律性:
平均路径与小世界性:
聚集系数与高聚集性:
其他性质:
匹配性( Assortative coefficient )
度异质性( Degree heterogeneity )
网络效率( Efficiency )
复杂网络中的基本概念基本性质
(1-2)
(1-3)
(1-4)
4/32
复杂网络节点相似性 1.2
社会领域: 角色对等,社交网络
经济领域: 推介系统
信息科学领域: 数据挖掘
生物学领域: 蛋白质功能预测
复杂网络领域:社区检测,链路预测
图1-3 美国大学足球网络原始社区结构
复杂网络节点相似性研究背景研究意义
5/32
节点坐标矩阵
节点坐标
余弦相似性
优缺点:能够有效克服传统指标低估的缺点,克服大量节点之间相似性相同的缺点
,但是复杂度高。
余弦相似性指标的定义 2.1
(2-1)
(2-2)
6/32
模块度
归一化互信息NMI值
社区检测结果衡量标准 2.2
(2-3)
(2-4)
7/32
余弦阈值
度阈值
基于核心节点的社区检测算法 2.3
核心节点
核心节点集
8/32
输入:网络邻接矩阵
输出:网络社区划分
计算相似性矩阵和节点度数
While
While
1 提取核心节点
2 检测社区
3 计算社区划分模块度Q并记录
4
End
End
找到最大模块度对应的社区划分结果
算法描述
9/32
现实网络
社区检测实验结果
表2-1基于核心节点的社区检测算法实验结果
网络
节点数
原社区数
原社区模块度
检测社区数
检测模块度
其他算法模块度
Friendship network
34
2
0.3715
3
0.3944
0.3718(FN)
football team network
115
12
0.554
11
0.6022
0.6005(GN)
Dolphin’s association network
62
2
0.2758
5
0.5184
0.508(BCID)
Pol-books network
105
3
0.4149
6
0.519819
0.51(GN)
Net-science network
1589
*
*
277
0.951
0.927(BCID)
Pol-blog network
1490
2
*
2
0.424236
0.4176(标签传播)
10/32
结论:明显提高社区检测精度和模块度值。
图2-2 NMI值作为 Z_out的函数图像
11/32
生成网络
将该相似性矩阵的所有元素(节点相似性)变为相反数,然后再将相似性矩阵的主对角线上的元素变成原相似性矩阵各行元素的求和。
基于余弦相似性矩阵的谱聚类算法 2.4
类拉普拉斯矩阵
(2-5)
12/32
表2-2 相似性矩阵谱平分法NMI值实验结果
谱聚类实验结果
元素值越小节点越相似,最大特征值对应的特征向量;元素值越大节点越相似,第二小 特征值对应的特征向量
13/32
a 空手道俱乐部网络层次树 b 空手道俱乐部NMI值变化曲线
基于余弦相似性矩阵的层次聚类 2.5
层次聚类实验结果
图 2-3 空手道俱乐部层次聚类社区检测结果
14/32
a GN测试网络层次树 b GN测试网络NMI值随社区数目变化的函数
图 2-4 GN测试网络层次聚类社区检测结果
表2-3 相似性矩阵层次聚类实验结果
15/32
CD指标
CDI指标
CD和CDI指标在复杂网络链路预测中的应用 3.1
定义
(3-1)
(3-2)
16/32
为了测试算法的准确性,将已知的连边E分为训练集ET和测试集EP两部分。在计算相似性时只能使用ET中的信息。E=ET∪EP,且ET∩EP=?,将属于U 但不属于E的边定义为不存在的边,即U-E 。
AUC值
EPU - E
原创力文档


文档评论(0)