- 5
- 0
- 约2.77千字
- 约 7页
- 2018-06-23 发布于福建
- 举报
一种新社团挖掘算法MFA
一种新社团挖掘算法MFA
摘要:介绍了一种新的社团挖掘算法MFA(Maximum weighted edge First Algorithm),该算法是一个优先考虑边权值进行社团划分的算法,同时也继承了通过优化Q值进行社团划分的算法的优点。通过实验证明,该算法完全正确的将加权的Zachary网络划分为个数分别为16和18的两个社团,要远优于其他大部分社团划分算法。
关键词:社团挖掘;算法;MFA
中图分类号:TP301.6 文献标识码:A 文章编号:1009-3044(2013)36-8217-03
1 概述
目前,通过直接优化模块Q值来进行社团划分的算法以其稳定而良好的表现在社团挖掘领域占据了主导地位。相关的文献也指明,在加权网络的社团挖掘方面,模块Q值同样是一个优秀的判断和划分标准。但是直接优化Q值的方式也并不是完美无缺的,分析基于这种方式的现有加权网络社团划分算法不难发现:它们往往忽视了边权值这一加权网络最重要的特殊属性,而试图将之视为普通的复杂网络而加以处理。这正是现有算法的先天缺陷之一[1-4]。
MFA算法是一个优先考虑边权值进行社团划分的算法,同时也继承了通过优化Q值进行社团划分的算法的优点。该算法是基于Newman快速算法加以改进的,其时间复杂度达到了[O(n2)],并且有进一步提高的余地。
2 MFA算法思想
观察现实的社会生活,我们会发现:判断一个个体是否在某一个群体中,往往是根据这个个体和群体中其他个体的交往次数的多少来判断的,交往次数越多,这个个体在群体中的可能性就越大。如果用网络来表现这一现象。个体就相当于网络中的节点;个体之间的交往次数就相当于在节点之间的边上加权;个体加入了群体就相当于进行了社团划分。联系社团划分这个目的仔细的分析这个现象,我们会找到这样几
个关键所在:要形成一个群体的关键是要有足够多的相互联系,而足够多的相互联系本身就是群体形成的一个重要因素。
在加权网络社团划分过程中,单纯的考虑权值会造成一个显而易见的问题,那就是网络中的所有节点会按照边权值的大小一次合并到同一个社团中,这个结果显然不是我们所需要的。那么,现在的问题就是,当我们找到了一个权值最大???边是,如何判断这条边所联系的两个顶点是属于同一个社团的呢?显然,模块Q值在这里为我们提供了足够有力的判断标准。在此我们采用Newman快速算法的标准,以合并后△Q是否大于0来决定合并与否。
此时,我们发现,MFA算法的基本思想已经形成了,它的流程如图1所示。
3 MFA算法的实验分析
3.1 算法复杂度分析
整个算法包括三个部分:初始化、查找、合并。
其中查找的时间复杂度为[O(m)];每次合并以后,更新相应的元素[eij],[eki],[ekj](k≠i,j),[ai],[aj],该步的时间复杂度为[O(n)]。因此,一次查找和合并的总时间复杂度为[O(m+n)]。对于一个n个顶点的网络来说,共需要进行n-2次合并,因此算法总的时间复杂度为[O((m+n)n)]。对于稀疏网络,时间复杂度为[O(n2)]。
3.2实验对比
由于找不到更多的最新算法,我们选择了目前世界上性能较好的加权Newman快速算法与本算法进行了对比。
由于目前加权网络方面的研究较少,因此加权网络的实验数据集也比较少。限于此种情况,我们采取了一部分无权网络的数据集,并将其边权统一赋为1进行实验。
我们使用了如下数据对两个算法进行了比较:
表 1 实验数据集规模及其描述
[数据集名称\顶点数\边数\应用领域\Zachary Karate club\34\78\社会网络\Geom\7343\11898\生物信息\KDD citation\27770\352807\社会网络\]
注:该文所做的实验都是在一台CPU为奔腾M 2.4G,内存为512M的电脑上完成的。软件平台为:Windows XP SP2,Microsoft Visual Studio 6.0。
算法执行速度如下:
表 2 算法运行时间比较(单位:毫秒)
[\Zachary\Geom\KDD\加权Newman算法\15\10531\938250\MFA算法\16\11352\956737\]
可见两者的运行时间相差无几,另外由上述的时间复杂度分析也可以看到,MFA算法在时间复杂度上并没有质的提高,这一点在实验中得到了证实。
算法的执行效果比较如下:(在这里我们直接比较Q值)
表 3 算法的模块Q值对比表
[\Zachary\Geom\KDD\加权Newman算法\0.371795\0.776724\0.506033\MFA算法\0
您可能关注的文档
- “数学广角”内容分析与教学策略.doc
- “数据结构”教学中提高学生编程能力浅谈.doc
- “数据结构”课程教学中案例设计及应用.doc
- “文化走出去”战略背景下英译策略.doc
- “文科生”理性思维能力培养物理教学探究.doc
- “斗牛”比赛对小学生篮球技术保持与发展实验研究.doc
- “新闻”定义在中国发展脉络.doc
- “旅行者”号 跨越36年探索之梦.doc
- “旱立停”抗旱剂在冬播马铃薯上应用效果.doc
- “时政评述”在高校思想政治理论课教学实践中应用研究.doc
- 2025年版汽车趋势报告 The 2025 EPA Automotive Trends Report.docx
- 2026年边缘计算开源平台EdgeX Foundry入门与二次开发.docx
- 2026年超声内镜放大内镜早癌诊断AI辅助识别系统临床评价.docx
- 2026年报废汽车回收与再制造逆向物流体系.docx
- 2026年产品碳足迹核算方法学:从摇篮到大门与从摇篮到坟墓.docx
- 2026年城乡要素平等交换双向流动政策创新试点申报材料.docx
- 2026年超导半导体接口电路架构与电平转换驱动器设计.docx
- 2026年财政贴息不再以再贷款支持为前提后的风险防范与合规要点.docx
- 2026年不动产信托登记试点政策对遗嘱信托支持.docx
- 2026年城乡有机废弃物协同处理技术方案.docx
最近下载
- 第6课 古往今来话编码 课件 义务教育版四年级信息科技.pptx
- 中文修订版儿童社会能力和行为评定量SCBE-30.docx VIP
- 2025年第二十六届全国初中应用物理竞赛试卷.doc VIP
- 带头强化政治忠诚、提高政治能力方面等五个带头方面存在问题2026年民主生活会对照检查材料(精选).docx VIP
- 2024年海南省高考英语试卷(含答案解析)+听力音频.docx
- 2026湖北武汉市江汉城市更新有限公司及其下属子公司招聘11人笔试参考题库及答案解析.docx VIP
- 中文修订版儿童社会能力和行为评定量表(SCBE-30).docx VIP
- 江苏省专升本2025年经济学专业微观经济学真题汇编试卷(含答案).docx VIP
- 2024年新疆兵团公务员考试《申论》真题及答案.docx VIP
- 上海立达学院专升本微观经济学试卷及答案.pdf VIP
原创力文档

文档评论(0)