- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社交网络话题传播模型剪枝策略研究.doc
社交网络话题传播模型剪枝策略研究
摘 要:在进行社交网络话题传播时,随着数据量的不断增大,传播模型在进行传播模拟时所花销的时间更多,程序运行所占用存储空间也更大。然而,在实际的话题传播过程中,大多数话题集中在某些关键节点上,且相当一部分节点对话题的传播没有太大的影响。因此,如果在进行话题传播时,我们能够剪掉社交网络中的某些传播节点,这不仅能够减少程序的运行时间,而且能够降低数据所占用的存储空间。针对上述问题,我们设计了两种新颖的图剪枝算法来减少社交网络中的节点数量。本文所提出的两种算法是将推荐系统的思想引入到社交网络传播模型的剪枝策略研究中,具有一定的新颖性。通过实验分析,我们对比分析了不同剪枝策略对传播模型的效果,所占空间,运行时间以及图的健壮性的影响。
关键词:社交网络;剪枝策略;传播模型;话题
中图分类号:TP391.41 文献标识号:A
The Research on Pruning Strategies Topic Propagation Model of Social Network
YIN Zelong, TANG Xianglong
(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
Abstract: With the spreading of topics in the social network, topic models would spent more time and more storage space with the increase of the size of data. However, most topics focus on some key nodes and parts of nodes have no significant effect on topic propagation in the real process of topic propagation. If we could reasonably cut some nodes in the social network during the spread of topics, the runtime of the program and the storage space both would be reduced. To solve the above problem, the paper designs two novel graph pruning algorithm to reduce the number of nodes in the social network. The two algorithms presented in this paper introduced the thought of recommend system into the research on pruning strategy of topic propagation models and have a certain novelty. With the analysis and comparison, the paper analyzes the impact of different pruning strategies of propagation model on the effectiveness, the space, running time and the robustness of the graph.
Keywords: Social Network; Pruning Strategy; Propagation Model; Topic
0 引 言
剪枝是一种机器学习技术,通过移除树的某些节点来减少决策树的大小,其中这些节点对分类实例拥有很小的影响因子[1-2]。剪枝不仅能够减小算法的复杂性,同时还能够提高算法的预测准确性。
在决策树算法中,一个重要的问题就是优化最终树的规模。如果树的规模过大,就会存在训练数据集过度拟合而新样本概括不准确的问题;树的规模过小也会无法把握样本空间重要的信息结构。同时,也很难分析出算法何时应该停止,因为此时仍无法判断新加入的节点能否动态地减少错误,这个问题被称为视界效应。一个一般化的策略是让树自然生长直到停止为止,再使用剪枝策略去移除那些没有重要作用的节点。
在本文中,研究拟将将剪枝技术运用到社交网络话题传播模型中。在进行社交网络话题传播时,话题在不同
您可能关注的文档
最近下载
- 高一数学同步备课课件(人教A版2019必修第一册):正弦函数、余弦函数的性质(二).pptx VIP
- 汉民族传统服饰知识竞赛(试题19道含答案)13471.pdf
- 高一数学同步备课课件(人教A版2019必修第一册):正弦函数、余弦函数的性质(一).ppt VIP
- 国家开放大学一网一平台电大《商法》期末试题及答案(试卷代号d:1058).doc
- 六年级英语阅读理解100篇(含答案).pdf
- 发现母亲成就孩子.ppt
- 2×300MW火电厂电气部分的设计 毕业论文.doc
- 成都师范学院《概率论与数理统计》2023-2024学年第一学期期末试卷.doc VIP
- 电影拍摄剧组通告单模版.docx
- 国家开放大学一网一平台电大《商法》期末试题及答案(试卷代号c:1058).doc
文档评论(0)