Web社区结构挖掘的的研究与应用.pdfVIP

  • 4
  • 0
  • 约6.7万字
  • 约 61页
  • 2017-09-05 发布于安徽
  • 举报
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

摘要 摘要 Web是一个复杂超文本所组成的巨大信息源,而且以很快的速度在不断的 扩大,Web在发展过程中存在着大量的社区,这些社区是Web组织中非常重要 的信息,社区可以为用户提供有价值的、可靠的、及时的信息,社区反映了Web 中普遍存在的、复杂的聚团关系和层次关系。如何利用和发现Web中的社区, 是Web挖掘的一个研究方向。 本文在分析了W曲社区的定义、社区的发展、Web数据挖掘的概念与分类、 链接分析技术等基础理论的基础上,对Web社区结构挖掘的典型算法:基于重 HITS算法进行了详细的分析和比较。重点研究了传统最大流算法和基于HITS 算法的边容量分配最大流算法的实现过程及在社区挖掘中存在的问题。传统最大 流算法虽然能较好的解决主题漂移问题,但对社区的质量和数量也会带来许多不 利的影响。而基于HITS算法的边容量分配最大流算法因为采用两个结点的中心 值和权威值的简单加和平均作为边容量,从而有可能增加噪音页面被提取到社 区。为解决上述算法中存在的问题,本文提出了基于传递概率的边容量分配最大 流改进算法,该算法将节点连接度和节点相关度这两个不同角度的属性特征量化 地融合到连边的传递概率中,根据传递概率分

文档评论(0)

1亿VIP精品文档

相关文档