《北京大学硕士研究生学位论文》.docVIP

  • 33
  • 0
  • 约 69页
  • 2016-06-30 发布于河南
  • 举报
《北京大学硕士研究生学位论文》.doc

北京大学硕士研究生学位论文 题目:结合语义相似度的链接分析 姓 名:朱家稷 学 号院 系:信息科学技术学院 专 业:计算机软件与理论 研究方向:计算机网络与分布式系统 导 师:李晓明 教授 2006 年 5 月 版权声明 任何收存和保管本论文各种版本的单位和个人,未经本论文作者同意,不得将本论文转借他人,亦不得随意复制、抄录、拍照或以任何方式传播。否则,引起有碍作者著作权之问题,将可能承担法律责任。 摘要 链接分析技术作为文本分析和日志挖掘技术的有效补充,被广泛应用在主题提取、网页分类、资源发现等诸多Web信息处理任务和服务中。由于Web的巨大、动态变化和复杂,给链接分析技术带来了很大的挑战。 链接表达了网页间复杂而隐蔽的关系。为了更有效的进行链接分析,需要细致的考察并区分对待不同的链接关系(后面如何体现???)。在本文中我们研究了链接网页间多种属性,包括网页的入度、出度分布,内容相似度和链接相似度等,并且引入了语义相似度的概念。语义相似度描述了网页表达的潜在主题间的相似程度。它与内容相似度和链接相似度相关却又有很大差别。它更精确的刻画了链接网页间语义上的关联程度。 我们用语义相似度作为区分链接权重的标准,并将它应用在PageRank的改进中。在PageRank的基本框架下,我们提出了如下假设:浏览者在选择链接浏览下一网页时,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档