基于时间反馈和分类技术的PageRank改进算法.pdfVIP

基于时间反馈和分类技术的PageRank改进算法.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第40卷增刊 北京化工大学学报(自然科学版) V01.40,Suppl 2013芷 JournalofBeijing ofChemical Science) 2013 University Technology(Natural 李更生 卢 罡 (北京化工大学信息科学与技术学院,北京 100029) 摘 要:首先对经典排序算法Rank算法进行优劣分析,对其缺点提出针对性的改进。在原有算法中融入网 页之间的链接相似度,并加入时间反馈因子,最终提出基于时间反馈和分类技术的PageRank搜索引擎改进算法, 解决了PageRank算法搜索应用中结果偏向于旧网页的问题,并提高了用户搜索的查准率。 关键词:PageRank;搜索引擎;时间反馈;分类技术 中图分类号:TP301.6 其中尺。,(”)是网页的页面级别,参数d为介于(0,1) 引 言 区间的衰减因子,其取值的大小不影响网页的排名, 如今互联网已成为人们日常生活中最重要的信 但一般取0.85左右,B,.为指向网页”的其他网页, 息来源之一。互联网在给人们带来海量信息的同 Ⅳ.,是网页u中向外指出的链接数目。 时,也对互联网的有效利用提出了新的课题,例如应 但是由于PageRank算法只是客观的分析网页 用广泛的搜索引擎就面临着不断改进的压力,以达 之间的链接,计算网页之间的尺,值,之后排序推荐 到搜索的结果更加符合用户需求的目的。 给用户。虽然有很高的响应速度,但由于仅仅利用 搜索引擎一般包括用户界面、网络爬虫、数据库 了网络的链接结构,没有考虑到网页之间的主题相 索引、网页排序等几个功能模块…。。其中对于用户 关性等,而且也没有考虑到新发布的网页因为在互 反馈结果影响最大的就是网页排序所使用的排序算 联网L存在的时间较短造成尺,值小而排名靠后的 法,它的作用是接受到用户检索需求时,在索引数据 问题。因此,该算法有两个比较重要的不足,第一是 库中查找出所需内容,并将查询内容按照相关度进 容易出现主题漂移问题,第二是PageRank算法偏重 行计算,给出排列顺序,再将结果反馈给用户。 陈旧网页4l。 本文剖析了基于链接的经典排序算法Pager— 主题漂移问题使得查询结果的相关性未能得以 ank算法‘2 o和HITS算法¨。,并对已有的基于PageR— 利用。针对这一现象,陈伟柱等∞1提出了一种基于 ank算法的改进算法也进行了深入的分析,在此基 网页之间相似度的搜索引擎排序算法,即Catego— 础上,提出基于时间反馈和分类技术的PageRank改 ryRank算法。如果网页A有一个指向网页B的链 进算法。 接,网页A和B在内容上可以归类于某一个类别, 1 PageRank算法分析 然后针对A和B所属的类别之间的相似度获得一 个权值,并把这个权值加权到R,(A)/N。中,从而 PageRank算法是搜索引擎Google的核心算法, 它借鉴了传统情报检索理论中的引文分析方法,比 排序算法。 早期搜索引擎的搜索效果有了很大的提高,因此也 针对PageRank算法偏重旧

文档评论(0)

0520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档