网站大量收购独家精品文档,联系QQ:2885784924

搜索引擎结果的重排序方法.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎结果的重排序方法

第25卷第2期 计算机应用 Vo1.25 No.2 2005年2月 Computer Applications Feb.2005 文章编号:1001—9081(2005)02—0305一O4 搜索引擎结果的重排序方法 杨广翔’,俞 宁 ,谌 莉 (1.武汉大学计算机学院,湖北 武汉430079;2.武汉大学教育科学学院,湖北 武汉4300079) (xfygx@tom.com) 摘 要:当前Web搜索引擎返回的搜索结果一般是按“超链分析”进行排序的。采用词频统计、 词分布特征量等方法对Web搜索引擎的搜索结果的关键词相关度进行计算,并重新对搜索结果排 序,可以使得搜索结果中有关的页面文集更加集中。从而方便了信息的使用,特别是在对于特定内容 的信息搜索时。 关键词:词频统计;搜索引擎;词分布;排序 中图分类号:TP31l,13 文献标识码:A I rank method of rearch engine YANG Guang—xiang ,YU Ning ,SHEN Li f 1.College of Computer Science,Wuhan University,Wuhan Hubei 430079,China; 2.School of Education Science,Wuhan E,凡 e ,Wuhan Hubei 430079,China) Abstract:The result that current web search engineer returned were ranked mainly by their hyper~nk analyse,not their content.To take the search resuhs as an order coHection,we used item ~enqency statistic and calculated item position in every page by certain formula,by which we calculated each page’s relativity and re·ranked the collection.The experiment results show that the pages which meet the users needs were concentrated ahead.In this way,Th e precision Was enhanced.It can help user find inform ation rapidly. Key words:term frenqency ferquera;search engine;item position;rank 集。在很多Web页面的信息收集应用中,特别是指定内容页 0 引言 面文本的收集,用户主要关心的是搜索结果页面中的相关页 Web搜索引擎从1994年开始出现,到今天已经有近十年 面对于检索词的相关性。本文讨论了在搜索结果有序页面集 的历史了。衡量搜索引擎性能的一个重要指标是搜索引擎的 的有效且有限子集上进行词频统计和词分布统计的重排序方 可检索页面量。最初的World Wide Web Worm (WWW)…只 法;以及两者结合的方法进行重排序,以优化相关文档 能检索 110000个Web页面,发展到今天,Google的可检索页 (relevant document)在有序页面集的序次。实验结果表明,该 面量已经达到

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档