- 7
- 0
- 约10.18万字
- 约 78页
- 2015-10-21 发布于贵州
- 举报
互联网信息索排序算法研究——统一开放的排序公式
摘要
当前的互联嘲已经达到数十亿网页的规模,并且正在以每R数百万恻页的海
量速度增长。由于其规模如此之庞大的,用户在查洵资料的时候,经常面对搜索
引擎所返回的几千甚至几万个嘲页,用户很难准确找到自己所需要的内容。冈此,
搜索引擎如何优化搜索和排序算法,如何在解决搜索速度和查全率的基础上,提
高查准率,并且把最恰当的,最可信的链接放在返回结果的最前面成为互联删搜
索的关键问题。
本文分析了现有的互联网搜索和排序算法,特别是深入探讨了当前排序算法
中的相关度分析和链接分析的优缺点,也研究了网络蜘蛛的算法和中文分词技术
的应用。存此基础上,本文提出了统一丌放的排序公式。该公式把小同的排序算
法整合在一起,用户可以根据不唰的搜索要求动态调整排序算法,解决当前排序
算法的互不兼容刚题。本文在最后给出了该公式的一个简单的心用实例。
关键词:搜索引擎、排序算法
Abstract
World
The WideWeb(W脚)isstill atarateof
millions
expending pages
while arebillions
there of a1 ofits
perday pages
ready.Becausehuge
usersof.tencannotfind what are ror
size,web preciselY they searching
whenfaci numbersof returnedsearch
ngoVcrwhelming pages by engine.
avital for
Therefore,itbecomes search to
problem enginesoptimize
theWWWand thereLurned includesi ssues
searching sorting results,which
ofthesearch results
vs.thewholeresu]Lse
speed,missing L,accuracy,
the of first.
the returned
qualitv pages
This the1WW and
essay searchresult thmsoF
analyzes algori
sorting
i al that
ofrelativiandlink so
原创力文档

文档评论(0)