Web搜索引擎及算法培训教程文件.pptVIP

  • 3
  • 0
  • 约9.23千字
  • 约 57页
  • 2017-02-07 发布于江苏
  • 举报
Web搜索引擎及算法培训教程文件

Web搜索引擎 概述、体系结构、排序算法 搜索 Web 三种形式 Specific queries ? encyclopaedia, libraries Exploit hyperlink structure Broad queries ? web directories Web directories: classify web documents by subjects Vague queries ? search engines index portions of web Web信息的特点 Web本身: Large volume:8亿个页面(1999),每两年翻番。 Distributed: 分布在280万个Web Server上。 Dynamic:created,changed,moved,deleted No-structure、heterogeneitiy:pictures、audio… Variety of language:more than 100 Duplication :nearly 30% High linkage: averagely more than 8 links to others. 用户 Ill-formed queries: 未经专门培训,查询请求短、不精确 Wide variance in users:每个用户在needs,expe

文档评论(0)

1亿VIP精品文档

相关文档