分布式WEB信息检索技术研究ResearchonDistributedWEB.pptVIP

  • 6
  • 0
  • 约7.56千字
  • 约 67页
  • 2017-09-12 发布于重庆
  • 举报

分布式WEB信息检索技术研究ResearchonDistributedWEB.ppt

分布式WEB信息检索技术研究 Research on Distributed WEB Information Retrieval 博士生:张刚 导师:李国杰院士 Outline 研究背景 学位论文研究情况和已完成的研究内容 已取得的阶段性成果 下一步的工作计划 科研项目的完成情况 学术论文发表情况 课程完成情况 研究背景 海量信息检索的挑战 WEB信息的增长:6个月翻一番 表层页面(surface WEB)80亿-100亿 Hobbes‘ Internet Timeline统计,截止到2005年8月,互联网上WEB服务主机数已达到70,392,567台 矛盾与问题 80亿 VS. Top10问题! 是否80亿个页面都需要查询? 如何减少查询量? 研究背景 分布式信息检索是海量信息检索的有效方案 团队作战 分而治之 分布式信息检索的主要过程 文档集合划分 集合选择 单文档集合检索 结果合并 分布式信息检索的体系结构 分布式信息检索的过程 学位论文研究情况和已完成的研究内容 分布式WEB信息检索的集合划分问题 分布式信息检索检索的划分问题建模 基于内容的文档划分技术 基于链接的文档划分算法 分布式信息检索文档集合划分算法评价 分布式信息检索的集合选择问题研究 tf.idf系列模型 CORI集合选择算法 语言模型检索 OKAP模型 分布式信息检索检索的划分问题建模 文档

文档评论(0)

1亿VIP精品文档

相关文档