《InfoMall数据检索服务的设计以及全文检索系统的初步实现》.pptVIP

  • 3
  • 0
  • 约1.77千字
  • 约 14页
  • 2016-05-28 发布于河南
  • 举报

《InfoMall数据检索服务的设计以及全文检索系统的初步实现》.ppt

《InfoMall数据检索服务的设计以及全文检索系统的初步实现》.ppt

InfoMall数据检索服务的设计以及全文检索系统的初步实现 杨志丰 InfoMall万维网信息博物馆 中国万维网历史信息的存储和展示系统 维护2001年以来从中国万维网上搜集的近12亿篇网页(约20TeraByte) 以每月1000万的速度增长 现有服务及问题 目前提供三种服务 根据URL检索历史网页 提供人工整理的历史事件专题回放 免费提供网页和日志数据 局限 访问途径单一(只能通过URL) 整理历史事件专题需要大量的人工工作 只能获得某个时间段搜集的全部网页,且免费数据的获取需要很多人工维护工作 InfoMall数据检索服务 目的 整合现有服务 通过统一的数据访问接口,提供更加丰富,更加自动和便利的数据服务 InfoMall数据检索服务 提供以InfoMall历史网页文档为核心数据,以内容、空间、时间为查询纬度的,面向高层应用的客户服务器体系结构的数据检索服务。 “三维”的数据模型 检索服务原语 Augmented BNF 语法定义(部分摘录如下) query = “select” data-type “from” data-repository “where” 1*conditions [“max” maximum-item-number] conditions = content-condition / time-condition / location-

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档