第十章 Web数据库集成系统.pptVIP

  • 3
  • 0
  • 约1.38万字
  • 约 90页
  • 2017-11-23 发布于河南
  • 举报
第十章 Web数据库集成系统

第十章 Web数据库集成系统 QE-Extractor模型 * Web数据库发现子模块 ,发现可通过表单查询接口访问的Web数据库。Web数据库模式抽取子模块 ,用于准确地识别出Web数据库查询接口模式和查询结果模式中所包含的模式属性。 Web数据库分类子模块 ,对Web数据库进行分类能够更加有效地利用这些Web数据库中的数据信息。 查询结果记录抽取与标注子模块,主要功能是从Web数据库返回的查询结果页面中抽取出结构化的查询结果记录,并标示出查询结果记录中各个数据单元对应的模式属性。数据集成子模块,将来自于多个Web数据库的查询结果记录按照全局模式合并成统一的数据集合。 * * 而单以商业和购物两个领域来说,存在数以千计的Web数据库,而CompletePlanet发现的Web数据库只占整个Deep Web中大约7%。所以,实际上每个领域内的Web数据库远远大于1000个,如果只是简单地将集成接口上的查询转换到对每个数据源的查询,实际上是不可行的。 对于一个给定的用户查询(1)有些Web数据库并不满足该查询,即无须对其查询;(2)有些Web数据库之间存在较大的冗余,只选择其中一个或几个查询,如果用户查询被集成系统不加选择地直接分发到每个Web数据库中,不但查询代价高,而且会返回大量冗余的结果,造成系统不必要的负担和用户等待时间过长。 * 通过查询接口从Web数据库中以增量方式获取近

文档评论(0)

1亿VIP精品文档

相关文档