- 3
- 0
- 约2.12千字
- 约 93页
- 2017-08-20 发布于河南
- 举报
2011年第4次课-Deep Web 集成和查询new课件
第 4 章 Deep Web 集成查询研究;主要内容;主要内容;深层网络基本概念;深层网络基本概念; 当前Internet存在大量的页面是由后台数据库动态产生的,
这些页面不能通过静态链接直接获取,只能通过填写表单提交
查询方式来获取。传统的蜘蛛程序(Crawler)由于技术和其它
原因,不能抓取这些页面,导致这部分信息对用户是隐藏、不
可见的,称为Deep Web(深层网络) ; 对Deep Web的研究具有重要意义,Deep Web中包含的信息
是网络蜘蛛程序能够访问的Surface Web的500倍,Deep Web中蕴
涵的信息比Source Web质量更高、更专业,Deep Web数据量的增
长速度远大于Surface Web,Deep Web上95%的信息是可以公开访
问的,Deep Web中大量的信息是结构化的数据信息。因此有效地
利用Deep Web中丰富的信息,向用户提供针对Deep Web中多数据
源一致的查询接口,即研究Deep Web数据集成方法成为当前重要
的方向之一。 ; 我们对航空订票、图书销售、汽车销售等行业226个数据源
进行比较分析,发现这些数据源的数据主要以三种形式存在:
纯数据库数据、以XML形式存在的数据、通过网页获取的数据
库数据。其中通过网页获取的关系数据库数据150个(也称为深
层网络数据,
您可能关注的文档
- 14-循环嵌套、改变循环执行状态课件.ppt
- 13_第十三章_数据采集与振动信号处理课件.ppt
- 14 电路S域分析课件.ppt
- 14-10 自然光与偏振光课件.ppt
- 13第1课时 区域差异、国土整治和区域发展、3S技术应用课件.ppt
- 14.1变量和函数(第四课时)14.1.3函数三种表示方法02课件.ppt
- 14 第十一章 产品市场与货币市场一般均衡课件.ppt
- 13章点运动2010课件.ppt
- 14-1维修电工中级-第五章一般机械设备电气控制电路检修课件.ppt
- 14.1.2自变量取值范围2课件.ppt
- 中国国家标准 GB/Z 18975.11-2026工业自动化系统与集成 流程工厂(包括石油和天然气生产设施)生命周期数据集成 第11部分: 基于RDFS方法论的参考数据工业简化用法.pdf
- GB 51251-2017 建筑防烟排烟系统技术标准 正式版加条文.pdf
- 《建筑防烟排烟系统技术标准》GB51251-2017(170822报批稿)规范.pdf
- 2025年人形机器人市场研究报告.docx
- 2025年人形机器人市场研究报告.pdf
- 从对话到执行:OpenClaw企业级智能体应用手册.pdf
- 《商业模式创新》.pdf
- Openclaw龙虾全维度安全实战指南.pdf
- 2025年IT行业项目管理调查报告.pdf
- 2025年宠物洗护市场复盘总结及新品趋势.pdf
原创力文档

文档评论(0)