- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
deep web 数据集成系统的设计与应用研究word格式论文
优秀毕业论文
精品参考文献资料
摘要
Web 中蕴藏着海量丰富有用的信息。在 Web 中按其信息蕴含的深度可划分为 Surface Web(浅 Web)和 Deep Web(深 Web)两类,前者指能由传统的搜索引擎 搜索到的静态页面构成的集合,而后者与之相反,主要指由用户在后台数据库所 呈现的查询接口中通过提交查询而动态生成的页面集合。由于 Deep Web 中蕴含的 信息量是 Surface Web 信息的 400~500 倍之多,且其大部分信息为与主题相关的 结构化数据,更具有应用价值,因此,对 Deep Web 数据挖掘的研究与应用具有重 要的理论意义与应用价值。
通过 Deep Web 数据集成系统是挖掘 Deep Web 有用信息的有效手段之一。本 文在对 Deep Web 数据集成系统中的一些关键问题:Deep Web 数据集成系统的体 系架构、Web 信息抽取算法、查询接口的模式抽取算法及查询接口集成进行较深 入分析研究的基础上,给出了 Deep Web 数据集成系统的体系架构框架,提出了一 种改进的 MDR Web 信息抽取算法、查询接口模式抽取算法和查询接口集成算法。 同时,针对本地区高速公路建设发展的需求,将 Deep Web 数据集成系统技术初步 运用于“河北省公路工程材料信息管理系统”中的“价格管理”模块的研发中。 所设计实现的“价格管理”模块能从 Deep Web 中自动获取公路建设各类材料价 格,并能对其进行整合归类,为相关部门提供了公路建设概算预算编制、审查及 变更批示的依据。所研发的系统模块经相关单位测试使用,实现了合理确定材料 价格、有效降低公路造价的作用,取得了良好的社会效益与经济效益。
关键词:Deep Web 数据集成 查询接口 模式抽取
Abstract
Abstract
Web contains massive valuable information. The information, according to the “hidden” depth, can be divided into sub-categories: Surface Web and the Deep Web. The former refers to that a traditional search engine can search the set of static pages, while the latter opposite. Deep Web mainly refers to a collection of dynamically generated pages from the Web database (WDB) by users submission query on the query interface of WDB. According to the statistics published by industry authorities, the information contained in the Deep Web is about 500 times that in the Surface Web. Besides, the information in the Deep Web seems more professional since they can be focused on a specific domain and structured data. Thus, it turns to be fairly important and urgent for us to mine the useful information in Deep Web.
An efficient method for achieve the rich and valuable information “hidden” in the Deep Web is by the Deep Web data integration systems. Based on the basis of extensive study to the key issues of the Deep Web data integration system: the Deep Web data integration system architecture, Web information extraction techniques or algorithms, query interface model extraction algorithm and the query interface integra
您可能关注的文档
- cu基底cis薄膜的cuin互扩散分析word格式论文.docx
- cu基大块非晶合金的超塑扩散连接性能分析word格式论文.docx
- cvd法znomgno3)2si制备zno纳米结构材料的研究word格式论文.docx
- cvd法znomgno32si制备zno纳米结构材料的分析word格式论文.docx
- cvb3诱导不同性别balbc小鼠巨噬细胞差异性极化机制word格式论文.docx
- cvb3vp1阻滞hela细胞于g1s期的分子机制研究word格式论文.docx
- cvd法渗铝设备及工艺分析word格式论文.docx
- cuw体系复合材料热压烧结 结构调控与性能增强word格式论文.docx
- cu基非晶作为中间层在金属瞬时液相扩散连接中的应用分析word格式论文.docx
- cvd法制备tisio2与硅烷化改性及其催化丙烯环氧化word格式论文.docx
- deep web集成系统中同类主题数据源选择方法研究word格式论文.docx
- deep web环境下多源模式匹配方法的研究word格式论文.docx
- deep web数据源分类及用户满意度评估研究word格式论文.docx
- ddπ与bbπ耦合常数的研究word格式论文.docx
- dehydroαlapachone对胃癌ags细胞的作用及其机制word格式论文.docx
- dehp和bap联合染毒对人张氏肝细胞erod和ecod酶活性及凋亡的影响word格式论文.docx
- dehp及des对大鼠睾酮合成关键酶基因表达影响和隐睾机制的分析word格式论文.docx
- delaunay三角网算法分析和应用开发word格式论文.docx
- dehp对大鼠孕酮合成及star p450scc基因表达影响的研究word格式论文.docx
- dehp和mehp神经发育毒性的体外分析word格式论文.docx
文档评论(0)