基于XML的网络信息集成方法分析-计算机应用技术专业论文.docxVIP

基于XML的网络信息集成方法分析-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科学技术大学硕士学位论文 中国科学技术大学硕士学位论文 摘要 摘 要 网络信息集成涉及多种不同类型的异构信息源.如:HTML、XML、关系数据库等。其 目标是设计出一种高度灵活而综合的集成方法。来对这些异构信息源进行分折和整台,最终 形成一致的单一数据集合.这无论是对提高基于知识的决策能力,还是提高信息的再利用率. 都具有直接的现实意义。 为了有效解决这种异构信息源的集成问越.木文提出了以XML为统一的数据描述语言的 网络信息集成方法。同时,为能有效地降低整个信息集成过程的复杂度。采用“分而治之” 方法.提出了分阶段执行的信息集成思想,并将螺个网络信息集成过程划分为三个阶段:数 据抽取、数据集成和数据输出.本文的研究重点是前两个阶段。 在数据抽取阶段:本文分别研究了基于KPS和基于HTML到XML转换的HTML数据 抽取方法。解决从大量动态变化的HTML数据源中精确、、快速地寻找有效信息的数据抽取 问题;同时还研究了关系数据库的模式和数据拙取问题。 在数据集成阶段:为提高集成效率,本文再将该阶段细分成数据预处理、数据规格化和 数据融台三个子过程,数据预处理子过程研究了常用数据预处理的技术:数据规格化子过程 重点研究了基于(hltoto野r和多层集成方法(Multi.Layer Integration Approach)的异构XML 数据规格化方法:数据融合子过程针对不同数据严集间的逻辑关系.研究了不同的数据融合 算法.最终形成一致的xML文件。 在数据输出阶段:重点研究了几种常用的XML的查询语言.并以XML到HTML的数 据输出为例.简单介绍了XML查询语言的应用实例,最后,还介绍了一种基于XML关键 属性索引HASH函数的数据仓库星型模型生成力法。 在本文的最后,对未来的研究工作进行了展望。 本文的特色之处在于:采用“分而治之”办法.提出了分阶段执行的信息集成思想. 并针对各种不同数据源的具体特点.提出了以XMI,为统一的数据描述语言的网络信息集成方 法;其次本文提出了一种基于Ontology和多层的网络信息集成方法.借用本体对X)IL元素 的描述.来解决异构数据的各种冲突。并能有效地降低整个信息集成过程的复杂度。这些对 于研究网络信息集成而言是很有价值的。 关键字:网络信息集成信息检索本体XML 中国科学技术大学硕j:学位论文 中国科学技术大学硕j:学位论文 摘要 ABSTRACT Web information integration involves with heterogeneous information of different types,such HTML,XML,relational database,etc.It intends scheme highly flexible and integrated approach that is able analyze the heterogeneous information sources,integrate them, and finally generate unitary data sets.This is of immediate practical significance both improving the decision-making ability based knowledge and increasing the ofinformation. this paper,a web information integrating approach with XML the uniform data describing language is presented efficiently solve the integration problem of the heterogeneous information sources.In order reduce the complexity of the entire irifermation integrating effectively,we adopt the“divide and conquer”approach,present the idea of phase- executing information integration,and divide the entire network information integrating process into three phases:data mining,data integrating and data outputfing.We lay emphasis the first two phases in this

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档