- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
巾国科学技术大学博十学位沦文
巾国科学技术大学博十学位沦文 摘要
摘 要
异构信息集成系统旨在将多个自治和异构的数据源集成起来,并提供 统一的查询接口以供上层应用。本文深入研究了基于XML的异构信息集 成系统中的若丁关键技术。
论文首先研究了代表XML模式的文档类型定义的匹配问题。设汁了 一系列转换规则将文档类型定义转化为有向图模型,并提出一种基于上下 文的模式匹配算法。对文档类型定义中的节点,采用语义本体来衡量其名 称相似度,并利用近邻的己匹配节点和路径语义相似度来衡量其l下文相
似度。在树匹配算法中采取自底向上方式匹配,在图匹配算法中,采取图
扩张和引入循环节点的方法来进行匹配。在模式匹配算法的基础上,给出 了文档类型定义的聚类算法。
论文接着研究了异构XML模式的集成和查询处理问题。通过预集成 步骤将文档类型定义转化为公共的语义数据模型IDMX,并利用所提出的 模式匹配算法搜索语义等价的模式对象。通过语义等价关系可以确定对象 之间的语义包含关系,并通过模式变换使得异构的模式变得更加一致。在
模式集成算法中对多种模式冲突进行消解以获得全局模式,】司时生成全局 模式到局部模式的映射。进而设计了公共数据模型的查询语言IDMX QL, 并根据模式映射函数和关键字机制1,q-全局查询分解为针刺局部数据源的 子查询。在查询执行算法中考虑了可能出现的不确定查询结果的情况。
为了高效地对集成系统中的XML数据源进行查询,本文研究了XML 数据源的查询优化索引机制。提出一种基于二级编码机制的路径查询索引 SDDEX。在SDDEX中,构建XML文档集合的概要树,并利用目标集指
针将概要树中的节点与XML文档中具有相同绝对标签路径的节点相关联。 对概要树利XML文档分别进行编码,通过两个节点的编码即可判断它们 之间是否存在祖先一子孙关系。在查询处理中,根据编码机制提出了结构
连接算法以及时间复杂度较低的半结构连接算法,并给出了利用SDDEX
对路径查询进行分解和执行的算法,以及IDMX QL查询的执行算法。 根据以上描述的关键技术,我们实现了异构XML数据源的集成系统
KDXIS,并结合WEB数据集成以及生物数据集成的应用实例对该系统进
中国科学技术大学博士学位论文
中国科学技术大学博士学位论文 摘要
行了分析。进而设治窳现了关系数据源的预集成系统KDIRIS,该系统利 用关系宁段对戍的方式对关系数据进行集成和窳例化并转换为XML数据。
与已有的T作比较,奉文的新贞献在于:
《1)撬出了一静蒸予上下文戆转擒文挡类黧定义鹣嚣配棼法,与已鸯 算法相眈,无需利用学习过程来进行匹配T作,并且能够对。I二下文语义不 同、结构和名称差异较大的异构文档类型定义蠡生行有效匹配。
(2) 提出了一种始构XML模式的语义集成秘查询处理劣巢。与已有 对XML数据源避行集成懿系统栏跑,该方案避免了手1:圭遣遴行滓突溃解 和定义全局视图的工作,从而实现了XML数据源的半自动语义集成。
(3)提出了一种XML数据源的基于二级编码机制的路径查询索引。 与已有索引疆比,剥勰该索引能够对一黢的路径奁谗进行有效处理,并且 避免了冗余的遍历和遴簇操作。
关键掘:霹扩矮标识避言,文档类型定义,异搀,模式集袋,模式廷簸 焱询处理,蠢询索;l
4本论文研究工作褥到了圜家863计划和巾科院知识创新T榉项目的资助。
中国科学技术大学博士学位论文
中国科学技术大学博士学位论文 Abs仃act
Abstract
Heterogeneous Information Integration System(H11S)aims integrating autonomous and heterogeneous data prov ide uniform query interface for advanced appIications.This dissertation makes systematic and thorough study severaI key issues XML based HIIS.
Firstly the problem of matching heterogeneous Document Type Deflnitions(DTDsl is studied in detail‘which is the basis oK further conflict resoIution and schema integration.To ascertain the corresponding elements attributes of he
您可能关注的文档
- 基于XML的跨平台GUI语言应用与研究-软件工程专业论文.docx
- 基于XML的跨平台数据源信息检索-情报学专业论文.docx
- 基于XML的类结构完整性和一致性研究-计算机应用技术专业论文.docx
- 基于XML的旅游信息数据交换平台的设计-软件工程专业论文.docx
- 基于xml的煤矿空间信息系统图形数据重组与存储-地质工程专业论文.docx
- 基于XML的模型用户界面设计计算机科学与技术专业论文.docx
- 基于XML的企业集成供应系统的研究与设计-计算机技术专业论文.docx
- 基于XML的任务流编辑器的设计与实现-计算机应用技术专业论文.docx
- 基于XML的软件模式及应用开发研究-管理科学与工程专业论文.docx
- 基于XML的软件审查过程定义及其支持系统的研究-软件工程专业论文.docx
- 基于XML的异构信息集成研究-管理科学与工程专业论文.docx
- 基于XML的异质数据库数据共享与实现-软件工程专业论文.docx
- 基于XML的引文索引技术研究及其在CBMCI系统中的应用实现-计算机应用专业论文.docx
- 基于XML的元数据整合中间件的研究与实现-计算机系统结构专业论文.docx
- 基于XML的在线考试系统的与实现-软件工程专业论文.docx
- 基于XML的在线投招标系统设计与实现-软件工程专业论文.docx
- 基于XML的政法机关半结构化数据处理模式研究-软件工程专业论文.docx
- 基于XML的智能工厂建模数据管理系统的实现-计算机应用技术专业论文.docx
- 基于XML的智能化病历书写系统-计算机软件与理论专业论文.docx
- 基于XML的智能网业务构件的实现-计算机软件与理论专业论文.docx
最近下载
- 第10讲-地球科学概论_生物圈.pptx VIP
- 土方开挖施工方案(筏板、独立基础、条形基础、桩间土).pdf VIP
- 地球科学概论 第10讲 _生物圈——[武汉大学 地球科学概论].pdf VIP
- 通用汽车ECU密码一致性规范CYS9100 - The Per-ECU Password Utility.pdf VIP
- 2024秋《战场侦察监视技术与装备》答案.docx VIP
- 某公司年度经济活动分析报告.ppt VIP
- 明清时期举人名录.pdf VIP
- 苏教版小学科学五年级下册教学设计教案.pdf VIP
- 人教版七年级上册英语第一次月考试题(含答案).docx VIP
- 梅赛德斯-奔驰-R级-产品使用说明书-R350 4MATIC-251165-Rclass.pdf VIP
文档评论(0)