- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于相关性语义的高效XML Twig查询处理方法 朱金清, 王伟, 周军锋, 孟小峰 中国人民大学WAMDM实验室 大纲 背景 动机 基于相关性语义的Twig查询处理方法rTwigStack 实验分析 总结 背景 XML 互联网数据的表示和交换的标准 可以表示结构化和半结构化的数据 XML的应用 政府数据数据交换 各业务部门易于理解 跨平台、多种数据源 背景(2) XML的应用 电子病例数据(EMR) 背景(3) 越来越多的数据采用XML来表示和传输 随之而来的问题: 背景(4) 结构化查询方法 XPath XQuery … 大纲 背景 动机 基于相关性语义的Twig查询处理方法rTwigStack 实验分析 总结 XML查询存在的挑战性 XML文档结构的复杂性 信息的对称性和文档组织结构的不对称性 XML文档结构的不断演变性 动机 一点观察 XML文档中关系组织的复杂性 元素S在I的祖先结点,也可以在I的后代结点 实际上,复杂性只是对应了语义的简单性 总之,S和I是相关的(卖、卖家等) 所以,通过定义简单的语义来避免数据的复杂性,即相关性(related)语义 动机 扩展XPath的语法使之支持Related轴(“~”) 扩展的好处 用户了解文档结构,用精确XPath定位 不了解文档结构,通过Related轴表达查询请求 了解部分结构,通过related轴和已有XPath的组合来尽可能准确地表达查询 大纲 背景 动机 基于相关性语义的Twig查询处理方法rTwigStack 实验分析 总结 相关性(related)语义 related轴(“~”) 返回一系列数据元素,这些数据元素是当前context节点的最邻近的后代或者祖先. S~I:返回红色的元素I 对两个文档(内容相同但组织形式不同)的返回结果一样 相关性语义(2) 含related轴的整体匹配方法难点 related轴的对称性 u~v可能对应文档中的u//v, u/v , v//u , v/u中的一种或几种,如: related轴与A-D或P-C轴的不可相互表示 rTwigStack 优点: 一次扫描即可得到所有的结果 支持related轴的扩展XPath查询 可以移植到XQuery中以增强XQuery的功能 同时兼容包含PC、AD边的Twig查询处理 大纲 背景 动机 基于相关性语义的Twig查询处理方法rTwigStack 实验分析 总结 实验分析 实验设置: 三种方法:TwigStack(TS), rTwigStack和rTwigStack+ 1~200M的不同大小XMark文档 6个查询 3个含related查询 3个不含related查询数据集: 度量指标: (1) 运行时间 (2) 扫描的元素数量 运行时间对比 扫描元素数量、扩展性 大纲 背景 动机 基于相关性语义的Twig查询处理方法rTwigStack 实验分析 总结 总结和下一步工作 提出了一种新的related查询语义 提出了一种高效查询处理算法rTwigStack和基于DTD提出一种优化算法rTwigStack+ 实验表明,本文提出的算法不但可以高效处理包含related轴的查询,而且可以高效处理不包含related轴的查询. 下一步将考虑在XML图上的related语义和求解 谢谢~QA * * 国税 公安 工商 国土 XML pieces 性别 职业技能 婚姻状况 民族 籍贯 一般表述 诱因 症状 家庭成员 部位 时间 检查 机能 活动 损伤 处置 形状 大小 性质 定义 方式 程度 修饰 生理指标 生理指征 … … XML structure 性别 value男/value value女/value /性别 民族 value汉/value value蒙/value value…/value /民族 籍贯 value北京/value value上海/value value … /value /籍贯 婚姻 value已婚/value value未婚/value value … /value /婚姻 诱因 value活动后/value value体检时/value value … /value /诱因 症状 t=“Dict” value气促/value value疼痛/value value … /value /症状 部位 t=“Dict” value头部/value value胸部/value value … /value /部位 时间 formatyyyy-mm-dd
您可能关注的文档
最近下载
- 【解读】GB17761-2018电动自行车安全技术规范.pdf VIP
- AD832I机台操作指引.pdf VIP
- 《植物的茎》(教案)-中职农林牧渔大类《植物生长和环境》同步教学(高教版)(第四版)(全一册).docx VIP
- 证券从业资格证金融市场基础知识模拟卷及答案解析.docx VIP
- 证券从业资格证考试金融市场基础知识冲刺试题.docx VIP
- 证券从业资格证《金融市场基础知识》考前练习及答案解析.docx VIP
- 证券从业《金融市场基础知识》基础练及答案解析.docx VIP
- 证券从业资格考试金融市场基础知识预测试题及答案解析.docx VIP
- 2021年证券从业考试《金融市场基础知识》习题及答案.docx VIP
- 高中英语学业质量标准研究.pptx VIP
文档评论(0)