基于关键字检索的XML数据源选择-计算机软件与理论专业论文.docxVIP

基于关键字检索的XML数据源选择-计算机软件与理论专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关键字检索的XML数据源选择-计算机软件与理论专业论文

指导 指导小组成。名中. 指 导 小 组 成 员 名 单 杨 卫 东 副 教 授 汪 卫 教 授 谢 志 鹏 副 教 授 计 算 机 科 学 技 术 学 院 复 旦 大 学 H H 彔 目录 指 导 小 组 成 员 名 单 1 m 录 1 麟 1 A b stra c t 2 躲 1 1.1. 弓丨t 1 1.2 . 木 文 工 作 3 1.3 . 本 文 组 织 结 构 4 第 — 章 相 关 工 作 及 研 究 背 景 5 2 .1 . X M L 与 关 键 字 检 索 5 2 .1 .1 . X M L 5 2 .1.2 . X M L 关 键 字 检 索 6 2 .2 . 数 据 源 选 择 8 2 .2 .1. 信 息 检 尜 领 域 8 2 .2 .2 . 关 系 数 据 库 领 域 9 2 .3 . X M L 数 据 源 选 择 I I 第 乂 M X M L 数 据 源 选 择 及 摘 要 史 新 14 3 .1. H 题 描 述 和 相 —X ;定 义 14 3 .1.1. 评 分 模 型 14 3 .1.2 . 数 据 源 选 择 模 型 17 3 .2 . 系 统 柩 架 介 绍 18 3 .3 . 摘 要 建 立 19 3 .4 . 小 结 2 9 第 四 口 实 验 3 1 4 .1. 实 验 环 境 3 1 4 .2 . 数 据 预 处 理 3 1 4 .3 . 实 验 3 2 第 五 苹 总 结 和 将 来 丄 作 3 8 5 .1. 木 文 :[ 作 及 贡 献 3 8 H H a t 5 .2 . 将 来 工 作 3 9 . ? ? ;献 4 0 攻 读 学 位 期 间 作 者 的研 究 成 果 4 3 1. 参 与 科 研 项 0 4 3 2 . 己 发 哀 和 录 用 论 文 4 3 4 4 2 摘 要摘 摘 要 摘 要 关 键 字 检 索 由于 其 对 用 户 友 好 的特 点 在 信 息 检 索 领 域 得 到 了广 泛 的 应 用 , 用 户 不 需 要 学 习 数 据 源 底 层 的 结 构 信 息 及 繁 琐 的 查 询 语 言 , 如 SQL 、 XP a th 等 , 提 出相 关 的 关 键 字 就 能 查 询 到 所 需 要 的 信 息 。 XM L 由于 其 结 构 的 灵 活 特 性 ,很 快 成 为 了数 据 交 换 及 数 据 存 储 的 事 实 标 准 , 主 流 的 数 据 库 如 o ra c le , dh2 等 均 提 供 了 xm l 数 据 的 存 储 管 理 ,开 源 社 区 也 在 xm l 数 据 库 方 面 提 供 了强 有 力 的支 持 ,如 Ba seX ,B erk er lyDB 等 开 源 XM L 数 据 库 。随 若 大 数 据 时 代 的 到 来 , 数 据 会 呈 现 爆 炸 式 地 增 长 ,数 据 被 分 布 到 分 布 式 的 数 据 库 系 统 或 者 数 据 源 上 。 在 多 个 数 据 源 上 进 行 关 键 字 检 索 时 ,每 个 数 据 源 都 要 对 关 键 字 进 行 查 询 , 查 询 时 间 由 查询 速 度 最 慢 的 数 据 源 决 定 , 由于 有 些 数 据 源 针 对 某 些 关 键 字 ;4、能 给 出 很 好 的 结 果 却 浪 费 了 杳 询 时 间及 服 务 器 资 源 , 因 此 选 择 与 用 户 査 询 的 关 键 字 相 关 度 大 的 数 据 源 进 行 杏 询 对 提 卨 检 索 效 率 显 得 格 为 重 要 , 因 此 数 据 源 选 择 问题 是 信 息 检 索 领 域 及 异 构 系统 集 成 领 域 的 个 研 究 热 点 。本 文提 出 了 种 基 于 关 键 字 检 索 的 XM L 数 据 源 选 择 方 法 , 针 对 XM L 文 档 结 构 的 层 次特 性 ,提 出 了 一 种 递 归 定 义 的 结 果 评 分 模 型 ,将 节 点 的 关 键 7 ?频 率 与 路 径 长 度 递 归 地 加 入 到 评 分 模 型 中 ,相 比 较 之 前 的 方 法 , 评 分 模 型 能 够 准 确 地 评 判 结 果 的 优 劣 。 同 时 , 利 用 评 分 模 型 定 义 丼 提 取 了 X M L 数 据 源 的 摘 要 , 本 文 使 用 的 建 立 摘 要 的 算 法 只 要 解 析 X M L 文 档 一 遍 即 可 完 成 XM I. 数 据 源 摘 要 的 建 立 ,对 于 摘 耍 存 储 中 涉 及 的 压 缩 、优 化 、 更 新 等 问 题 的 解

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档