- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 卷第 期 计 算 机 应 用 研 究
年 月
基于数据图的关系数据库关键词查询排序研究
杨书新 徐慧琴
江西理工大学信息工程学院 江西赣州
摘 要 针对基于数据图的关系数据库关键词查询结果的排序问题提出了基于多因素的结果二度排序法 该
方法结合结果结构权重和信息检索中常用的内容匹配首先采用结果路径权重衡量关键词之间的关联紧密程度
对结果粗排序 然后对于结构权重相等的结果引入信息元组中的关键词词频和包含关键词的信息量对结果
细排序 实验分析表明该排序方法能将与查询条件高度相关的结果排在前面提高结果的查准率
关键词 关系数据库 数据图 关键词查询 关键词词频 信息量 排序
中图分类号 文献标志码 文章编号
网络信息技术的进步导致了可用数据的急剧增长要操作
相关工作
这些数据资源成为非常关键的一个任务但是数据的真正价值
在于它们之间的关系性正是这种关系性使得关系数据库关键 基于数据图的关系数据库关键词查询目前已有的研究成
词查询变得有意义 关系数据库关键词查询不要求用户熟悉 果很多无论是在查询方法还是在结果排序方面都取得了进
复杂的查询语言如 等和底层数 展 获取结果树的方法主要分为两种
据模式知识该方法根据关键词不仅能查找到包含关键词的 基于遍历的方法 比较经典的 系统以关键词
项而且能找到项与项之间的语义关系适用于文献应用网络 节点为初始节点对图进行反向遍历采用 算法更新关
寻找包含关键词的几篇论文之间的关系社会网络中寻找人物 键词节点到访问到的节点之间的路径对访问到的节点采取位
关系和城市道路交通等方面 目前关系数据库关键词查询方 标记并实时更新当访问到的节点位标记满足一定要求时就
法按数据模型划分可分为基于模式图和基于数据图两种方法 得到以当前访问节点为根节点的树 对结果树
基于模式图的方法有 和文献 基于数据图的 评分方式是使用一个系数把树累计的边权值与累计的节点权
方法有 等 数据图具有通用 值进行相加 类似于 系统图遍历获取结果的方法文
性无论是非结构化数据半结构化数据还是结构化数据都能 献 针对大规模图数据提出了基于图划分的图遍历的结
表示成数据图的形式 基于数据图的关系数据库关键词查询 果获取
主要分为枚举候选结果和结果排序两部分 枚举候选结果是 基于路径索引的方法 为了提高查询效率减少查询
对数据图进行查询获取图中包含所有关键词的最小连接树 过程中图遍历的时间开销一些方法对数据图进行预处理获取
结果排序则是衡量结果连接树与用户查询意图的相关度相关 相关 的路径索引信息 具代表性 的方法如
度高的排在前面 通常关键词查询工具查找到的结果很多
和 建立了双层索引支
原创力文档


文档评论(0)