- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关系数据库上基于语义的top-k关键字查询
李一罡 张 炜 (哈尔滨工业大学计算机科学与技术学院,哈尔滨 150001) (hit.liyigang@)
摘要 给定关键字集合,关系数据库上的关键字查询返回一个元组连接树集合。现有的关键字查询处理方法要求元组连接树的每个叶节点至少包含一个查询关键字。但是,这些方法都忽略了与查询关键字语义相关的元组。因此,提出一种基于语义的关键字查询处理算法。首先定义了查询关键字与元组连接树的语义相关性评价函数,然后在查询处理过程中利用该评价函数,以产生相关性最高的top-k结果。最后,实验结果表明该查询处理算法的准确性和高效性
关键词 关键字检索;top-k;语义;关系数据库
中图法分类号 TP391
A semantic top-k keyword query on relational database
Li Yigang, Zhang Wei, Gao Hong
(Department of Computer Science and Technology, Harbin Institute of Technology,Harbin 150001)
Abstract Given a set of keywords, keyword search on relational database return a set of joining trees of tuples. Existing work requires that each leaf node in the joining tree of tuples must contain one or more keywords. But it doesn’t consider the tuples which have semantic correlation with keywords. So we propose a keyword search algorithm based on semantic. First, we give evaluation function to measure the semantic correlation between keywords and joining tree of tuples. In the query processing, we compute the top-k results with highest correlation using evaluation function. At last, experiment result demonstrates the veracity and efficiency of our algorithm.
Keywords keyword search; top-k; semantic; relational database
随着网络技术和搜索技术的飞速发展以及在社会各个领域中的运用,关键字查询已经成为结构化和半结构化数据库中一种流行的查询方式。与传统的数据库查询模式相比,基于关键字的查询有着不可比拟的优势,首先,用户不需要知道数据库的模式信息。其次用户不需要掌握复杂的数据库查询语言,如SQL等。这种新型的查询方式可以让用户像使用Google那样轻松地在数据库中查询所需的信息。
近几年,研究人员提出了一些关系数据库上的关键字查询处理方法 Min-Cost Connected Trees[6],SPARK[7]等。这些方法的基本思想都是将数据库看作由数据元组通过主外键关系连接起来的元组图。查询结果就是元组图中包含查询关键字的元组连接树。这些查询处理方法主要关注直接包含查询关键字的元组,并要求作为查询结果的元组连接树的叶节点至少包含一个关键字。但是它们都没有考虑不包含查询关键字却与其紧密相关的元组。这样就必然会忽略与查询关键字同义、近义或具有语义相关的元组。另外,现有方法的评价函数对结果和关键字的相关性度量也存在一些不合理之处,导致查询结果的准确率较低。
针对上述问题,本文提出一种基于语义的top-k关键字查询处理方法。该方法采用了一种新的相关性评价函数。新的评价函数重新定义了关键字的包含关系,并通过分析数据库模式与查询内容的语义信息来评价元组与查询关键字的相关性。由于对语义信息进一步的发掘,可以更准确、高效的返回查询结果。1. 问题定义假设一个关系数据库DB包含n个关系,,…, 。每个关系由几个字段构成,关系的每个元组由主键唯一确定。定义1数据库的模式图:在模式图SG中,数据库DB中每个关系被映射为模式图中的一个节点,对于每个从主键(关系的属性集)到外键(关系的属性集)的联系,构造一条从指向的有向边。下面基于模式
您可能关注的文档
- “错觉论证” 与析取论.doc
- “中国煤层气资源开发” 项目的成就与后续发展初探.doc
- 2007 管理科学与工程国际会议论文排版要求及格式样张.doc
- A General Formula for Determining the Permeability of Porous Media Consisting of Obstacles of Different Sizes (Helvetica, 16, 实词首字母大写, 加粗, 居中, 固定 ….doc
- Dreamweaver8 中CSS 样式表的若干问题.doc
- IF 钢铸坯表层洁净度研究.doc
- 澳洲丹霞地貌的特色及其旅游开发.doc
- 从定义概念入手探究机械波的物理含义.doc
- 丹霞地貌的喀斯特现象.doc
- 丹霞地貌定义及分类中一些问题的探讨.doc
文档评论(0)