- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关系数据库关键词查询研究
基于关系数据库关键词查询研究
摘要:关系数据库关键词查询技术是目前数据库和信息检索领域研究的热点问题之一,它所研究的主要问题是根据用户提交的若干个查询关键词,从数据库中查询出相关的信息,应用这种技术使得普通用户或者Web用户可以有效地访问关系数据库。
关键词:关系数据库;关键词;查询
一、关系数据库关键词查询概述
关系数据库通常通过结构化查询语言SQL来访问。SQL访问方式不但要求用户知道并理解关系数据库模式,也要懂得书写复杂的SQL查询语言,因此,它一般适合于专业用户使用。普通用户一般通过定制的关系数据库查询接口程序RQI(Relational databases Query Interface)或者关系数据库应用程序RAP(Relational databases Application Program)来访问关系数据库。RQI访问方式虽然不要求用户书写复杂SQL查询语言,但是要求用户知道并理解关系数据库模式,对于不同的关系数据库需要使用不同的RQI,而且定制的RQI也往往不能满足灵活多变的用户查询需求,当RQI不能满足用户查询需求时,就需要应用开发人员来修改RQI,由此,使用RQI访问方式则需要较高的开发费用和维护费用。
随着Internet和Web技术的快速发展和应用,一方面用户越来越习惯于使用简单的查询关键词通过Web搜索引擎如Google,Baidu等来搜索信息;另一方面,越来越多的关系数据库发布到Web上面向广大普通用户,形成所谓的“Deep Web”问题,使得普通用户也期望能够使用简单的关键词来查询关系数据库数据。
二、相关定义
定义1:关系数据库模式Sdb(Relational Database Schema)假设关系数据库的模式,Sdb=(R,FK),R={R1,R2,…,Rk}是一组关系模式,FK是R中关系模式间引用关系的映射,FK:R→R,如果FK(Ri)=Rj,记为Ri→Rj(1≤i,j≤n),它表示Rj一个外键引用了Ri主键。
定义2:关系数据库模式图Gs(Relational Database Schema Graph)假设Gs=(V,E)表示模式Sdb=(R,FK)的关系数据库对应的模式图。Gs是一个有向图,将关系数据库中的每一个关系模式Rk(1≤k≤n)看作是Gs的一个节点,当且仅当关系模式Ri∈Gs,关系模式Rj∈Gs,(Ri→Rj)∈FK时,(Ri,Rj)∈E。
定义3:连接元组树Jt(Joning Tree of Tuples)给定一个关系数据库的模式图Gs=(V,E),Jt是以数据库中的元组tl为结点的一棵树,其中tl(1≤l≤m)是关系rk(1≤k≤m)中元组,关系rk(1≤k≤m)是关系模式Rk(1≤k≤n)上的实例,如果(Ri,Rj)∈E且(ti tj)∈(ri rj),那么,(ti,tj)是Jt的一条边,其中ti∈ri,tj∈rj,(1≤i, j≤n),称Jt为一棵连接元组树。
定义4:关键词查询Kq(Keyword Query)把关键词查询定义为查询函数f:Kq→T,其中Kq是一个集合,其元素ki(1≤i≤m)为关键词,T是一个集合,其元素Jti(1≤i≤n)为一个关键词查询结果。
定义5:关键词查询结果T(Keywords Qeury Results)关键词查询结果是OR语义,Kq是一个集合,其元素为ki(1≤i≤m)为关键词,一个查询结果是至少含有Kq中一个ki(1≤i≤m)且每个叶结点都至少含有Kq中一个ki(1≤i≤m) 的连接元组树。
关键词查询结果是AND语义,Kq是一个集合,其元素为ki(1≤i≤m)为关键词,一个查询结果是Kq中的每一个的关键词ki(1≤i≤m)都必须出现在结果中,并且每个叶子节点都至少含有一个Kq中的关键词ki(1≤i≤m)的连接元组树。
三、体系结构
(1)系统设置系统启动模块,做一些系统初始化工作,如系统的参数配置
(2)模式图生成器从系统配置文件读入数据库模式图的模式配置信息,生成数据库模式图。
(3)用户查询该模块为用户查询接口,接受用户输入的查询关键词,
提交后续模块处理。
(4)元组集生成器该模块利用由关系数据库的全文检索功能建立的IR引擎,将关系数据库中具有文本属性的每个关系生成元组集,只有那些与某个查询关键词或者查询关键词组合相关的非空的元组集保留下来,称为非自由元组集,每个非自由元组集都是其源表(即生成该元组集的表)的一个子集,每个非自由元组集实际上也是一个临时表,继承其源表的主外键关系。
(5)候选网络生成器候选网络生成器利用元组集生成器生成的非自由元组集扩展模式图,形成元组集图,然后对该元组集图进行
文档评论(0)