- 2
- 0
- 约5.92千字
- 约 12页
- 2018-11-16 发布于福建
- 举报
数据库关键字查询清理技术剖析
数据库关键字查询清理技术剖析
摘要:随着信息时代的发展,加快了数据库技术与互联网技术的结合,而且更多的用户可以通过对在线数据库的访问来获取相关信息。该文将会对数据库关键字查询清理的基本方法和相关技术给予介绍,从而提高用户关键字查询的效率和准确性。
关键词:数据库;关键字;查询清理技术
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)12-0003-03
传统的数据库查询技术一般是由程序员来操控的,然后对用户所输入的关键字和相关条件对比,最终为用户提供所需要的结果,但是该方法所需要花费的查询时间比较长,为了提高其查询效率,本文将会对数据库关键字查询清理技术给予介绍,并对其相关实例给予介绍。
1 数据库关键字查询综述
对于普通用户而言,为了更好地适应时代发展步伐,他们开始访问在线数据库,但是他们对数据库模式知识和查询语言不了解,从而无法进行准确的查询。与此同时,数据库里存放了大量的数据信息,如果没有一个简便而有效的查询方法,将会浪费大量的时间和精力,因此不管是企业还是个人都要鼓励使用数据库关键字查询,下面将会对数据库关键字查询方法给予介绍。
1.1基于数据图的方法
大量的研究标明,通过数据图的查询不仅能够实现对相关数据的查询,而且还能提高查询结果的准确性。在进行数据库关键字查询过程中,主要包括以下两个步骤。首先,将数据库赋予一定的权重,并转化成相应的数据图,随后对数据图进行物化处理,根据数据图中所具备的节点元组和边元组关系来实现关键词的查询工作,从而构建了一个最小代价的简化子树。
一个数据图G一般包括了两个主要的集合,分别是一个节点的集合和一个边的集合。图G中又含有结构化节点和关键词节点两种类型的节点。关键词节点只含有入射边,而结构化节点不仅包括了入射边,同时还包括了一个出射边。因此,仅通过一个边是无法完成两个关键词的衔接。图G中还包括了前向边(u,v)和后向边(v,u) 两种类型,前向边(u,v) 中,u和v之间一般是借助主外键关联进行连接的,而后向边(v,u),与前向边(u,v)存在一定的相关性,而且只要图中具有前向边(u,v),才能够形成后向边(v,u)。实际上,大部分数据图的边具有单方向的特征,并对各个方向上的强弱关系给予表示。例如在对主外键关联边进行反映过程中,主键与外键正方向的边和反方向的边具备不同的功能。
总的来说,如果数据库中具备了一个关键词集合,就能够进行信息的查询,而整个查询过程包括两个阶段:第一个阶段是完成倒排表关键词的查找,需要借助节点ID才能够完成,该节点含有一个或多个关键词,又被定义为“关键词节点”。第二个阶段是借助图搜索算法,来查询与上述关键词相关联的节点,并对结果树进行排序,以供用户筛选所用。
1.2基于模式图的方法
该方法一般包含了以下三个阶段。第一个阶段:在数据库模式的基础上,将所有可能出现的连接表达式及查询结果进行一一列出。第二个阶段,按照一定的标准将连接表达式按照一定的方式向SQL语句进行转换,以保证其在数据库上顺利执行,从而提高数据结果的准确性。第三个阶段,完成所有可能结果的排序工作,然后将最终结果反馈给用户。在第一个阶段所进行的列举,会对表达式的方式和数目进行限制,对于过大的表达式尺寸,将会增加两个元组的距离,这样就需要增加更多的中间连接,从而导致检测结果失真。
在关系数据库中,基于模式图的查询方法,一般需要通过以下三个阶段才能完成对关键字的查询。第一个阶段:将与关键字相关的候选答案一一列举出来,而且保证每个候选答案都拥有单独的元组连接树;第二个阶段,为每个答案进行分析和评价,并保证与查询相关的答案排到所有答案的前边;第三个阶段,将符合要求的结果反馈给用户。以DBXplorer为例,其一般需要通过以下两个步骤才能完成查询过程:(1)发布:主要是为数据库创建一个辅助符号和结构表,使其拥有一定的查询功能,此外在关键词查询过程中符号表起到了至关重要的作用,在查询时通过符号表的使用可以对数据库中关键词的具体位置给予准确的判定,从而加快查询结果的速度。(2)搜索:其能够从发布的数据库中搜寻到自己想要的结果,但是其一般需要借助系统来完成符号表的查找工作,从而确定关键词在数据库中的相关信息。其次,对所有连接树进行一一列举,并且任何一个连接树对于数据库模式图来说都具有十分重要的意义。最后,为每个连接树编写SQL语句,其不仅可以获得元组连接树,而且还可以完成对连接树中各个表的连接操作,并对所有关键词的元组连接树进行一一对应,然后并对取进行排序,并将最终的排序结果传输给用户。
2 数据库关键字查询清理技术分析
2.1语义矩阵及实例分析
语义矩阵最初是由Yu和Pu提出来的,是用于数
原创力文档

文档评论(0)