数据库全文检索方法探析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机世界 · 数据库全文检索方法探析 杨明远(沈阳海杰信息技术有限公司,辽宁 沈阳 110032) 摘 要:数据库技术的应用已经有几十年的历史,也出现了像SQLSERVER、ORACLE、MySQL这样的优秀数据库管理系统,并且随着版本的升级 也能够提供比较好的全文检索的功能,但是对中文和数据库大字段域的全文检索并不是很好,因此,本文通过~Sphinx的分析,并借鉴它的 设计思想,寻求一种能在不影响现有数据库设计,并且能提供现有数据库进行全文检索的方法。 关键词:数据库全文检索;数据库增量;数据源 数据库己经在众多领域得到广泛的应用,很多领域在使用 的环节,数据监控的力度并不是针对某个或某些数据库的表。 数据库之初可能并没有考虑数据量的大小对查询和使用数据库 对于在外部建立对数据库的全文索引,具体的去关注数据库表 技术效率的影响。而且随着数据库的应用时间越来越久,许多 里面数据的变化的没有意义的,因为建立索引时的基本单位是 领域的数据库已经存储了相当大的数据。在如此庞大的数据量 数据源。针对每个数据源,需要监控的是数据源的变化,包括 之下,简单的数据库管理己经无法满足领域的需要。好多领域, 记录的增加,删除和修改。 开始需要从庞大的数据库中进行综合性的数据检索而非简单 数据库增量数据监控方法: 的数据库查询。 (1)初始化: 1数据库全文检索介绍 ①针对数据源中的某些需要监控变化的列在配置文件中 以SOLSERVER数据库为例,它的全文检索配置如下: 做好配置。 从SQLSERVER7.0版本开始,SQLSERVER数据库管理系统就 ②指定数据源中能唯一标识一行数据的关键字。 新增了全文检索功能,但是对于全文索引操作过程比常规索引 ③读取数据源将数据源中的关键字的值以及由监控变化 要复杂许多。SQLSERVER为了支持全文检索,专门设计一些新的 列组成的向量存入关键字词典。 存储过程并定义一种transact-Sql语句,下面介绍具体的创建 (2)词典监控: 步骤: ①读取数据源的一行记录,通过配置文件信息和关键字信 (1)启动 SQLSERVER的全文检索功能 息获取该行的一个关键字词典行。 (2)建立 SQLSERVER的全文检索 目录 ②通过关键字在关键字词典中查找,若查不到,则将该记 (3)将新建立的全文索引表添加到全文检索目录 录插入关键字词典中,转④若查到则转③。 (4)指定全文检索的字段 ③对列向量的每一列进行mds~I密算法后同查到的关键 (5)创建全文索引 字词典中的列的集合向量进行比较。若向量相等则不做任何处 (6)填充全文索引 理。若不等,则转④ 建立全文索引时需要注意的内容有:每个表只能有~个全 ④标记词典中该行的deleteable标记位为true,并用该行 文索引,且同一个数据库中的多个全文索弓l可以组织为一个全 的列的集合向量替换词典中的列向量值。转⑤ 文 目录,且全文索引并不是存储在数据库系统中,而是存储在文 ⑤循环执行以上步骤,若该行是数据源数据的最后一行, 件系统中 “。 遍历关键字词典表,将词典表中delel~eabte为true的行写入增 2数据库外部全文检索建立过程 量关键字词典中,同时将关键字词典中的该行的deleteable置 为false。 数据库全文检索的建立过程分为三个步骤: (1)确定SOL数据源:指定一个SQL为数据库爬虫的入口。

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档