(中文)全文数据库索引模型探究.pdf

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文 全文数据库索引模型研究 摘要 摘要 在文本信息急剧膨胀和电子图书迅猛发展的今天,文本数据库日益成为信 息技术领域一个重要的研究发展方向。文本数据库在图书馆、办公自动化、软 件工程、自动目录管理和图书与报干0的出版发行以及涉及文本信息存取的其它 都离不开文本数据库的后台支持。本文首先介绍了中文文本数据库的基本体系 和相关概念,然后对目前实用的几种模型算法进行介绍、分析,特别叙述了一 种最新的模型——IS订也E模型,对传统的模型和新兴模型进行文本数据模型 的对比,分析各个模型在空间效率、时间效率、动态性能几个主要方面的优胜 ISTREE模型的索引创建方法、查询以及原文生成算法和目前的研究进展情况, 为大家提出一个新的思路。最后给出实验原型系统的实验结果,分析该模型的 特性、指出发展方向以及应用前景。 关键字:全文数据库、全文索引、ISTREE √ v ~, 中文 全文数据库索引模型研究 摘要 Abstract When thetextinformation andelectronicbooks expandsrapidly develop has textdatabasebecomean research IT quicklytoday,full importantdirectionin field after textDatabasehasbeen inthe day day.Full applied othertext engineer,automaticcatalog and information management,thepublication and fields.Thewebsearch suchasGOOGLE.LYCOS storage querying engineers etc.arealso text basedthefull database.Inthis theChinese paper,firstly,we present textdatabase’Sarchitectureand relative and y,we concepts.Secondlpresentanalyze severaltextindexmodelsused and inColmnerceresearch describeanew the model,ISTREE.Thirdly,We comparespaceefficiency,time and these describethe efficiencydynamic models.Here,we performance among realizationof model’S ISTREE index and prototype,thebuilding method,querying the comebackofsourcetextarithineticofthenormalISTREEmodeIits and directanew for optimized this,we fulltext isthe model.By way database.Finally,it resultsand experiment analysis. words:Fulltext text database,full Key index,ISTREE .4. 中文 全文数据库索引模型研究 第一章绪论 1.1研究背景 随着人类社会进入信息时代步伐的加快,信息呈现指数增长的趋势。由于 文本是信息的主要载体之一,因此如何有效地管理文本这种非结构化数据成为 当前一项紧迫的研究任务。全文数据库被认为是解决这个问题的一个有效途径。 全文数据库,也可称为文本数据库,它是管理大量文本的系统。由于传统 数据库擅长于结构化数据的管理,而文本是典型的非结构化数据,它们之间的 巨大差异使得全文数据库的实现手段以及全文索引的结构模型完全不同于传统 数据库,比如关系数据库,因此无法通过对传统数据库技术的移植、借用和变 换等简单方法,而必须研究发现全新的理论和方法来完成这项研究工作。而且 它的研究也能够为其他几种更复杂的信息载体,如声音、图像等的管理的研究 提供重要的经验和基础。 作为一种特殊的数据库系统,全文数据库要完成的工作仍然是传统数据库 的两大功能:存储和检索,具体而言就是文本数据的存储和任意字符串的检索。 后一项功能就是与本文研究密切相关的全文检索。 数据库系统的两大功能中,检索更具有核心的地位,可以认为全文数据库 研究的重点是全文检索,而全文检索的关键又是全文索引。一般全文索引的研 究内容主要有:①索引的空间效率;②索引的

文档评论(0)

feiyang66 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档